阿里云开源通义千问140亿参数模型Qwen-14B及Qwen-14B-Chat免费商用:高性能对话模型引领AI潮流

通义千问11mos agoupdate lida
70 0 0

文章主题:阿里云, 开源模型, 大模型, 语言模型

666ChatGPT办公新姿势,助力做AI时代先行者!

阿里云开源通义千问140亿参数模型Qwen-14B及Qwen-14B-Chat免费商用:高性能对话模型引领AI潮流

(编辑/吕栋)

在9月25日,阿里云的开源项目通义千问宣布其140亿参数模型的Qwen-14B以及其对话模型Qwen-14B-Chat可以免费商用。据相关介绍,Qwen-14B在多个权威评测中表现出了超越同等规模模型的能力,其中一些指标甚至接近了Llama2-70B的水平。值得一提的是,这并不是Qwen-14B第一次展现其强大的实力,就在一个月前的某个时间点,阿里云的开源项目已经成功推出了70亿参数的Qwen-7B模型,并且其下载量已经突破了百万大关。

Qwen-14B是一款高性能的开源模型,具备强大的推理、认知、规划和记忆能力,这要归功于其使用的优质数据。据我国相关研究数据显示,这款模型的整体训练数据超过了3万亿Token,这使得它相较于同类模型表现更为突出。值得一提的是,Qwen-14B最大支持8k的上下文窗口长度,这意味着它可以更好地处理长文本输入,并生成更加精确的内容。此外,Qwen-14B-Chat是基于基座模型并通过精细的SFT得到的对话模型,借助于基座模型的强大性能,Qwen-14B-Chat在内容生成的准确性方面有了显著的提升。

阿里云开源通义千问140亿参数模型Qwen-14B及Qwen-14B-Chat免费商用:高性能对话模型引领AI潮流

Qwen-14B在十二个权威测评中全方位超越同规模SOTA大模型

阿里云官方表明,Qwen具备卓越的工具调用技能,能够协助开发者更迅速地搭建基于Qwen的Agent(智能体)。开发者可以利用简洁的指令教授Qwen运用繁复的工具,例如运用Code Interpreter工具展开Python编程以完成 intricate数学计算、数据分析以及图表绘制等任务;同时,也能打造拥有多文档问答、长文撰写等功能的“高级数字助理”。

在当前的AI应用开发与更新过程中,拥有百亿级参数规模的大语言模型已成为开发者的主流选择。据阿里云公布,其研发的Qwen-14B模型在提高小尺寸模型性能的同时,更在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12项权威测试中表现最为突出,超越了所有参测的SOTA(即当前最先进技术)大模型,包括超越Llama-2-13B,以及与Llama 2的34B、70B模型相比,其表现同样不落下风。值得一提的是,Qwen-7B也进行了全新升级,其核心指标最高提升了22.5%,展现了我国在AI领域的强大实力。

阿里云开源通义千问140亿参数模型Qwen-14B及Qwen-14B-Chat免费商用:高性能对话模型引领AI潮流

Qwen-14B性能超越同尺寸模型

当前,开源成为了我国大型模型的主流策略。《中国人工智能大模型地图研究报告》揭示,我国超过50%的自主研发大型模型已经实现开源,并且正在快速向通用型和专业型的大型模型两大地步推进。除了通义千问,由王小川创办的百川智能公司在短短一个月内就使通用型模型的参数规模翻了一番。继今年6月推出拥有70亿规模参数的Baichuan-7B开源模型之后,该公司又于7月开放了拥有130亿参数规模的Baichuan-13B模型。

大模型专业性较强,其应用会受到行业数据及适用范围的限制,这导致了不同开源模型的参数规模存在较大差距。今年5月,知乎已开源了具有100亿参数规模的CPM-Bee 10b模型,该模型在搜索场景中表现出色。而在金融领域,度小满在今年9月才开源了金融大模型“轩辕70B”,其参数量达到70B,且具有上下文长度高达8k的能力。

有专业人士强调,对于某些特定领域,即使模型参数量较低、通用能力较弱,只要拥有数十亿至百亿参数规模,结合垂直领域的数据,就能充分发挥其价值。对整个行业来说,开源大模型的出现,能够帮助用户简化和优化模型训练与部署流程。用户无需从零开始训练,只需下载已经预先训练好的模型并进行适当的微调,便可迅速构建出高质量的模型。这正是开源大模型推动各行各业发展的核心驱动力。

阿里云的CTO周靖人明确表示,阿里云将坚定不移地拥抱开源开放的策略,并致力于推动我国大型模型生态的建设。为了实现这一目标,阿里云主动承担起了建设我国最大AI模型开源社区——魔搭ModelScope的重任。在过去的两个月里,魔搭社区的模型下载量实现了显著增长,从4500万激增至8500万,涨幅高达近100%。这一成果充分展示了阿里云在推动我国AI技术发展方面的决心和行动力。

阿里云, 开源模型, 大模型, 语言模型

阿里云开源通义千问140亿参数模型Qwen-14B及Qwen-14B-Chat免费商用:高性能对话模型引领AI潮流

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© Copyright notes

Related posts

No comments

No comments...