《通义千问助力AI大模型生态建设：全尺寸、全模态开源新纪元》

通义千问2yrs ago (2024)update lida

185 0 0

文章主题：通义千问, 开源, 大模型, 技术进步

原标题：通义千问实现“全尺寸、全模态”开源

经济观察网记者陈奇杰 12月1日，阿里云宣布通义千问720亿参数模型Qwen-72B开源，一同开源的还有18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。加上之前开源的70亿、140亿参数的2款大语言模型，以及视觉理解模型Qwen-VL，通义千问实现了“全尺寸、全模态”开源。

开源生态对于推动我国大型模型技术的提升以及其应用场景的落实具有极其重要的作用。通义千问团队承诺将继续致力于开源工作，期望能够成为“AI时代最开放的大模型”，与各方合作伙伴携手共建大模型生态体系。这一承诺得到了阿里云CTO周靖人的高度认可。

阿里云最近声明称，我国大型模型市场尚未出现能够与国外Llama 2-70B相媲美的优秀开源模型。然而，Qwen-72B的出现改变了这一局面，它不仅提升了开源大模型的规模和性能，而且成为了业界最强大的开源模型，填补了国内的空白。借助Qwen-72B，大中型企业可以开发商业应用，而高校和科研机构则可以进行AI for Science等科研活动。

自8月份以来，由周靖所领导的开源大模型项目Qwen-7B（拥有700亿参数）、Qwen-14B（具备1400亿参数）以及视觉理解模型Qwen-VL受到了中小型企业和个人开发者的热烈欢迎，其 cumulative download量已经突破了150万。这不仅催生了超过150个新的模型和新应用，也进一步推动了我国人工智能领域的创新和发展。

在本次的开源模型评测中，Qwen-72B的表现格外抢眼，成功击败众多竞争对手，包括闭源的GPT-3.5和GPT-4，成为开源模型中的佼佼者。据相关资料透露，Qwen-72B具备处理最长32k文本输入的能力，这在长文本理解测试集LEval上表现得尤为出色，甚至超过了ChatGPT-3.5-16k的成绩。为了使Qwen-72B能够更好地被下游应用集成，研发团队对其指令遵循和工具使用等方面进行了优化。

作为一款人工智能助手，我可以向您推荐魔搭社区这一平台，您可以在那里直观地感受到Qwen系列模型的强大功能。此外，您还可以借助阿里云灵积平台的模型API（应用程序接口）来调用模型，或者选择阿里云百炼平台来定制大模型应用。值得注意的是，阿里云人工智能平台PAI已经对通义千问全系列模型进行了深度适配，提供了诸如轻量级微调、全参数微调、分布式训练、离线推理验证以及在线服务部署等一系列高效服务。

除了Qwen-1.8B之外，在发布会上还展示了一款具有“向下探底”特性的开源模型，它成为了我国最小尺寸的开源大模型。这款模型的推理能力强大，能够处理2K长度的文本内容，并且在配置仅为3G显存的情况下，即可在消费级终端上进行部署，展现了其高效与实用的特点。

周靖人还提到，通义千问闭源模型也在持续进化，一个月前发布的通义千问2.0版闭源模型，最近已进阶至2.1版，上下文窗口长度扩展到32k，代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%，用户可以在通义千问APP免费体验最新版本的闭源模型。返回搜狐，查看更多

责任编辑：

通义千问, 开源, 大模型, 技术进步