《阿里云通义千问70亿参数模型开源，引领大厂模型转变》

通义千问1yrs ago (2023)update lida

120 0 0

原标题：阿里云发布通义千问开源模型，打响大厂开源第一枪 | 最前线

作者 | 周愚

编辑 | 邓咏仪

在这场国内大模型的“百模大战”中，开源生态正在日趋活跃。

在8月3日这个美好的日子里，我国AI模型社区魔搭ModelScope迎来了一位重要的客人——阿里云。它带来了一款令人振奋的消息：Qwen-7B和Qwen-7B-Chat这两款开源模型正式上线。经过阿里云的严格认证，这两款模型被确定为通义千问70亿参数通用模型和对话模型。值得关注的是，这两款模型已经对外公开，并且完全免费，可以供广大商业用户随意使用。这是一个令人感到鼓舞的时刻，也是我国AI技术发展史上的一次重要突破。

至此，阿里云称已经成为国内首个开源自家大模型的大型科技企业。

《阿里云通义千问70亿参数模型开源，引领大厂模型转变》

来源：阿里云

在具体的参数设置方面，Qwen-7B基座模型能够兼容中英文等多语种，经过在超过2万亿token的数据集中进行训练，其上下文窗口长度可达8k。此外，该模型还具备开源代码支持，可以实现对Qwen-7B以及Qwen-7B-Chat的量化处理。这使得用户能够在消费级显卡上进行模型的部署和运行。

用户有两个途径可以获取和使用魔搭社区提供的模型：其一，可以直接从魔搭社区下载；其二，是通过阿里云灵积平台，访问并调用Qwen-7B或Qwen-7B-Chat。阿里云提供一站式服务，涵盖了模型训练、推理、部署以及精调等环节。

原内容主要表达了开源作为对比闭源模型的有效途径这一观点，并以 Meta 旗下的 Llama 2 为例，说明其在上个月开源并免费商用后，被广泛认为是当前最强大的开源大模型。在此基础上，我们可以从以下几个方面对原文进行改写和扩展，使其表达更为丰富和准确。开源作为一种有效的技术发展路径，正逐渐成为与闭源模型竞争的有力手段。近年来，随着人工智能技术的飞速发展，各类大模型如雨后春笋般涌现，其中，由 Meta 公司推出的 Llama 2 更是在上个月开源并免费商用后，迅速崭露头角，被誉为“最强开源大模型”。这不仅标志着开源技术在人工智能领域的地位日益重要，同时也反映出其在大模型开发方面的巨大潜力。开源的魅力在于它能够汇聚全球范围内的智慧与力量，打破传统的闭源模式，实现更广泛、更深入的技术合作与创新。如今，越来越多的企业开始关注开源项目，将其视为提升自身技术实力的重要途径。而像 Llama 2 这样的优秀开源大模型，更是为众多开发者提供了丰富的学习资源与实践机会，进一步推动了人工智能领域的发展。总之，开源技术的崛起不仅为人工智能领域带来了新的机遇，也为各类企业和开发者提供了更多的发展可能。可以预见，在未来，随着更多优秀的开源大模型的诞生，人工智能将会在更多领域取得突破性的进展，从而推动整个科技行业的繁荣发展。

在我国，一些重要的AI模型，如百川智能的Baichuan-7B和清华大学与智谱AI的ChatGLM2-6B，已经成为了AI创业公司中一股不可忽视的力量。这些开源的行动，无疑对大型企业产生了深远的影响。在此之前，我国的许多大型企业倾向于不开放源代码。然而，现在，阿里巴巴的通义千问也开始开源，这无疑标志着大型企业对于大模型思考的一种转变。

其实，阿里云的开源战略早有端倪，为通义千问的开源做出了铺垫。

此次上架通义千问开源模型的魔搭ModelScope，是阿里云于去年11月初牵头发起的AI模型社区。目前，魔搭聚集了20多家人工智能机构贡献的1000多款开源模型，开发者数量超160万，模型下载量超2500万。

在今年6月举行的2023开放原子全球开源峰会上，阿里云还公布了“1+4”开源战略。除魔搭社区外，阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。

开源的同时，阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。

在英文能力测评基准MMLU上，通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上，通义千问在验证集和测试集中也都是得分最高的7B开源模型。

《阿里云通义千问70亿参数模型开源，引领大厂模型转变》

在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4，超过所有同等尺寸和部分大尺寸开源模型。来源：阿里云

附开源地址：

魔搭Model Scope：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen