通义千问：开源大模型助力中国AI生态繁荣

通义千问2yrs ago (2024)update lida

173 0 0

文章主题：通义千问, 开源, 模型, 人工智能

666ChatGPT办公新姿势，助力做AI时代先行者！

分享一个好消息——通义千问，开源了！

昨天，通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat上架魔搭，两款模型均开源、免费、可商用。

通义千问：开源大模型助力中国AI生态繁荣

今年四月，阿里云推出自研大模型通义千问，引发了大量市场需求。最近，该公司的最小型模型版本已开源，这将有助于降低模型使用的门槛，使更多的中小企业和AI开发者能够尽早、更快地应用通义千问。

Qwen-7B是支持中、英等多种语言的基座模型，在超过2万亿token数据集上训练，上下文窗口长度达到8k。

Qwen-7B-Chat是基于基座模型的中英文对话模型，已实现与人类认知对齐。

作为一位文章写作高手，我将重新组织原文内容，并确保其长度不短于原文。在此过程中，我将保持语言的专业性和表达的准确性。对于Qwen-7B和Qwen-7B-Chat的开源代码支持，我们可以看到它为用户提供了在消费级显卡上部署和运行模型的便利性。用户可以选择在魔搭社区中下载模型并将其本地部署，或者直接在魔搭平台上启动阿里云机器学习平台PAI，从而在云端对模型进行微调、部署和推理。这样的设计不仅提高了用户的体验，还为那些没有足够计算资源的用户提供了方便。

若开发者在开启产品时希望立即运用Qwen-7b和Qwen-7b-chat，我们可以通过阿里云的模型API平台——灵积来进行测试调用通义千问API。阿里云提供了一站式的服务，涵盖了模型下载、训练、部署和推理等各个方面，为用户提供了极大的便利。

通义千问7B预训练模型在各种权威基准测试中展现了卓越的表现，其中文和英文能力不仅超过了我国和国际上的同规模开源模型，而且在某些方面甚至超越了包括12B和13B在内的更大规模的开源模型。

在英语能力测评基准MMLU中，通义千问7B模型表现卓越，其得分超过了众多主流开源模型，如12B、13B等，甚至超越了一众7B模型。这一基准涵盖了57个学科的英文题目，旨在考核学生的人文素养、社会科学知识、理工科问题解决能力等多方面的综合素质。

在C-Eval中文常识能力测评基准中，通义千问模型在验证集和测试集中均取得了最高的7B分数，充分展示了其扎实的中文处理能力。相较于英文世界的繁荣AI开源生态，我国中文社区尚缺乏优秀的基座模型。通义千问模型的出现，有望为开源社区带来更多选择，进而推动我国AI开源生态的建设与发展。

通义千问：开源大模型助力中国AI生态繁荣

在数学解题能力评测GSM8K、代码能力评测HumanEval等基准上，通义千问7B模型也有不俗表现，胜过所有同等尺寸开源模型和和部分大尺寸开源模型。

开源大模型可以帮助用户简化模型训练和部署的过程，用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型。

开源生态对促进中国大模型的技术进步与应用落地至关重要。今年7月，阿里云宣布将促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供智能算力、开发工具等全方位服务。2022年阿里云牵头发起AI模型社区魔搭，以AI模型为核心服务AI开发者。目前，魔搭聚集了20多家顶尖人工智能机构贡献的1000多款开源模型。

*开源地址：

魔搭ModelScope：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen

GitHub：https://github.com/QwenLM/Qwen-7B

/ END /