通义千问：阿里云发布720亿参数开源大模型，引领AI技术新潮流

通义千问2yrs ago (2024)update lida

142 0 0

文章主题：通义千问, 阿里云, Qwen-72B, 人工智能

在12月1日的阿里云通义千问发布会上，我们见证了开源通义千问720亿参数模型的诞生，名为Qwen-72B。这款模型在10个权威基准测试中取得了最佳成绩，其性能甚至超过了国际开源标杆Llama 2-70B以及众多商用闭源模型。这标志着，在未来，无论是企业级还是科研级的高性能应用，都有了开源大模型这一选择。

据报道，Qwen-72B模型依托于3T token高质量数据训练，成功在10个权威基准评估中脱颖而出，成为开源模型中的佼佼者，甚至在某些评估中超越了闭源的GPT-3.5和GPT-4。在英语任务领域，Qwen-72B在MMLU基准测试中荣获开源模型的最高分数；而在中文任务方面，该模型在C-Eval、CMMLU、GaokaoBench等多个基准榜单中名列前茅，其得分甚至超过了GPT-4。在数学推理领域，Qwen-72B在GSM8K、MATH测评中表现卓越，远超其他开源模型。而在代码理解能力方面，Qwen-72B在HumanEval、MBPP等测评中的表现也显著提升，其代码能力实现了跨跃式发展。

据报道，Qwen-72B能够处理长度达到32k的长文本输入，这一性能在长文本理解测试集LEval中超过了ChatGPT-3.5-16k的表现。为了使Qwen-72B能够更好地被下游应用集成，研发团队对其指令遵循和工具使用等技能进行了优化。例如，Qwen-72B配备了强大的系统指令（System Prompt）功能，用户只需给出一个提示词，就可以定制AI助手，让大模型扮演特定角色或执行特定回复任务。

此前，我国的大模型市场尚无能够与Llama 2-70B相媲美的优质开源模型。然而，Qwen-72B的开源发布，填补了国内高性能、高可控和高性价比的开源大模型领域的空白，为国内开发者提供了与商业闭源大模型相媲美的选择。借助Qwen-72B，大中型企业可以开发商业应用，而高校和科研机构则可以开展AI for Science（科学智能）等科研活动。

在开源大模型领域，Qwen-72B以其“向上摸高”的卓越表现，引领着行业在模型尺寸和性能上的提升；而Qwen-1.8B则以“向下探底”的创新精神，成为了我国尺寸最小、性能卓越的开源大模型。其独特之处在于，它能够在推理2K长度文本内容时，仅需3G显存，便可以实现消费级终端的部署。这就是通义千问，一个拥有18亿、70亿、140亿以及720亿参数规模的“全尺寸开源”大模型，它的出现，无疑将开启我国人工智能技术的新篇章。

阿里云CTO周靖人强调，开源生态对于推动我国大型模型技术的提升和应用实践的落实具有至关重要的作用。通识千问将不断加大在开源领域的投入力度，致力于成为“AI时代最具开放性的大型模型”，携手合作伙伴共建大模型生态体系。

根据天眼查APP的信息，我们可以看到，阿里云的母公司是阿里云计算有限公司，这家公司于2008年创立，作为阿里巴巴集团的一员，它坐落在浙江省杭州市。阿里云计算有限公司主要从事软件和信息技术服务业务，并且其注册资本和实缴资本都非常雄厚，达到100000万人民币和5000万人民币 respectively. 此外，该公司在2015就已经完成了一次战略融资，交易金额高达60亿人民币。