文章主题:通义千问, AI模型社区, 魔搭ModelScope, Qwen-7B
近日,我国知名的开源AI模型社区魔搭ModelScope,宣布上架了两款全新的开源模型——Qwen-7B和Qwen-7B-Chat。这两款模型由通义千问团队开发,并且得到了阿里云的认证,作为通义千问70亿参数通用模型和对话模型,它们对外公开、免费且允许商用。值得一提的是,通义千问7B模型在多项权威评测中,表现出了超越国内外同类型模型的优异成果,堪称当前业界最强的中英文7B开源模型。
今年四月,阿里云推出自研大模型通义千问,引发了大量市场需求。值得一提的是,该公司此次推出了小型化模型版本,并将其开源,旨在降低模型使用的门槛。这将使得大量的中小企业以及AI开发者能够尽早、更快地应用通义千问。这一举措使阿里云成为我国首个加入大模型开源领域的大型科技企业,展现了其在人工智能领域的领导地位和雄心壮志。
Qwen-7B是一款具备多语言处理能力的基座模型,经过在超过2万亿token的数据集中进行训练,其上下文窗口长度可达8k。作为基于基座模型的中英文对话模型,Qwen-7B-Chat实现了与人类认知的无缝对接。该模型的开源代码能够支持对Qwen-7B和Qwen-7B-Chat的量化处理,让用户能够在消费级显卡上进行模型的部署和运行。
用户有两个途径可以获取和使用魔搭社区提供的模型:其一,可以直接从魔搭社区下载;其二,是通过阿里云灵积平台,访问并调用Qwen-7B或Qwen-7B-Chat。作为用户的全方位服务提供商,阿里云不仅提供模型训练、推理、部署和精调等服务,而且覆盖了模型使用的整个流程。
通义千问7B预训练模型在各种权威基准测试中展现了卓越的表现,其中文和英文能力不仅超过了我国和国际上的同规模开源模型,而且在某些方面甚至超越了包括12B和13B在内的更大规模的开源模型。
在英语能力测评基准MMLU中,通义千问7B模型表现卓越,其得分超过了众多主流开源模型,如12B、13B等,甚至超越了一众7B模型的表现。这一基准涵盖了57个学科的英文题目,旨在考核学生的人文素养、社会科学知识、理工科解决问题的综合能力。
在中文常识能力测评基准C-Eval上,通义千问在验证集和测试集中都是得分最高的7B开源模型,展现了扎实的中文能力。相比英文世界热闹的AI开源生态,中文社区缺少优秀的基座模型。通义千问的加入有望为开源社区提供更多选择,推动中国AI开源生态建设。
在数学解题能力评测GSM8K、代码能力评测HumanEval等基准上,通义千问7B模型也有不俗表现,胜过所有同等尺寸开源模型和和部分大尺寸开源模型。
阿里云表示,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。
开源生态对促进中国大模型的技术进步与应用落地至关重要。今年7月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等全方位服务。2022年阿里云牵头发起AI模型社区魔搭,以AI模型为核心服务AI开发者。目前,魔搭聚集了20多家顶尖人工智能机构贡献的1000多款开源模型,已经成为中国大模型开源第一门户。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!