阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat免费可商用

通义千问12mos agoupdate lida
96 0 0

文章标签:阿里云, 开源模型, 大语言模型, Qwen-14B

近日,阿里云开源项目“通义千问”宣布推出两款具有强大实力的新模型:Qwen-14B及其对话模型Qwen-14B-Chat。这两款模型具备140亿参数大模型的实力,且已可以向商用领域免费提供。值得一提的是,Qwen-14B在多项权威评测中表现优异,甚至在某些指标上达到了接近Llama2-70B的水平。在此之前,阿里云已经成功开源了70亿参数的Qwen-7B模型,并在短短一个多月的时间里,获得了超过100万的下载量,赢得了开源社区的高度认可和赞誉。

Qwen-14B是一款高性能开源模型,能够支持多种语言,相较于其他同类模型,它使用了更多的高质量数据进行训练,整个训练数据超过了3万亿Token,这使得该模型具备了更强大的推理、认知、规划和记忆能力。此外,Qwen-14B最大支持8k的上下文窗口长度,可以更好地处理长文本输入。

阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat免费可商用

打开凤凰新闻,查看更多高清图片

图1:Qwen-14B在十二个权威测评中全方位超越同规模SOTA大模型

Qwen-14B-Chat是一款基于基座模型并通过精细的SFT技术加以优化的对话生成模型。得益于基座模型的卓越性能,Qwen-14B-Chat在内容生成的精确性方面有了显著的提升,同时也更贴近人类的喜好。此外,该模型还能在内容创作方面带来更多的想象空间和丰富的表现形式。

Qwen是一款卓越的工具调用专家,它能够让开发者迅速地构建基于Qwen的智能体。通过简单的指令,开发者就可以教授Qwen如何运用各种复杂工具,例如使用Code Interpreter工具来执行Python代码,从而进行繁琐的数学计算、数据分析和图表绘制等任务。此外,Qwen还能够开发出具备多文档问答以及长文撰写等功能的“高级数字助理”。

在当前的AI应用开发与更新领域,拥有百亿参数级别的强大语言模型已成为开发者和研究人员的主要选项。其中,Qwen-14B模型在小型模型领域的性能表现尤为突出,它从众多同类型模型中脱颖而出,以卓越的性能在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12项权威测试中取得最佳成绩,超越了所有评测中的SOTA(最先进技术)大模型,包括超越Llama-2-13B,以及与Llama 2的34B、70B模型相比,其表现同样不逊色。此外,Qwen-7B模型也进行了全新的升级,其核心指标最高提升了22.5%,展现了强大的性能提升空间和出色的研发实力。

阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat免费可商用

图2:Qwen-14B性能超越同尺寸模型

用户可以轻松地从魔搭社区获取所需的模型,同时,通过阿里云的灵积平台,他们也可以方便地访问和调用Qwen-14B以及Qwen-14B-Chat。作为一家致力于为用户提供全方位服务的公司,阿里云不仅提供模型训练、推理、部署和精调等服务,而且完全符合用户的需求。

在 August 月份,阿里云开源通义千问70 亿参数基座模型 Qwen-7B 成功登上 Hugging Face 和 Github 的 trending 榜单。仅仅一个月多的时间,其累计下载量已经突破了 100 万。在开源社区中,基于 Qwen 的模型数量超过了 50 个,而且包括了许多知名工具和框架在内的集成。这一成果展示了我国人工智能技术的最新进展和广泛应用,进一步推动了人工智能领域的发展。

阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat免费可商用

通义千问是中国大型语言模型中最具影响力和广泛应用的一个,已经在国内外众多领域得到广泛应用,其用户数量不断增长。在国内,已有许多个月活过亿的应用成功接入通义千问,包括阿里巴巴集团的淘宝、钉钉、未来精灵等知名产品,以及各种科研机构和创业公司。通义千问的出现,不仅为企业和个人提供了更加智能化的解决方案,同时也推动了人工智能技术的发展和应用,成为了中国人工智能领域的标志性事件。

浙江大学联合高等教育出版社基于Qwen-7B开发了智海-三乐教育垂直大模型,已在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力,模型已在阿里云灵积平台对外提供服务,一行代码即可调用;浙江有鹿机器人科技有限公司在路面清洁机器人中集成了Qwen-7B,使机器人能以自然语言与用户进行实时交互,理解用户提出的需求,将用户的高层指令进行分析和拆解,做高层的逻辑分析和任务规划,完成清洁任务。

阿里云CTO周靖人表示,阿里云将持续拥抱开源开放,推动中国大模型生态建设。阿里云笃信开源开放的力量,率先开源自研大模型,希望让大模型技术更快触达中小企业和个人开发者。

阿里云还牵头建设了中国最大的AI模型开源社区魔搭ModelScope,团结全行业的力量,共同推动大模型技术普惠和应用落地。过去两个月内,魔搭社区的模型下载量从4500万飙升到8500万,增幅接近100%。

阿里云, 开源模型, 大语言模型, Qwen-14B

© Copyright notes

Related posts

No comments

No comments...