文章主题:阿里云, 大模型, 通义千问, AI模型
经济观察网 记者 钱玉娟
在全球范围内,大型开源模型体系的推出及商业化的实施取得了巨大成功。紧接着这一趋势,我国知名科技巨头阿里巴巴集团的子公司阿里云在8月3日对外宣称,其自主研发的大模型通义千问已经正式开源,这使得它成为了我国首个公开宣布大模型开源的大型互联网科技公司。值得一提的是,通义千问的70亿参数通用模型Qwen-7B以及对话模型Qwen-7B-Chat都已经上架到AI模型社区魔搭ModelScope,向公众提供开源、免费且可商用的服务。
据深度了解,魔搭社区由阿里云于2022年主导创建,这是一个专注于AI模型的开放社区,旨在服务于AI开发者和爱好者。据官方统计数据显示,目前魔搭社区已汇集了来自超过20家人工智能机构的约1000多款开源模型,这使得它成为了我国最大的AI模型开源门户。
在六月份之前,由王小川创立的百川智能人工智能创新科技公司,先后推出了两个大规模参数模型——Baichuan-7B和Baichuan-13B,这两个模型的参数规模分别达到了70亿和130亿。这使得百川智能成为了我国首个推出完全开源、免费可商用的大模型创业公司,展现了其在人工智能领域的领先地位。
以飞鲸开发者视角观察,尽管通义千问开源模型参数仅为70亿,但在经过微调之后,其数学推理能力呈现出令人满意的表现。对于诸如加减乘除等常见应用题型,模型能够给出相对准确的答案。
在通义千问开源的消息发布后,用户和应用开发者现在可以方便地获取和使用Qwen-7B和Qwen-7B-Chat这两个模型。他们不仅可以在魔搭社区直接下载这些模型,还可以通过阿里云灵积平台进行访问和调用。在用户使用这个全面的开源大模型体系的过程中,阿里云将提供包括模型训练、推理、部署、精调等一系列全方位的服务。
在今年四月份,我们推出了一款名为通义千问的自研大模型产品。仅仅过去了两个月,阿里巴巴云计算平台就宣布将其作为首要目标,致力于推动我国大模型生态的蓬勃发展。为了实现这一目标,阿里云将为大模型创业公司提供一系列支持,包括智能算力和开发工具等关键资源。
谈及当前国内外开源的模型,飞鲸认为对包括他在内的开发者们帮助极大,“可以基于自己的业务领域需求,做finetune(微调)或者和本地知识库对接,实现快速地业务落地。”
飞鲸告诉记者,在一些垂直领域并不需要参数量很高、通用能力很强的模型,而是“希望一些小甜点”,他举例到,比如几十到百亿左右参数规模的模型,结合垂直领域数据,就可以发挥很好的价值。
阿里云方面认为,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!