周靖人:通义千问2.0性能超GPT-3.5 模型参数达千亿级新京报2023-10-31 20:33新京报2023-10-31 20:33

通义千问10mos agoupdate lida
85 0 0
新京报贝壳财经讯(记者罗亦丹)10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。阿里云CTO周靖人介绍,在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。目前,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。
过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。根据在多个主流测评集上的测试结果,目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
通义千问2.0在指令遵循、工具使用、精细化创作等方面也进行了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
此外,基于通义大模型训练的8大行业模型组团上线,分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融软件开发等领域的落地。
周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。
编辑 岳彩周
校对 翟永军
举报/反馈

© Copyright notes

Related posts

No comments

No comments...