经济观察网 记者 钱玉娟
9月25日午后,我国知名云计算服务商阿里云正式公布两款全新人工智能模型——通义千问140亿参数模型Qwen-14B与Qwen-14B-Chat,并决定将其向全社会免费开放,供公众免费商用。阿里云方面表示,自70亿参数的Qwen-7B等模型开源以来,仅用了短短半个月时间,其下载量便已经突破了百万量级。现在,用户只需在中国大模型开源社区魔搭社区内,或通过阿里云的灵积平台,即可直接下载和使用14B模型。
我们是一个致力于构建开源模型的技术社群,旨在为广大开发者和企业提供更多选择。阿里云CTO周靖人在接受经济观察网记者采访时表示:“目前我们仅提供一个非常基础的模型,离实际应用场景仍有一定距离。”他强调,团队的核心任务在于协助开发者和企业充分利用这些模型。
因此,通义千问决定开源自研大模型,以便为开发者和企业提供更多选择。周靖人强调:“根据具体应用场景的需求,用户可以在自己的开发环境中选择不同规模的大模型。”
随着模型参数、整体容量和能力的逐步优化与提升,14B模型相较于7B模型在部分长尾领域将展现出更为显著的认知能力和推理技巧。周靖人强调:“在模型微调及应用方面,14B模型具备更高的性价比。”
不只是阿里云走上了大模型开源之路,全球以及中国市场上很多厂商都在做出这一选择,IDC中国高级分析师程荫称,“模型开源会让更多的人接触到大模型技术,从而降低技术学习和使用的门槛和成本,促进大模型在行业内的广泛应用。”
行业开源开放确实是趋势,但“让AI更普惠”这句话在周靖人看来,实现起来并不容易。
“只做开源也不行,不做开源更不行。”周靖人强调,当下大模型生态需要在技术创新的同时也要更及时地触达中小企业和个人开发者。
“未来可能会形成一种开源模型和商业模型并存的格局。”程荫分析,开源模型会促进更多生态的形成,降低训练模型的巨大成本,为创业型企业、开发者们带来更多机会。
阿里云, 开源模型, 大模型, 人工智能