经济观察网 记者 钱玉娟
9月25日午后,我国知名云计算服务商阿里云正式公布两款全新人工智能模型——通义千问140亿参数模型Qwen-14B与Qwen-14B-Chat,并决定将这些模型向全社会免费开放,供公众免费商用。阿里云方面表示,自今年7月份推出70亿参数的Qwen-7B等模型以来,短短一个月的时间里,其下载量已经突破了百万级别。目前,用户已经可以通过中国大模型开源社区魔搭社区的网站,直接下载和使用14B模型。同时,用户还可以通过阿里云的灵积平台,方便地访问和调用这些强大的AI模型。
据相关报道,阿里云的灵积平台不仅拥有自家的通义千问大模型,同时还兼容并托管了包括百川、姜子牙、Stable Diffusion以及ChatGLM-v2在内的多行业大模型。
我们是一个致力于构建开放、共享的模型社区的团队,我们的目标是为广大开发者和企业提供更多元化的选择。阿里云CTO周靖人在接受经济观察网记者采访时表示,目前他们所提供的模型还处于基础阶段,与实际应用场景之间仍存在一定距离。周靖人强调,团队的核心任务并非仅仅构建模型,更重要的是协助开发者和企业充分利用这些模型,以实现其真正的价值。
因此,通义千问决定开源自研大模型,以便为开发者和企业提供更多的选择。周靖人强调:“我们可以根据不同的应用场景和实际需求,选择不同规模和效能的模型,并将其应用于开发环境中。”
随着模型参数、整体容量和能力的逐步优化与提升,14B模型相较于7B模型在部分长尾领域将展现出更为显著的认知能力和推理技巧。周靖人强调:“在模型微调及应用方面,14B模型具备更高的性价比。”
不只是阿里云走上了大模型开源之路,全球以及中国市场上很多厂商都在做出这一选择,IDC中国高级分析师程荫称,“模型开源会让更多的人接触到大模型技术,从而降低技术学习和使用的门槛和成本,促进大模型在行业内的广泛应用。”
行业开源开放确实是趋势,但“让AI更普惠”这句话在周靖人看来,实现起来并不容易。
“只做开源也不行,不做开源更不行。”周靖人强调,当下大模型生态需要在技术创新的同时也要更及时地触达中小企业和个人开发者。
“未来可能会形成一种开源模型和商业模型并存的格局。”程荫分析,开源模型会促进更多生态的形成,降低训练模型的巨大成本,为创业型企业、开发者们带来更多机会。
阿里云, 开源模型, 大模型, 人工智能