文章主题:开源大模型, 通义千问, 千行百业, 创新方向
开源大模型风起云涌 通义千问的关键一役
在经历了热情洋溢且紧张刺激的“百模大战”之后,大型模型如何为各行各业提供赋能,已经成为新的创新趋势。在这个过程中,许多开发者和创业公司正积极投身于开源大模型的研究和应用,努力开发出属于他们自己的模型和应用方案。
例如,个人开发者陶佳运用通义千问(Qwen)开源模型,构建了文档问答相关的应用,并尝试探讨大模型在电力领域中的多种应用可能性。同时,华东理工大学的薛栋团队也借助开源的通义千问基座模型,研发出了心理健康大模型MindChat(漫谈)。此外,有鹿机器人的创始人兼CEO陈俊波,则依靠自主研发的第二代具身智能技术LPLM大模型,构建了一个软硬件高度适配且具有泛化能力的通用智能大脑。
在此过程中,诸如阿里云等科技巨头,通过利用开源基础大模型,向个人开发者、科研团队、初创公司以及大型和中型企業提供了丰富的開發工具。这些举措有力地推动了大模型技術的普及和實際應用,从而促進了中國大模型生態系統的繁榮發展。
开源大模型掀起开发潮
就职于中国能源建设集团浙江省电力设计院有限公司者陶佳,是开源大模型的一名个人开发者。
在探索开源模型的过程中,陶佳采取了一种节省成本的方法。她选择在家中购买一台服务器,并配置三四块显卡,这样的投入相对较低。接下来,她下载了Qwen并将其部署在服务器上运行。为了实现更广泛的应用,她还搭建了一个FRP反向代理,这使得她能够通过外部网络访问家庭服务器。此外,她在工作中利用通义千问进行实验,进一步拓展了自己的技术领域。总的来说,陶佳通过这种节省成本的方式,实现了高效的开源模型使用,并在工作和生活中都取得了良好的效果。
陶佳目前正在进行的工作是基于私有知识库的检索问答应用开发,该应用能够处理大量文本信息(数十万字乃至上百万字)。在这个项目中,用户会提供一个特定的英文文档作为输入,然后大模型将根据文档目录来回答问题,指出答案所在的具体目录项。
作为华东理工大学·X-D Lab(心动实验室)的一名00后成员,颜鑫带领着他的科研团队,致力于开发一系列具有针对性的垂直领域大模型。他们以开源的通义千问基座模型为基础,成功研发出了三款功能强大的大模型,分别是心理健康大模型MindChat(漫谈)、医疗健康大模型Sunsimiao(孙思邈)以及教育/考试大模型GradChat(锦鲤)。这些大模型的开发,不仅展现了颜鑫团队在人工智能领域的技术实力,更为各类用户提供了一个更加精准、个性化的服务体验。
MindChat是一款具有人工智能技术的心理咨询工具,它像是一位智能的心理咨询师,能够帮助用户解决各种心理困扰。无论是工作中遭受老板的批评,还是学习过程中遇到的困难,如撰写论文等,用户都可以向MindChat寻求帮助。更值得一提的是,MindChat还支持语音输入,让用户在使用时更加便捷。颜鑫先生这样评价道。
在医疗与心理领域,隐私保护尤为重要,因此许多客户都倾向于采用私有化部署。为了满足这一需求,我们选择了开源模型。颜鑫回忆道,在Qwen出现之前,他们曾尝试过多种模型,例如ChatGLM、Baichuan和InternLM。随着Qwen-7B和14B的推出,他们迅速展开试验,并利用内部数据以及自定义的benchmark进行了评估。在他们所涉及的场景中,通义千问成为所有开源模型中表现最为优秀的,堪称当前最佳选择。
陈俊波,有鹿机器人的创始人和首席执行官,一直致力于推动开源大模型的开发和商业化进程。在我国,有几千家专业设备制造企业,却往往缺乏开发人工智能系统的实力。为了改变这一现状,有鹿机器人积极投身于开源大模型的研究和应用,其目标是为每一个专业设备提供一个通用的AI大脑,从而推动我国人工智能技术的广泛应用和发展。
举例来看,在清洁行业,物业经理说“在一号楼门前有一个可乐瓶,你过来扫一扫”。有鹿机器人在路面清洁机器人中集成Qwen-7B,使机器人能以自然语言与用户进行实时交互,理解用户提出的需求,将用户的高层指令进行分析和拆解,做高层的逻辑分析和任务规划,完成清洁任务。
随着越来越多的开发者和企业加入到开源模型阵营,开源模型的生态逐渐形成气候,“高质量开源基础大模型-大模型优化-AI应用创新”的商业化落地发展路径也变得清晰起来。
为什么选择开源大模型?
2023年,是AI大模型快速发展的一年。伴随ChatGPT的横空出世,国产大模型的数量也快速增长,数据显示,截至今年10月,国内已发布238个大模型。
目前,大模型行业主要有两条技术路线,一个是以OpenAI的GPT4.0为代表的闭源路线,马斯克曾评价其一点也不Open,一条是以Meta的Llama2、阿里QWen等为代表的开源路线,后者在创投领域更受追捧。
百模大战当前胜负未分,开源、开放、开发者,或是当下能最大限度激发创业热情的连接方式。
“我们没有资源从头训练一个基座模型,选模型的第一个考量就是,它背后的机构能不能给模型很好的背书,能不能持续投入基座模型及其生态建设,为跟风、吃红利而生的大模型不可持续。”颜鑫分享称,他希望选择主流的、稳定的模型架构,它能最大限度发挥生态的力量,匹配上下游的环境。
开源大模型可以帮助用户简化模型训练和部署的过程,使得用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型或进行相应的应用开发。
而在陈俊波看来,他需要的不是一个一成不变的、智能性水平的大语言模型,而是随着数据的积累,能变得越来越聪明的大语言模型。闭源大模型显然做不到这一点。所以在他们的业态里面,终局一定是开源模型。
同时,未来速度联合创始人兼CEO秦续业提出,开源大模型在B端大有可为,企业级用户更在意的是能不能解决问题,而非要求模型能力面面面俱到。开源大模型更可控、定制化强、更具性价比。具体而言,经过简单微调,开源大模型能满足很多B端场景需求,同时开源大模型推理成本大约只有闭源收费大模型的1/50。
通义千问助力生态繁荣
大模型开源之风渐起。优质大模型的开源有助于促进中国大模型的技术进步与应用落地,推动大模型技术普惠。然而,目前国内市面上有100多个大模型,只有少数是高质量开源的。
此前,中国大模型市场暂未出现足以对捍Llama 2-70B的优质开源模型。12月1日,阿里云开源通义千问720亿参数模型Qwen-72B,填补了国内空白,大中型企业可基于Qwen-72B开发商业应用,高校、科研院所可基于Qwen-72B开展AI for science等科研工作。
此外,阿里云同步开源了通义千问18亿参数模型Qwen-1.8B和通义千问音频大模型Qwen-Audio,至此,通义千问开源光谱覆盖18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。
作为国内最早开源自研大模型的科技公司之一,阿里云对打造大模型开源生态不遗余力,如今,补齐开源大模型的最后一片拼图,是通义千问的关键一役。
阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!