titled:开源大模型风起云涌：通义千问关键一战与千行百业赋能

通义千问2yrs ago (2024)update lida

146 0 0

文章主题：开源大模型, 通义千问, 千行百业, 创新方向

开源大模型风起云涌通义千问的关键一役

在经历了热情洋溢且紧张刺激的“百模大战”之后，大型模型如何为各行各业提供赋能，已经成为新的创新趋势。在这个过程中，许多开发者和创业公司正积极投身于开源大模型的研究和应用，努力开发出属于他们自己的模型和应用方案。

例如，个人开发者陶佳运用通义千问（Qwen）开源模型，构建了文档问答相关的应用，并尝试探讨大模型在电力领域中的多种应用可能性。同时，华东理工大学的薛栋团队也借助开源的通义千问基座模型，研发出了心理健康大模型MindChat（漫谈）。此外，有鹿机器人的创始人兼CEO陈俊波，则依靠自主研发的第二代具身智能技术LPLM大模型，构建了一个软硬件高度适配且具有泛化能力的通用智能大脑。

在此过程中，诸如阿里云等科技巨头，通过利用开源基础大模型，向个人开发者、科研团队、初创公司以及大型和中型企業提供了丰富的開發工具。这些举措有力地推动了大模型技術的普及和實際應用，从而促進了中國大模型生態系統的繁榮發展。

titled:开源大模型风起云涌：通义千问关键一战与千行百业赋能

开源大模型掀起开发潮

就职于中国能源建设集团浙江省电力设计院有限公司者陶佳，是开源大模型的一名个人开发者。

在探索开源模型的过程中，陶佳采取了一种节省成本的方法。她选择在家中购买一台服务器，并配置三四块显卡，这样的投入相对较低。接下来，她下载了Qwen并将其部署在服务器上运行。为了实现更广泛的应用，她还搭建了一个FRP反向代理，这使得她能够通过外部网络访问家庭服务器。此外，她在工作中利用通义千问进行实验，进一步拓展了自己的技术领域。总的来说，陶佳通过这种节省成本的方式，实现了高效的开源模型使用，并在工作和生活中都取得了良好的效果。

陶佳目前正在进行的工作是基于私有知识库的检索问答应用开发，该应用能够处理大量文本信息（数十万字乃至上百万字）。在这个项目中，用户会提供一个特定的英文文档作为输入，然后大模型将根据文档目录来回答问题，指出答案所在的具体目录项。

作为华东理工大学·X-D Lab（心动实验室）的一名00后成员，颜鑫带领着他的科研团队，致力于开发一系列具有针对性的垂直领域大模型。他们以开源的通义千问基座模型为基础，成功研发出了三款功能强大的大模型，分别是心理健康大模型MindChat（漫谈）、医疗健康大模型Sunsimiao（孙思邈）以及教育/考试大模型GradChat（锦鲤）。这些大模型的开发，不仅展现了颜鑫团队在人工智能领域的技术实力，更为各类用户提供了一个更加精准、个性化的服务体验。

titled:开源大模型风起云涌：通义千问关键一战与千行百业赋能

MindChat是一款具有人工智能技术的心理咨询工具，它像是一位智能的心理咨询师，能够帮助用户解决各种心理困扰。无论是工作中遭受老板的批评，还是学习过程中遇到的困难，如撰写论文等，用户都可以向MindChat寻求帮助。更值得一提的是，MindChat还支持语音输入，让用户在使用时更加便捷。颜鑫先生这样评价道。

在医疗与心理领域，隐私保护尤为重要，因此许多客户都倾向于采用私有化部署。为了满足这一需求，我们选择了开源模型。颜鑫回忆道，在Qwen出现之前，他们曾尝试过多种模型，例如ChatGLM、Baichuan和InternLM。随着Qwen-7B和14B的推出，他们迅速展开试验，并利用内部数据以及自定义的benchmark进行了评估。在他们所涉及的场景中，通义千问成为所有开源模型中表现最为优秀的，堪称当前最佳选择。

陈俊波，有鹿机器人的创始人和首席执行官，一直致力于推动开源大模型的开发和商业化进程。在我国，有几千家专业设备制造企业，却往往缺乏开发人工智能系统的实力。为了改变这一现状，有鹿机器人积极投身于开源大模型的研究和应用，其目标是为每一个专业设备提供一个通用的AI大脑，从而推动我国人工智能技术的广泛应用和发展。

举例来看，在清洁行业，物业经理说“在一号楼门前有一个可乐瓶，你过来扫一扫”。有鹿机器人在路面清洁机器人中集成Qwen-7B，使机器人能以自然语言与用户进行实时交互，理解用户提出的需求，将用户的高层指令进行分析和拆解，做高层的逻辑分析和任务规划，完成清洁任务。

titled:开源大模型风起云涌：通义千问关键一战与千行百业赋能

随着越来越多的开发者和企业加入到开源模型阵营，开源模型的生态逐渐形成气候，“高质量开源基础大模型-大模型优化-AI应用创新”的商业化落地发展路径也变得清晰起来。

为什么选择开源大模型？

2023年，是AI大模型快速发展的一年。伴随ChatGPT的横空出世，国产大模型的数量也快速增长，数据显示，截至今年10月，国内已发布238个大模型。

目前，大模型行业主要有两条技术路线，一个是以OpenAI的GPT4.0为代表的闭源路线，马斯克曾评价其一点也不Open，一条是以Meta的Llama2、阿里QWen等为代表的开源路线，后者在创投领域更受追捧。

百模大战当前胜负未分，开源、开放、开发者，或是当下能最大限度激发创业热情的连接方式。

“我们没有资源从头训练一个基座模型，选模型的第一个考量就是，它背后的机构能不能给模型很好的背书，能不能持续投入基座模型及其生态建设，为跟风、吃红利而生的大模型不可持续。”颜鑫分享称，他希望选择主流的、稳定的模型架构，它能最大限度发挥生态的力量，匹配上下游的环境。

开源大模型可以帮助用户简化模型训练和部署的过程，使得用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型或进行相应的应用开发。

而在陈俊波看来，他需要的不是一个一成不变的、智能性水平的大语言模型，而是随着数据的积累，能变得越来越聪明的大语言模型。闭源大模型显然做不到这一点。所以在他们的业态里面，终局一定是开源模型。

titled:开源大模型风起云涌：通义千问关键一战与千行百业赋能

同时，未来速度联合创始人兼CEO秦续业提出，开源大模型在B端大有可为，企业级用户更在意的是能不能解决问题，而非要求模型能力面面面俱到。开源大模型更可控、定制化强、更具性价比。具体而言，经过简单微调，开源大模型能满足很多B端场景需求，同时开源大模型推理成本大约只有闭源收费大模型的1/50。