文 | 苏建勋、邓咏仪、尚恩
🎉🎉智能涌现 late night learned that on August 31st, at midnight, the highly anticipated list of the first batch of large-scale model products was finally revealed. It includes both established companies and startups as well as research institutions. The specific corporate entities include:
五家北京企业机构:🔍百度(文心一言)、📱抖音(云雀大模型)、🤖智谱AI(GLM大模型)、💡中科院(紫东太初大模型)、💼百川智能(百川大模型)
三家上海企业机构:🤖 商汤(日日新大模型)、🤖 MiniMax(ABAB大模型)、🤖 上海人工智能实验室(书生通用大模型)。
在产品获得批准之后,那些属于上述企业机构的大模型产品,便可以在网站或应用商店中直接获取并使用。以百度所属的“文心一言”为例,经过智能涌现的测试,我们发现在8月30日的晚上23点左右,文心一言的应用已经可以向公众开放使用,在此之前,用户需要提前排队申请内测资格。
百度“文心一言”内测排队页面,目前已完全开放
在8月31日的凌晨,百度官方公众号立即发布了一则消息,宣布“文心一言”正式对社会公开。用户现在可以在应用商店中搜索并下载“文心一言APP”,或者直接访问“文心一言官网”来体验这一全新的AI应用。在未来,百度还将继续开放一系列经过深度改造的AI原生应用。
📣商汤科技官方宣布:其旗下的顶级聊天机器人应用“商量SenseChat”正式向所有用户提供全面开放的服务!这一消息的发布意味着广大用户可以尽情享受这款强大且实用的AI助手带来的便捷体验。从今天起,商汤SenseChat将更好地满足人们的需求,提供更加智能、高效的服务。
今年大模型爆火以来,监管层面一直有相关政策落地。生成式AI产品涉及用户数据安全,正式上线前除了要进行算法备案外,还需要向相关部门申报安全评估。
4月11日,国家互联网信息办公室发布的关于《生成式人工智能服务管理办法(征求意见稿)》提出,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。同时,利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。
6月20日,国家互联网信息办公室发布了关于深度合成服务算法备案信息的公告,公开发布境内深度合成服务算法备案信息。根据公告附件的清单,共有41个深度合成服务算法被纳入清单,涵盖美团、快手、淘宝、大麦、酷狗音乐、百度文心一格等多个热门应用。
从备案到获批上线,国内大模型企业终于有了明确的政策准入。率先获批的企业,可以优先推出面向To C广大用户的AI产品,这意味着在用户积累、数据获取与产品打磨上能占据主导权。
百度创始人、董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。
以下为首批获批上线的大模型企业介绍:
百度-文心一言大模型
百度“文心一言”为国内首个、全球大厂中首个生成式AI产品,于2023年3月16日开启邀测,基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居第一。
抖音集团-云雀大模型
8月17日,抖音集团(前字节跳动)宣布开始对外测试AI对话产品“豆包”。据悉“豆包”是基于抖音云雀模型开发,提供聊天机器人、写作助手以及英语学习助手等功能。目前支持网页Web平台、iOS 以及安卓平台,用户可通过手机号、抖音或者Apple ID登录使用。
智谱AI-GLM大模型
成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。
当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。
基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。
百川智能-百川大模型
百川成立于2023年,由搜狗创始人王小川创立。今年6月15日,百川智能推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。前不久,百川智能刚刚宣布推出新一代大模型Baichuan-53B。
中科院自动化研究所-紫东太初大模型
中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。
“紫东太初”目前参数已达千亿级别,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布2.0版本,再加入了视频、传感信号、3D点云等新的模态数据。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。
商汤-日日新大模型
今年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,其参数达千亿级规模。
Minimax-ABAB大模型
Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,推出自研通用大模型“ABAB”,以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。
Minimax也是如今国内估值最高的大模型初创公司之一。据路透6月报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。
上海人工智能实验室-书生大模型
上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。
2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。