通用大语言模型Baichuan-13B-Base及对话模型Baichuan-13B-Chat发布

AIGC与创业9mos agoupdate lida
118 0 0

文章主题:搜狗公司, 王小川, 百川智能, 通用大语言模型

666ChatGPT办公新姿势,助力做AI时代先行者!

本报记者 李昆昆 李正豪 北京报道

近期,搜狗公司前CEO王小川创立的百川智能正式推出了三款模型产品——通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat以及它们的量化版本INT4/INT8,其中参数量达到了130亿。

王小川表示,我国期望在大模型行业以及各个垂直领域的基础上,催生更多卓越的产品和行业应用。让技术在真实的、丰富的应用场景中迅速地进行迭代和创新。我们愿意与广大的企业和开发者共同为我国开源社区的生态繁荣贡献力量。

优势和劣势

如今,开发大型人工智能模型的公司众多,然而,要打造通用人工智能大模型却是一项耗资巨大的挑战。一位从事人工智能行业的专业人士在接受《中国经营报》记者采访时表示,虽然大模型领域的发展势头强劲,但最终能够脱颖而出的一般只有3-4家公司,其余的公司则将主要从事与这些头部公司相关的生态建设和应用实践。

在创业领域,尤其是大型模型创业公司,数据的获取以及算力的供应都成为了一项巨大的挑战,同时,训练的成本更是不菲。然而,OpenAI的情况有所不同,这家公司在上初期就得到了多家巨头的支持,这在当前的市场上是相当罕见的。由于这种特殊情况,使得OpenAI在创业公司的竞争中占据了优势地位,但这也意味着OpenAI需要自己承担更多的责任与挑战,毕竟,现在很少有巨头会像OpenAI那样全力支持一家创业公司。

在2023年的4月10日,王小川正式宣布创立了百川智能这家公司。这家中国公司致力于研发并 提供通用人工智能 (AGI) 服务,目标是创建一个类似于OpenAI基础大模型的中国版,同时结合颠覆性的上层应用。百川智能承诺利用语言AI技术的突破,构建“中国最佳的大模型底座”,并在搜索、多模态、教育医疗等领域进行加强,以便让大众能够轻松且普及地获得全球知识和专业服务。

公司名称“百川”的由来,王小川阐述说:“百川”一词源于“百川归海”的理念,它寓含着无数条河流最终都汇入大海的景象,象征着大量的数据和行业知识汇聚成一個強大的智能體系,不斷繁衍發展。此外,“百川”還象徵著集成各種智慧,吸引更多的人與之一起探索未知的領域,共同前行。

王小川的逻辑是“知识密集型”领域是他核心要突破的点,教育和医疗就是他眼中的知识密集型方向。他一直在追求“生命的意义”。

据了解,通用大语言模型Baichuan-13B-Base是百川智能发布的第二款通用大语言模型,而在前不久的6月15日,百川智能就已经推出了首款70亿参数量的中英文语言模型Baichuan-7B,并一举拿下多个世界权威Benchmark榜单同量级测试榜首。

谈及百川智能的优劣势,爱分析首席分析师李喆向本报记者说:“百川智能目前做的是基础大模型,未来应该是要做通用大模型和B端/C端应用。我们目前是按照算力资源、数据集、AI工程化和生态四个维度对大模型厂商进行评估,百川智能的优势是数据集和AI工程化能力,数据集是有中文场景语料数据积累,AI工程化方面主要体现在其算法框架层和模型层的优势,算力资源和生态相比其他厂商存在劣势,百川‘屯卡’(指GPU板卡)时间太晚,推出基础模型的时间也落后于其他大模型厂商。”

李喆称,C端受限于监管等因素,短期发展不会特别快,重点肯定是B端。B端一般会从大模型厂商未来商业模式出发,去思考大模型市场的未来竞争格局。大模型厂商未来商业模式包括:一是API调用、二是大模型license/一体机、三是行业应用(应用产品、解决方案)。API调用未来肯定都是云厂商的市场机会,百川智能的机会在于大模型license/一体机和行业应用,比较看好百川在行业应用方面的市场机会。

机遇和挑战

此前,王小川曾向媒体说:“追上ChatGPT水平,我觉得今年内就可能实现,但对于GPT-4或者GPT-5,我认为可能需要三年左右的时间,应该不会低于两年。”

王小川坦言,当下国内大厂产品和ChatGPT有较大差距,我们就要不断追OpenAI。“现在首先百川智能要做的,就是中国最好的大模型,然后去美国挖人才再追它(OpenAI)。这比较现实一点,人家做‘长生不老丸’,我们先做个‘延年益寿丸’。”

百川智能的对手很多,国产大模型“军备竞赛”以“天”为计不断更新,阿里巴巴、华为、京东商汤都在争夺这趟通用人工智能(AGI)列车席位。

掌柜智库高级顾问沈阳告诉本报记者,对比其他AI公司,百川智能的优势有:一是技术理想,公司具有优势,王小川目前是最好的状态,也是国内在AGI领域认知最深刻、最有资本和人才、最有国际视野的人,他的认知超越同行,至少是当下最领先。特别是他的技术洁癖,可以远离商业,追求AGI的突破。二是中华传统文化的浸润较多,目前的领先公司多是海外公司,王小川具备传统中华文化的底蕴。三是对AGI的认知深刻,这是王小川的百川智能最大的亮点,也可能是其他AI公司无法触及的高度,百川智能是目前国内能看见的最有可能突破AGI的公司。

沈阳认为,谨慎看好的原因则是:一方面王小川一直比较顺利,没有经历太大的磨难,可能在自我的修炼和提升上,还没有遇见大的障碍和瓶颈,这样可能不太具备巨大的突破能力,这个确实是个人修为的问题;另一方面目前医疗和教育领域可能是最好的AGI的突破领域,但是解决的路径太“物化”,更多在看资本、人才、算力、资源等这些领域,没有太关注“意识”和“认知”这些高维度能量的领域,这可能是一个缺陷。

王小川表示:“Baichuan-13B是百川智能为科技强国送上的一份礼物。”

(编辑:吴清 校对:颜京宁)

举报/反馈
通用大语言模型Baichuan-13B-Base及对话模型Baichuan-13B-Chat发布

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© Copyright notes

Related posts

No comments

No comments...