文章标签:ChatGPT, 网易有道, 翻译产品, 大模型
ChatGPT出现之后,网易有道公司内部大吵了一架。
在2008年上线的网易自主研发、国内首个统计机器翻译线上引擎——有道翻译,一直备受关注。然而,随着产品的不断发展和市场变化,如何规划下一步的发展路线图成为了团队内部争议的焦点。近期的一则争论,将目光引向了这款产品的未来走向。
有道神经网络翻译(NMT)在业内已获得15年的技术升级和改进,从而使其在当前的市场环境中保持着竞争优势。据权威数据表明,至2023为止,有道词典的月活跃用户数量已突破1亿大关,成为我国 dictionary 翻译市场的领军者。
在我国翻译行业中,人们普遍认为,智能翻译产品能否取代人工翻译成为一种共识。事实上,当前的翻译工具在一定程度上已经达到了这个目标。
在实现目标之后,我们应该如何面对接下来的挑战与机遇?换言之,当一项技术的发展已经远远超越了传统的能力和人类智能的表现,那么它所带来最大的影响应该是怎样的?
网易 有道 CEO 周枫已经深刻理解到,随着前沿技术的不断更新,传统的翻译方式已经无法满足需求,必须进行产品迭代。他渴望采用大模型的方式,对翻译产品进行全新的思考和设计,以适应不断变化的市场环境。
要实现最大的变革,关键在于大幅提升翻译工具的使用频率,使其成为人们生活中不可或缺的一部分。正如亨利·福特推出 Model T 汽车,彻底改变了全球汽车产业的格局。Model T 的亲民价格使得普通人也能够轻松拥有和使用汽车,从而使得技术的力量真正改变人类的生活。
周枫告诉钛媒体APP,这些争吵在注重技术的网易有道属于常态,他们内部也经常做这样的事情。
他认为,技术团队经常需要创新思维。因此,他重新集结了翻译团队这些资深同事,旨在让大家掌握大型语言模型的技能,并尝试在新模型上让翻译产品焕发新的活力。
在经过大约四五个月的持续努力后,我们的团队进行了严格的评测,结果表明这些工作取得了显著的效果。相较于过去使用的模型,现有的方法在性能和最终翻译质量方面都有所提升。这充分证明了我们在研究和开发过程中的努力和付出,为我们带来了更先进的成果。
但投入“烧钱”的大模型,对于尚处于盈利阶段挣扎的网易公司来说,是否划算?公司研发和训练大模型的成本投入,又是否感到吃力?
今年第一季度,网易有道业绩产生波动。财报数据显示,一季度,网易有道净收入为11.6亿元人民币,同比减少3.1%;净亏损2.1亿元,同比增加101.9%,继上个季度利润转正后再次由盈转亏;并且,有道一直引以为傲的硬件业务收入也下滑16%。
“做公司永远是这样的,好东西都要钱,好的也最贵,这不是新问题,我们一定会管理好。”周枫对钛媒体APP表示。
他称,现在做大模型效率还比较高,一方面是公司之前有一定的基础,另一方面,有道Transformer的优化很强,很早的时候,他们就能把Transformer装到小设备里面。
并且,大模型的边际成本非常低,复制模型不需要太多额外的成本。虽然有道的近百人的AI团队,人数也不少,但总体上,不需要增加额外的特别大的投入。
在网易有道首席科学家段亦涛看来,很多技术和资源都是一脉相承的。他告诉钛媒体APP,有道做大模型的过程,是在之前团队框架进行的,并没有额外的组建团队来做。
从2016年开始,有道协同构建AI基础能力,同步组建语言、视觉、声音等团队,积累了有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算(HPC)四个底层技术能力。
2017年,有道就看上了主流技术Transformer,将AI能力统一在大模型之下,重视在端侧的落地应用。2019年,有道词典笔2代的产品中,首次搭载离线Transformer NMT。2022年,有道词典笔P5中搭载了自研的离线ASR,已升级为Transformer技术。
用大模型做翻译产品,周枫公开表示,在内部的测试中,在中英互译的方向上,已经超越ChatGPT的翻译能力,也超过了谷歌翻译的水准。
不过,基于大模型的翻译产品,一个非常现实的问题是,它的成本较之前是有所提升的。周枫对钛媒体APP透露,内部经过测算,用大模型做翻译,因为计算量非常大,查询一次的成本,要比之前的模型贵近20倍,而有道的翻译产品,现在每天大约要承接几亿次的查询量。
虽然让大模型翻译大量被使用是周枫的目标,但他也发现,大模型的确是烧钱,尤其是在最开始的时候,会有一些成本上的困难。他们目前需要资金,因为确实现有的东西,不满足他们对产品的要求。
这样的投入吃紧的现实,也可能改变翻译这类产品的商业模式。不同于以往翻译产品的流量转化广告变现的逻辑,周枫告诉钛媒体APP,对大模型翻译来说,付费会员制是目前比较合理的方案。
不过,大模型也已经引来教育界的“封杀”。美国多所公立学校已经禁用了ChatGPT,多家科学期刊也禁止将ChatGPT列为论文“合著者”。
周枫也反对学生在学习的过程中用大模型“抄答案”的行为,在应用端体现为“家长管控”功能,可以管控识别答案,给出讲解,而不是直接给出最后的答案。
不用去把大模型去神圣化。周枫说,我们应当对大模型里面的产品和技术创新做到具体案例具体分析,不能认为大模型是一切事物的通途,更值得研究的是,在丰富的应用场景。应用和场景是整个变革的过程中,大家应该及早去抓的。因为抓得越早,后边能抓到的东西越多。
不只是网易有道,教育界也有一些公司对大模型的积极拥抱。今年5月,学而思正在研发数学大模型MathGPT的消息引发行业热议。
彼时,学而思方面对钛媒体APP表示,MathGPT以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。
今年7月初,学而思一次发布会上透露可能该月底会有相关成果的对外展示。不过,截至目前,他们还没有相关进展对外披露。
这背后或许是相对于其他领域,数学大模型难度颇高。
数学大模型要解决的三个难题在于,第一,题目要解对,现在GPT结果经常出现错误;第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲得有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。
周枫则认为,数学大模型是大家都想投入的方向,但只是给数学大模型“投喂”再多的内容,都不适用于数学领域,它背后涉及的是一些数学原理性的问题,现在的大模型还不具备这样的能力,但这仍是一个值得研究的方向。
钛媒体APP了解到,新东方、作业帮等教培巨头内部,也已经把目光盯紧大模型,但目前暂未有公开落地的成果。
ChatGPT, 网易有道, 翻译产品, 大模型