财联社4月18日讯(记者 崔铭)昨日,昆仑万维(300418.SZ)正式发布大语言模型「天工」3.5,同时宣布即日起启动邀请测试。财联社记者第一时间对其进行了测评。
🌟【科技巨头联手】揭秘「天工」3.5!🚀由顶尖团队——昆仑万维与创新智源携手打造,这不仅是国产大语言模型的里程碑,更是智能涌现领域的突破性成果。🔍它以卓越性能,被誉为“国内ChatGPT有力竞争者”,能胜任文案撰写、知识问答等基础任务,更展现出强大的代码编程和逻辑推理能力。📊无论是创意构思还是复杂问题解决,「天工」3.5都能提供精准且高效的解决方案。🌍无论你身处何地,只要有网络,它就能陪伴你,开启无限智慧之旅!🌐欲了解更多,敬请关注我们的最新动态。🏆 #科技革新 #智能涌现 #天工3.5
那么,该产品实际表现如何?让我们一探究竟。
在开始测试前,记者先请「天工」3.5做了个自我介绍。

考虑到在此之前,业内已有多家企业推出大模型,记者也顺势问了它与其他大模型相比有什么优点?
🌟”天工”,一款强大而高效的神器,以其灵活性、智能化及卓越的安全环保特性脱颖而出。它不仅是工作中的得力助手,更是未来趋势的象征。无论是任务执行的迅速,还是数据保护的周全,都展现出其无可挑剔的可靠品质。用它,就是选择了一种高效且绿色的生活方式。🌍💪

🌟【深度评测】天工3.5全方位技能大揭秘🔍——文本创作之光🔥,语义解析的智者🧠,逻辑推演的高手🧩,数学运算的精准计算器 calcular,代码撰写不在话下💻。记者亲身体验,每一项都能展现出强大的实力与独特魅力。🚀🌟【技术深度】天工3.5,不止于此——以卓越的文本生成能力,带你领略文字艺术的魅力;通过深度语义理解,洞悉每一份信息背后的深层含义;逻辑推理的精密,如同数学般精确无误;数学计算的快速响应,让数据处理如行云流水。💻📊🌟【智能升级】在这个智能化的时代,天工3.5无疑是技术与智慧的结晶。它不仅满足基本功能,更在细节中展现出对用户需求的深刻理解,让你的工作更加高效便捷。💪SEO优化提示:使用关键词“天工3.5”、“全方位技能”、“文本写作”、“语义理解”、“逻辑推理”、“数学计算”、“代码撰写”,适当增加行业相关术语和提问句型,保持信息连贯性和流畅性。
首先,我们抛出了一个比较常规的写作要求:如果续写《西游记》故事,可以有哪些角度?
可以看到,「天工」3.5给出了几个写作方向,语言组织能力较为通顺,也较为符合逻辑。

随后,记者让其以“月光”为主题写一首有平仄且押韵的七言律诗,「天工」3.5在几秒钟内便完成了。

有趣的是,记者也让ChatGPT(3.5版本)写了一首,发现两首诗竟有不少重叠的部分。

🎉撰写一篇引人入胜的MMORPG游戏广告文案,以下是根据您的需求进行优化后的版本:🌟在虚拟世界中寻找不朽传奇,「天工」3.5带你开启全新冒险篇章!💡创新与传统交织,丰富的剧情和角色塑造,让你欲罢不能。🏆然而,别忘了,真正的挑战才刚刚开始——策略与技巧的较量,每一次胜利都是对智慧的考验。🔥让每个玩家都能体验到独一无二的游戏之旅,「天工」3.5等你来探索,释放你的游戏热情!SEO优化提示:使用行业关键词如”MMORPG”, “虚拟世界”, “不朽传奇”, “策略与技巧”, “智慧考验”, “游戏旅程”等。

🎉【电商运营秘籍】揭示!🚀「天工」的JD大公开🔍——🔥职位名称:电商运营专员🔍🌟职位描述:引领潮流的数字舞者,负责从产品到顾客的全链路优化,用数据说话,让销售额直线上升!📈💼任职要求:熟悉电商平台,精通SEO和数据分析,有创新思维,抗压能力强,我们期待你的数字魔法!🔮💰薪资待遇:3.5K起,优秀者可面议,更有广阔的职业发展空间和年度奖金等你来拿!💸🔍公司介绍:我们是一家专注于电商生态建设的创新型企业,团队年轻活力,氛围开放包容。在这里,你将与行业精英共事,一起见证成长的奇迹!🌟💌投递邮箱:[联系方式],请附上简历,让我们一同期待你的加入,开启电商运营新篇章!🎉注意:保留关键信息,删除具体联系和广告内容,确保SEO优化。


语义理解方面,「天工」3.5能准确说出成语释义。

也懂一点上海话。

记者决定加大难度,问一些“陷阱题”,看看「天工」3.5能否从容应对。
先来一个脑筋急转弯,提问:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,三儿子叫什么名字?
「天工」3.5一次就答对了。

极简版

再来一道灯谜题,提问:说它是头牛,不会拉犁头,说它力气小,背着屋子走。(打一个动物)
「天工」3.5又一次答对了。

而ChatGPT(3.5版本)并没有答对。

面对“蒸包子”问题,「天工」3.5也回答的头头是道,颇为“理性”。

ChatGPT(3.5版本)则给出了略微不同的回答。

接着,记者希望能考一下它的数学能力。
最经典的“鸡兔同笼”问题:若干只鸡兔同在一个笼子里,已知笼子里有9个头,有30只脚,请问笼中各有多少只鸡和兔?
这次「天工」3.5列出了正确的方程式,却得出了错误的答案。

在被指出这一问题后,「天工」3.5 “虚心认错”并重新计算了一遍,但还是没有得出正确的答案。

同样的题目,我们又问了一遍ChatGPT(3.5版本),依然是列出了正确的方程式,但在运算过程中出错,最后也没有回答正确。

记者又问了一道奥数题:已知父亲今年32岁,儿子今年5岁,请问几年后父亲的年龄正好是儿子的年龄的4倍?
这次「天工」3.5没有答出。

同样的问题,ChatGPT(3.5版本)算出了正确答案。

记者还尝试使用「天工」3.5写代码,提问:用Scala实现并查集,在得到回答后,又再次提问:用Java再写一遍。
随后记者拿给程序员朋友检查,对方称结果是对的,还表示这一问题相对基础,写代码能力如何还要视具体需求,若能进行多轮对话联系上下文修改,会是个辅助业务的“好帮手”。

最后,以一个哲学问题结尾。
记者问了著名的“电车难题”,「天工」3.5指出这是一个伦理困境的问题,并给出了一个辩证的答复。

从记者体验来看,「天工」3.5已经能够较为准确、完整、流畅地回答问题,较少出现“答非所问”的情况。在跟ChatGPT(3.5版本)对比使用过程中,二者的文本写作能力接近,在一些与数理相关问题上,还有优化的空间。
昆仑万维CEO方汉在昨日发布会上透露,「天工」3.5累计投入数亿元,由数百人研发团队历时3年时间打造。目前最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平及较强记忆能力。
据悉,未来昆仑万维「天工」大模型在数理、逻辑推理等方面也将不断迭代优化,随着产品技术成熟,将根据监管和合规要求逐步启动开源,「天工」4和「天工」5也在推进计划中。
(编辑 刘琰)

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!