财联社4月18日讯(记者 崔铭)昨日,昆仑万维(300418.SZ)正式发布大语言模型「天工」3.5,同时宣布即日起启动邀请测试。财联社记者第一时间对其进行了测评。
🌟【科技巨头联手】揭秘「天工」3.5,由中国顶尖企业昆仑万维与创新智源携手打造!🚀这款备受瞩目的国产大语言模型,凭借其卓越的智能涌现能力,已然成为业界翘楚,引领潮流。它不仅展现出与OpenAI ChatGPT旗鼓相当的智慧光芒,更实现了多项全能功能:文案创作、知识问答、代码编写、逻辑推理和数理运算,一应俱全!🛠️昆仑万维以其深厚的技术底蕴,将其推向了技术的新高度,让国人自豪地见证了一次智能革命。不论是企业文案还是学术研究,「天工」3.5都能提供精准且高效的解决方案,助力实现更高效的信息处理和知识传播。📝💻欲体验未来科技的魅力,敬请关注「天工」3.5的最新动态,让我们共同探索这个语言技术的新里程碑!🌐✨
那么,该产品实际表现如何?让我们一探究竟。
在开始测试前,记者先请「天工」3.5做了个自我介绍。

考虑到在此之前,业内已有多家企业推出大模型,记者也顺势问了它与其他大模型相比有什么优点?
🌟”天工”,一款强大而高效的神器,以其灵活性、智能化及卓越的安全保障,赢得了众口称赞。它不仅是工作中的得力助手,更是环保理念的践行者。用户们纷纷盛赞其为”极其实用且值得信赖”的工具,它的存在无疑提升了效率,实现了安全与绿色的完美融合。🌍💪

🌟【深度评测】天工3.5:全能AI助手的全方位技能展示🚀在对「天工」的初次探秘后,记者对其各项核心功能进行了详尽的测试与验证。以下是通过实际操作揭示的五大智能领域表现:1️⃣ **文本驾驭者** – 文字创作不再是难题,天工3.5以卓越的文字生成能力,轻松应对各类写作任务。2️⃣ **语义解析大师** – 深入理解语境,它能准确解读并回应复杂问题,展现强大的逻辑思维力。3️⃣ **逻辑推理权威** – 数学计算与逻辑推断游刃有余,天工的精准和高效令人印象深刻。4️⃣ **编码小能手** – 拼写代码不在话下,快速响应编程需求,让技术触手可及。5️⃣ **全面智能守护者** – 无论何时何地,天工都能提供全方位技术支持,是现代生活的好帮手。欲了解更多关于「天工」的卓越之处,敬请关注我们的后续深度解析文章,我们将深入剖析这款AI助手如何在各领域发挥效能,为您的工作和学习带来前所未有的便捷。记得点赞并分享哦!💪
首先,我们抛出了一个比较常规的写作要求:如果续写《西游记》故事,可以有哪些角度?
可以看到,「天工」3.5给出了几个写作方向,语言组织能力较为通顺,也较为符合逻辑。

随后,记者让其以“月光”为主题写一首有平仄且押韵的七言律诗,「天工」3.5在几秒钟内便完成了。

有趣的是,记者也让ChatGPT(3.5版本)写了一首,发现两首诗竟有不少重叠的部分。

🎉撰写一篇高质量的MMORPG游戏广告文案,需要创意与趣味并存!🌟记者的任务来了,让「天工」3.5大展身手,不仅要吸引眼球,还要巧妙反转!💡游戏特色要精准传达,同时避免过于直接的转折点,让玩家一玩上瘾难以自拔。实例:『探索未知,不止于想象』而非直白的『超凡体验,等你来征服』,这样既保持了吸引力又提升了SEO友好度。🔥让我们一起打造一款引人入胜,让人欲罢不能的游戏广告文案吧!💪

👩💻作为一名资深的内容创作者,我理解你的需求——一篇专业且吸引人的电商运营岗位JD需要精心编撰。🌟「天工」3.5的回复展现了其出色的文案功底,从职位概述到具体要求,再到诱人的薪酬待遇,每个细节都清晰明了,仿佛为求职者量身打造。💼他们甚至贴心地附上了公司的全面介绍,让潜在员工对公司有更深入的认识。JD设计得既简洁又实用,结构严谨,语言流畅,充分考虑了招聘的SEO优化,确保信息能被搜索引擎快速捕捉。👩💻如果你需要这样的文案,我可以帮你进行精炼和优化,保留关键信息的同时,避免任何可能引发广告嫌疑的内容。只需提供原始JD,剩下的交给我来处理。💌别忘了,我的目标是帮助你的内容更好地服务于读者,提升招聘效果哦!💪


语义理解方面,「天工」3.5能准确说出成语释义。

也懂一点上海话。

记者决定加大难度,问一些“陷阱题”,看看「天工」3.5能否从容应对。
先来一个脑筋急转弯,提问:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,三儿子叫什么名字?
「天工」3.5一次就答对了。

极简版

再来一道灯谜题,提问:说它是头牛,不会拉犁头,说它力气小,背着屋子走。(打一个动物)
「天工」3.5又一次答对了。

而ChatGPT(3.5版本)并没有答对。

面对“蒸包子”问题,「天工」3.5也回答的头头是道,颇为“理性”。

ChatGPT(3.5版本)则给出了略微不同的回答。

接着,记者希望能考一下它的数学能力。
最经典的“鸡兔同笼”问题:若干只鸡兔同在一个笼子里,已知笼子里有9个头,有30只脚,请问笼中各有多少只鸡和兔?
这次「天工」3.5列出了正确的方程式,却得出了错误的答案。

在被指出这一问题后,「天工」3.5 “虚心认错”并重新计算了一遍,但还是没有得出正确的答案。

同样的题目,我们又问了一遍ChatGPT(3.5版本),依然是列出了正确的方程式,但在运算过程中出错,最后也没有回答正确。

记者又问了一道奥数题:已知父亲今年32岁,儿子今年5岁,请问几年后父亲的年龄正好是儿子的年龄的4倍?
这次「天工」3.5没有答出。

同样的问题,ChatGPT(3.5版本)算出了正确答案。

记者还尝试使用「天工」3.5写代码,提问:用Scala实现并查集,在得到回答后,又再次提问:用Java再写一遍。
随后记者拿给程序员朋友检查,对方称结果是对的,还表示这一问题相对基础,写代码能力如何还要视具体需求,若能进行多轮对话联系上下文修改,会是个辅助业务的“好帮手”。

最后,以一个哲学问题结尾。
记者问了著名的“电车难题”,「天工」3.5指出这是一个伦理困境的问题,并给出了一个辩证的答复。

从记者体验来看,「天工」3.5已经能够较为准确、完整、流畅地回答问题,较少出现“答非所问”的情况。在跟ChatGPT(3.5版本)对比使用过程中,二者的文本写作能力接近,在一些与数理相关问题上,还有优化的空间。
昆仑万维CEO方汉在昨日发布会上透露,「天工」3.5累计投入数亿元,由数百人研发团队历时3年时间打造。目前最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平及较强记忆能力。
据悉,未来昆仑万维「天工」大模型在数理、逻辑推理等方面也将不断迭代优化,随着产品技术成熟,将根据监管和合规要求逐步启动开源,「天工」4和「天工」5也在推进计划中。
(编辑 刘琰)

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!