财联社4月18日讯(记者 崔铭)昨日,昆仑万维(300418.SZ)正式发布大语言模型「天工」3.5,同时宣布即日起启动邀请测试。财联社记者第一时间对其进行了测评。
🌟【科技巨头联手】揭秘「天工3.5」——国产大模新力作!🚀由中国顶尖企业昆仑万维与创新智源携手打造,这款语言模型以其卓越性能,被誉为国内首屈一指的智能涌现里程碑。🌈它已展现出与OpenAI ChatGPT旗鼓相当的智慧光芒,无论是文案撰写、知识问答,还是代码编写、逻辑推理或是复杂数理运算,都能游刃有余,满足全方位需求。💻🚀欲体验未来语言科技的魅力?「天工3.5」带你走进智能新世界!🌍欲了解更多详情,敬请关注我们的官方平台,这里将为您提供最专业、最全面的AI技术解析。🔗💖
那么,该产品实际表现如何?让我们一探究竟。
在开始测试前,记者先请「天工」3.5做了个自我介绍。
考虑到在此之前,业内已有多家企业推出大模型,记者也顺势问了它与其他大模型相比有什么优点?
🌟”天工”,一款强大而高效的神器,以其灵活性、智能化及卓越的安全环保特性脱颖而出。它不仅是工作中的得力助手,更是未来趋势的引领者。无论是任务执行的迅速,还是数据保护的周全,都展现出其无可挑剔的可靠品质。用它,就是选择了一种高效且绿色的生活方式。🌍💪
🌟【深度评测】天工3.5全方位技能大揭秘🔍在初次接触的深入探索后,我以记者的专业视角,对「天工」的强大功能进行了全面且细致的检验。以下是五大核心领域的能力展示——文案魔术笔📝、智慧语义解析🧩、逻辑思维引擎💡、数字运算能手Calculator及编码创作巧匠Coder。首先,文本写作模块展现了其卓越的文字驾驭力,每一段文字都精准流畅,仿佛在诉说着科技的魅力。📖接着,语义理解层面,「天工」展现出了强大的信息抽取和理解能力,对复杂概念的诠释清晰透彻。🤔再者,逻辑推理环节,它如同一个无懈可击的智囊团,每一步推断都严密而精准。🧩数学计算方面,无论是基础还是高级问题,「天工」都能迅速给出准确答案,展现其强大的数字处理能力。 calcular最后,代码编写部分,它的简洁高效让人印象深刻,每一行代码都凝聚着科技的精粹。💻总的来说,「天工」3.5不仅技术过硬,而且在用户体验上也做到了极致,是现代科技与智慧的完美结晶。🏆#天工评测 #技能全面 #科技未来
首先,我们抛出了一个比较常规的写作要求:如果续写《西游记》故事,可以有哪些角度?
可以看到,「天工」3.5给出了几个写作方向,语言组织能力较为通顺,也较为符合逻辑。
随后,记者让其以“月光”为主题写一首有平仄且押韵的七言律诗,「天工」3.5在几秒钟内便完成了。
有趣的是,记者也让ChatGPT(3.5版本)写了一首,发现两首诗竟有不少重叠的部分。
🎉撰写一篇引人入胜的MMORPG游戏广告文案,需要创意与趣味并存!🌟记者的要求是既要出彩又要有惊喜,「天工」3.5不负众望,给出了颇具游戏特色的文案。✨开头吸引眼球,用生动的语言描绘游戏世界,让玩家仿佛置身其中。🌍比如:”探索无垠星海,一触即达的奇幻之旅等你来启航!🚀”然后巧妙转折,避免过于生硬,保持连贯性的同时提升吸引力。%”在冒险的道路上,不只有刀光剑影,更有深厚的情感羁绊和难以预料的奇遇。👫” 记住,要让玩家跃跃欲试,而不只是简单告知。:”准备好你的智慧与勇气,因为每一次挑战都可能带你飞升至新的高度!鸚鵡螺号,启程吧!🚀”最后,用有力的口号收尾,强化印象:”加入「天工」3.5,开启你的不凡MMORPG冒险,让我们一起在虚拟世界中书写传奇!🌟”SEO优化提示:使用游戏相关关键词如”星海探索”、”奇遇”、”智慧与勇气”、”MMORPG冒险”等。同时,保持积极正面且具有行动力的语言,以提高搜索引擎排名和用户阅读欲望。
🎉【电商运营秘籍】揭示!🚀「天工」3.5以专业视角,为你量身打造了一份电商岗位JD的完美指南!💼🔍职位名称:电商运营大拿招手!👩💻📝职位描述:解锁销售增长密码,驾驭数字潮流,我们需要你引领潮流,优化策略!📈🔍任职要求:电商背景?NO!创新思维?必须!数据分析高手?加分!🚀💰薪资待遇:优厚,具体面议,但保证让你的才华得到应有的回报!💰🔍公司介绍:我们不只是雇主,更是你的职业发展伙伴。在这里,你将见证成长与成功!🤝💌投递邮箱:悄悄告诉你,只需轻轻一点,机会就在眼前!💌别犹豫了,这份JD不仅是一份工作描述,更是一扇通向电商运营殿堂的钥匙!快来开启你的电商运营新篇章吧!🚀SEO优化提示:电商运营、职位描述、任职要求、薪资待遇、公司介绍、投递邮箱等关键词应适当融入。
语义理解方面,「天工」3.5能准确说出成语释义。
也懂一点上海话。
记者决定加大难度,问一些“陷阱题”,看看「天工」3.5能否从容应对。
先来一个脑筋急转弯,提问:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,三儿子叫什么名字?
「天工」3.5一次就答对了。
极简版
再来一道灯谜题,提问:说它是头牛,不会拉犁头,说它力气小,背着屋子走。(打一个动物)
「天工」3.5又一次答对了。
而ChatGPT(3.5版本)并没有答对。
面对“蒸包子”问题,「天工」3.5也回答的头头是道,颇为“理性”。
ChatGPT(3.5版本)则给出了略微不同的回答。
接着,记者希望能考一下它的数学能力。
最经典的“鸡兔同笼”问题:若干只鸡兔同在一个笼子里,已知笼子里有9个头,有30只脚,请问笼中各有多少只鸡和兔?
这次「天工」3.5列出了正确的方程式,却得出了错误的答案。
在被指出这一问题后,「天工」3.5 “虚心认错”并重新计算了一遍,但还是没有得出正确的答案。
同样的题目,我们又问了一遍ChatGPT(3.5版本),依然是列出了正确的方程式,但在运算过程中出错,最后也没有回答正确。
记者又问了一道奥数题:已知父亲今年32岁,儿子今年5岁,请问几年后父亲的年龄正好是儿子的年龄的4倍?
这次「天工」3.5没有答出。
同样的问题,ChatGPT(3.5版本)算出了正确答案。
记者还尝试使用「天工」3.5写代码,提问:用Scala实现并查集,在得到回答后,又再次提问:用Java再写一遍。
随后记者拿给程序员朋友检查,对方称结果是对的,还表示这一问题相对基础,写代码能力如何还要视具体需求,若能进行多轮对话联系上下文修改,会是个辅助业务的“好帮手”。
最后,以一个哲学问题结尾。
记者问了著名的“电车难题”,「天工」3.5指出这是一个伦理困境的问题,并给出了一个辩证的答复。
从记者体验来看,「天工」3.5已经能够较为准确、完整、流畅地回答问题,较少出现“答非所问”的情况。在跟ChatGPT(3.5版本)对比使用过程中,二者的文本写作能力接近,在一些与数理相关问题上,还有优化的空间。
昆仑万维CEO方汉在昨日发布会上透露,「天工」3.5累计投入数亿元,由数百人研发团队历时3年时间打造。目前最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平及较强记忆能力。
据悉,未来昆仑万维「天工」大模型在数理、逻辑推理等方面也将不断迭代优化,随着产品技术成熟,将根据监管和合规要求逐步启动开源,「天工」4和「天工」5也在推进计划中。
(编辑 刘琰)
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!