天工3.5：国产大语言模型的智能化探索

天工2yrs ago (2024)update lida

157 0 0

财联社4月18日讯（记者崔铭）昨日，昆仑万维（300418.SZ）正式发布大语言模型「天工」3.5，同时宣布即日起启动邀请测试。财联社记者第一时间对其进行了测评。

“天工” 3.5是由昆仑万维与奇点智源联手开发而成,这是我国首个真正实现智能涌现的国产大型语言模型。据昆仑万维方面的介绍,该模型已经达到了非常接近 OpenAI ChatGPT 的智能水平,能够满足各种应用场景的需求,如文案创作、知识问答、代码编程、逻辑推演以及数理推算等。

那么，该产品实际表现如何？让我们一探究竟。

在开始测试前，记者先请「天工」3.5做了个自我介绍。

考虑到在此之前，业内已有多家企业推出大模型，记者也顺势问了它与其他大模型相比有什么优点？

‘天工’ 3.5 的优势表现在灵活性、高效性、智能化、安全性和环保性方面。此工具具有高度实用性且可靠，可以满足各种需求，为工作和生活带来便利。

在对「天工」3.5进行初步了解之后，记者将分别从文本撰写、语义解析、逻辑推导、数学计算以及编程编码等五个维度，全面测试其各项能力。

首先，我们抛出了一个比较常规的写作要求：如果续写《西游记》故事，可以有哪些角度？

可以看到，「天工」3.5给出了几个写作方向，语言组织能力较为通顺，也较为符合逻辑。

随后，记者让其以“月光”为主题写一首有平仄且押韵的七言律诗，「天工」3.5在几秒钟内便完成了。

有趣的是，记者也让ChatGPT（3.5版本）写了一首，发现两首诗竟有不少重叠的部分。

在撰写任何文章时，最重要的是确保其具有实际应用价值。针对这个问题，一位专业的文章写作高手可能会提出这样的建议：为了使读者更深入地理解MMORPG游戏的特点，我们需要通过一些引人入胜的描述来吸引他们。因此，我们邀请记者朋友撰写一篇富有创意和吸引力的游戏广告文案。经过多次修改和完善，我们最终得到了这样一则文案：「天工」3.5版本迅速给出了令人满意的答案，其整体风格也符合该类游戏的特征。然而，在转折部分，我们发现其稍显生硬，可能需要进一步优化以提高读者的兴趣。

当我们向「天工」3.5提出请求，希望它能够为我们撰写一份详尽的电商运营岗位招聘JD（职位描述）时，它给出的答复可以说是非常全面且细致的。该JD不仅涵盖了职位名称、职位描述、任职要求、薪资待遇等核心信息，甚至还提供了公司简介以及投递邮箱等重要细节。这样的一份招聘JD，其格式严谨、内容合理，无疑能够为我们的招聘工作提供极大的帮助。

语义理解方面，「天工」3.5能准确说出成语释义。

也懂一点上海话。

记者决定加大难度，问一些“陷阱题”，看看「天工」3.5能否从容应对。

先来一个脑筋急转弯，提问：小明的爸爸有三个儿子，大儿子叫大毛，二儿子叫二毛，三儿子叫什么名字？

「天工」3.5一次就答对了。

同样的问题，记者向ChatGPT（3.5版本）提问，尽管它给出了正确的回答，但却多问了一句话：“因此，小明的名字究竟是什么？”这句话体现了ChatGPT在回答问题时，对于相关信息的不确定性以及其想要进一步了解问题背景的愿望。

再来一道灯谜题，提问：说它是头牛，不会拉犁头，说它力气小，背着屋子走。（打一个动物）

「天工」3.5又一次答对了。

而ChatGPT（3.5版本）并没有答对。

面对“蒸包子”问题，「天工」3.5也回答的头头是道，颇为“理性”。

ChatGPT（3.5版本）则给出了略微不同的回答。

接着，记者希望能考一下它的数学能力。

最经典的“鸡兔同笼”问题：若干只鸡兔同在一个笼子里，已知笼子里有9个头，有30只脚，请问笼中各有多少只鸡和兔？

这次「天工」3.5列出了正确的方程式，却得出了错误的答案。

在被指出这一问题后，「天工」3.5 “虚心认错”并重新计算了一遍，但还是没有得出正确的答案。

同样的题目，我们又问了一遍ChatGPT（3.5版本），依然是列出了正确的方程式，但在运算过程中出错，最后也没有回答正确。

记者又问了一道奥数题：已知父亲今年32岁，儿子今年5岁，请问几年后父亲的年龄正好是儿子的年龄的4倍？

这次「天工」3.5没有答出。

同样的问题，ChatGPT（3.5版本）算出了正确答案。

记者还尝试使用「天工」3.5写代码，提问：用Scala实现并查集，在得到回答后，又再次提问：用Java再写一遍。

随后记者拿给程序员朋友检查，对方称结果是对的，还表示这一问题相对基础，写代码能力如何还要视具体需求，若能进行多轮对话联系上下文修改，会是个辅助业务的“好帮手”。

最后，以一个哲学问题结尾。

记者问了著名的“电车难题”，「天工」3.5指出这是一个伦理困境的问题，并给出了一个辩证的答复。

从记者体验来看，「天工」3.5已经能够较为准确、完整、流畅地回答问题，较少出现“答非所问”的情况。在跟ChatGPT（3.5版本）对比使用过程中，二者的文本写作能力接近，在一些与数理相关问题上，还有优化的空间。

昆仑万维CEO方汉在昨日发布会上透露，「天工」3.5累计投入数亿元，由数百人研发团队历时3年时间打造。目前最高已能支持1万字以上文本对话，实现20轮次以上用户交互，在多类问答场景中都能实现较高的输出水平及较强记忆能力。

据悉，未来昆仑万维「天工」大模型在数理、逻辑推理等方面也将不断迭代优化，随着产品技术成熟，将根据监管和合规要求逐步启动开源，「天工」4和「天工」5也在推进计划中。

（编辑刘琰）

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

# 天工 # # AIGC # ChatGPT # 天工 # 奇点智源 # 安全 # 提问 # 昆仑万维

文章版权归作者所有，未经允许请勿转载。

Canva与ChatGPTIntegration:简化和用户友好的数字设计方法

lida

177

🔥AI革命来了！大模型+云变革，火山引擎引领未来计算新潮流？💡🔥

lida

158

国内互联网大厂能否追赶ChatGPT？巨头们的秘密行动与赛道挑战

lida

163

ChatGPT：人工智能对新闻传播学的挑战与机遇

lida

182

ChatGPT火了，它能成为‘作者’吗？人工智能生成内容的法律边界何在？

lida

146

探索智慧未来！科大讯飞星火认知大模型将震撼首展，带你感受人工智能‘智慧涌现’的每一步

lida

173

No comments

No comments...

天工3.5：国产大语言模型的智能化探索

千年之作：“天工”大语言模型的革命性突破

揭秘昆仑万维新发布的千亿级大语言模型“天工”：智能互动，覆盖多元领域

Related posts

No comments