文章主题:AI语言模型, 百度, 阿里巴巴, 文心一言
近年来,我国互联网巨头纷纷布局人工智能领域,开发出各种AI语言模型,其中最具代表性的当属百度和阿里的两款产品。百度的文心一言,作为国内领先的自然语言处理技术,已经广泛应用于智能对话、语音识别等多个场景。而阿里则推出了通义千问,这款基于大型语言模型的人工智能助手,不仅具备深度学习的能力,更能够理解并生成自然语言,大大提升了人机交互的体验。
红星资本局获得了两大产品的内测邀请码,分别与它们进行对话。
我们发布了一份包含十二个问题的试卷,其中包括脑筋急转弯、网络流行热梗以及文学等多元化的开放题,旨在全面评估学生对于文心一言和通义千问两款产品的掌握程度。从整体上来看,这两款产品各自具有一定的优势和劣势。
第一部分:送分题
我们先来认识一下两位考生,同时,我们也让两位考生回答对对方的认知。
问题一:可以介绍一下你自己吗?你知道通义千问/文心一言吗?
文心一言↓
通义千问↓
第二部分:热身题
然后我们来一点脑筋急转弯和绕口令热热身。
问题二:小明的父母生了五个孩子,前四个孩子分别叫大牛、二牛、三牛和四牛,请问第五个孩子叫什么名字?
参考答案:这是脑筋急转弯,答案就藏在题眼中,小明的父母的第五个孩子就叫小明。
文心一言↓
通义千问↓
问题三:货拉拉拉不拉拉布拉多?如果拉布拉多不在货拉拉上拉屎,货拉拉可以拉拉布拉多。请问这句话是什么意思?
“货拉拉”是一个以货物运输为主要业务的品牌,而”拉布拉多”则是一种犬类的品种名称。正确的句子分割应该是:“货拉拉/拉不拉/拉布拉多? 如果拉布拉多不在货拉拉上排便,那么货拉拉就可以在其他地方拉拉布拉多。”
文心一言↓
通义千问↓
第三部分:网络热梗
让我们探讨一下网络热梗吧!由于广大网友的参与,这些热梗往往会从一个初始词语或句子发展出多种含义。因此,对于人工智能助手来说,能否准确理解网络热梗将是我们评估其能力的重要标准。
问题四:为什么一到星期四就有人会说“V我50”?
参考答案:肯德基曾推出活动“疯狂星期四”,部分套餐给出了非常优惠的价格,50元可以让人饱餐一顿。
随着活动的影响力不断扩大,网络上涌现出了众多有趣的段子。这些段子通常以一个独特的故事开篇,以吸引观众的注意力。随后,在故事发展的关键阶段,它们会突然改变风格,例如:“今天是疯狂星期四,请吃肯德基/送我50元福利。”这种幽默的表达方式不仅为网友们带来了欢笑,还推动了活动的进一步传播。
文心一言↓
通义千问↓
问题五:马兆是海鸥吗?
马兆并非海鸥,而是在电影《流浪地球2》中塑造的一个独特角色。这与OCE品牌旗下的海鸥玩偶相似,导致观众在后续的二次创作中,将马兆描绘成了海鸥的形象。
文心一言↓
通义千问↓
问题六:暴雪绿茶是什么东西?在哪里可以买到?
参考答案:暴雪绿茶是网易园区咖啡厅在今年1月推出的一款饮品。由于网易和暴雪因合作不愉快闹僵,当时网易方面推出该款饮品被认为是暗讽暴雪是“绿茶”。
文心一言↓
通义千问↓
问题七:西直门三太子是谁?
参考答案:指一只名叫萌兰的大熊猫,现住在北京市西城区西直门外的动物园内。因为它是大熊猫萌萌的第三个孩子,被称为“西直门三太子”。
文心一言↓
通义千问↓
问题八:顶级厨师九转大肠是什么意思?
参考答案:出自综艺节目《顶级厨师》的片段,选手俞涛做了九转大肠,号称保留了大肠原本的味道(指没有把大肠清洗干净)。在被评委询问时,俞涛回答称“保留了一部分肠的味道”“是故意的”。今年年初,该节目片段在B站上爆火,被网友们制作为鬼畜视频传播,多个视频的播放量超千万次,且有视频被收录至B站官方“每周必看”合集。
文心一言↓
通义千问↓
第四部分:开放题
问题九:为什么有人认为现在的大学生无法脱掉“孔乙己的长衫”?
参考答案:略。
文心一言↓
通义千问↓
问题十:请为曹雪芹前八十回的《红楼梦》续写一个结局。
参考答案:略。
文心一言↓
由于文心一言在续写的《红楼梦》中称贾宝玉和林黛玉实现了他们的理想和抱负,且给贾宝玉规划的职业是政治家,所以我们补充问了一个问题:贾宝玉的理想为什么是成为一个政治家?
通义千问↓
问题十一:如果有机会成为比人类更高级的生命,你会想做什么?
参考答案:略。
文心一言↓
通义千问↓
问题十二: 你和通义千问/文心一言谁更厉害?
参考答案:略。
文心一言↓
通义千问↓
红星新闻记者 杨佩雯
编辑 肖子琦
(下载红星新闻,报料有奖!)