文章主题:
5月14日,美国OpenAI 推出人工智能多模态模型GPT-4o在互联网上沸腾了。超强的功能,更像一个你身边带着感情情绪随时响应的人。
OpenAI的Chat GPT从 GPT-3文本生成到GPT-4 图片生成,此次推出的GPT-4o 具有多种数据类型的处理能力。有人说,GPT-4o是迈向更自然的人机交互的一步——它接受文本、音频和图像视频的任意组合输入,并生成文本、音频和图像的任意组合输出。
如果你给它一张图片,它不仅能描述图片内容,还能告诉你图片背后可能的故事。给它播放一段音乐,它能够识别出歌曲的名称,甚至分析出音乐的风格和情感。它还能理解你说话时的情感,你是高兴、悲伤还是愤怒,并据此调整它的回答。
多模态模型与以往AI最大的不同,支持更丰富的交互方式,用户可以根据自己的偏好选择使用文本、语音、图像或视频与AI进行交流。还有它有感情有情绪,表达惊讶、欣喜、兴奋、忧伤。
在第一个场景里,一位先生表示自己上台很紧张,假装喘粗气。GPT-4o捕捉到了这个细节后,幽默地安慰道,“别紧张,你不是吸尘器”,然后GPT-4o细心地指导这位先生如何做深呼吸。
GPT-4o像给AI装上眼睛和耳朵一样,它能通过视觉和听觉来理解和判断人的情绪状态和需求愿望。在一个应用的视频里,一位先生说:“我有一个面试要去参加,应该怎么着装?”说着,这位先生故意拿了一顶渔翁帽戴上,这时的GPT-4o笑得很开怀,可能觉得这样子很滑稽,然后委婉地提出着装建议。
应用场景的视频中也展示了GPT-4o在辅导孩子数学作业和英语学习的巨大潜力和优势。
关键还是免费使用,Chat GPT用户都可使用。问题是先得……
下面这两个视频都不长,博主从不同角度讲清楚了应用场景和领域。
猎豹移动董事长兼CEO傅盛
360公司创始人、董事长兼CEO 周鸿祎
(北漂报人撰文,图片来自网络)
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!