ChatGPT听觉与视觉升级背后:AGI是否触手可及?

AIGC与创业9mos agoupdate lida
92 0 0

文章主题:ChatGPT, 图像识别, 语音识别, 人工智能

666ChatGPT办公新姿势,助力做AI时代先行者!

近期,ChatGPT 进行了重大升级,实现了图片和语音输入的功能。那么在这个重要的时刻,我们应该从中期待什么样的突破?关于终极 AGI 的实现,我们又还有多少路要走呢?

引言

在国庆长假即将到来之际,ChatGPT 进行了重大升级,使得用户能够以更加多样化的方式与其进行互动。OpenAI 的CEO奥特曼在校友分享会上,仅仅是用一句轻描淡写的话语,就给众多 GPT 创业项目画上了一个句号。此外,强化学习领域的奠基人之一——萨顿,与传奇程序员卡马克联手投身于 AGI(通用人工智能)的研究,那么,我们距离实现终极 AGI 还有多远呢?

一、GPT 更新了什么?

1. 会听——和 ChatGPT 语音对话

通过语音交互,用户与ChatGPT展开多轮对话,官方提供的示例为让ChatGPT讲述一个适用于睡前的故事,同时具备语音包切换功能。当前,其表现相当自然,至少“机器人声音”并不突出。

2. 会看——给 ChatGPT 发图聊天

ChatGPT 已经具备了处理图片的能力。官方提供的示例是一个用户上传了一张自行车的照片,并期望 GPT 提供降低座高方案。

当然,我们还可以将自家的剩余食材交给 GPT,让它为我们生成相关的菜谱或饮食计划;另外,我们也可以向 GPT 发送一张表格,请求它进行数据分析和处理。

二、OpenAI CEO 奥特曼说了什么?

ChatGPT 的出现标志着人工智能技术在语音识别和图像识别领域取得了重大突破。这对于我们来说意味着许多事情。OpenAI 的首席执行官埃隆·马斯克(Elon Musk)对此发表了自己的看法。他认为,ChatGPT 的这些新功能将极大地改变我们的生活方式。首先,它能听取人类的声音,为我们提供更为便捷的沟通方式。其次,它能够识别图像,使我们在处理信息时更加高效。总的来说,ChatGPT 的出现预示着未来人工智能技术的无限可能。

OpenAI CEO 奥特曼最近在校友会上发表了一些看法,更是直接 ” 提醒 ” 了不少创业公司:别花太多精力在 UI 界面上(也就是咱们常说的套壳)。当然,除此之外,奥特曼还给出了不少干货,简单整理如下:

1. 为啥取名叫 ChatGPT?

就是特意取了个 ChatGPT 这样的名字,让它看起来就很像机器,避免人类对它产生感情。

2. 套壳 GPT 的都将灭亡!

目前有不少企业正在 ” 解决 “GPT 模型的小缺陷,尤其是只在 UI 界面上做优化的,这是肯定行不通的。因为 OpenAI 已经着手解决了大部分问题,而且不要尝试和 OpenAI 拼迭代速度。善意提醒:独立的企业必须能提供真正的、独特的价值。

3. 看好 AI 赋能医学和教育方向

AI 诊疗(AI medical advisor):这将会体现出巨大的社会价值。

AI 陪练(AI personalized one on one tutor):为用户提供一对一量身定制的辅导。

4. GPT5/6 还会给我们带来什么变化?

奥特曼透露,GPT5/6 会具备多模态的输出能力,比目前的 GPT 有更高的可靠性和个性化定制能力。

但是一说到大模型,大多数人第一反应就是贵。那 GPT5/6 的成本和收费会不会非常恐怖呢?奥特曼表示,摩尔定律在大模型领域依然生效,目前大模型的训练成本越来越低,因此未来调用 GPT 接口的价格也会更加便宜。

三、讨论:AGI 离我们还有多远

1. OpenAI 奥特曼:目前距离 AGI 还很远

虽然 GPT 已经给 AI 领域按下了 ” 加速键 “,但是还在还没找到一个产品能让我感觉和真人在聊天。

真正的 AGI 是能够 ” 自行推理 “,而不是依赖大模型预训练的,它像真实人类那样根据学到的知识,写论文、做实验的 AI 才能是称得上是 AGI。

2. Keen Technologies:2030 年实现 AGI 可行!

近期,强化学习之父萨顿也加入了 Keen Technologies,联手传奇程序员卡马克 All in AGI。他们两人在阿尔伯塔大学机器智能研究所(Amii)特别活动表示,2030 年可以实现 AGI 的目标。而且,他们相信最终的 AGI 源代码将会是一个人就能编写的量级,可能只有区区几万行。

所以,AI 的终极形态会是什么样的呢,让我们一起拭目以待吧!

以上资料参考来源如下,侵删:

https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

https://www.linkedin.com/posts/ibamasood_chatgpt-can-now-hear-see-and-speak-nervous-activity-7112087060068368384-0OXb/

https://www.amii.ca/latest-from-amii/john-carmack-and-rich-sutton-agi/

本文由 @运营老中医 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

查看原文

ChatGPT听觉与视觉升级背后:AGI是否触手可及?

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© Copyright notes

Related posts

No comments

No comments...