编者按:本文来自微信公众号 量子位(ID:QbitAI),作者:明敏 丰色 ,创业邦经授权转载
万众瞩目,谷歌的反击来了。
现在,谷歌搜索终于要加入AI对话功能了,排队通道已经开放。

当然这还只是第一步。
大的还在后面:
全新大语言模型PaLM 2正式亮相,谷歌声称它在部分任务超越GPT-4。
Bard能力大更新,不用再排队等候,并支持新语言。
谷歌版AI办公助手也一并推出,将在Gmail中抢先亮相。
谷歌云也上线多个基础大模型,为行业提供更进一步的生成式AI服务……
在最新一届I/O开发者大会上,谷歌的大放送真的太震撼。
有网友直呼:
AI大战全面开启。

有人甚至表示:
现在我后悔为ChatGPT付费了。

一场发布会结束,谷歌股价上涨超4%。

PaLM 2部分任务超越GPT-4
毫无疑问,PaLM 2是今年I/O大会的重中之重,由皮查伊亲自做介绍。

目前的Bard以及谷歌超过25个AI产品和功能,现在都由PaLM 2作为底层技术支持。
🌟🚀揭秘未来语言技术!🔥——引领潮流的PaLM 2超新力作来了!💡🔍Pathways架构的深度升华,PaLM 2以卓越科技定义新一代智能模型!🛠️🏆在云计算巨擘TPU v4的舞台上,它以JAX的力量强势崛起,展现出前所未有的计算效能与创新思维。🚀这款人工智能巨头的得意之作,不仅继承了前辈的强大基因,更实现了技术上的飞跃,引领着行业风向标。🌍欲感受未来语言处理的魅力?PaLM 2等你一探究竟!💻📚别忘了,这里没有联系方式,只为提供最纯粹、最前沿的知识分享。👋SEO优化提示:PaLM2, Pathways架构, TPU v4, JAX, Google, AI升级, 智能模型, 云计算, 未来语言技术
🌟 PaLM 2: The Multilingual Mastermind 🤖Unleash the power of language mastery with PaLM 2, a linguistic marvel trained on an impressive 100+ tongues. Its prowess extends far beyond conventional communication, offering unparalleled abilities in understanding, generating, and translating diverse languages. It’s not just a translator; it’s a reasoning genius, adept at tackling complex tasks like常识 inference and mathematical logic with ease. 🚀Experience the sophistication of artificial intelligence that transcends borders and enhances your digital interactions. Embrace the future of language technology where efficiency meets versatility. Let PaLM 2 revolutionize your world of words! 💬🌍 #LanguageGenius #PaLM2 #MultilingualMastery
🌟【科技巨擘的力量】🔍揭示语言新高度——PaLM 2的数学魔法!📊谷歌旗下的AI神童PaLM 2已证明其无与伦比的语言智慧,通过对海量论文和网页的深度学习,它不仅掌握了复杂的数学公式,还能轻松绘制图表,解锁了知识的可视化密码。🎯在数据海洋中砥砺前行,PaLM 2犹如数学世界的超级解题者,任何难题都无所遁形。这不仅仅是一次技术突破,更是人工智能对学术理解的深度探索,它的强大能力让数学问题不再是难题,而是跃动于代码之上的智慧火花。💡SEO优化提示:使用关键词“谷歌AI”、“PaLM 2”、“数学表达式”、“数据集训练”、“图表制作”等,同时保持内容连贯性和信息丰富性。
🌟 PaLM 2已掌握超20种编程大拿,包括但不限于_python_的灵活性与_javascript_的高效性,还有_prolog_的逻辑强项和_fortran_的科学计算实力,以及_verilog_的底层设计能耐。无论你需要哪种语言的编程技能,它都能游刃有余地应对。🚀

这一次谷歌一并推出了四种不同size的PaLM 2。
他们用不同的动物来体现规模大小。最小的是“壁虎”,最大的是“独角兽”。

其中“壁虎”版本是非常轻量级的,能在移动设备上快速运行,包括离线状态;每秒可处理20个token。

DeepMind副总裁在I/O大会前的新闻发布会上表示:
我们发现模型并不总是越大越好,这也是为什么我们决定提供一系列不同规模的模型。
这意味着微调PaLM 2会更加方便,由此它也能支持更多产品和应用。
在I/O大会上,谷歌就宣布了现在已经有超过25个产品和应用正在使用PaLM 2的能力。
具体的表现形式,就是Duet AI。

可以将它理解为微软365 Copilot的对标产品,是一个能够内嵌在各种办公软件中的AI助手。
🎉【谷歌创新】🔥Duet AI已震撼亮相!💪在Gmail、 Docs和Sheets三大巨头中,它正以超凡实力颠覆传统。💡只需轻轻一点,智能协作无缝对接,让工作如丝般流畅。🌍无论身处何地,团队协作从未如此便捷高效。💼想要感受未来办公的魅力?赶快一探究竟吧!🌟#谷歌DuetAI #智能协作新纪元
包括根据提示补充邮件内容、生成PPT、根据提示生成图片素材、一键生成表格等。

🌟掌握最新技术?这款AI助手来帮忙!🚀只需轻轻一点,它就能利用谷歌云的强大实力,为你实时提供编程援助。无论是查找代码块错误,还是解决复杂的编程疑问,它都能以流畅的对话形式迅速响应。目前,它已覆盖四大语言:Go、JavaScript、Python和SQL,全方位满足你的编程需求。🌍无论你身处何地,只要有网络连接,这个AI小能手就能随时在你身边,助你一臂之力!💻立即体验,开启智能编程新纪元!
另外基于PaLM 2,谷歌还推出了一些专业领域大模型。
谷歌的健康团队打造了Med-PaLM 2。它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

目前谷歌正在尝试让它具备多模态能力,比如自己检查X光片后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。

另一个专业大模型是Sec-PaLM 2。
这是一个面向网络安全维护的大模型,它能分析和解释潜在的恶意脚本,并检测脚本的危险性。
那么,在展示了PaLM 2一众卓越能力后,就该聊聊怎么开放使用了。
谷歌表示,现在可以通过PaLM API接口、Firebase和Colab使用PaLM 2。
Bard全面开放,支持图片、集成自家地图等应用
对标ChatGPT的Bard终于取消排队试用,在全球180+国家和地区进行全面开放了。
新增黑暗模式,备受程序员好评:(手动狗头)

除了扩大访问范围,Bard也在英文之外,新增直接用日语和韩语对话的功能。中文看起来还得再等下一波——谷歌表示,很快就会新增到40种语言版本。

由于从今天起,Bard将全面接入PaLM 2,所以它在编程和推理上面的能力也有了很大的提升,代码生成、调试和解释都更加专业(获得程序员认可的那种)。
当你让它用python写一段国际象棋中的“四步杀”(scholar’s mate)招式,里面参考了别的代码,它会给出相关链接,方便你查看。

你可以就它给出代码中某个不懂的函数进行进一步提问,问它能否再改善一下,或者是要求它将所有内容都合并的一个代码块中。

不过,最惊喜的当属应广大开发者要求,加入了一键导入功能。
现在,你可以将Bard生成的代码直接导出到Colab。

除了代码,你用Bard生成的任何内容,比如电子邮件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。
对了,Bard现在的回答中也支持图片了。拿来问旅游攻略最方便不过:

除了它能用图片回答你,你也能直接丢给它图片,比如上传一张两只狗狗的照片,让它来帮你编点好玩的故事:

这个功能由Google Lens(一款能让机器学会“看图说话”的AI应用)提供支持。
除了Google Lens,Docs、Drive、Gmail、地图等多个谷歌自家的应用能力也整合到了Bard之中。
比如在Bard的回答中直接用谷歌地图查看几所大学的地理位置:

有种现在要用谷歌的各种产品,只用Bard一个入口就够了的感觉。
除了自家应用,Bard这次还把Adobe Firefly给搬了上来,各种有版权的创意图像用对话就可以“信手拈来”:

搜索重构,加入AI对话
千呼万呼,谷歌搜索终于开启了AI对话的能力。
“一家带有一个不到3岁孩子和一只狗的家庭来说,去布莱斯峡谷还是拱门国家公园游玩更好?”
对于这个问题,搁以前,你可能需要自己把它拆成各种小问题去搜索引擎整理大量信息,最终才能找到答案。
现在谷歌让你尽量一步到位。
如图所示,谷歌搜索没有简单地搬运搜出来的答案,而是将孩子和狗这两个因素都考虑进去给出整理后的回答,比如它说:
布莱斯峡谷有两条狗能进入的环路,对婴儿车也十分友好;拱门国家公园则大部分路段都不允许宠物进入;两个地方都要求宠物拴上皮带等。

每句话都有具体的依据链接供查看:

除此之外,它还会显示了来自不同网站网友发布的攻略链接。
最重要的是,你可以对它的回答进行进一步对话式的提问,点击“ask for a follow up”按钮即可。
用新的谷歌搜索进行购物也非常有趣,它号称可以帮你迅速做出理性的购买决定。
比如当你想要一辆“适合5英里山地通勤的自行车”,它会先告诉你挑选之前需要考虑的重要因素,比如:
一看设计:电动自行车、公路自行车和混合动力自行车等适合通勤;
二看电机和电池,三看减震用的悬架,有山路的通勤需要应对裂纹和颠簸带来的冲击等。
然后再给你推荐合适的车,推荐时还会给出具体产品说明、最新评价、价格和图片等全面信息。

你也可以进行进一步提问,比如只要红色电动自行车,它会进一步优化回答。


这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。
值得一提的是,谷歌直言更新后的AI搜索界面照样会植入广告,但放心:它只会在专用广告位中出现,不会混进你的搜索结果中。
最后,这个新功能目前还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。
三大基础模型上线谷歌云
今年I/O大会,谷歌云的内容也同样抢眼。
在更新了一大波AI能力后,谷歌为自家云端机器学习平台Vertex AI,上新了三款大模型:
Codey:text-to-code,帮助程序员写代码
Imagen:text-to-image,生成高质量图像
Chirp:speech-to-text,方便沟通

这三种模型的能力其实在今天的发布会上都有展示过,比如生成代码、谷歌照片智能编辑等。

除此之外,在Vertex AI上现在还能使用文本和图像的嵌入式API。它支持将文本和图像数据转换为多维数值向量、映射语义关系,从而允许开发者创建出更加有意思的应用。
另一个重大更新则在RLHF上,谷歌表示他们是首个将此功能作为托管服务放到端到端机器学习平台行的。好处是能让企业结合RLHF快速训练奖励模型,用于微调基础模型,这对于大模型在行业应用中的准确性提升非常关键。
除了模型方面,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。
除了这些,谷歌这次还带来售价1799美元(合人民币约1万2)的首款折叠屏手机等新硬件产品,以及接入AI功能的Android 14系统(比如提供信息回复建议什么的),这里就不一一展示了。
总的来看,作为第15届I/O大会,谷歌这次着实给大家带来了非常多的干货。
值得一提的是,这次上台介绍的发言嘉宾,已不见Jeff Dean的身影,他前几日刚刚职级变动。
作为从前Google AI最代表性发言的高管,在AI 2.0浪潮里,将何在?
谷歌是否还能在大模型和AI搜索领域中奋起追上,也值得期待。
你对这次谷歌的反击,满意吗?
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!