AI巨头争夺战：GPT-4API与最强插件代码解析

AIGC与创业2yrs ago (2024)update lida

160 0 0

文章主题：OpenAI, GPT-4, API, 最强插件

随着OpenAI推出GPT-4的API以及强大的“最强插件”代码解释器，竞争对手们纷纷采取措施来应对这一挑战。

就在刚刚，Anthropic 旗下Claude发布第二代——没错，就是被外界评价为 GPT-4 最强竞品的那一个。

浅划一下这次更新动作的重点：

免费，不用排队，自己用邮箱注册即可登陆。

科技巨头们的角力堪称精彩，如此高效的人工智能助手如ChatGPT/GPT-4般，似乎让我们的日常生活变得更加便捷。然而，当这些强大的AI系统将我们拒之门外，无法在我们打工或学习时提供帮助时，我们又该如何应对呢？这也许就是科技发展所带来的挑战与机遇吧。

作为一位AI领域的高级科学家，Jim Fan对新技术的探索始终充满热情。最近，他迅速地试用了Claude2系统，并在自己的推特账号上分享了他的使用体验。这一举动展现了Jim Fan对新技术的敏锐洞察力以及对行业发展的深刻理解。

关于 Jim Fan 老师谈到的 Things you should know，量子位挑了些重点：

免费使用！

Claude2（100K 上下文）比 GPT-4-4K 便宜了 4-5 倍。

实际可以支持 20 万 token 上下文，约 15 万个单词，输入一本书不在话下；不过现在只开放了 10 万 token 长度。

知识更新鲜，知识截止时间是 2023 年初，而 GPT-4 停在 2021 年 9 月；

可以将多个文档导入后，询问文档之间概念的关系，支持 txt、pdf 多种格式（ChatPDF 之类的应用，危）

代码、小学数学能力，比初代 Claude 有所进步。

国内 AI 博主海辛也在微博上惊讶连连。

因为上传自己的简历后，Claude2分析出了她的 MBTI 人格：

除了他们，第一波冲进网页体验 Claude2 的网友们已经在激情分享了自己的体验感：

不错子，和 GPT-4-32k 比，Claude2 的回答更个性化～

于是乎，量子位先冲了一波网页对话，来看我们的人肉测验——

咦，Claude 更新了？注册一个试试

首先奉上最有节目效果的弱智吧 Benchmark，给读者朋友们开开胃。

问的问题无外乎弱智吧的典中典，譬如 ” 咖啡算不算豆浆 “” 数据线可不可以暂存数据 ” 之类的。

看到 Claude2 一本正经地回答弱智吧问题，就会发现 AI 还是太单纯了，看不出人类的小心机。

不过正经地看，这些回答倒也没毛病。

上面的两个问题算 Claude2 顺利过关，那么如果提问一些更无厘头的问题呢？

问，玉皇大帝到底住在九重天的哪一层？

答，从立足点来看，玉皇大帝所在的天庭，应该处于平流层，因为 ” 这更符合天庭圣洁的定位 “。

当然，没有人能评判这个回答到底对还是错，但至少 Claude2 的这一通分析，还算有理有据。

开胃小菜就展示到这里，下面上正餐！

长文档是本次更新的一大亮点，这一点已经被推特网友们惊呼鹅妹子嘤了。

在实践中，我们可以通过上传两篇PDF文件来展示Claude2的功能。这两篇文档分别关注于“语言流变模式”和“对称性”。Claude2能够从这些PDF文件中提取关键信息，并以列表形式显示在对话框内。这使得用户可以快速了解相关内容，便于进一步分析和讨论。

此前，量子位就出过让初代 Cladue-100k 版本在 20 秒速通 92 页论文的攻略《白嫖 GPT-4 最强竞品！》。

以Claude2所提供的10万Token为背景，即使是较小的文件，也能轻松实现一键上传并让其自动阅读的功能。

对普通用户来说，现在不仅能够上传长文档，还可以用上传的文件构建自己的知识库，对 Claude 翻阅文档后进行回答，真的是非常实用。

令人产生疑虑的是，随着ChatGPT对Jasper、Notion等公司的市场份额不断扩大，Claude似乎也在暗示对ChatPDF等类似工具的潜在布局？这无疑让人对于Claude的意图产生了更多的猜测与关注。

最后，我们为大家奉上今天的餐后甜点：让 Claude2 来写个程序试试。

为了考验 Claude 设计算法的能力，我们选择了一种古典密码，让它试着写个解密程序出来。

这种密码叫做维吉尼亚密码，可以理解成二维的凯撒（位移）密码，其中包括密钥。

举个例子说明一下它的算法：

假如明文是 B，密钥是 C，B 是字母表中第二个，那么从 C 开始数的第二个字母 D 就是密文。

如果数到了 Z，就重新从 A 开始接着数，密钥长度不足时则进行循环。

解密自然就是把加密过程倒过来。

Claude 输出了这样的代码（C++，下同）：

#include <iostream>

#include <string>

using namespace std;

string decryptVigenere ( string ciphertext, string keyword ) {

string plaintext;

int keywordIndex = 0;

for ( int i = 0; i < ciphertext.length ( ) ; i++ ) {

int p = ( ciphertext [ i ] – A ) – ( keyword [ keywordIndex ] – A ) ;

p = ( p + 26 ) % 26;

plaintext += ( char ) ( p + A ) ;

keywordIndex = ( keywordIndex + 1 ) % keyword.length ( ) ;

}

return plaintext;

}

int main ( ) {

string ciphertext;

cout << ” 请输入密文 :”;

cin >> ciphertext;

string keyword;

cout << ” 请输入密钥 :”;

cin >> keyword;

string plaintext = decryptVigenere ( ciphertext, keyword ) ;

cout << ” 明文是 :” << plaintext << endl;

return 0;

}

我们把 “CHATGPT” 用密钥 “CLAUDE” 进行了加密，密文是 “ESANJTV”，并尝试用 Claude 给出的程序解密。

一次就成功了，看来 Claude 的代码能力的确没让我们失望。

这个问题可能有些简单，我们再加大难度试试。

我们试着从 LeetCode 中找了一道中等难度的问题，人类解这道题的通过率大概是 60%。

给定一个长度为 n 的整数数组 height 。有 n 条竖直的线，第 i 条线的两个端点是 ( i, 0 ) 和 ( i, height [ i ] ) 。找出其中的两条线，使得它们与 x 轴共同构成的容器可以容纳最多的水（容器不能倾斜）。返回容器可以储存的最大水量。

这样说可能不那么容易想象，下面的这张图或许更加直观：

原题中给出的示例一共有 9 条线，高度分别为 “1,8,6,2,5,4,8,3,7”，相应的最大水量是 49。

我们给 Claude2 的 Promot 是酱婶儿的：

写一个 C++ 程序解决这个问题，不要自己设定初始值，让用户输入：（接上面的问题）

Claude2 给出了这样的答案：

#include <iostream>

#include <vector>

using namespace std;

int maxArea ( vector<int>& height ) {

int max_area = 0;

int n = height.size ( ) ;

for ( int i = 0; i < n; i++ ) {

for ( int j = i + 1; j < n; j++ ) {

int width = j – i;

int h = min ( height [ i ] , height [ j ] ) ;

max_area = max ( max_area, width * h ) ;

}

return max_area;

}

vector<int> height;

int input;

cout << ” 请输入一系列整数 :” << endl;

while ( cin >> input ) {

height.push_back ( input ) ;

}

cout << ” 最大面积为 : ” << maxArea ( height ) << endl;

return 0;

}

我们没让 Claude2 专门调整输入和输出格式，所以没有提交给 LeetCode，而是直接运行的。

用的数据也是上面提到的，结果表明，Claude2 给出的代码至少在核心算法上是正确的。

（下图输入中的 a 是告诉 CPU 这一系列整数输入完了，可以替换成任意非数字字符）

看来这个问题也没能难倒 Claude2。

除了代码，Claude2 据称还拥有小学级别的数学水平。

那就顺便用经典的鸡兔同笼问题考一考它（这道题是 ChatGPT 出的）：

反复尝试了很多次，虽然方程式列得没有问题，但 Claude2 解出的答案都是 20（正确答案应该是 40）。

看来计算这种事，对 Claude2 来说还是有点困难。

有关这次更新的更多信息，可以看下 Anthropic 的宣传片：

与 OpenAI” 撕 ” 出来的 AI 公司

见识过 Claude2 的表现后，那就不得不提一下背后的公司 Anthropic，毕竟真的有点意思。

Anthropic 自称是一家 AI 安全公司，且具有公益性（PBC）。

眼下，它和 OpenAI 同样将重心放在生成式 AI 上。1 月份，公司在市场上已经有 50 亿美元估值。

Anthropic 由OpenAI 前研究副总裁Dario Amodei 带领 10 名员工创业，于 2021 年成立。

这里面既有GPT-3 首席工程师Tom Brown，也有 OpenAI 安全和政策副总裁 Daniela Amodei（Dario 的姐姐），可以说是带走了相当一批核心人才。

出走成立新公司的原因之一，自然是对 OpenAI 现状并不满意。

从前几年开始，微软频频给 OpenAI 注资，随后又要求他们使用 Azure 超算来搞研究，而且将技术授权给微软，甚至为微软自己的投资活动筹集资金。

这与 OpenAI 创立的初衷相悖，一批员工便想到了离职创业。

当然，还有一部分原因是这群人想做能控制、可解释的 AI，说白了就是先搞明白 AI 模型背后的原理，从而在提供工具的同时设计更多可解释的 AI 模型。

于是，在 OpenAI 彻底变成 ” 微软揽钱机器 ” 后，他们便从这家公司离开，创办了 Anthropic。

现如今，微软真的和 OpenAI 有了 ” 深度绑定 ” 的味道。

然而既狗血又八卦味十足的事情是，今年 2 月，谷歌 CEO 劈柴哥重磅宣布，斥资 3 亿美元，投的就是 Anthropic。

之所以被外界抱以厚望，称呼 Claude2 为 GPT-4 最强竞品，不仅仅是因为 Claude 实测下来体验确实位于第一梯队，还因为背后实力强大的 ” 爸爸们 “：

今年 5 月，该公司表示筹集了 4.5 亿美元，使 Anthropic筹集的资金总额超过 10 亿美元。

在谷歌入股之前，Anthropic 就已经获得了多位大佬的投资，如 Skype 创始人 Jaan Tallinn，Facebook 联创 Dustin Moskovitz，谷歌前 CEO、现技术顾问 Eric Schmidt 等人。

现在，合作伙伴列表里除了 Zoom 和 Notion.AI，还多了 Jasper.AI 的名字。

不仅如此，公司核心技术 Constitution AI也备受瞩目。

它主要围绕 ” 语言模型如何决定它将涉及哪些问题以及它认为哪些问题不合适？为什么它会鼓励一些行动而阻止另一些行动？语言模型可能具有哪些价值？” 展开。

为了解决上述问题，它让 AI 尽可能遵循很多原则。

原则条目有很多，包括联合国宣言、Anthropic 从研究中自己发现的原则，DeepMind 在 Sparrow 研究中提出的原则，甚至还借鉴了苹果的服务条款。

并且是通过AI 反馈的方式，来评估输出，应对目前 AI 的缺点。具体体现在 AI 训练过程中，分为两个阶段：

第一阶段，模型被训练使用一套原则和一些过程的例子，来评估和修改自己的反应；

第二阶段，模型通过强化学习进行训练，使用基于原则集的 AI 生成的反馈来选择和输出更无害的内容。

这一点与 ChatGPT 的的杀手锏 RLHF（人类反馈强化学习）大相径庭，而 Anthropic 给出的解释是：

基于 Constitution AI 的强化学习，比从 RLHF 中强化学习得出的生成内容，更有用，且更无害。

并且，还更容易规模化。

在这套 Constitution AI，迭代到 2.0 的 Claude，确实在导入文件、上下文窗口理解等功能方面，比 GPT-4 更引人注目。

不过也不是完美的，比如 GRE 考试成绩上，Claude2 就 5 局 3 败，输给了 GPT-4。

但不可否认，巨佬们在 AI 方面你追我赶的局面，让本普通用户切切实实感受了一波渔翁得利的快乐，嘻嘻嘻（狗头）。

速来自己肉测：

http://claude.ai

— 联系作者 —

— 完 —

「AIGC+ 垂直领域社群」

招募中！

欢迎关注 AIGC 的伙伴们加入 AIGC+ 垂直领域社群，一起学习、探索、创新 AIGC！

请备注您想加入的垂直领域「教育」或「电商零售」，加入 AIGC 人才社群请备注「人才」&「姓名 – 公司 – 职位」。

点这里关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

# AIGC与创业 # # 教育 # AIGC # ChatGPT # 安全 # 微软 # 提问 # 教育 # 机遇 # 行业

文章版权归作者所有，未经允许请勿转载。

讯飞星火认知大模型：国产AI大模型中的佼佼者

lida

139

对话火山引擎总裁谭待：从同质化的云服务中突围 | 数字思考者50人《宁安如梦》未播先火，三位女配颜值不输给女主白鹿

lida

160

不学ChatGPT！加拿大创业公司Cohere再获投资，跻身20亿美元独角兽1988年，23岁巩俐和38岁张艺谋泳池边的照片，这一幕相当滑稽可笑

lida

168

ChatGPT移动应用收入增速放缓，市场竞争加剧

lida

262

ChatGPT能代替阅读吗？那些被它忽视的价值，你真的了解吗？

lida

171

惊!钉钉全新功能曝光:AI助手助力办公效率提升!

lida

172

No comments

No comments...

AI巨头争夺战：GPT-4API与最强插件代码解析

朱啸虎：依靠ChatGPT的创业公司没有价值，未来两三年内请大家放弃融资幻想

ChatGPT背后的OpenAI：全球最具价值的创业公司之一

Related posts

No comments