GPT-4太强了，10秒钟做出一个网站，考试中击败90%的人类

出境入境2024-03-21 04:52小乐

编辑：毕路明

3月15日，#GPT4建站仅需十秒#成为热搜话题。

当地时间周二（3月14日），人工智能研究公司OpenAI公布了其大规模语言模型——GPT-4的最新版本。对于几乎任何办公桌工作，GPT-4 都可以胜任。比如10秒就可以搭建一个网站，程序员是不是该失业了？大家应该看看昨天（3月14日）的GPT4新闻发布会。下面摘录的两分钟展示了：

1、用笔和纸在草稿本上画出一个非常粗略的草图；

图片来源：视频截图

2、拍张照片告诉GPT我想做一个这样的网站，并为我生成网站代码；

3. 完成网站大约需要十秒钟。

图片来源：视频截图

此外，该公司表示GPT-4 在许多专业测试中的表现优于绝大多数人类。 OpenAI 还表示，GPT-4 参加了多种基准考试，包括统一律师考试、LSAT、SAT 数学部分以及“美国高考”的证据阅读和写作部分。在这些测试中，它的得分高于88% 的考生。

OpenAI 周二表示，在内部评估中，GPT-4 产生正确响应的可能性比GPT-3.5 高出40%。此外，GPT-4是多模式的，支持文本和图像输入功能。 OpenAI 表示，GPT-4 比以前的版本“更大”，这意味着它接受了更多数据的训练，并且模型文件中的权重更多，从而使其运行成本更高。

OpenAI 表示，在某些情况下，GPT-4 比之前的GPT-3.5 版本有巨大改进。新模型将产生更少的错误答案，更少偏离对话轨迹，更少谈论禁忌话题，甚至在许多标准化测试中表现得比人类更好。

例如，GPT-4 在模拟律师考试中排名前10%，在SAT 阅读考试中排名前7%，在SAT 数学考试中排名前11%。

OpenAI 表示，它已与多家公司合作，将GPT-4 纳入其产品中，其中包括Duolingo、Stripe 和Khan Academy。 GPT-4模型还将以API的形式提供给ChatGPT Plus付费版本的订阅者。开发人员可以注册并使用它构建应用程序。微软随后表示，新的Bing搜索引擎将运行在GPT-4系统上。

OpenAI 表示，虽然这两个版本在日常对话中看起来很相似，但当任务复杂度达到一定程度时，差异就会显现出来。 GPT-4 更可靠，更有创意，能够处理更微妙的指令。 “根据我们的内部评估，它产生正确响应的可能性比GPT-3.5 高出40%。”

另外，GPT-4有了质的飞跃——，可以开始处理图像了。经常使用ChatGPT的人一定知道它只能处理文本，但是GPT-4开始接受图像作为输入媒体。在OpenAI 提供的示例中，GPT-4 准确地回答了几个关于互联网表情包为何有趣的问题（尽管解释并不好笑）。

不过，OpenAI 也警告称，GPT-4 尚不完美，很多情况下其能力还不如人类。该公司表示：“GPT-4 仍然存在一些我们正在努力解决的已知局限性，例如社会偏见、幻觉和对抗性线索。”

OpenAI 透露，摩根士丹利正在使用GPT-4 来组织数据，而电子支付公司Stripe 正在测试GPT-4 是否可以帮助打击欺诈。其他客户包括语言学习公司Duolingo、可汗学院和冰岛政府。

每日经济新闻综合OpenAI官网

每日经济新闻

GPT-4太强了，10秒钟做出一个网站，考试中击败90%的人类

猜你喜欢