GPT-4太强了,10秒钟做出一个网站,考试中击败90%的人类

出境入境2024-03-21 04:52小乐

GPT-4太强了,10秒钟做出一个网站,考试中击败90%的人类

编辑:毕路明

3月15日,#GPT4建站仅需十秒#成为热搜话题。

当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大规模语言模型——GPT-4的最新版本。对于几乎任何办公桌工作,GPT-4 都可以胜任。比如10秒就可以搭建一个网站,程序员是不是该失业了?大家应该看看昨天(3月14日)的GPT4新闻发布会。下面摘录的两分钟展示了:

1、用笔和纸在草稿本上画出一个非常粗略的草图;

图片来源:视频截图

2、拍张照片告诉GPT我想做一个这样的网站,并为我生成网站代码;

3. 完成网站大约需要十秒钟。

图片来源:视频截图

此外,该公司表示GPT-4 在许多专业测试中的表现优于绝大多数人类。 OpenAI 还表示,GPT-4 参加了多种基准考试,包括统一律师考试、LSAT、SAT 数学部分以及“美国高考”的证据阅读和写作部分。在这些测试中,它的得分高于88% 的考生。

OpenAI 周二表示,在内部评估中,GPT-4 产生正确响应的可能性比GPT-3.5 高出40%。此外,GPT-4是多模式的,支持文本和图像输入功能。 OpenAI 表示,GPT-4 比以前的版本“更大”,这意味着它接受了更多数据的训练,并且模型文件中的权重更多,从而使其运行成本更高。

OpenAI 表示,在某些情况下,GPT-4 比之前的GPT-3.5 版本有巨大改进。新模型将产生更少的错误答案,更少偏离对话轨迹,更少谈论禁忌话题,甚至在许多标准化测试中表现得比人类更好。

例如,GPT-4 在模拟律师考试中排名前10%,在SAT 阅读考试中排名前7%,在SAT 数学考试中排名前11%。

OpenAI 表示,它已与多家公司合作,将GPT-4 纳入其产品中,其中包括Duolingo、Stripe 和Khan Academy。 GPT-4模型还将以API的形式提供给ChatGPT Plus付费版本的订阅者。开发人员可以注册并使用它构建应用程序。微软随后表示,新的Bing搜索引擎将运行在GPT-4系统上。

OpenAI 表示,虽然这两个版本在日常对话中看起来很相似,但当任务复杂度达到一定程度时,差异就会显现出来。 GPT-4 更可靠,更有创意,能够处理更微妙的指令。 “根据我们的内部评估,它产生正确响应的可能性比GPT-3.5 高出40%。”

另外,GPT-4有了质的飞跃——,可以开始处理图像了。经常使用ChatGPT的人一定知道它只能处理文本,但是GPT-4开始接受图像作为输入媒体。在OpenAI 提供的示例中,GPT-4 准确地回答了几个关于互联网表情包为何有趣的问题(尽管解释并不好笑)。

不过,OpenAI 也警告称,GPT-4 尚不完美,很多情况下其能力还不如人类。该公司表示:“GPT-4 仍然存在一些我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性线索。”

OpenAI 透露,摩根士丹利正在使用GPT-4 来组织数据,而电子支付公司Stripe 正在测试GPT-4 是否可以帮助打击欺诈。其他客户包括语言学习公司Duolingo、可汗学院和冰岛政府。

每日经济新闻综合OpenAI官网

每日经济新闻

猜你喜欢