就在ChatGPT发布四个月后,北京时间3月15日,OpenAI宣布正式发布GPT-4。
据OpenAI介绍,GPT-4是一个大规模多模态模型(接受图像和文本输入,并输出文本输出)。尽管它在许多现实场景中不如人类,但它在各种专业和学术基准上的表现与人类相当。等级。 GPT-4 是OpenAI 在扩展深度学习方面的最新里程碑。
根据OpenAI总裁兼联合创始人Greg Brockman的现场演示,GPT-4页面比ChatGPT有更多的功能。左侧的“系统”框可用于设置AI身份属性,中间的输入框可输入问题,右侧可根据提问者的需求设置参数。
“我们花了六个月的时间,使用我们的对抗性测试程序和从ChatGPT 中吸取的经验教训来迭代调整GPT-4,以在现实性、可操作性和超出设定范围的拒绝方面取得历史性成果。有史以来最好的结果。”OpenAI 说道。
这种差异在对比GPT-4 和GPT3.5 模拟考试的分数时更加直观。例如,在一次模拟律师考试中,GPT-4的分数排在前10%,而GPT-3.5的分数则排在后面。约10%; GPT-4可以几乎满分的方式通过170分的GRE考试科目,比GPT-3.5高出十多分。
不仅如此,GPT-4还解锁了很多GPT-3.5做不到的事情,比如报税、写诗、写代码等。此外,GPT-4还实现了质的飞跃,那就是它可以接受图像作为输入媒体并生成描述、分类和分析。例如,如果你输入一张食材图片,并询问这些食材可以做什么,GPT-4可以识别图片中的食材,并给出可以制作的食物示例;它可以一秒识别手绘网站图片,并根据需求实时生成网页代码,打造出与同一网站手绘版几乎一模一样的产品。
除了普通图片之外,GPT-4还可以处理更复杂的图像信息,包括表格、考题截图、论文截图、漫画等,比如根据专业论文提供论文的摘要和要点,以及了解模因中的缺陷。
在测试的26 种语言中,GPT-4 在24 种语言中超越了GPT-3.5 等大型语言模型的英语语言性能。其中中文准确率达到了80.1%,优于GPT-3.5的英文准确率。 10%。
由于功能更强大,运行成本也更高,GPT-4 没有免费测试权,但需要每月20 美元的会员费。
中信证券预计,在GPT-4的推动下,未来大模型、多模式模型的商业应用将进一步加速,带动行业景气度持续上升。随着成本的降低和多模态的不断演进,GPT等大型模型有望构建AIGC的核心基石,加速AI商业化进程,打开市场天花板。
不过,值得一提的是,OpenAI 强调GPT-4 与早期GPT 模型具有类似的局限性。它仍然是根据2021年9月之前的数据进行训练,因此缺乏对当前情况的有效认识,会大胆地编造事实。甚至出现推理错误。因此,使用最好通过人工审查、附加上下文来补充,并避免在高风险情况下使用。