圈小蛙

OpenAI发布旗舰AI模型GPT-4o Mini,价格更便宜

彭博社的报道称:OpenAI正在推出其旗舰人工智能模型的更实惠、更精简的版本,以在日益拥挤的人工智能服务市场中吸引更广泛的开发人员和商业客户。

ChatGPT制造商周四宣布推出GPT-4o mini,这是其功能最强大的AI模型GPT-4o的更小、更便宜的版本。这家总部位于旧金山的初创公司表示,升级后的模型将于今日向免费用户和付费ChatGPT Plus和Team用户提供,并将于下周向企业客户提供。GPT-4o mini将在ChatGPT中取代旧型号​​GPT-3.5 Turbo。

OpenAI称,GPT-4o mini是“功能最强、成本偏低的模型”,计划今后整合图像、视频、音频到这个模型中。

该公司在一份新闻稿中表示,GPT-4o mini从周四开始向ChatGPT的免费用户以及ChatGPT Plus和Team订阅者开放,并将于下周向ChatGPT Enterprise用户提供。该模型至少比GPT-3.5 Turbo的价格便宜60%。

在过去的一周里,一些开发者一直在试用这个模型,Godement说。邮件创业公司Superhuman用它来编写自动回复,金融服务创业公司Ramp则依靠它从收据中提取信息。

具有卓越文本智能和多模态推理能力的小模型

GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,并且支持的语言范围与 GPT-4o 相同。它还在函数调用方面表现出色,这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序,并且与 GPT-3.5 Turbo 相比,它的长上下文性能有所提高。

GPT-4o mini已经在几个关键基准上进行了评估。

推理任务: GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准 MMLU 上的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。

数学和编码能力: GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上之前的小型模型。在测量数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,而 Gemini Flash 得分为 75.5%,Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上,GPT-4o mini 得分为 87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。

多模态推理: GPT-4o mini 在多模态推理评估 MMMU 上也表现出色,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

作为模型开发过程的一部分,OpenAI与一些值得信赖的合作伙伴合作,以更好地了解 GPT-4o mini 的用例和局限性。OpenAI与Ramp等公司合作(在新窗口中打开)和超人(在新窗口中打开)他们发现,在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini 的表现明显优于GPT-3.5 Turbo。

内置安全措施

安全性从一开始就融入到OpenAI的模型中,并在开发过程的每一步中得到强化。在预训练中,OpenAI会过滤掉OpenAI不希望模型学习或输出的信息,例如仇恨言论、成人内容、主要汇总个人信息的网站和垃圾邮件。在训练后,OpenAI使用强化学习和人工反馈 (RLHF)等技术将模型的行为与OpenAI的策略保持一致,以提高模型响应的准确性和可靠性。

GPT-4o mini内置了与GPT-4o相同的安全缓解措施,OpenAI根据OpenAI的准备框架并按照OpenAI的自愿承诺,使用自动和人工评估对其进行了仔细评估。超过70位来自社会心理学和错误信息等领域的外部专家对GPT-4o 进行了测试,以识别潜在风险,OpenAI已经解决了这些风险,并计划在即将发布的GPT-4o系统卡和准备记分卡中分享详细信息。这些专家评估的见解有助于提高GPT-4o和GPT-4o mini的安全性。

基于这些经验,OpenAI的团队还致力于利用OpenAI研究得出的新技术来提高 GPT-4o mini 的安全性。API 中的 GPT-4o mini 是第一个应用OpenAI的指令层次结构的模型(在新窗口中打开)方法,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力。这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

OpenAI将继续监控GPT-4o mini的使用情况,并在发现新的风险时提高模型的安全性。

供货和价格

GPT-4o mini现已作为文本和视觉模型在Assistants API、Chat Completions API和Batch API中提供。开发人员每100万个输入令牌支付15美分,每100万个输出令牌支付60美分(大约相当于标准书籍的2500页)。OpenAI计划在未来几天推出GPT-4o mini的微调。

在 ChatGPT 中,免费版、Plus版和团队版用户从今天开始将能够使用GPT-4o mini,以替代GPT-3.5。企业用户也将从下周开始使用,这符合OpenAI让所有人都能享受 AI 好处的使命。

Exit mobile version