两年前,ChatGPT的问世引起了巨大的轰动,如今,ChatGPT即将变得更加有用。
OpenAI 周一宣布了其最新的人工智能大语言模型,据称该模型将使 ChatGPT 更智能、更易于使用。
新型号名为 GPT-4o,是该公司一年多前推出的上一代 GPT-4 型号的更新版本。 该模型将向免费客户开放,这意味着任何人都可以通过 ChatGPT 访问 OpenAI 最先进的技术。
根据该公司周一的演示,GPT-4o 将有效地将 ChatGPT 转变为可以进行实时语音对话的数字个人助理。 它还能够使用文本和“视觉”进行交互,这意味着它可以查看用户上传的屏幕截图、照片、文档或图表,并就它们进行对话。
OpenAI 首席技术官 Mira Murati 表示,ChatGPT 的更新版本现在还将具有记忆功能,这意味着它可以从之前与用户的对话中学习,并且可以进行实时翻译。
“这是我们第一次在易用性方面真正迈出一大步,”穆拉蒂在公司旧金山总部的现场演示中说道。 “这种互动变得更加自然,也更加容易。”
新版本发布之际,OpenAI 力求在日益激烈的人工智能军备竞赛中保持领先地位。 包括谷歌和 Meta 在内的竞争对手一直致力于构建日益强大的大型语言模型,为聊天机器人提供动力,并可用于将人工智能技术引入各种其他产品。
OpenAI 活动在谷歌年度 I/O 开发者大会前一天举行,预计该公司将在会上宣布其 Gemini AI 模型的更新。 与新的 GPT-4o 一样,谷歌的 Gemini 也是多模式的,这意味着它可以解释和生成文本、图像和音频。 OpenAI 的更新也是在苹果下个月的全球开发者大会上预计发布人工智能之前发布的,其中可能包括将人工智能融入到下一个 iPhone 或 iOS 版本中的新方法。
与此同时,最新的 GPT 版本可能对微软来说是一个福音,微软已经向 OpenAI 投资了数十亿美元,将其人工智能技术嵌入到微软自己的产品中。
OpenAI 高管演示了与 ChatGPT 的语音对话,以获得解决数学问题的实时说明、讲述睡前故事并获得编码建议。 ChatGPT 能够以自然的、听起来像人类的声音以及机器人的声音说话,甚至还可以唱出部分回应。 该工具还能够查看图表图像并进行讨论。
他们还展示了检测用户情绪的模型; 有一次,它能听到一位高管的呼吸声并鼓励他冷静下来。
“你不是吸尘器!” ChatGPT 的女声(听起来与 2013 年电影《她》中斯嘉丽约翰逊配音的数字伴侣非常相似)开玩笑地告诉工作人员。
ChatGPT 还能够通过自动翻译和响应以多种语言进行对话。 据 OpenAI 称,该工具现在支持 50 多种语言。
“新的语音(和视频)模式是我用过的最好的计算机界面,”OpenAI 首席执行官 Sam Altman 在宣布这一消息后在博客文章中表示。 “感觉就像电影中的人工智能; 我仍然有点惊讶它是真的。 事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”
Murati 表示,OpenAI 将推出具有 GPT-4o 功能的 ChatGPT 桌面应用程序,为用户提供另一个与该公司技术交互的平台。 GPT-4o 也将可供希望从 OpenAI 的 GPT 商店构建自己的自定义聊天机器人的开发人员使用,该功能现在也可供非付费用户使用。
更新的技术和功能将在未来几个月内推出到 ChatGPT。 免费 ChatGPT 用户将与新的 GPT-4o 模型进行有限次数的交互,然后该工具会自动恢复依赖旧的 GPT-3.5 模型; 付费用户将可以使用最新型号访问更多数量的消息。
OpenAI 表示已有超过 1 亿人在使用 ChatGPT。 但更新的 ChatGPT 体验——以及在桌面上通过改进的语音对话与其进行交互的能力——可能会让更多的人有理由使用其技术。 这些举措出台之际,谷歌和 Meta 将人工智能集成到 Instagram 和 Google Assistant 等更广泛使用的消费产品中,可能会让这些公司的技术更广泛、更容易使用。
OpenAI宣布将免费(有限制)向所有人开放新旗舰型号GPT-4o。
此外,PLUS用户原有的限制将提升五倍,并且可以提前测试新的macOS桌面应用程序和下一代语音和视频功能等功能。