OpenAI发布GPT-4o：可免费开放使用语音对话媲美真人

快科技5月14日消息，OpenAI在今日凌晨的发布会上震撼推出了全新升级的大模型GPT-4o，标志着人工智能领域的一大步前进。

GPT-4o中的“o”代表着“omni”，源自拉丁语“omnis”，意味着“全能”。GPT-4o不仅能实时对音频、视觉和文本进行推理，还能处理超过50种不同的语言，且在处理速度和质量上均有显著提升。

与之前的GPT-3.5和GPT-4相比，GPT-4o在语音对话方面有了质的飞跃。它能在仅232毫秒内对音频输入做出反应，这一速度几乎与人类在对话中的反应时间相媲美。更值得一提的是，GPT-4o在音频处理上不再丢失大量信息，能准确识别笑声、歌唱声和情感表达等。

GPT-4o在现场展示时，作为实时翻译工具的表现也相当出色，能够即听即翻意大利语和英语。此外，它还能接受文本、音频和图像的组合输入，并生成这三者任意组合的输出，极大地增强了人机交互的自然性和全面性。

OpenAI表示，GPT-4o将向免费用户开放，但数量有限。一旦免费用户达到限定数量，系统将自动切换回GPT-3.5。同时，GPT-4o还将为开发者提供API，价格仅为GPT-4-turbo的一半，但速度却是后者的两倍，速率限制也高出5倍。

官方透露，GPT-4o将在未来几周内陆续开放。另外，OpenAI还发布了ChatGPT的桌面版应用，目前仅限MacOS版本，Windows版本将在稍晚时间推出。 OpenAI发布GPT-4o：可免费开放使用语音对话媲美真人

文章版权归作者所有，未经允许请勿转载。

3,242 5

2,741 6

1,813 5

2,278 2

1,866 1

3,052 8

OpenAI发布GPT-4o：可免费开放使用 语音对话媲美真人