OpenAI发布GPT-4o:可免费开放使用 语音对话媲美真人
快科技5月14日消息,OpenAI在今日凌晨的发布会上震撼推出了全新升级的大模型GPT-4o,标志着人工智能领域的一大步前进。
GPT-4o中的“o”代表着“omni”,源自拉丁语“omnis”,意味着“全能”。GPT-4o不仅能实时对音频、视觉和文本进行推理,还能处理超过50种不同的语言,且在处理速度和质量上均有显著提升。
与之前的GPT-3.5和GPT-4相比,GPT-4o在语音对话方面有了质的飞跃。它能在仅232毫秒内对音频输入做出反应,这一速度几乎与人类在对话中的反应时间相媲美。更值得一提的是,GPT-4o在音频处理上不再丢失大量信息,能准确识别笑声、歌唱声和情感表达等。
GPT-4o在现场展示时,作为实时翻译工具的表现也相当出色,能够即听即翻意大利语和英语。此外,它还能接受文本、音频和图像的组合输入,并生成这三者任意组合的输出,极大地增强了人机交互的自然性和全面性。
OpenAI表示,GPT-4o将向免费用户开放,但数量有限。一旦免费用户达到限定数量,系统将自动切换回GPT-3.5。同时,GPT-4o还将为开发者提供API,价格仅为GPT-4-turbo的一半,但速度却是后者的两倍,速率限制也高出5倍。
官方透露,GPT-4o将在未来几周内陆续开放。另外,OpenAI还发布了ChatGPT的桌面版应用,目前仅限MacOS版本,Windows版本将在稍晚时间推出。
© 版权声明
文章版权归作者所有,未经允许请勿转载。