标签:音频

人工智能现在能有多“聪明”?

全尺寸人形仿生机器人,其身高达1.77米,重量为52公斤 摄影/本报记者 李娜 正在召开的2023中关村论坛上,“人工智能”无疑是最热门的关键词。无论是自动驾驶还...

多模态大模型推动AI迈向“通感”时代

如同人类的“五感”互相连通密不可分,人工智能(AI)的视觉、语言、音频等模态间的边界也在日渐融合。随着人工智能感知、交互和生成能力的快速发展,多模态大...

OpenAI将推出多模态大模型,志在阻击谷歌Gemini

谷歌在大约半个月前公布了自家的大模型Gemini,消耗的算力是GPT-4的五倍之多,官方称之为“一种多模态和高效的机器学习工具”。Gemini的开发始于今年四月,谷歌...

重磅!谷歌推出其最先进AI模型Gemini,大规模多任务语言理解或超越人类专家

OpenAI空前崛起之际,谷歌毅然打响了绝地反击战。当地时间12月6日,谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处...

人工智能科技革命推演

李超/文一、人工智能科技革命是第四次科技革命我们认为,人工智能科技革命是第四次科技革命。科技革命爆发的标志就是新一代科技成果开始广泛应用生产生活,解...

生成式AI大爆发后,2024年人工智能行业有哪些新趋势

受聊天机器人ChatGPT于2022年11月推出加持,2023年成为了AI(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式...

人工智能狂飙,数智出版如何当好AI“牧羊人”

“大模型生成式人工智能技术的突破,将对出版行业产生特殊价值和影响,在此背景下,对数智出版的发展途径展开专题研讨,具有重要意义。”日前,上海市编辑学会...

被马斯克炮轰的Apple智能,为什么更接近理想的AI形态?

今年的苹果 WWDC,是一场事先张扬的 AI 发布会,库克罕见地从几个月前就在各种场合渲染气氛。可当你上个月看过 OpenAI 和 Google 、微软的发布会,又会觉得这...

AI智能剪辑软件AIMIX:助力短视频混剪、文案与字幕生成、语音合成等功能

AIMIX是一款集视频批量混剪、文案、字幕生成、语音合成等功能于一体的AIGC智能剪辑软件。用户可以通过这款软件快速批量产出原创短视频,利用自己积累的素材库...

积极拥抱生成式AI-甲骨文召开CloudWorld 2023大会

在近日于拉斯维加斯召开的年度CloudWorld会议上,甲骨文表示正在全力发展生成式AI,绝不会看着自己最大的竞争对手亚马逊云科技(AWS)占领市场。在讨论本届Cl...
12345615