AIGC的传播应用和核心技术有哪些-aigc导航|ai导航
AIGC的传播应用主要集中在以虚拟主持人为中心的新闻播报等领域,虚拟人开创了新闻领域实时语音及人物动画合成的先河,只需输入要播发的文本内容,电脑就会生成相应的虚拟人播报的新闻视频,并确保音频,表情,嘴型保持自然一致,展现与真实主持人同样的信息传达效果,现在虚拟人在传媒领域的应用有三方面的特点。
应用范围不断拓展,目前新华社等媒体及东方卫视等省市级媒体,都开始积极探索虚拟人,并逐渐从新闻推广到晚会,现场记者,天气预报等更广泛的场景应用。
应用场景不断升级,除了常规式主持播报,虚拟人也开始陆续支持多语种和手语播报,2022年冬奥会期间,百度,腾讯等企业陆续推出手语播报数字人,为广大听障用户提供手语解说,更推动体育赛事的无障碍进程。
应用形态日趋完善,在形象上,虚拟人逐步从2D走向3D,在驱动范围上,开始从只有口型变化发展到面部表情,肢体与手指动作,背景内容等一应俱全,在内容构建上,从支持SaaS化平台工具构建向智能化生产延伸,例如腾讯3D手语虚拟人“聆语”,可生成唇动等细微内容,并配套可视化动作编辑平台,支持对手语动作进行微调。
AIGC的核心技术有哪些。
变分自编码器是深度生成模型中的一种,由Kingma等人在2014年提出,与传统的自编码器通过数值方式描述潜空间不同,它以概率方式对潜在空间进行观察,在数据生成方面应用价值较高。
VAE分为两部分,编码器与解码器,编码器将原始高维输入数据转换为潜在空间的概率分布描述,解码器从采样的数据进行重建生成新数据。
GoodFellow提出了生成对抗网络,成为早期较著名的生成模型,GAN使用零和博弈策略学习,在图像生成中应用广泛,以GAN为基础产生了多种变体,如DCGAN,StytleGAN,CycleGAN等,GAN包含两个部分:。
生成器:学习生成合理的数据,对于图像生成来说是给定一个向量,生成一张图片,其生成的数据作为判别器的负样本。
判别器:判别输入是生成数据还是真实数据,网络输出越接近于0,生成数据可能性越大,反之,真实数据可能性越大。