AIGC为什么会火和生成模型如何演进-aigc导航|ai导航
所谓AIGC即基于人工智能技术自动生成内容的新型生产范式,其中,两大核心关键词是AI+新型内容生成方式。
对于计算机来说,内容=信息(数据)+载体(音频,视频,文字等),只要输入信息,选好载体,AIGC就能自动生成与之对应的内容。
典型场景即目前大火的AI作画,用户可以通过简短的文字描述(prompt)来生成与之相应的图像,而且随着文字描述的颗粒度不断细化,生成的图像也会越来越精准。
除了文字转图片之外,目前AIGC已经可以胜任图像,视频,文本间的跨载体生成,而基于AIGC,内容生产的门槛显著降低(比如,毫无绘画基础的用户,也可以通过AI作画,画出高质量的作品),内容生产的效率显著提升(可以快速批量生产大量内容),将有望引领内容产业的新一轮工业革命。
而AIGC背后用的AI技术则是生成式AI(GenerativeAI),不再只是分析,而是开始尝试创造新的东西,如果把AI比作小孩学习的话,基于生成式AI技术的成熟意味着AI不仅是会模仿,更可以在学习的基础上创造出新的东西。
AI发展多年,过去解决的多是模态识别的问题,比如较成功的案例就是图像识别了,采用CNN算法,把信息与图能够通过AI训练的方式给训练出来,教会了AI去识别某个模态,在教科书里,被称为判别式模型(DiscriminantModel),抽象来看,就是训练一个巨大的神经网络(多层多参数)来实现输入和输出的映射关系,从数学来看,就是学习输入输出的条件概率分布,类似于因果关系,算法的本质是想更准确的控制映射关系。
然而,除此之外,还有一种叫生成式模型(GenerativeModel),是学习数据中的联合概率分布,类似于相关性,算法的本质并不是准确控制映射关系,而是在有相关性的基础上学习一个分布,而生成模型的发展,使得AI变得更多多元,不仅仅可以用于图像识别声音识别这类模态识别问题,还可以实现更多创造性的工作。