稳定性 AI 推出了全新的图像生成模型 Stable Diffusion XL 1.0,拥有35亿个参数
在激烈的竞争和伦理挑战中,人工智能初创公司Stability AI不断改进其生成式AI模型。
SDXL 1.0将在Amazon Bedrock上发布,这是由亚马逊AWS提供的完全托管服务,通过API可以访问领先的AI初创公司和Amazon Titan的基础模型。这一公告是在年度AWS纽约峰会上发布的,进一步确认了亚马逊致力于为客户提供最强大的文本到图像基础模型(例如Stability AI的SDXL 1.0)的承诺。
今天,Stability AI宣布推出名为Stable Diffusion XL 1.0的文本到图像模型,该公司称其为“迄今为止最先进”的版本。Stable Diffusion XL 1.0将在GitHub上开源,并提供给Stability的API和消费者应用程序ClipDrop和DreamStudio。Stability声称,相较于之前的版本,Stable Diffusion XL 1.0提供了更鲜艳、更准确的颜色,以及更好的对比度、阴影和光照。
Stability AI的应用机器学习负责人Joe Penna在接受媒体采访时指出,Stable Diffusion XL 1.0包含了35亿个参数,可以在多种宽高比下几秒钟内生成完整的100万像素分辨率图像。在这里,“参数”是模型从训练数据中学习到的部分,实际上定义了模型在解决问题时的技能,对于该模型来说就是生成图像。
此前的Stable Diffusion模型Stable Diffusion XL 0.9也可以生成更高分辨率的图像,但需要更多的计算能力。
Penna表示:“Stable Diffusion XL 1.0是可定制的,可以根据概念和风格进行微调。”他还表示:“它也更易于使用,可以通过基本的自然语言处理提示来实现复杂的设计。”
此外,Stable Diffusion XL 1.0在文本生成方面也有所改进。尽管许多最佳的文本到图像模型在生成图像方面表现不佳,很难生成可辨认的标志、书法或字体,但Stable Diffusion XL 1.0能够进行“高级”文本生成和可读性。