Stability.ai推出移动端大模型,亚马逊发布AIGC功能玩具-aigc导航|ai导航
一、面对OpenAI的多模态DALL-E 3,无可争议地成为了AI绘画领域的扛把子。Midjourney也不甘示弱的拿出了下一代更强的版本Midjourney V6,不仅性能对标DALL-E 3,还加入了社交功能。
点评:在DALL-E 3发布后,Midjourney的CEO就曾被问到如何看待它的全新多模态能力时,其本人颇为不屑地回应称:“Midjourney将继续提供最高质量的图像。这次DALL-E 3和Midjourney V5间的比较中,其实可以看到DALL-E 3在图像质量方面也没有遥遥领先,虽然它确实可以更好地遵循提示并呈现文本。Midjourney后续也将上线3D和视频生成功能,不过不是在今年。”
二、全球三大咨询公司之一BAIN(贝恩)在官网宣布,将基于OpenAI的GPT-4以及自身海量专业咨询数据,打造AIGC助手Sage,为总计约1.8万名员工提供服务。此外贝恩还将微软的Copilot集成业务中,用于执行各种日常任务,包括自动起草咨询文案、总结摘要、审查内容等,以实现降本增效。链接:https://www.bain.com
点评:贝恩策略顾问公司与波士顿咨询公司和麦肯锡公司,并称为全球三大管理咨询公司。此次与OpenAI的合作,标志着AIGC在企业咨询领域的应用取得了新进展。大模型强大的文本生成能力,可以帮助企业提高工作效率和客户体验。随着AIGC技术的不断发展,其在企业咨询领域的应用将更加广泛。
三、亚马逊推出多款支持AIGC功能的新产品,大部分是智能家居,如遥控器Echo Hub、流媒体播放器Fire TV Stick 4K等,此外还有三款儿童产品:儿童智能音箱Echo Pop Kids,儿童平板电脑Fire HD 10,以及Amazon Glow,一款交互式视频通话设备。
点评:“教育科技+玩具”或许是全球的新趋势。根据亚马逊自己的调查统计数据,科技在全球教育玩具市场上发挥着越来越大的作用,使用AR等技术将数字图形叠加在现实世界物体上的玩具,可能引起市场上新一轮对学习玩具的需求。从亚马逊的儿童智能硬件产品可以看到,硬件之外的内容愈发重要。这些儿童智能硬件新品都有亚马逊儿童+服务,有专门针对儿童的内容,且正在研发更多专门针对儿童的功能。
四、著名开源平台Stability.ai在官网宣布,推出开源大模型StableLM-3B-4E1T。这是一款主要面向手机、笔记本等移动设备的基础版大模型,在保证性能的前提下,极大降低了对算力等资源的要求。开源地址:https://huggingface.co/stabilityai/stablelm-3b-4e1t
点评:多数大模型都需要耗费大量算力资源才能预训练、微调,同时对开发AIGC应用的运行环境也有很高的要求。高通就发布了专门针对移动端的AI芯片,以解决算力问题。Stability.ai希望通过开源StableLM-3B,帮助那些没有庞大算力资源的开发者,也能打造小巧精悍的生成式AI产品,可以安全、稳定地在移动端运行。
五、谷歌的DeepMind汇集了来自22种不同机器人类型的数据,以创建全新的数据集Open X-Embodiment,包括500多种技能和150000个任务,然后在之前的模型RT-1和RT-2的基础上,训练出了能力更强的RT-1-X和RT-2-X。DeepMind在五个不同的研究实验室测试了RT-1-X模型,结果显示与针对每个机器人独立开发的方法相比,新方法在五种不同的常用机器人中平均成功率提高了50%。RT-2-X也能被赋予原始数据集中不存在的额外技能,使其能够执行新颖的任务。
点评:DeepMind的这项新研究表明,通过利用更多样化的数据和更好的模型进行扩展学习,有可能开发出更好用的辅助机器人。与世界各地的实验室合作并共享资源,对于以开放和负责任的方式推进机器人研究至关重要。DeepMind希望通过开放数据源和提供安全但有限的模型来减少障碍,加快研究。机器人技术的未来有赖于机器人之间的相互学习,最重要的是,让研究人员能够相互学习。
六、全球支付领导者Visa在官网宣布,推出一亿美元的风险投资基金,专门投资AIGC相关企业,以实现金融科技领域创新。该投资基金将由Visa旗下的投资部门Visa Ventures管理,去寻找、投资那些可能颠覆金融支付的AIGC相关企业。
点评:Visa作为金融支付领域与AI结合的先驱,将此项倡议视为公司在使用AI推动支付创新、为合作伙伴和客户创造价值,以及启用和赋能全球商业方面的领导力的延伸。虽然截止目前,大部分的AIGC都集中在任务和内容创建上,但这项技术很快不仅会改变我们的生活和工作方式,而且还会以我们需要理解的方式有意义地改变商业。
七、一款出色的文本生成GIF的大模型Hotshot-XL正在悄然流行,专门针对Stable Diffusion XL进行训练。它具备强大的功能,可以生成与任何已经或者新训练的SDXL模型相关的GIF动画。链接:https://www.hotshot.co/
点评:从此可以轻松制作符合需求的GIF动画,无需对Hotshot-XL进行额外的微调。寻找适用于训练数据的合适图像通常比寻找视频更容易,同时也符合现有的工作流程。此外,Hotshot-XL与SDXL controlnet兼容,可以创建满足需求的GIF动画布局。需要注意的是,Hotshot-XL的绘图效果普通,动画效果还算可以,但持续时间非常短暂。总体来说,它不如AnimatedDiff,但它的优势在于它可以在网页上使用,无需高性能显卡。