AIGC热门产品集:AI 新算法 CEBRA:会读脑,还能预测未来画面-aigc导航|ai导航
AIGC热门产品
SmartGPT 是 GitHub 新项目,能让 ChatGPT 完成复杂任务,GPT-3.5 和 GPT-4 都支持。在它的调教下,GPT-4 回答的准确率从 68% 提高到了 85%。SmartGPT 由独立的子模块组成,使用者可以对它们进行任意排列、组合和删改。此外,无论对于用户还是开发人员,SmartGPT 的配置过程都更为简单。
Android 14 加入生成式 AI 编写短信和设计壁纸功能
Android 14 将使用谷歌的生成式 AI 技术为你编写短信。该工具带有多种样式设置,可以为你的消息赋予不同的风格。谷歌还将在 Android 的自定义菜单中引入内置的 AI 图像生成器。你可以使用该工具创建线上找不到的壁纸。它带有预设的提示信息,你可以调整这些提示信息,使引导 AI 的过程变得更加容易。
谷歌为 Workspace 推出 Duet AI:全面对标微软 Copilot
在今年的 Google I/O 上,该公司针对此举推出了新的品牌——Duet AI,但这些功能本身仍未向大众开放。该公司还预告了一项名为「Sidekick」的新功能,能够阅读、概括并回答跨不同 Google 应用程序中的文档问题。Duet AI 涵盖了 Google 生产力应用的一系列生成式 AI 工具。包括 Docs 和 Gmail 的写作辅助、Slides 的图像生成、Meet 的自动会议摘要等。
OpenAI 新的文本生成 3D 模型 Shap-E
OpenAI 最近分享了他们在将文本提示转化为 3D 物体方面的最新探索,名为 Shap-E。这款生成式 AI 工具提供了一种新的方式来生成 3D 物体,其制作的物体比去年发布的 Point-E 模型更好、更详细、更准确。
开源编程大语言模型 StarCoder :可自动写代码、根据指令改代码
StarCoder LLM。是一个 150 亿参数的模型,旨在为开放式人工智能研究社区负责任地生成代码。该模型根据来自 GitHub 的许可数据进行训练,涵盖 80 多种编程语言,并在 350 亿个 Python token 上对其进行微调。可用于自动完成代码、通过指令修改代码以及用自然语言解释代码片段。
ChatAvatar:Text to 3D 生成看清毛孔细节的高精度数字人
一款名为 ChatAvatar 的产品低调公测,火速收揽超 70 万浏览与关注。其主要亮点包括:使用简便;其次是生成跨度大,且五官可改,还能生成与面部贴合的面具、纹身等。ChatAvatar 甚至可以进一步生成超出人类范畴的角色,如阿凡达等影视作品中的角色
ImageReward 奖励模型:让文本到图像合成更符合人的偏好
清华大学和北京邮电大学的团队开发了第一个通用的文本到图像的人类偏好奖励模型——ImageReward,主要解决改进生成模型(如 Stable Diffusion)中的各种普遍问题,接受了人类反馈的训练,并使它们与人类价值观和偏好保持一致。
AI 新算法 CEBRA:会读脑,还能预测未来画面
自洛桑联邦理工学院的研究团队提出了一种名为 CEBRA 的最新算法,可以用 AI 从大脑信号中提取视频画面。AI 不仅会读脑,还会预测下一个画面,利用 AI,一个研究团队「看见」了老鼠眼中的电影世界。更神奇的是,这种机器学习算法,还能揭示大脑记录数据中隐藏的结构,预测复杂的信息。
Stability AI 发布新文本到图像模型 DeepFloyd IF
Stability AI 及其多模态 AI 研究实验室 DeepFloyd 发布 DeepFloyd IF 研究版,这是一种尖端的文本到图像级联像素扩散模型,并且可以智能地将文本集成到图像中。
DeepFloyd IF 拥有几个显着的特点,包括:深度文本指提示词理解能力、连贯清晰的文本和生成的图像、高度逼真、纵横比转换、零样本迁移能力实现图像到图像的转换等等。
最新大模型研究工作中,IBM 让 AI 自己完成对齐流程。全程只需 300 行(或更少)人类标注数据,就把基础语言模型变成 ChatGPT 式的 AI 助手。
更重要的是,整个方法完全开源,任何人都能按此方法,低成本把基础语言模型变成类 ChatGPT 模型。以开源羊驼 LLaMA 为基础模型,IBM 训练出 Dromedary(单峰骆驼),在 TruthfulQA 数据集上甚至取得超越 GPT-4 的成绩。