首页AI 新闻
AI 周报 #19 谷歌终于让OpenAI感到了压力
228

AI 周报 #19 谷歌终于让OpenAI感到了压力

好说新闻
好说新闻
2023-12-08 11:41

本周封面:@稀饭lxb 提示词:A woman, looking back, bright sunshine, small city, upper body photo --beauty

新闻精选

谷歌发布原生多模态大模型 Gemini

当地时间 12 月 6 日,谷歌 CEO 桑达尔・皮查伊官宣原生多模态大模型 Gemini 1.0 版正式上线。

目前,Gemini 1.0 提供了三个不同的尺寸版本:

  • Gemini Ultra:规模最大、能力最强,用于处理高度复杂的任务;

  • Gemini Pro:在各种任务上扩展的最佳模型;

  • Gemini Nano:用于端侧(on-device)任务的最高效模型。

现在,谷歌的类 ChatGPT 应用 Bard 已经升级到了 Gemini Pro 版本,实现了更为高级的推理、规划、理解等能力,同时继续保持免费。谷歌预计在明年初将推出「Bard Advanced」,其将使用 Gemini Ultra。谷歌对 Gemini 模型进行了严格的测试,并评估了它们在各种任务中的表现。从自然图像、音频和视频理解,到数学推理等任务,Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过当前 SOTA 结果。

春晚吉祥物 “龙辰辰” 被疑 AI 生成 官方紧急澄清

12 月 6 日,中央广播电视总台 2024 龙年春晚吉祥物形象 “龙辰辰” 正式发布亮相,然而,这张 “定妆照” 却被指是 AI 作图。

部分网友认为 “龙辰辰” 细节出错太多:三只腿爪数量都不同,有只耳朵的耳孔也反了,前腿腿毛是螺旋设计,后腿腿毛却不沿用前腿腿毛的设计。春晚官方账号随即在 12 月 7 日凌晨火速回应,“真的是设计老师一笔笔画出来的”,并以录屏的形式晒出了部分设计线稿和上色成图。

对此,有网友表示,澄清视频并没有点开 PSD 文件展示图层,且在滑动鼠标的时候,PSD 文件太小,多为几百 KB,配色方案似乎也抄袭了 2022 年的一张商业插图。

随着 DALL-E 3 的问世以及 Midjourney 等同类工具的不断迭代,AI 绘画能力越来越强。春晚吉祥物形象陷入舆论漩涡,再次把 AI 绘画推向风口浪尖。尽管此事未有定论,但大家对 AI 生成内容的争议始终存在。

Meta 推出 AI 音频模型 Audiobox:支持语音及文字同时输入、可生成

多层次声音

Meta 日前推出了一款 AI 声音生成模型 Audiobox,能够同时接收语音及文字输入,用户可同时使用语音及文字描述,让这款模型生成所需的音频。据悉,这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型,据称 Audiobox 能生成各种环境音、自然对话语音,并整合了音频生成和编辑能力,以便于用户自由生成自己所需的音频。

Meta 介绍称,生成高品质音频需要有大量音频库及深厚的领域知识,但大众难以获得这些资源,而该公司推出这个模型旨在降低声音生成门槛,让任何人都更容易制作视频、游戏等应用场景的音效。

OpenAI 首席执行官 Sam Altman 被《时代》周刊评为年度 CEO

当地时间周三,OpenAI 首席执行官萨姆・阿尔特曼(Sam Altman)被《时代》周刊评为年度 CEO。

回顾最近的动荡,阿尔特曼表示:“这是一场堪称满分的疯狂经历。我到现在仍会感到震惊。”

他表示,Chat-GPT 及其后续版本 GPT-4 为 OpenAI 乃至整个世界带来了革命性的影响,而 2023 年也成为了许多人开始认真对待人工智能的一年。

最初作为致力于推进人工智能以造福人类的非营利研究实验室而设立的 OpenAI,在经历了一系列转变之后,现在已经成为一个价值 800 亿美元的实体。

正因如此,阿尔特曼也成为了一位极具影响力的高管,象征着技术革命的领导者和有远见的领袖。

全部讨论

no data来都来了,坐下聊聊