热度最高
好说 AI
好说 AI
好说 AI
14.3万
好说AI 是一款融合AI聊天、AI艺术创作、AI工具推荐、AI资讯及技术创新交流的高效应用,旨在为你提供极具创造力和便利性的AI体验!作为专业的智能移动助手,好说AI 将引领你探索令人着迷的AI世界,激发未来科技的无尽潜能。此处唯有无限遐想,不设任何界限! 【AI绘图】 好说AI 配备了尖端神经网络AI艺术技术,借助Stable Diffusion 技术,仅需简洁的提示及描述,便能生成高品质图像。无论你是专业设计师、艺术家,还是业余爱好者,好说AI 都能助你缔造出极具创意的佳作。 【AI聊天】 通过采用各种智能聊天模型的好说AI 机器人,你可以轻松实现创意写作、自动翻译、信息检索、智能虚拟助手等诸多便捷功能。好说AI 还支持在各类大语言模型(LLM) 之间切换,借助这些模型,让你随时随地告别昂贵的学习成本,开启全新的AI之旅。 【AI工具推荐】 好说AI 为你推荐行业前沿、实用性强的人工智能技术与应用,助你深入了解更多AI工具,提升各领域工作效率。 【实时AI资讯】 紧密关注行业动向,尽享AI Chat、Stable Diffusion、Midjourney、Bard 等全面的AI资讯与创新成果,助你站稳科技风口,成为行业焦点的领先者。 【社区互动】 加入好说AI 社区,与志同道合者共享交流,无论是实践应用还是理论探讨,都可以在这里找到志趣相投的朋友。让我们共同跨越束缚,拥抱创新的自由翱翔!
要闻2023.09.26
Spotify推出播客语音翻译功能,完全使用播主的声音!
Spotify推出播客语音翻译功能,完全使用播主的声音!
Spotify推出播客的语音翻译功能,这是一个由 AI 驱动的突破性功能,可以将播客翻译成其他语言——并完全使用播主的声音。 该功能基于OpenAI 新发布的语音生成技术。无论文化、国家还是社区,我们分享的故事都将我们联系在一起。更多的时候,是说话者的声音为这些故事赋予了与叙事本身一样重要的价值。15 年来,Spotify 的全球平台赋能各种背景的创作者与全球听众分享他们的作品。 核心在于,这是通过利用音频的力量来克服获取障碍、边界和距离的技术实现的。但随着近期的技术进步,我们开始思考:我们是否还有更多的方法来弥合语言差异,使这些声音在全球范围内被听到? 今天,我们很高兴推出播客的语音翻译功能,这是一个由 AI 驱动的突破性功能,可以将播客翻译成其他语言——完全使用播主的声音。 这个由 Spotify 开发的工具利用了最新的创新技术——其中之一就是 OpenAI 新发布的语音生成技术——来匹配原始讲话者的风格,为听众提供比传统配音更真实的听感,听起来更加亲切自然。一个原本用英语录制的播客节目现在可以用其他语言提供,同时保持说话者独特的语音特征。 作为试验的一部分,我们与播客主播 Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons 和 Steven Bartlett 紧密合作,为一些目录中的节目和未来的节目发布生成了 AI 驱动的其他语言(包括西班牙语、法语和德语)的语音翻译。我们也期待加入其他节目,如 Dax Shepard 的《eff won with DRS》、The Ringer 的《The Rewatchables》以及 Trevor Noah 今年晚些时候发布的新原创播客。
好说新闻
·2023-09-26
会说话、能识图的ChatGPT来了!距离“超级助理”更进一步
4
会说话、能识图的ChatGPT来了!距离“超级助理”更进一步
ChatGPT将开口说话,并拥有5种不同语音,与Siri等C端个人助理直接竞争,同时还可以根据图片回答或给出建议。开口说话、装上“眼睛”,多模态ChatGPT来了。 周一,OpenAI在官网宣布,将在未来两周内面向Plus和企业用户推出ChatGPT的语音和图像功能,上述功能允许用户进行语音对话或向ChatGPT展示图片。 语音功能方面,ChatGPT可以用语音来回答问题和命令,与苹果的Siri等C端个人助理形成直接竞争。此外,ChatGPT将有五种不同的语音供用户选择,同时支持语音音频生成文本、将播客语音翻译成其他语言等功能。 图像功能方面,用户提交图片并询问相关问题,ChatGPT可以根据图片回答或给出建议。据悉,语音功能将在iOS和Android平台推出,图像功能将登陆所有平台。 开口说话、5种不同语音OpenAI升级了用户与ChatGPT的交互方式,用户不仅可以通过在文本框中输入句子,还可以通过大声说话来提示聊天机器人。 这一功能并不陌生,类似于与谷歌助手交谈,只是OpenAI希望,由于底层技术的改进,答案会更好。目前,大多数虚拟助手都在依靠大模型进行重建,OpenAI 只是走在了前面。 OpenAI 于今年 5 月发布了 ChatGPT 应用程序,并已经提供了语音转文本功能。增加语音回复功能可以让用户感觉在进行更人性化的对话。该公司希望这项新功能能鼓励用户随时随地使用其移动应用,并与谷歌的 Assistant、苹果的 Siri或 亚马逊的 Alexa 等个人助理产品形成直接的竞争。 OpenAI正在推出一种新的文本转语音模型,并称它可以“通过文本和几秒钟的语音样本生成类似人类的音频”,用户可以从五个选项中选择 ChatGPT 的声音,但 OpenAI 似乎认为该模型的潜力远不止于此。例如,OpenAI 正在与 Spotify
好说新闻
·2023-09-25
小米小爱同学大模型版安装包公布
1
小米小爱同学大模型版安装包公布
小爱同学大模型版安装体验包已公布,小米用户可下载体验。据官方介绍,大模型加持的小爱同学实现了全新升级,现已支持文本生成、个性化助手、内容摘要、角色定制、图片生成、多语言翻译、小米产品助手等功能。小米用户点击活动页面下方的下载按钮后,选择“原安装包下载”,如果没有看到“原安装包下载”(如上图右图所示),需要升级应用商店到最新版后重试。(注:如果小米手机显示无法安装,可以从小米文件管理器打开安装包。)此外,用户还可以在浏览器首页打开“我的”-“我的下载”找到已下载的安装包,点击打开后选择允许浏览器安装应用,即可按步骤完成安装。需要注意的是,小爱同学大模型版仅支持小米设备安装体验,其他品牌的设备安装后无法打开。内置大模型的新版小爱同学已于 8 月 14 日起开启邀请测试,首批包含小米 MIX Fold 3、小米 13/12 系列、Redmi K60 / K50 系列机型。之后小米又于 8 月 21 日和 8 月 24 日开启两次邀请测试,机型包括小米 MIX Fold 2、小米 11 系列、小米 10 系列等。没有赶上这三次测试的小米用户,可以尝试下载体验。
好说新闻
·2023-09-25
DALL·E 3内部实测效果惊人!Karpathy生成逼真灵动「美国小姐」,50个物体一图全包
DALL·E 3内部实测效果惊人!Karpathy生成逼真灵动「美国小姐」,50个物体一图全包
OpenAI 作图神器 DALL·E 3 内测开启,网友纷纷上手实测后,感慨强到令人发指。文生图从此告别「提示词时代」?一直以来,Midjourney 横扫设计界,效果惊艳,让许多网友惊呼将淘汰一波打工人。 如今,OpenAI 官宣了新一代作图模型——DALL·E 3,还将其与 ChatGPT 合并,画作细腻度令人发指。 甚至,不用 prompt,它能准确还原细节,为图片配上文字。 DALL·E 3 的实力究竟如何?真的可以挑战 Midjourney 吗? 现在,已经拿到内测资格的网友们,纷纷来了一大波实测。 一起来看看吧。 网友实测OpenAI 科学家 Karpathy 体验了一把 DALL·E 3+pika_labs 生成动画风格的案例。 他随意找出一篇 WSJ 文章,「The New Face of Nuclear Energy Is Miss America」,将里面部分文字粘贴 DALL·E 3,然后生成相关的图片。 最后再用 pika_labs 生图工具,让它动起来。 首先让 ChatGPT 预测未来一年的一个重要新闻标题。 使用插图和 /animate 参数提示 @pika_labs。「意想不到的突破:科学家用革命性技术逆转气候变化影响;一夜之间恢复极地冰川!」 通过结合 @OpenAI 和 @pika_labs 的力量,你现在已经在短短几分钟内预测了未来的重大新闻,并为其绘制了插图和动画! 多轮对话,50 个物体,一图全包他还按照 Reddit 网友给他的创意,发推描述了一个对 DALL·E 3 的能力进行测试的具体用例。 首先,他先让 ChatGPT 生成了一个包含 50 个日常生活物体的清单。让后让结合了 DALL·E 3 的 ChatGPT 把这 50 个物件画到一张图里。
好说新闻
·2023-09-25
每日AI资讯(9.25):不能错过的大新闻
3
每日AI资讯(9.25):不能错过的大新闻
9月25日每日资讯,每天阅读3分钟,提早告别信息差 1.百度发布量子领域大模型。该量子领域大模型基于文心一言,使用量子领域数据进行更有针对性的训练和优化,能更好地理解量子知识并执行任务。 2.智谱AI发布MathGLM数学模型。MathGLM数学模型能精确计算包括基础算术和复杂混合在内的算术运算,并提升模型的中文数学解决能力。 3.统信开源操作系统deepin接入大模型。大模型的接入可提升deepin语言理解和处理能力,并带来全新交互模式,合作伙伴还将直接调用操作系统的AI能力。 4.小米公布小爱同学大模型版安装包,小米用户可下载体验。据悉,大模型加持的小爱同学已支持文本生成、角色定制、图片生成、多语言翻译等功能。 5.微软推出Copilot Lab,可助员工在企业环境下使用AI工具。微软称,Copilot Lab将成为企业员工中心,员工可和同事分享AI使用心得和建议,如使用AI编写邮件等。 6.龙之信条2游戏开发商利用AI驱动游戏NPC。官方表示,利用AI让游戏NPC在独立于玩家的情况下过着自己的生活,是龙之信条2努力实现的目标。
好说新闻
·2023-09-25
微软深夜革命,GPT-4 Office全家桶登场!每月30刀,10亿打工人饭碗被抢?
12
微软深夜革命,GPT-4 Office全家桶登场!每月30刀,10亿打工人饭碗被抢?
微软果然来搞事了!深夜忽然炸场,GPT-4 加持全新 Copilot 正式接入 Office 全家桶、Windows 11 和 Edge。可以说,微软半年前「吹的牛」,今天几乎全部都实现了。鸽了 6 个月,微软 Copilot 全家桶,真的要来了! 刚刚,微软又在深夜放炸弹了—— 9 月 26 日起,全新升级的 Copilot 将直接集成到 Windows 11、微软 Office 365 全系产品和 Edge 中。 从此,不管是 Word、PPT、Excel、Outlook、Teams 这些办公软件,还是 Windows 11 操作系统,亦或是 Edge 浏览器,通通都会得到 GPT-4 的加持! 果然不出所料,昨日 DALL·E 3 的发布,只是微软放大招的号角。或许是谷歌多模态大模型 Gemini 的风声日渐逼近,微软急了。 对于 Copilot,微软这样介绍——「你的日常 AI 伴侣,让你更聪明、更有创造力、更有生产力,与周围的世界连接得更紧密。」 满满写着这几个字——进化为更好的打工人。 微软 Copilot 全面上线,AI 新时代来了!9 月 26 日 Windows 11 推出的巨量更新中,之前已经测试了一段时间的 Windows Copilot 直接上线。 就像 Copilot 这个词的字面意思——副驾驶一样,这次的 Windows 11 Copilot 将利用 AI 的理解能力,帮助用户以前所未有的方式,轻松创建,完成 Windows 中的各项任务。 有了 Copilot 的加持,Windows 11 瞬间化身你的数字管家。你不用再记住那些像咒语一样的快捷键组合,只用向他用自然语言提出要求,他都能尽最大的努力直接向你呈现结果。 这个推出了 20 多年,世界范围内用户最多的操作系统,将成为用户体验 AI 强大能力的始发站。
好说新闻
·2023-09-22
微软 GitHub AI 代码助手 Copilot Chat 现已开放个人使用
5
微软 GitHub AI 代码助手 Copilot Chat 现已开放个人使用
微软 GitHub 于今年 7 月份为企业用户推出了 Copilot Chat 工具,这是一个 AI 代码助手。今日,GitHub 宣布该工具已可在 Visual Studio 和 Visual Studio Code 中面向个人使用,为 GitHub Copilot 个人用户提供公开测试版本,附链接如下:https://gh.io/github-copilot-chat-beta据介绍,GitHub Copilot Chat 测试版已免费向所有 Copilot 个人用户启用。目前,Visual Studio 和 Visual Studio Code 编辑器均支持 GitHub Copilot Chat,个人用户还将收到一封电子邮件通知,以指导进行后续步骤。以下是 GitHub Copilot Chat 的一些功能:实时指导:GitHub Copilot Chat 可以建议针对特定编码挑战量身定制的最佳实践、技巧和解决方案。开发者可以使用 GitHub Copilot Chat 快速学习新语言或提高技能。 代码分析:通过 GitHub Copilot Chat,开发者可以分解复杂的概念并获得代码片段的解释。 解决安全问题:GitHub Copilot Chat 可以提出修复建议,并帮助减少安全扫描期间发现的漏洞数量。 简单的故障排除:在调试代码中,GitHub Copilot Chat 不仅可以识别问题,还可以提供建议、解释和替代方法。
好说新闻
·2023-09-21
360 智脑大模型面向公众开放:千亿参数规模,十大核心能力
1
360 智脑大模型面向公众开放:千亿参数规模,十大核心能力
360 公司官方今日宣布,360 智脑大模型全面接入 360 全家桶,正式面向公众开放。用户可通过 ai.360.com 一站式登录体验 360 智脑 App、360 搜索、360 安全浏览器、LoRA360、AI 数字员工等大模型服务,大家可自行体验。据介绍,360 智脑拥有千亿参数规模,预训练超万亿 tokens,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,能够覆盖大模型应用的所有场景。基于 360 智脑的企业级垂直大模型,已在金融、医疗、教育等近 20 个行业陆续落地。360 智脑大模型号称拥有三大创新体验:第一,360 智脑为上网体验引入更强的智能助手,可一键对浏览网页进行总结摘要、翻译、改写,结合图形化效率工具。 第二,大模型数字人结合 360 搜索多年积累的垂直知识库,可智能优化用户输入 prompt,识别用户意图,AI 问答生成结果更加专业、优质。 第三,多轮问答生成和引导的追问形式,可突破用户知识边界,最大程度激发用户创造力。
好说新闻
·2023-09-21
OpenAI 发布 DALL-E 3 文生图模型:与 ChatGPT 完全集成 在细节和提示保真度方面挑战极限
5
OpenAI 发布 DALL-E 3 文生图模型:与 ChatGPT 完全集成 在细节和提示保真度方面挑战极限
本周三,OpenAI 宣布了 DALL-E 3,这是其最新版本的 AI 图像合成模型,它与 ChatGPT 完全集成。 DALL-E 3 通过紧密遵循复杂的描述并处理图像内文本生成(如标签和标志)来渲染图像,这是早期模型所面临的挑战。目前处于研究预览阶段,将于十月初提供给 ChatGPT Plus 和企业客户。 与其前身一样,DALL-E 3 是一种文本到图像生成器,根据称为提示的书面描述创建新颖的图像。尽管 OpenAI 没有透露关于 DALL-E 3 的技术细节,但以前版本的 DALL-E 的核心 AI 模型是基于由人类艺术家和摄影师创作的数百万张图像进行训练的,其中一些是从像 Shutterstock 这样的库网站获得许可的。DALL-E 3 很可能也遵循了这一相同的方法,但使用了新的训练技术和更多的计算训练时间。 从 OpenAI 在其宣传博客上提供的示例来看,DALL-E 3 似乎是迄今为止可用于按提示操作的图像合成模型中的一个巨大突破。尽管 OpenAI 的示例是精选的,以展示其效果,但它们似乎忠实地遵循了提示的指令,并以无需任何「黑科技」或提示工程即可令对象逼真地呈现出来。 与 DALL-E 2 相比,OpenAI 表示 DALL-E 3 能够更有效地细化手部等小细节,从而默认情况下创建引人入胜的图像。 相比之下,来自另一竞争对手供应商 Midjourney 渲染了逼真的细节,但仍然需要对提示进行大量反直觉的调整才能控制图像输出。 DALL-E 3 似乎还可以处理图像中的文本,而其前身无法做到这一点(一些竞争模型,如 Stable Diffusion XL 和 DeepFloyd,在这方面表现得越来越好)。例如,包含「一幅画中,一个鳄梨坐在治疗师椅子上,说着『我感到内心空虚』,中间有一个坑孔大小的洞」的提示,创建了一个卡通鳄梨,角色的台词完美地被包含在一个对话气泡中。
好说新闻
·2023-09-21
TikTok成为第一个正式要求创作者添加人工智能生成标签的平台
1
TikTok成为第一个正式要求创作者添加人工智能生成标签的平台
TikTok近日全面启动平台AIGC内容的监管。为了提高透明度,TikTok正式推出了其新的AI生成内容的内部标签。 TikTok要求使用AI在应用中创建帖子的用户标记它,如果未能这样做,他们的内容可能会被删除。 根据TikTok的说法,AI提供了令人难以置信的创意机会,但如果观众不知道内容是由AI生成或编辑的,它可能会混淆或误导观众。标记内容可以帮助解决这个问题,通过明确告诉观众内容是由AI技术大幅修改或修改的。 TikTok成为第一个正式添加特定AI生成标签的平台,Instagram也正在开发其自己的AI内容标签,它也可能会使发布成为要求。YouTube也正在开发新工具来应对预期的“AI海啸”,而X到目前为止已经依赖于社区注释来帮助用户了解人工内容。
好说新闻
·2023-09-20
发现更多AI新闻
加入好说 AI 社区
保持与全球最新的人工智能新闻同步,并在线获取尖端的人工智能工具
立即注册