Ideogram AI:AI作图现在也能准确生成文字了
互联网上有很多图像生成人工智能,如 Midjourney 和 OpenAI 的 Dall-E 2,然而,Ideogram AI 已经成为一家值得关注的初创公司。
What is Ideogram AI?
Ideogram AI 公司由前谷歌大脑研究人员创立,并从 a16z 和 Index Ventures 等实力雄厚的投资者那里获得了 1650 万美元的巨额种子资金。
我们的创始团队由世界知名的人工智能专家组成,他们曾在谷歌大脑、加州大学伯克利分校、CMU 和多伦多大学领导过变革性的人工智能项目。我们在人工智能领域的基础工作包括 去噪扩散模型、Imagen: 谷歌的文本到图像系统、用于视频合成的 Imagen Video、用于语音合成的 WaveGrad、神经语音识别、神经机器翻译、用于学习视觉表征的对比学习以及生成对抗模仿学习。
如何将文字准确地融入生成的图像--想想标牌上的字母或公司徽标--一直是许多人工智能平台面临的难题。Ideogram AI 似乎已经破解了这一难题。这款基于网络的应用程序目前正在进行测试,在其风格选项中提供了 "排版 "预设。这样,用户就可以创建带有文字元素的图像,并以不同的颜色、字体、大小和风格进行渲染。从 3D 效果图到时尚和概念艺术,该平台允许用户选择并无缝组合多种风格。
Ideogram AI 并非总是完美无瑕,但文字渲染似乎比其他现有解决方案更加准确。
尽管如此,Ideogram AI 也并非没有局限性。我们在测试中发现了输出质量的不一致性。此外,该平台还缺乏同类图像生成器的一些功能,如缩放/外绘功能。有趣的是,Ideogram AI 甚至难以准确呈现自己的名字,而在使用更通用的文本时表现更好。

A happy robot. Text: “AI can write now”, typography, poster, cinematic
尽管有些缺点,Ideogram AI 提供了一种专门服务,填补了当前AI生成影像领域的空白,使其成为这个快速发展行业中的一个重要新进者。
与其启动和测试版本发布同时,Ideogram AI选择了一种独特的方式去实践其使命宣言:“帮助人们变得更富有创造力”。 这个宣言本身就是用其自家的排版工具生成。这种创新展示立即吸引了行业重要人物的关注,如Sakana AI的创始人David Ha,以及曾经的谷歌员工Margaret Mitchell,为这个初创公司赢得了宝贵的认可。

Ideogram AI聚焦于排版生成,这是策略性的选择,使得它在竞争激烈的领域中独树一帜。这个特性可能会对平面设计师,或那些通常需要雇佣此类专业人士来创建专门的基于文本的图像的人,尤其有吸引力。
同时,竞争对手并未停滞不前。AI图像生成领域的另一参与者Midjourney,刚推出了其新的“变化区域”功能,允许用户添加、移除或调整生成图像的特定部分。这个领域的动态性持续发展,但Ideogram AI的专门服务可能会赋予其优势,特别是在那些寻求在他们的数字艺术作品中进行高质量的文本呈现的人群中。
如何使用Ideogram AI?
第一次使用Ideogram AI?界面设计得非常用户友好。首先,访问 Ideogram AI 的官方网站,然后点击“使用 Google 注册”按钮创建您的帐户。

Step 1 (Image credit)
一旦您进入主控制面板,您将看到一个设计用于输入提示的文本框。
例如,我们输入了提示:“Text ‘DATA SCIENCE’, vibrant colors, 8k, 3d render, vibrant, typography”。

Step 2 (Image credit)
此平台还提供了选择宽高比的选项,为您提供如“10:16”、“1:1”和“16:10”等选择。如果您要为需要特定尺寸的特定平台生成图像,这尤其有用。
此外,Ideogram AI 提供预设关键字以丰富您的创作过程。您可以添加如“电影”或“3d 渲染”等标签来调整您生成的图像。
配置好设置后,点击“生成”按钮并等待。系统将处理您的请求,最终为您显示四个不同版本的生成图像供您选择。
我们的经验显示,输出质量通常相当可观,符合平台承诺的更具创造性的基于文本的图像生成功能。
Example 1:

Example 2:

Ideogram AI的多功能潜在应用
正如我们已经讨论的,Ideogram AI提供了独特的功能,特别是在基于文本的图像生成方面,这可能使其在Midjourney等竞争对手中脱颖而出。但是这如何转化为跨行业的实际应用呢?
设计加速
Ideogram AI为快速原型设计提供了一种简化的方法。无论您是为徽标草拟初步概念,还是想象各种场景插图,该平台都允许您直接从文本提示中生成视觉效果。这加速了头脑风暴阶段,促进了从想法到实物设计的更高效的流程。
广告定制
对于营销和广告专业人员,Ideogram AI作为敏捷概念测试的工具。你可以快速生成针对不同消费者群体的定制广告、海报或信息图表。考虑到Ideogram AI的运行速度,A/B测试变得更为高效,使营销人员能够实时优化活动。

A cute cat holding a sign that says “meow”
创作催化剂
传统和数字艺术家都可以利用Ideogram AI来提升他们的创作过程。你可以输入一个简单的提示来可视化角色或场景,而不是花费几小时去草拟初稿。这不仅节省时间,而且还可以作为创新灵感的新泉源,为你的下一部杰作提供起点。
内容增强
像作者和博主这样的内容创作者也可以从Ideogram AI的文本到图像功能中受益。如果你想用定制的图像来增强你的文字作品,但缺乏图形设计技能,Ideogram AI提供了一个简单的解决方案。它可以生成与你的文字内容的主题或主题相对应的定制视觉效果,为读者增加了另一层的参与度。

A robot pointing his finger toward a neon billboard saying: “artificial intelligence”, illustration
为所有人提供图像
最后,我们不能忘记休闲用户和业余爱好者。Ideogram AI也吸引那些只想探索他们想象力边界,而不需要高级设计技能的人。提示驱动的界面允许任何人将一个瞬间的思考、梦想或抽象概念转化为视觉形式,对非艺术家来说也同样具有趣味性和便利性。
Ideogram AI平台的多功能性表明其有广泛的应用,从专业用途到个人项目。其在基于文本的图像生成方面的独特重点,可能使其成为跨多个领域的无价财富。