首页AI 工具
Segment Anything

Segment Anything

Meta AI
28人喜欢过
entry-slick
entry-slick
entry-slick
entry-slick
entry-slick
Segment Anything简介

Segment Anything Model (SAM):来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象

你可以点击此处来免费体验模型Demo

SAM 是一种可提示的分割系统,可以对不熟悉的对象和图像进行零样本泛化,无需额外训练。

SAM:一种通用的分割方法

以前,要解决任何类型的分割问题,有两类方法。第一种是交互式分割,允许分割任何类别的对象,但需要一个人通过迭代细化掩码来指导该方法。第二种,自动分割,允许分割提前定义的特定对象类别(例如,猫或椅子),但需要大量的手动注释对象来训练(例如,数千甚至数万个分割猫的例子),连同计算资源和技术专长一起训练分割模型。这两种方法都没有提供通用的、全自动的分割方法。

SAM 是这两类方法的概括。它是一个单一的模型,可以轻松地执行交互式分割和自动分割。该模型的可提示界面(稍后描述)允许以灵活的方式使用它,只需为模型设计正确的提示(点击、框、文本等),就可以完成范围广泛的分割任务。此外,SAM 在包含超过 10 亿个掩码(作为该项目的一部分收集)的多样化、高质量数据集上进行训练,这使其能够泛化到新类型的对象和图像,超出其在训练期间观察到的内容。这种概括能力意味着,总的来说,从业者将不再需要收集他们自己的细分数据并为他们的用例微调模型。

总而言之,这些功能使 SAM 能够泛化到新任务和新领域。这种灵活性在图像分割领域尚属首创。 - SAM 允许用户通过单击或通过交互式单击点来分割对象以包含和排除对象。还可以使用边界框提示模型。

  • SAM 可以在面对被分割对象的歧义时输出多个有效掩码,这是解决现实世界中分割问题的重要且必要的能力。

  • SAM 可以自动查找并屏蔽图像中的所有对象。

  • SAM 可以在预计算图像嵌入后实时为任何提示生成分割掩码,从而允许与模型进行实时交互。

SAM 的工作原理:即时分割

在自然语言处理和最近的计算机视觉领域,最令人兴奋的发展之一是基础模型的发展,这些基础模型可以使用“提示”技术对新数据集和任务执行零样本和少样本学习。我们从这行工作中汲取了灵感。

我们训练 SAM 为任何提示返回有效的分割掩码,其中提示可以是前景/背景点、粗框或掩码、自由格式文本,或者一般来说,指示图像中要分割的内容的任何信息。有效掩码的要求仅仅意味着即使提示不明确并且可能指代多个对象(例如,衬衫上的一个点可能表示衬衫或穿着它的人),输出也应该是一个合理的掩码这些对象之一。此任务用于预训练模型并通过提示解决一般的下游分割任务。

我们观察到预训练任务和交互式数据收集对模型设计施加了特定的约束。特别是,该模型需要在 Web 浏览器的 CPU 上实时运行,以允许我们的注释者实时交互地使用 SAM 以高效地进行注释。虽然运行时约束意味着质量和运行时之间的权衡,但我们发现简单的设计在实践中会产生良好的结果。

在引擎盖下,图像编码器为图像生成一次性嵌入,而轻量级编码器将任何提示实时转换为嵌入向量。然后将这两个信息源组合在一个预测分割掩码的轻量级解码器中。在计算图像嵌入后,SAM 可以在 50 毫秒内根据网络浏览器中的任何提示生成一个片段。

官方动态
查看更多
Meta AI
“Prime 现在售价 179 美元,但很少有人知道这个省钱技巧。

你会想尽快检查一下。”
分享
Meta AI
🏆👏 Winners Announced: #MealtimeTogether Video Awards Celebrates the Spirit of Good Times and Togetherness at #GanJingWorld
分享
社区动态
Meta AI
“Prime 现在售价 179 美元,但很少有人知道这个省钱技巧。

你会想尽快检查一下。”
分享
Meta AI
🏆👏 Winners Announced: #MealtimeTogether Video Awards Celebrates the Spirit of Good Times and Togetherness at #GanJingWorld
分享
Meta AI
分享
Meta AI
Is there a more breathtaking sight than Niagara Falls at full, gushing force? There is, actually - the very same falls drained, as they were in 1969.
分享
Meta AI
Spread your message further, stand out from the crowd, and hire great people. Directly on X.

Boost your business with Verified Organizations.
分享
Meta AI
上个月,我们发布了 SeamlessM4T,这是一种用于语音翻译的基础多模态模型,可以根据任务执行多达 100 种语言的语音到文本、语音到语音等任务。

有关这项工作的更多详细信息➡️ t.co/v2AhogY1cX
image
分享
Meta AI
我们最近发布了 Belebele,这是第一个多语言阅读理解数据集。它对 122 种语言变体是并行的,可以直接比较模型对不同语言的理解程度。

数据集⬇️
t.co/4HMjxLRLCP
分享
Meta AI
🚀 Huuuuge News! 🚀

We’re releasing model weights for our production generative Voice model: XTTS🎙️✨

✅ 3-second cloning
✅ Multilingual speech generation
✅ Cross-language voice cloning
✅ 24khz quality

Try it on @Huggingface now 🔥

t.co/bwHBVkLRc1
分享
Meta AI
📣 Llama 2 和 Code Llama 现已出现在 #KaggleModels 上!
-------------
来自@Kaggle:🤖#KaggleModels 上的新内容!隆重推出 @MetaAI 的 Llama 2:一组经过预训练和微调的生成文本模型,参数规模从 70 亿到 700 亿不等。 📚 探索、分享和投票您最喜欢的笔记本。快乐卡格!
分享
Meta AI
“Prime 现在售价 179 美元,但很少有人知道这个省钱技巧。

您是否注意到您的亚马逊成本上涨了?专家们揭示了该如何应对。”
分享
Meta AI
"Prime is now $179, but few know this saving hack.

Did you notice that your Amazon costs went up? Experts reveal what to do about it."
分享
Meta AI
我们通过在 Apache-2 许可证下发布训练代码和模型权重来扩展对 DINOv2 的访问。

有关此内容以及我们最近为推进计算机视觉研究和人工智能公平性所做的更多工作的详细信息⬇️
分享
Meta AI
RT @MyoSuite:(1/8) 7 月,我们在 #RSS2023 上介绍了 SAR。我们证明,SAR 通过应用 m 的神经科学来实现 SOTA 高亮度控制……
分享
Meta AI
恭喜 @ylecun 被选为 2023 年 #TIME100AI 之一。查看完整列表以及 @TIME 上对 Yann 的简短采访 ➡️ t.co/kihVm6nn2s
image
分享
Meta AI
Anyscale Endpoints 使 AI 应用程序开发人员能够轻松地将封闭模型替换为 Llama 2 模型,或者在同一应用程序中使用开放模型和封闭模型。
-------------
来自@ray:@MetaAI 团队为推动 Llama 模型领域的发展做出了巨大的努力。我们很高兴能够合作帮助发展 Llama 生态系统。
分享
Meta AI
作为我们对当今人工智能开放方法价值的持续信念的一部分,我们发表了一篇研究论文,其中包含有关 Code Llama 培训、评估结果、安全性等的更多信息。

Code Llama:代码的开放基础模型➡️ t.co/u7iXXE08Bd
image
分享
Meta AI
Be warned, the following images will show you a world that you never knew existed, and leave you with a newfound appreciation for the power of photography in preserving our collective memory.
分享
Meta AI
14-3-3ƞ (eta) is the only test that not only predicts the development of rheumatoid arthritis (RA) in its earliest stages but also provides joint health information along the disease course that enables tight treatment control.
分享
Meta AI
Snack big, win big! Play Field Goal Feast online for a chance to win a Fanatics Gift Card!
分享
Meta AI
我们相信,无论是在创新还是安全方面,人工智能模型都受益于开放的方法。发布像 Code Llama 这样的模型意味着整个社区可以评估他们的能力,识别问题并解决问题。修复漏洞。 GitHub - facebo...
link
GitHub - facebookresearch/codellama: Inference code for CodeLlama models
Inference code for CodeLlama models. Contribute to facebookresearch/codellama development by creating an account on GitHub.
分享