entry-slick
InternGPT简介

InternGPT(iGPT 的简称)/ InternChat(iChat 的简称)是一种定位语言驱动的可视化交互系统,允许您使用定位设备通过点击、拖动和绘图与 ChatGPT 进行交互。 InternGPT 这个名字代表交互、非语言和 ChatGPT。与现有依赖纯语言的交互系统不同,iGPT 通过结合指向指令,显着提高了用户与聊天机器人之间的交流效率,以及聊天机器人在以视觉为中心的任务中的准确性,尤其是在复杂的视觉场景中。此外,在iGPT中,使用辅助控制机制来提高LLM的控制能力,并为高质量的多模态对话微调了一个名为Husky的大型视觉语言模型(令人印象深刻的ChatGPT-3.5-turbo 93.89% GPT-4 质量)。

🎁主要特点

删除蒙版对象

交互式图像编辑

图像生成

交互式视觉问答

交互式图像生成

视频精彩解读

官网

https://github.com/OpenGVLab/InternGPT

官方动态
查看更多
社区动态
InternGPT
#SPHINX 演示就在这里!尝试一下并告诉我们您是否发现任何有趣的例子🤩🤩
t.co/16asBqX3xz
-------------
来自 @Pan Lu:🚀 我们的 @Gradio 演示现在支持多种视觉语言任务:
1️⃣ 视觉问答(VQA)
2️⃣ 多级密集字幕
3️⃣ 参考表达理解
4️⃣ 关系基础
5️⃣ 接地字幕
6️⃣ 物体检测
7️⃣人体关键点检测
8️⃣ 文本检测...
分享