InternGPT(iGPT 的简称)/ InternChat(iChat 的简称)是一种定位语言驱动的可视化交互系统,允许您使用定位设备通过点击、拖动和绘图与 ChatGPT 进行交互。 InternGPT 这个名字代表交互、非语言和 ChatGPT。与现有依赖纯语言的交互系统不同,iGPT 通过结合指向指令,显着提高了用户与聊天机器人之间的交流效率,以及聊天机器人在以视觉为中心的任务中的准确性,尤其是在复杂的视觉场景中。此外,在iGPT中,使用辅助控制机制来提高LLM的控制能力,并为高质量的多模态对话微调了一个名为Husky的大型视觉语言模型(令人印象深刻的ChatGPT-3.5-turbo 93.89% GPT-4 质量)。
删除蒙版对象
交互式图像编辑
图像生成
交互式视觉问答
交互式图像生成
视频精彩解读
官网