首页AI 新闻
Stable Diffusion 团队发布大语言模型:开源版 ChatGPT 的时代要来了?

Stable Diffusion 团队发布大语言模型:开源版 ChatGPT 的时代要来了?

好说新闻
好说新闻
2023-04-20 14:30

Stability AI 发布的开源模型Stable Diffusion,是目前最主流也是最重要的AI绘画模型之一。

基于 Stable Diffusion,开发者社区创作了许多有意思的插件和模型,例如可以控制图形形状的 Control Net 项目等,相关的开发项目超过1000个。

现在,这家热衷于开源的AI公司又想搞一个大事情——发布一个类似 ChatGPT 的开源大语言模型。

人人都有大语言模型

2023年可以说大语言模型井喷的一年,这几个月以来,几乎每个星期都有一个新的大语言模型面世。大模型、小模型、文本生成的、多模态的、闭源的、开源的……现在就是大语言模型的春天,各家百花齐放。这份热闹不仅属于微软、Google、百度、阿里等互联网大厂,也属于所有与AI相关的科技公司。

和现有的大模型相比,StableLM 大语言模型有什么特别的呢?

根据官方的介绍,目前 StableLM 是一个开源且透明的模型,允许研究人员和开发者自由地检查、使用和修改代码。就像 Stable Diffusion 一样,用户们都可以自由地配置 Stable LM,打造专为自己需求而量身定制的大语言模型。目前 StableLM Alpha 版本模型的参数大小为30亿和70亿,未来 Stability AI 还会提供150亿和650亿参数大小的模型版本。

尽管和 GPT-3 模型的 1750亿 参数相比,StableLM 的模型大小要小得多,但 Stability AI 表示 StableLM 是基于一个比The Pile数据集还要大3倍的扩展数据集训练而成,在编码和自然语言对话方面都有不错的表现。

The Pile 数据集本身已经包括了大量书籍、Github 知识库、网页、聊天记录等数据,还收集了医学、物理、数学、计算机科学和哲学学科的论文,可以为通用大语言模型、跨领域文本生成训练提供很好的基准。因此在实际使用时,StableLM 与 GPT-3 的差距并不像纸面参数数据的差异那样明显。

例如在对话方面,若是提问“你会对即将高中毕业的朋友说些什么”,StableLM会回答:

应该为自己和取得的成绩感到骄傲,并且应该对未来抱以期望。

对于“写一封电子邮件”这样的任务,StableLM也能轻松应对。

在创作方面,若给出这样的题目——“在深度学习神经网络和符号人工智能之间写一首史诗般的说唱战歌”,StableLM也能秒写出一首rap歌词。

此外,Stability AI还展示了一些“不走寻常路”的例子,比如用C语言编写能计算机生命意义的程序。

Stability AI 还将StableLM托管在了 HuggingFace 社区网站上,想要尝试的使用者可以访问这里进行交流调试。

通过我们进行的简短测试,我们发现StableLM的中文水平还不是太好,更不用说与像ChatGPT这样的优秀学生相比了。因此,在交流时,建议大家使用英语。

与ChatGPT有多少距离?

那么它与ChatGPT相比如何呢?至少在目前,最好不要把它们相提并论。实际上,它的输出的真实性几乎是不存在的。例如,下面就可以看到,它声称在2021年1月6日,特朗普的支持者控制了立法机构,这是对最近事件的一些危险的混淆性信息。

而 ChatGPT是这样回答的:

闭源还是开源?

像包括斯坦福大学的Alpaca在内的许多开源大语言模型一样,StableLM 给开发者们提供了在本地或服务器上自由定制大语言模型的机会,免除了担心数据泄露给模型后台的顾虑。

然而,ChatGPT 火爆后,关于AI模型数据隐私的问题层出不穷。不久前,三星被曝多名员工向 ChatGPT 泄漏机密数据,以至于三星半导体部门决定自己开发内部AI工具,避免类似问题再度发生。

除了高透明度优势外,开源模型还方便开发者们开发出更具创造性的应用。例如,使用者可以对 StableLM 进行自定义调试,打造一个不会停顿的网络作家,或是一位熟悉公司项目的资深程序员或文案撰写人员。此外,还可以调试成微博上的星座运势专家。

开源模型为开发者提供了更广泛的创意空间,但同时也会提供作恶者更高级的工具。对于那些别有用心的人来说,开源的大型语言模型可能成为电信诈骗的神器,他们可以逼真地模拟对话,骗取人们的财物。

开源技术总是伴随着争议,这点 Stability AI 早有预料。因为开源的“Stable Diffusion”,Stability AI 已经面临了很多著作权侵犯方面的法律诉讼,以及因用户使用其工具生成色情内容而引起的争议。

Stability AI 的 CEO Emad Mostaque 在之前的采访中提到,大型模型需要接受更多的监管,而不是被大公司锁在小黑盒里。因此,大型模型的开放性对于这个社区非常重要。Stability AI 坚持开源,是为了将技术带给更多的人,并引导人们进行更多的思考。

StableLM 是对 Stability AI 承诺的又一次验证,这也有可能开启未来每个人都拥有自己专属语言模型的新篇章。

全部讨论

no data来都来了,坐下聊聊