号称可以成为 ChatGPT 平替的开源模型 “Dolly”

Databricks 这家软件公司，在各个领域都有所建树，尤其是在数据仓库和基于人工智能的解决方案方面。

最近，随着 ChatGPT 横空出世，Meta、谷歌甚至 Mozilla 都开始效仿 ChatGPT。

而现在，Databricks 开源了其大型语言模型 large language model （LLM）“Dolly”，也正在以自己的方式进行尝试。

我们一起来看看它。

发生了什么？ 在最近的公告中，Databricks 介绍了他们号称 “廉价构建” 的 LLM，使用 EleutherAI 的已经开源的参数模型提供功能。

他们在该模型基础上稍作调整，赋予了 Dolly 指令诸如头脑风暴和文本生成的能力。

当你拿它与 GPT-3 中的 1750 亿个参数 比较时，Dolly 的 60 亿个参数 就可能显得微不足道。

但是，当 Databricks 的人看到即使数据量与 GPT-3 相差这么多，Dolly 也能 展示很多与 ChatGPT 相同的能力 时，他们感到非常震惊。

下面是他们展示的其中一个例子：

a screenshot of how dolly performs in an open question and answer scenario

原始模型使用了 Alpaca 的数据，该模型由斯坦福大学以 Meta 的 LLaMA LLM 为基础建立。

但是，正如你所看到的，原始模型产生了一个非常杂乱无章的结果，而 Dolly，通过不同的模型和调整，能够产生一个更为可用的答案。

? 有趣的事实：“ 多莉 Dolly ” 名字取自世界上第一只克隆羊。

为什么是现在？ 根据 Databricks 的说法，他们认为 许多公司更愿意建立自己的模型，而不是将数据发送给某个紧紧掌握模型只对外提供 API 的集中式供应商。

许多公司可能不愿意将他们最敏感的数据交给第三方，然后在模型质量、成本和所需行为方面进行各种权衡。

你想看看吗？

当然，但有一个问题。

你必须 使用他们的平台来使用 Dolly，他们已经开源了一个 Databricks 笔记本，可以帮助你在 Databricks 上构建它。

此外，如果你想获得训练好的权重，你必须联系他们。不过我不确定他们是否会免费提供使用权。

总而言之，这种开源其模型的举动应该对其他公司有好处，可以保护他们的数据、节省运营成本，其他公司也能使用它创建自己的模型。

你可以查看其公告博客，以了解更多技术细节和其他计划。

via: https://news.itsfoss.com/open-source-model-dolly/

作者：Sourav Rudra 选题：lkxed 译者：lxbwolf 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

本文转载来自 Linux 中国: https://github.com/Linux-CN/archive

对这篇文章感觉如何？

太棒了

不错

爱死了

不太好

感觉很糟

Rain

雨落清风。心向阳

号称可以成为 ChatGPT 平替的开源模型 “Dolly”

对这篇文章感觉如何？

Ubuntu Cinnamon 正式成为 Ubuntu 官方风味版

如何从GitHub存储库直接安装npm包

Leave a reply 取消回复

More in:Linux中国

捐赠 Let's Encrypt，共建安全的互联网

Let's Encrypt 正式发布，已经保护 380 万个域名

关于Linux防火墙iptables的面试问答

Lets Encrypt 已被所有主流浏览器所信任

中文操作系统论坛

关注 LinuxStory

开源学村

编程类开放书籍荟萃

如何杀死 Linux 中的僵尸进程

2022年，从学习Rust开始

使用 Linux 命令行解决Wordle 问题

Makefile 简介

5本学习 TeX 的最佳免费书籍

Linux 内核补丁提交初体验

Linux 的前世今生 – 1

特别关注

更开放的分布式事务 | Fescar 品牌升级，更名为 Seata

HeRM’s – 一个命令食谱管理器

使用 Let's Encrypt 保护你的网站

最新文章

加入 LinuxStory 交流群组

投票调查

最热标签

分享

对这篇文章感觉如何？

You may also like

Leave a reply 取消回复

More in:Linux中国

中文操作系统论坛

关注 LinuxStory

开源学村

特别关注

最新文章

最热标签