Искусственный интеллект

Dolly 2.0, искусственный интеллект, подобный ChatGPT, но совершенно бесплатный


Компания Databricks недавно анонсировала Dolly 2.0, нового чат-бота похожий на ChatGPT. Компания выпустила исходный код искусственного интеллекта, а также набор данных, использованных для обучения, под свободной лицензией.

Хотя ChatGPT является эталонным чат-ботом, число его конкурентов растет. К ним относятся Bard от Google, основанный на большой языковой модели LaMDA (LLM), или LLaMA от Meta*. Новый конкурент - Dolly 2.0 от Databricks. По словам разработчика, это первая полностью бесплатная большая языковая модель (LLM), обученная на базе данных, которая также является бесплатной.

Имея 12 миллиардов параметров, Dolly 2.0 немного меньше своих конкурентов ChatGPT (175 миллиардов), LaMDA (137 миллиардов) или LLaMA (65 миллиардов). Этот новый ИИ основан на pythia-12b, бесплатной модели из 12 миллионов параметров, разработанной EleutherAI. Dolly 1.0 был выпущен всего три недели назад, но эта первая версия обучалась на наборе данных, созданном для модели Alpaca Стэнфордского университета, которая содержит данные из ChatGPT. Однако OpenAI запрещает любое использование данных, полученных его ИИ, для создания конкурирующего сервиса, что препятствует любому коммерческому использованию.

База данных, созданная вручную

Чтобы сделать свой искусственный интеллект полностью бесплатным, разработчики создали собственный набор данных для его обучения, который называется databricks-dolly-15k и состоит из 15 000 вопросов с оригинальными ответами. Для этого они просто устроили конкурс, открытый для всех 5 000 сотрудников Databricks, который занял неделю. Благодаря этому ИИ показывает лучшие результаты, чем другие недавно выпущенные языковые модели (такие, как Alpaca, Koala, GPT4All или Vicuna), обученные на ответах ChatGPT, включающих ошибки и галлюцинации.

Благодаря открытому исходному коду и базе данных, компании и организации могут создавать свои собственные чат-боты для конкретных областей без необходимости делиться конфиденциальными данными с третьими лицами. По словам представителей Databricks, Dolly не стремится стать самым современным (то есть таким же хорошим, как ChatGPT). Скорее, компания надеется внести свой вклад в диверсификацию и демократизацию больших языковых моделей.

Подпишитесь на нас: Дзен.Новости / Вконтакте / Telegram
Back to top button