реклама
Новости Software

Meta✴ представила большую языковую ИИ-модель LLaMA для создания чат-ботов вроде ChatGPT, но лучше и экономичнее

Meta Platforms представила в пятницу большую языковую модель Large Language Model Meta AI (LLaMA) на базе ИИ, предназначенную для исследовательского сообщества. LLaMA будет доступна по некоммерческой лицензии исследователям и организациям, связанным с правительством, гражданским обществом и академическими кругами, сообщается в блоге компании. Разработчики смогут использовать LLaMA для создания чат-ботов и других продуктов на основе ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

LLaMA отличается от ChatGPT тем, что вовсе не является системой, с которой можно поговорить, а скорее исследовательским инструментом, который может помочь экспертам выявить проблемы языковых моделей ИИ, от предвзятости и токсичности до их склонности выдумывать информацию. Также следует отметить, что LLaMA Meta будет доступна в нескольких версиях — LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров — 7, 13, 33 и 65 млрд соответственно.

Инструмент, LLaMA, является новейшим достижение Meta в области больших языковых моделей, которые «показали многообещающие возможности для создания текста, ведения разговоров, обобщения письменного материала и более сложных задач, таких как решение математических теорем или предсказание белковых структур»,сообщил исполнительный директор Марк Цукерберг в своём аккаунте в Instagram.

LLaMA является более новой и продвинутой системой по сравнению с вышедшей в мае прошлого года большой языковой моделью OPT-175B, тоже предназначенной для исследователей, которая легла в основу новой версии чат-бота Meta BlenderBot.

Meta утверждает, что вторая по размеру версия модели LLaMA, LLaMA-13B, «в большинстве тестов» работает лучше популярной модели OpenAI GPT-3, в то время как самая большая модель LLaMA-65B, «конкурирует с лучшими моделями», такими как Chinchilla70B от DeepMind и PaLM 540B от Google.

В конце прошлого года компания выпустила ещё одну языковую модель Galactica, демонстрационную версию которой вскоре закрыла после того, как исследователи обнаружили, что она регулярно делилась предвзятой или неточной информацией.

Сообщается, что компания предоставит пользователям базовый код для настройки модели и её применения в сценариях использования, связанных с исследованиями. Модель, которая, по словам Meta, требует «гораздо меньше» вычислительной мощности, обучается на 20 языках с упором на языки с латиницей и кириллицей. После обучения LLaMA-13B сможет работать на одном ускорителе NVIDIA Tesla V100.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Браузер Firefox версии «Nightly» получил ИИ-помощников ChatGPT и Gemini 53 мин.
Политические дипфейки оказались самой популярным направлением в злоупотреблениях ИИ 6 ч.
Forza Horizon 4 скоро снимут с продажи и удалят из Game Pass — подробности и причины 7 ч.
Игровая студия стримера Dr Disrespect разорвала с ним отношения — выяснилась причина его вечного бана на Twitch 8 ч.
Еженедельный чарт Steam: Elden Ring, новый кооперативный хит Chained Together и MMORPG от создателя EVE Online 8 ч.
Спустя три года фанаты дождались анонса Farming Simulator 25 — дата выхода, первый трейлер и предзаказ в российском Steam 10 ч.
Apple включила RCS на iPhone с выпуском второй беты iOS 18, но работает функция пока не у всех 11 ч.
Сборник S.T.A.L.K.E.R. Legends of the Zone Trilogy на PlayStation и Xbox получил официальную поддержку модов 11 ч.
ЕС предъявил Microsoft обвинения в незаконной привязке Teams к Office — компании грозит многомиллионный штраф 12 ч.
Анонсирована новая игра в легендарной серии «Ил-2» — первый тизер и скриншоты «Корея. Серия Ил-2» 12 ч.
Власти Южной Кореи со следующего месяца начнут распределять $19 млрд в полупроводниковом секторе 15 мин.
Новая статья: Обзор смартфона Infinix NOTE 40 Pro+ 5G: главарь банды 5 ч.
Etched Sohu — самый быстрый в мире ИИ-ускоритель, но только для трансформеров 6 ч.
Выяснились характеристики всех процессоров Intel Lunar Lake с новой графикой и ядрами, а также набортной ОЗУ 6 ч.
Новая статья: Обзор ноутбука OSiO FocusLine F160a: уверенные первые шаги 7 ч.
Самолёты можно питать с помощью микроволнового излучения прямо в полёте, но сделать это крайне трудно 8 ч.
Huawei показала лучший рост продаж смартфонов во время недавних распродаж в Китае, несмотря на самые скромные скидки 8 ч.
Китайский стартап Yusur наладил массовое производство DPU третьего поколения K2-Pro 9 ч.
Представлена обновлённая портативная колонка Beats Pill с автономностью на 24 часа, защитой IP67 и портом USB-C 11 ч.
Tesla отозвала более 11 000 пикапов Cybertruck из-за проблем с обшивкой кузова и стеклоочистителем 11 ч.