реклама
Новости Software

Meta✴ представила большую языковую ИИ-модель LLaMA для создания чат-ботов вроде ChatGPT, но лучше и экономичнее

Meta Platforms представила в пятницу большую языковую модель Large Language Model Meta AI (LLaMA) на базе ИИ, предназначенную для исследовательского сообщества. LLaMA будет доступна по некоммерческой лицензии исследователям и организациям, связанным с правительством, гражданским обществом и академическими кругами, сообщается в блоге компании. Разработчики смогут использовать LLaMA для создания чат-ботов и других продуктов на основе ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

LLaMA отличается от ChatGPT тем, что вовсе не является системой, с которой можно поговорить, а скорее исследовательским инструментом, который может помочь экспертам выявить проблемы языковых моделей ИИ, от предвзятости и токсичности до их склонности выдумывать информацию. Также следует отметить, что LLaMA Meta будет доступна в нескольких версиях — LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров — 7, 13, 33 и 65 млрд соответственно.

Инструмент, LLaMA, является новейшим достижение Meta в области больших языковых моделей, которые «показали многообещающие возможности для создания текста, ведения разговоров, обобщения письменного материала и более сложных задач, таких как решение математических теорем или предсказание белковых структур»,сообщил исполнительный директор Марк Цукерберг в своём аккаунте в Instagram.

LLaMA является более новой и продвинутой системой по сравнению с вышедшей в мае прошлого года большой языковой моделью OPT-175B, тоже предназначенной для исследователей, которая легла в основу новой версии чат-бота Meta BlenderBot.

Meta утверждает, что вторая по размеру версия модели LLaMA, LLaMA-13B, «в большинстве тестов» работает лучше популярной модели OpenAI GPT-3, в то время как самая большая модель LLaMA-65B, «конкурирует с лучшими моделями», такими как Chinchilla70B от DeepMind и PaLM 540B от Google.

В конце прошлого года компания выпустила ещё одну языковую модель Galactica, демонстрационную версию которой вскоре закрыла после того, как исследователи обнаружили, что она регулярно делилась предвзятой или неточной информацией.

Сообщается, что компания предоставит пользователям базовый код для настройки модели и её применения в сценариях использования, связанных с исследованиями. Модель, которая, по словам Meta, требует «гораздо меньше» вычислительной мощности, обучается на 20 языках с упором на языки с латиницей и кириллицей. После обучения LLaMA-13B сможет работать на одном ускорителе NVIDIA Tesla V100.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
ИИ-поисковик Google предложил добавить клей в пиццу, чтобы сыр лучше прилипал к тесту 2 ч.
К2Тех и MTS AI помогут компаниям во внедрении технологий генеративного ИИ на базе российской LLM Cotype 2 ч.
Alphabet и Meta предлагают Голливуду миллионы долларов за использование контента для ИИ 4 ч.
Microsoft Edge начнет блокировать создание скриншотов на защищённых страницах 5 ч.
«Ничего лучше в жизни не видел»: игроков восхитил трейлер MultiVersus, посвящённый маньяку-убийце из «Пятницы, 13-е» 10 ч.
Анонсирована Warhammer 40,000: Mechanicus II с кампаниями за Адептус Механикус и Некронов — первый трейлер и подробности 11 ч.
Дополнение Void Shadows к Warhammer 40,000: Rogue Trader получило дату выхода, а для Warhammer 40,000: Boltgun анонсировали аддон Forges of Corruption 12 ч.
Взрывной трейлер Warhammer 40,000: Space Marine 2 подтвердил PvE-режим и возвращение PvP — в российском Steam открыт предзаказ 13 ч.
Смартфоны и планшеты с российской ОС «Аврора» и RuStore поступят в продажу 27 мая 15 ч.
В рамках мегараспродажи Epic Games Store началась раздача новой тайной игры 15 ч.
Калифорния больше месяца обходится одной только возобновляемой энергией и ещё продаёт излишки 39 мин.
Прототипы интернет-спутников Amazon Kuiper сгорят в атмосфере 41 мин.
Вплоть до 1,6 нм: за два следующих года TSMC освоит четыре новых техпроцесса 44 мин.
Apple планирует выпустить MacBook с гибким дисплеем в 2026 году 2 ч.
ASML в ближайшие годы сосредоточится на повышении производительности своего оборудования для выпуска чипов 3 ч.
Microsoft запустила Prism — эмулятор для быстрой работы x86-приложений на новых ПК с Arm-процессорами 4 ч.
SMIC удалось догнать UMC на рынке услуг по контрактному производству чипов и занять третье место 5 ч.
Omnispace обвинила спутники Starlink в создании радиопомех 5 ч.
Вторая крупнейшая криптовалюта вышла на новый уровень — США одобрили спотовые Ethereum-ETF 6 ч.
Новая статья: Снова менять? Обзор блока питания PCCooler YS1200 с разъемом 12V-2x6 10 ч.