реклама
Новости Software

«Китаю нужна своя OpenAI»: создатель популярного китайского поисковика выложил в открытый доступ мощную ИИ-модель Baichuan-13B

В феврале основатель китайской поисковой службы Sogou (входит в Tencent) Ван Сяочуань (Wang Xiaochuan) написал в соцсети Weibo, что «Китаю нужна своя OpenAI». С реализацией плана предприниматель затягивать не стал — его стартап Baichuan Intelligence создал и выложил в открытый доступ большую языковую модель искусственного интеллекта Baichuan-13B.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Baichuan считается одним из наиболее многообещающих китайских разработчиков больших языковых моделей — основателем компании является выпускник Университета Цинхуа, который создал поисковую службу Sogou, впоследствии поглощённую местным технологическим гигантом Tencent. Ван покинул Sogou в конце 2021 года. Когда платформа ChatGPT уже стала мировой сенсацией, бизнесмен запустил стартап Baichuan и оперативно собрал инвестиции на $50 млн.

Как следует из названия, обученная на китайском и английском большая языковая модель Baichuan-13B на архитектуре Transformer (она же лежит в основе GPT) имеет 13 млрд параметров — переменных, которые используются при генерации текста. Исходный код платформы выложен на GitHub и оптимизирован для коммерческого использования. Baichuan-13B обучена на 1,4 трлн токенов — для сравнения, модель Meta LlaMa с теми же 13 млрд параметров была обучена на 1 трлн токенов.

Стартап Baichuan развивается с неимоверной скоростью. Открывшаяся в апреле компания к концу месяца расширила штат до 50 человек, а в июне опубликовала первую большую языковую модель Baichuan-7B с 7 млрд параметров. Новая Baichuan-13B доступна бесплатно для учёных и разработчиков, получивших разрешение на её использование в коммерческих целях. Стоит отметить, создатели учли введённые США антикитайские санкции, и модель можно запускать на системах с комплектующими потребительского класса, включая видеокарты NVIDIA GeForce RTX 3090.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Новая статья: Hauntii — милейший загробный мир. Рецензия 55 мин.
Новая статья: Gamesblender № 676: God of War: Ragnarok на ПК, осенний ремейк Silent Hill 2 и новости Warhammer 2 ч.
Европол отключил 2000 вредоносных доменов киберпреступников 4 ч.
Число владельцев криптовалют в мире достигло 562 млн — крипта есть у каждого тринадцатого 5 ч.
Владелец Ticketmaster подтвердил утечку данных 560 млн пользователей спустя 11 дней 11 ч.
В Telegram добавили сообщения с анимированными эффектами, глобальные хештеги и другие нововведения 12 ч.
Anthropic позволит создавать персональных помощников на базе ИИ-чат-бота Claude 14 ч.
ElevenLabs запустила ИИ-генератор звуковых эффектов по текстовому описанию 14 ч.
Новая статья: Songs of Conquest — песнь величия. Рецензия 01-06 00:03
В ранний доступ Steam ворвался олдскульный шутер Selaco на движке классических Doom — с перестрелками и умными врагами в духе F.E.A.R. 31-05 21:58
Boeing отменила пилотируемый полёт космического корабля Starliner к МКС за несколько минут до старта 3 ч.
Привет из 2014-го: Asus выпустила обновлённую GeForce GT 710 EVO с 2 Гбайт GDDR5 4 ч.
Apple выбрала процессоры М2 Ultra и М4 для серверов, на которых будут работать ИИ-функции iPhone 7 ч.
Выставка Computex 2024 откроется 4 июня, но презентации AMD, Intel и Nvidia пройдут раньше 8 ч.
iPhone 5s официально устарел, а iPod touch 6 стал винтажным 8 ч.
Vivo оккупировала значительную часть майского рейтинга производительности AnTuTu 9 ч.
Игровой монитор Xiaomi G Pro 27i на панели Mini LED с 1152 зонами затенения выйдет на мировой рынок 9 ч.
Starlink хочет открыть для пользователей спутниковую сотовую связь уже осенью 11 ч.
Новые спутники Starlink могут уничтожить радиоастрономию на Земле, предупреждают учёные 13 ч.
Корейский профсоюз Samsung объявил забастовку, но на производство и поставки памяти это не повлияет 14 ч.