реклама
Теги → нейросеть
Быстрый переход

В Tinkoff Research придумали, как ускорить обучение искусственного интеллекта в 20 раз

Учёные из лаборатории исследований искусственного интеллекта Tinkoff Research разработали SAC-RND — новый алгоритм для обучения ИИ. На робототехнических симуляторах было достигнуто повышение скорости обучения в 20 раз по сравнению со всеми существующими аналогами при возросшем на 10 % качестве. Оптимизация крайне ресурсоёмкого процесса обучения ИИ ускорит развитие многих сфер, где применяется ИИ.

 Источник изображения: Tinkoff

Источник изображения: Tinkoff

Разработчики утверждают, что SAC-RND может «повысить безопасность беспилотных автомобилей, упростить логистические цепочки, ускорить доставку и работу складов, оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ в окружающую среду. Открытие не только улучшает работу узкоспециализированных роботов, но и приближает нас к созданию универсального робота, способного в одиночку выполнять любые задачи».

Результаты исследования были представлены в конце июня на 40-й Международной конференции по машинному обучению (ICML) в Гонолулу, Гавайи. Эта конференция является одной из трёх крупнейших в мире в сфере машинного обучения и искусственного интеллекта.

Одним из наиболее перспективных видов обучения ИИ является обучение с подкреплением (RL), позволяющее ИИ учиться методом проб и ошибок, адаптироваться в сложных средах и изменять поведение на ходу. Обучение с подкреплением может использоваться во всех сферах: от регулирования пробок на дорогах до рекомендаций в социальных сетях.

При этом ранее считалось, что использование случайных нейросетей (RND) не применимо для офлайн-обучения с подкреплением. В методе RND используются две нейросети — случайная и основная, которая пытается предсказать поведение первой. Свойство нейросети определяются её глубиной — количеством слоёв, из которых она состоит. Основная сеть должна содержать больше слоёв, чем случайная, иначе моделирование и обучение становится нестабильным или даже невозможным.

Использование неправильных размеров сетей привело к ошибочному выводу, что метод RND не умеет дискриминировать данные — отличать действия из датасета от прочих. Исследователи из Tinkoff Research обнаружили, что при использовании эквивалентной глубины сетей, метод RND начинает качественно различать данные. Затем исследователи приступили к оптимизации ввода и научили роботов приходить к эффективным решениям при помощи механизма слияния, основанного на модуляции сигналов и их линейном отображении. До этого при использовании метода RND поступающие сигналы не подвергались дополнительной обработке.

На визуализации ниже в верхнем ряду показаны предыдущие попытки применения метода RND, в нижнем — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию. Метод Tinkoff Research во всех случаях стабильно приводит робота в нужную точку

 Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Источник изображения: Tinkoff Research

Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Источник изображения: Tinkoff Research

Метод SAC-RND был протестирован на робототехнических симуляторах и показал лучшие результаты при меньшем количестве потребляемых ресурсов и времени. Открытие поможет ускорить исследования в области робототехники и обучения с подкреплением, поскольку оно снижает время получения устойчивого результата в 20 раз и является важным шагом на пути к созданию универсального робота.

Tinkoff Research — российская исследовательская некоммерческая группа. Учёные из Tinkoff Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV), обучение с подкреплением (RL) и рекомендательные системы (RecSys). Команда курирует исследовательскую лабораторию «Тинькофф» на базе МФТИ и помогает талантливым студентам совершать научные открытия.

Stability AI выпустил ИИ-генератор изображений Stable Diffusion XL 1.0, который может работать на более «простом» вычислительном оборудовании

ИИ-стартап Stability AI выпустил новую версию своей флагманской модели преобразования текста в изображение Stable Diffusion XL 1.0 (SDXL 1.0) с открытым исходным кодом, которую он позиционирует как свою «самую продвинутую» модель на сегодняшний день.

 Источник изображения: Pixabay

Источник изображения: Pixabay

По словам Stability, SDXL 1.0, доступная на GitHub в дополнение к API Stability и потребительским приложениям Clipdrop и DreamStudio, обеспечивает «более яркие» и «точные» цвета и лучшую контрастность, тени и освещение по сравнению с предыдущей версией.

Джо Пенна (Joe Penna), руководитель отдела прикладного машинного обучения Stability AI, сообщил в интервью TechCrunch, что SDXL 1.0, содержащая 3,5 млрд параметров, может выдавать изображения с разрешением 1 мегапиксель «за секунды» с различными соотношениями сторон.

Модель предыдущего поколения Stable Diffusion XL 0.9 также могла создавать изображения с высоким разрешением, но для её запуска требовалось больше вычислительной мощности. Как отметил ресурс SiliconANGLE, открытый исходный код наряду с возможностью работать на относительно простом оборудовании делают SDXL 1.0 гораздо более доступной, чем конкурирующие модели создания изображений.

«SDXL 1.0 — кастомизируемая и готова к тонкой настройке в соответствии с концепциями и стилями, — рассказал Пенна. — Она также проста в использовании, обладает способностью создавать сложные проекты с базовыми запросами на обработку естественного языка».

Кроме того, SDXL 1.0 получила улучшения в области генерации текста. В то время как даже у многих лучших моделей преобразования текста в изображение наблюдаются проблемы с генерацией изображения с разборчивыми логотипами, не говоря уже о каллиграфии или шрифтах, SDXL 1.0 способна на «продвинутое» генерирование текста и обеспечение его разборчивости, говорит Пенна.

SDXL 1.0 имеет функции inpainting, позволяющую восстанавливать недостающие части изображения, outpainting (расширение существующих изображений) и подсказки «изображение-к-изображению», позволяющую после ввода изображения добавлять несколько текстовых подсказок для создания более подробных вариантов этого изображения. Кроме того, модель «понимает» сложные инструкции, состоящие из нескольких частей, которые даются в коротких подсказках, тогда как в предыдущих моделях Stable Diffusion требовались более длинные текстовые подсказки.

Тренировочный набор SDXL 1.0 также включает в себя работы художников, протестовавших против использования компаниями, включая Stability AI, их работ в качестве обучающих данных для генеративных моделей ИИ. Stability AI утверждает, что она защищена от юридической ответственности доктриной добросовестного использования, по крайней мере, в США. Хотя это не помешало Getty Images подать в суд на Stability AI с обвинением в незаконном использовании изображений сервиса для обучения своей генеративной нейросети.

«Сбер» выложил в открытый доступ русскоязычную ИИ-модель ruGPT-3.5

Инженеры «Сбера» выложили в открытый доступ нейросетевую модель ruGPT-3.5, лежащую в основе сервиса GigaChat, который до сих пор проходит стадию закрытого тестирования. Лицензия MIT позволяет использовать материалы проекта в коммерческих целях.

 Структура датасета ruGPT-3.5. Источник изображения: habr.com

Структура датасета ruGPT-3.5. Источник изображения: habr.com

Важнейшим недостатком открытых больших языковых моделей вроде Meta LlaMA является ограниченная поддержка русского языка — обычно это русский раздел «Википедии» и некоторое количество общедоступных текстов. Это оказывает негативное влияние на понимание моделью языка и качество её ответов. Модель ruGPT-3.5, основанная на архитектуре OpenAI GPT-3, создана в первую очередь для работы в русскоязычной среде, поэтому она более качественно обрабатывает такие запросы.

Обучение модели производилось в два этапа. Первый этап продлился 1,5 месяца — за это время платформа обработала 300 Гбайт данных: книги, энциклопедийные и научные статьи, социальные ресурсы и другие источники. Потребовались ресурсы 512 ускорителей NVIDIA V100. На втором этапе проводилось дообучение на 110 Гбайт данных из датасета The Stack, юридических документов и обновлённых текстов «Википедии» — это заняло три недели и потребовало 200 ускорителей NVIDIA A100.

В результате у ruGPT-3.5 13 млрд параметров при длине контекста 2048 токенов — для сравнения, привели пример разработчики, рассказ А. П. Чехова «Хамелеон» разбивается на 1650 токенов при его длине в 901 слово.

Google разрабатывает ИИ-алгоритм Genesis для написания новостных статей, но о замене журналистов речи не идёт

По сообщениям сетевых источников, компания Google работает над созданием ИИ-алгоритма для написания новостных статей. Он разрабатывается под кодовым названием Genesis и уже был продемонстрирован руководству некоторых крупных изданий, таких как The New York Times, The Washington Post и The Wall Street Journal.

 Источник изображения: StartupStockPhotos / Pixabay

Источник изображения: StartupStockPhotos / Pixabay

По данным источников, Genesis может генерировать новостные статьи на основе данных о тех или иных событиях. В компании считают, что алгоритм может стать своеобразным помощником для журналистов. С его помощью можно не только генерировать готовые статьи, но и, например, подобрать оптимальный заголовок или изменить стиль материала.

«В партнёрстве с издателями новостей, особенно с небольшими издательствами, мы находимся на ранней стадии изучения идей, которые потенциально могут привести к созданию ИИ-инструментов для помощи в работе журналистов. Например, инструменты на базе ИИ могут помочь журналистам с выбором заголовка или стилем написания», — рассказал представитель Google. Он также добавил, что цель компании заключается в том, чтобы предоставить журналистам ИИ-инструменты для повышения эффективности их работы. Особо отмечается, что Google не стремится заменить журналистов ИИ-алгоритмами.

На данный момент трудно судить, насколько хорошо Genesis справляется с поставленными задачами. Очевидно, больше информации об этом алгоритме станет известно по мере развития проекта.

«Сбер» научил нейросеть Kandinsky генерировать стикеры и фотореалистичные изображения и портреты

«Сбер» представил новую версию своей нейросети для генерации изображений по текстовому описанию — Kandinsky 2.2, которая позволит создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации, а также обеспечит значительный прирост качества при создании портретов.

 Генерация Kandinsky 2.2           Источник изображений: «Сбер»

Генерация Kandinsky 2.2. Источник изображений: «Сбер»

Для дообучения Kandinsky 2.2 использовался набор данных из 1,5 млрд пар «текст — изображение», что на 300 млн больше, чем для предыдущей версии — Kandinsky 2.1, вышедшей в апреле этого года и набравшей всего за 6 дней 2 млн пользователей.

Новую версию модели научили создавать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также благодаря внедрению специального структурного блока управляемых изменений ControlNetона она получила способность изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя при этом композицию исходной иллюстрации.

 Генерация Kandinsky 2.2

Генерация Kandinsky 2.2

Согласно пресс-релизу, Kandinsky 2.2 понимает запросы на русском и английском языках, обладает способностью рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, а также дорисовывать недостающие части картинки (inpainting) и создавать картины в режиме бесконечного полотна (outpainting).

 Стикерпак от Kandinsky 2.2

Стикерпак от Kandinsky 2.2

«Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации», — сообщил первый зампред правления Сбербанка Александр Ведяхин, добавив, что, как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, и протестировать её можно совершенно бесплатно.

Сообщается, что ознакомиться с возможностями Kandinsky 2.2 можно на промостранице модели, на платформе FusionBrain.AI, в Telegram-боте и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Разработкой и обучением нейросети занимались исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Anthropic запустила Claude 2 — дружелюбного ИИ-бота с безобидными ответами и своей конституцией

Anthropic выпустила в свободный доступ вторую версию своего чат-бота Claude. Компания советует воспринимать «Claude 2 как дружелюбного, увлечённого коллегу или личного помощника, которого можно проинструктировать на естественном языке». Контекстное окно Claude 2 вмещает почти 75 000 слов, что радикально больше 3000 слов у общедоступной версии ChatGPT. К тому же, по словам Anthropic, её чат-бот обладает чувством юмора. ИИ-бот уже доступен для жителей США или Великобритании на сайте Anthropic, а через VPN можно получить к нему доступ и из других стран.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Бот Claude 2, которого Anthropic описывает как «полезного, безобидного и честного», может приводить краткие содержания текстов, писать код, переводить тексты и выполнять массу других семантических задач. По описанию его функциональность схожа с Google Bard или Microsoft Bing, но Anthropic утверждает, что он построен иначе. Его стиль общения более разговорный и человечный, чем у его «собратьев», кроме того он, предположительно, наделён чувством юмора. Claude 2 руководствуется набором принципов, называемых его создателями «конституцией», которые он использует для проверки своих ответов, не привлекая модераторов-людей.

Claude 2 значительно расширил свои возможности по сравнению с предшественником. В дополнение к способности создавать более длинные ответы, чат-бот теперь немного лучше разбирается в математике, кодировании и рассуждениях по сравнению с предыдущей моделью. Так, Claude 2 набрал 76,5 % при сдаче экзамена на адвоката, в то время как предшественник получил только 73 %. Согласно Anthropic, Claude 2 намного лучше «даёт безобидные ответы», не содержащие вредоносного контента, хотя Anthropic не исключает возможности, что чат-бот может быть спровоцирован.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В отличие от Bard и Bing, Claude 2 не подключён к интернету и обучается на данных до декабря 2022 года. Хотя он не может отображать самую последнюю информацию о текущих событиях, его набор данных все же более свежий, чем тот, который использует бесплатная версия ChatGPT, ограниченная концом 2021 года.

Anthropic расширила контекстное окно Claude 2 примерно до 75 000 слов. Пользователь сможет загрузить в чат-бота десятки страниц или даже целый роман для анализа. Благодаря такому размеру контекстного окна, Claude 2 может создать краткое изложение сложной и очень длинной исследовательской работы. Его «собратья» накладывают гораздо более строгие ограничения: максимум ChatGPT составляет около 3000 слов, а контекстное окно Bing было недавно увеличено до 4000 слов.

Anthropic, поддерживаемая Google, первоначально запустила первую версию Claude в марте. Тогда этот чат-бот был доступен для предприятий только по запросу или в виде приложения в Slack. Теперь, когда Claude 2 стал общедоступным, множество пользователей постараются выяснить, достаточно ли более длинного контекстного окна, чтобы сбить этого «безобидного» бота с толку, как это уже было с другими чат-ботами.

На OpenAI подали в суд за незаконное использование литературных произведений для обучения нейросетей

На OpenAI снова подали в суд за использование произведений для обучения ИИ. Два известных писателя подали иск против компании, которая стоит за ChatGPT и Bing Chat, в нарушении авторских прав. По их мнению, OpenAI использовала их произведения в качестве обучающих данных. Это, по всей видимости, первый поданный иск об использовании текста (в отличие от изображений или кода) в качестве обучающих данных.

В поданном в окружной суд Северного округа Калифорнии иске истцы Пол Тремблей (Paul Tremblay) и Мона Авад (Mona Awad) утверждают, что OpenAI и её дочерние компании нарушили авторские права, нарушили Закон об авторском праве в цифровую эпоху (DMCA), а также нарушили калифорнийские и общие законодательные ограничения на недобросовестную конкуренцию.

Писатели представлены юридической фирмой Джозефа Савери (Joseph Saveri) и Мэттью Баттерика (Matthew Butterick), той же командой, которая стоит за недавними исками, поданными против Stable Diffusion AI и GitHub. В жалобе утверждается, что роман Тремблея «Хижина на краю света» и два романа Авад: «13 способов посмотреть на толстую девушку» и «Зайка» использовались в качестве обучающих данных для GPT-3.5 и GPT-4. Хотя OpenAI не раскрывала, что эти романы находятся в её обучающих данных (которые держатся в секрете), истцы делают вывод, что они должны быть там, поскольку ChatGPT смог предоставить подробные резюме сюжетов и ответить на вопросы о книгах, что потребовало бы доступа к их текстам.

«Поскольку языковые модели OpenAI не могут функционировать без выразительной информации, извлечённой из произведений истцов (и других лиц) и сохранённой в них, языковые модели OpenAI сами являются нарушающими авторские права производными произведениями, созданными без разрешения истцов и в нарушение их исключительных прав по Закону об авторском праве», — говорится в жалобе.

Все три книги содержат информацию о защите авторских прав (CMI), такую как ISBN и номера регистрации авторских прав. Закон об авторском праве в цифровую эпоху (DMCA) утверждает, что удаление или фальсификация CMI является незаконной, и поскольку ответы ChatGPT не содержат этой информации, истцы утверждают, что OpenAI виновна в нарушении этого закона, помимо факта нарушения авторских прав.

Хотя в настоящее время в иске участвуют только два истца, адвокаты намерены сделать иск коллективным, что позволило бы другим авторам, чьи авторские произведения использовались OpenAI, также получить компенсацию. Адвокаты требуют денежных возмещений, судебных издержек и судебного запрета, принуждающего OpenAI изменить своё программное обеспечение и деловые практики в отношении авторских материалов. На сайте юридической фирмы LLM Litigation подробно изложена позиция истцов и причины подачи иска. «Мы подали коллективный иск против OpenAI, обвиняя ChatGPT и его базовые большие языковые модели, GPT-3.5 и GPT-4, в том, что они перерабатывают авторские произведения тысяч писателей — и многих других — без согласия, компенсации или признания», — сообщают адвокаты.

Они также критикуют концепцию генеративного ИИ, утверждая: «Генеративный искусственный интеллект — это просто человеческий интеллект, переупакованный и проданный как новый продукт. Это не новый вид интеллекта. Это просто новый способ использования чужого интеллекта без разрешения или компенсации». Они отмечают, что, хотя OpenAI заявляет, что не знает, какие именно книги использовались для обучения ИИ, это не имеет значения, поскольку: «OpenAI знает, что она использовала множество книг, и она знает, что она не получила разрешения от их авторов».

Это не первый случай, когда OpenAI сталкивается с подобными обвинениями. Однако новый иск, станет первым, затрагивающим использование текстовых данных, и он может создать прецедент для будущих судебных дел о нарушении авторских прав в области ИИ.

Нейросеть YandexGPT научилась тезисно пересказывать тексты на русском языке

Команда разработчиков «Яндекса» сообщила о расширении функциональных возможностей языковой ИИ-модели нового поколения YandexGPT (YaLM 2.0) — теперь генеративная нейросеть умеет выделять из статей на русском языке основные тезисы и излагать их в кратком пересказе. Это позволяет быстрее узнать содержание объёмного материала и сэкономить время.

Оценить в деле новую функцию YandexGPT можно на сайте 300.ya.ru. Нейросеть умеет конспектировать русскоязычные тексты длиной до 30 тысяч знаков и сокращать их до небольшого конспекта от 300 до 1000 знаков. В среднем на чтение статьи такого большого объёма требуется 15 минут, а благодаря ИИ-сервису узнать её содержание можно менее чем за минуту. Это удобно, когда требуется проанализировать множество источников информации, написать к ним тезисы или найти ответ, не читая текст целиком.

Помимо краткого пересказа текста ИИ-сервис также предоставляет API для разработчиков. С его помощью они могут получить ссылку на сокращённую версию статьи, не пользуясь веб-интерфейсом. Это может быть полезно владельцам сайтов или новостных каналов. Сам сервис и API доступны широкой аудитории и работают в режиме бета-тестирования.

YandexGPT была представлена широкой публике 17 мая 2023 года. Языковая ИИ-модель нового поколения доступна в «Яндекс.Браузере», мобильном приложении «Яндекса», программе «Шедеврум», голосовом помощнике «Алиса», в линейке умных колонок и телевизоров компании, а также на главной странице «Яндекса» (ya.ru) и в API для клиентов Yandex Cloud. В планах разработчика — обучение нейросети новым знаниям и её внедрение в другие сервисы и продукты компании, прежде всего в поиск.

Глава DeepMind AI похвастался разработкой ИИ-алгоритма, который превзойдёт ChatGPT

В 2016 году разработчики из дочерней компании Google под названием DeepMind AI создали алгоритм AlphaGo, который вошёл в историю, победив чемпиона в настольной игре Го. Теперь же Демис Хассабис (Demis Hassabis), соучредитель и генеральный директора DeepMind, заявил о разработке нейросети, которая станет более совершенной по сравнению той, что стоит за популярным ИИ-ботом ChatGPT от компании Open AI.

 Источник изображения: Placidplace/pixabay.com

Источник изображения: Placidplace/pixabay.com

Нейросеть Gemini представляет собой большую языковую модель, которая схожа с лежащей в основе ChatGPT моделью GPT-4. Разработчики из DeepMind намерены объединить возможности нейросети с технологиями, которые использовались в AlphaGo, чтобы расширить возможности алгоритма. «На высоком уровне можно думать о Gemini как о сочетании некоторых сильных сторон систем вроде AlphaGo с удивительными возможностями больших языковых моделей. У нас также есть несколько инноваций, которые будут довольно интересными», — приводит источник слова Демиса Хассабиса.

Напомним, о разработке нейросети Gemini впервые стало известно в прошлом месяце. Что касается AlphaGo, то этот алгоритм обучался решать сложные задачи методом, требующим от алгоритма определённого действия. Кроме того, для изучения и прогнозирования возможных ходов на доске для игры в Го использовался алгоритм, называемый древовидным поиском. По словам Хассабиса, алгоритм Gemini всё ещё находится на этапе разработки, который займёт ещё несколько месяцев и для реализации которого могут потребоваться десятки или даже сотни миллионов долларов. Согласно имеющимся данным, разработка GPT-4 обошлось в более чем $100 млн.

Знаменитости начали продавать цифровых клонов для рекламы и участия в шоу

С развитием систем генеративного ИИ цифровые двойники знаменитостей стали появляться в Сети без разрешения самих «оригиналов». Как сообщает The Wall Street Journal, звёзды решили взять этот процесс под контроль — теперь они сами продают цифровых двойников, которые будут трудиться вместо них в рекламе и не только. В перспективе цифровые копии знаменитостей будут даже общаться с поклонниками — нечто подобное происходит уже сейчас.

 Цифровой двойник Евы Герциговой. Источник изображения: WSJ

Цифровой двойник Евы Герциговой. Источник изображения: WSJ

По словам Тома Грэма (Tom Graham), главы стартапа Metaphysic, занимающегося созданием цифровых двойников, звёздам просто необходимо прийти на несколько минут в студию с 3D-сканером, в будущем это позволит создавать бесчисленное множество часов контента. Например, ещё в прошлом году в ходе Нью-Йоркской недели моды к виртуальным презентациям компания Puma привлекла цифрового двойника футболиста Неймара (Neymar), которого создали с помощью приложения MetaHuman, входящего в пакет Unreal Engine компании Epic Games.

Участие знаменитостей в мероприятиях и рекламе — огромный по объёмам бизнес. Только Nike потратила в минувшем фискальном году на привлечение звёзд и спортивных команд $1,3 млрд. Развитие индустрии цифровых двойников может полностью изменить правила игры, поскольку виртуальные звёзды способны на такое, чего никогда не смогли бы проделать люди в реальной жизни. Например, легенда гольфа Джек Никлаус (Jack Nicklaus) согласился, чтобы ИИ-компания Soul Machines создала версию его 38-летнего аватара (сейчас ему уже 83).

 Джек Никлаус общается со своей виртуальной версией. Источник изображения: WSJ

Джек Никлаус общается со своей виртуальной версией. Источник изображения: WSJ

Голливудское агентство CAA уже уловило намечающийся тренд и начало консультировать звёзд о возможностях, которые перед ними открывает продажа ИИ-двойников. По некоторым данным, определённые сделки уже заключаются, например, Metaphysic уже заключила контракт на выполнение неких услуг, связанных с применением ИИ-технологий для фильма Роберта Земекиса (Robert Zemeckis) с Томом Хэнксом (Tom Hanks), а также участвует и в других проектах.

Как сообщает издание, в фэшн-индустрии, где модели обычно не владеют правами на свои изображения, ИИ тоже открывает новые перспективы. Так, супермодель Ева Герцигова (Eva Herzigova) в апреле представила собственную виртуальную версию, созданную на решениях Epic Games — клон может участвовать в виртуальных онлайн-шоу, а вскоре двойник появится на виртуальных торговых площадках — в будущем модели смогут даже разговаривать с помощью чат-ботов. При этом растут и репутационные риски, поскольку боты вполне способны на грубые или некорректные высказывания. В случае с Джеком Никлаусом, например, пришлось создавать отдельную языковую модель вместо использования инструментов вроде ChatGPT.

Ещё одна проблема — пока существующие пробелы в законодательстве. Например, достоверно неизвестно, кому именно должны принадлежать цифровые двойники и каким образом можно организовать их «верификацию» и сделать так, чтобы люди не путали дипфейки с реальными собеседниками. Впрочем, работы в этом направлении уже ведутся, компании пытаются разработать системы идентификаторов для цифровых клонов — как сообщают в Metaphysic, уже в ближайшие пару лет даже обычные люди смогут создавать фотореалистичных двойников не только себя, но и других людей. Общие стандарты позволят звёздам, например, требовать удаления нелегального контента из Сети и контролировать распространение своих копий в целом.

Нейросеть YandexGPT стала доступна сторонним разработчикам

Компания «Яндекс» объявила о том, что нейросеть YandexGPT, также известная как YaLM 2.0, теперь доступна сторонним разработчикам в облачной платформе Yandex Cloud. Изначально YandexGPT была запущена 17 мая 2023 года с доступом через команду «Давай придумаем» в голосовом помощнике «Алиса». Теперь компании могут подать заявки для использования нейросети для создания своих чат-ботов, умных помощников, работы с текстом, а также решения различных бизнес-задач.

По словам представителей пресс-службы компании, на начальном этапе доступ к сервису будет предоставлен лишь небольшому числу пользователей. При подаче заявки на тестирование, компаниям необходимо описать задачи, которые они намерены решать с использованием YandexGPT. Это даст возможность команде Yandex Cloud определить, насколько технология соответствует поставленным целям. Платформа предлагает два режима: YandexGPT Playground и YandexGPT API. Playground предназначен для тестирования нейросети с целью решения бизнес-задач. В этом режиме можно оценить качество ответов и изучить взаимодействие с сервисом для его настройки в продукте. YandexGPT API позволяет интегрировать сервис в приложения в тестовом режиме.

Начиная с июля 2023 года, первые пользователи получат возможность опробовать нейросеть в решении бизнес-задач. В сотрудничестве с командой Yandex Cloud, клиенты будут работать над выявлением ключевых бизнес-сценариев для дальнейшего развития YandexGPT на облачной платформе. Для получения доступа, заявителям необходимо описать конкретные цели, которые они стремятся достичь с помощью YandexGPT. Это позволит специалистам Yandex Cloud адекватно оценить потенциал технологии для решения конкретных задач. Стоит отметить, что обучение нейросети YandexGPT проходило в два этапа на мощных суперкомпьютерах «Яндекса», что гарантирует высокое качество и множество возможностей, которые она предлагает.

YandexGPT является перспективным направлением в области нейросетей и облачных технологий. Её применение способно оказать значительное влияние на бизнес-процессы, улучшая их эффективность и автоматизацию. Однако, как и в случае с любой новой технологией, важно провести тщательные исследования и тестирование, чтобы определить наилучшие методы использования и возможные ограничения.

«Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста

Компания «Яндекс» продолжает совершенствовать ИИ-приложение «Шедеврум», изначально предназначенное для создания картинок по описанию. Теперь нейросеть программы получила дополнительную функциональность благодаря интеграции другого решения — YandexGPT на основе большой языковой модели нового поколения (YaLM 2.0).

Источник изображения:

Источник изображения: «Яндекс»

Пользователи приложения не только могут получать изображения по текстовому запросу, но и генерировать к ним содержательные «осмысленные» описания. Такую функциональность можно использовать для творчества и развлечений, а также подготовки контента для его последующего размещения в социальных сетях.

YandexGPT позволяет с помощью «Шедеврума» написать небольшой рассказ, объявление, приглашение на то или иное мероприятие или даже весёлую шутку. Нейросеть сам сформулирует заголовок и предложит под содержание текстового контента изображение из числа изображений, сгенерированных пользователями приложения.

Приложение в значительной степени похоже на социальную сеть. Вход осуществляется под аккаунтом «Яндекса», сгенерированный контент можно публиковать в общей ленте, а прочие пользователи могут оценивать работы лайками и подписываться на понравившихся авторов.

Первая бета-версия «Шедеврум» была представлена 5 апреля. В день запуска новинка возглавила рейтинг российского сегмента App Store. По имеющимся данным, приложение уже скачали более 3,5 млн раз.

Доступ к YandexGPT появился 17 мая в составе голосового ассистента «Алиса». ИИ-модель обучали как на общедоступных материалах, так и на текстах, специально созданных сотрудниками компании. Разработчики подчёркивают, что пока нейросеть функционирует в режиме тестирования и может ошибаться в фактах.

В мобильных версиях Gmail появился ИИ-инструмент, который поможет писать электронные письма

В рамках прошедшей в этом году конференции Google I/O разработчики рассказали о разных ИИ-инструментах, которые в будущем станут доступны пользователям сервисов компании. Одним из таких инструментов является функция Help Me Write, которая построена на базе нейросети и уже некоторое время доступна участникам программы тестирования Google в десктопной версии Gmail. Теперь же стало известно, что это нововведение появилось в мобильных версиях сервиса для Android и iOS.

 Источник изображений: Future

Источник изображений: Future

Инструмент Help Me Write может использоваться для редактирования уже написанного электронного письма. Например, он может сократить текст, если письмо слишком растянуто, сделать его более формальным или же наоборот, добавить смайлов, чтобы сделать послание непринуждённым.

Если же у пользователя нет времени на написание полноценного письма, можно задать небольшую подсказку и на её основе ИИ-алгоритм сгенерирует развёрнутое послание. После генерации сообщение можно отредактировать вручную самостоятельно или же задействовать упомянутые ранее опции.

Источник отмечает, что на данный момент инструмент Help Me Write лучше справляется с редактированием сообщений, чем с их написанием. В настоящее время это нововведение могут испытать участники программы тестирования Google. Когда именно Help Me Write для мобильных версий Gmail может стать общедоступным, пока неизвестно.

Нейросеть «Яндекса» для генерации картинок начала иллюстрировать рекламу

Нейросеть «Яндекса», работающая в приложении «Шедеврум», теперь генерирует иллюстрации для онлайн-рекламы, сообщили в компании. Это значительно упростит настройку объявлений рекламодателям, которым затруднительно готовить собственные картинки. Воспользоваться новой функцией смогут клиенты платформы «Яндекс Бизнес».

 Источник изображения: yandex.ru/adv

Источник изображения: yandex.ru/adv

На начальном этапе нейросеть «Яндекса» уже подготовила 2500 изображений для 149 сфер деятельности рекламодателей — библиотека соответствует примерно 40 % кампаний на платформе. При публикации объявлений с иллюстрациями нейросети учитываются вид деятельности рекламодателя, содержание объявления, а также привлекательность самой картинки: можно выбрать либо автоматически предлагаемый системой вариант, либо загрузить собственное изображение.

На достигнутом в «Яндексе» останавливаться не планируют. Решение будет поддерживаться и развиваться: коллекцию картинок станут пополнять, администрация платформы повысит их оригинальность, кроме того, можно будет генерировать изображения для неохваченных видов деятельности.

Ранее компания подключила большую языковую модель YandexGPT к голосовому помощнику «Алиса», который научился самостоятельно писать длинные тексты. Впоследствии нейросеть обучили учитывать в диалоге с пользователем контекст беседы.

Чат-бот YandexGPT научился ведению связных бесед с пользователем

Команда разработчиков «Яндекса» сообщила о расширении функциональных возможностей языковой ИИ-модели нового поколения YandexGPT (YaLM 2.0) — теперь нейросеть может общаться с пользователем и писать ответы с учётом истории предыдущих сообщений.

 Источник изображения: «Яндекс» (company.yandex.ru)

Источник изображения: «Яндекс» (company.yandex.ru)

YandexGPT встроена в виртуального помощника — в «Алису» и активируется по запросу «Алиса, давай придумаем». ИИ-модель запоминает реплики и отвечает на уточняющие вопросы. Это позволяет общаться с ней, как с человеком, который следит за нитью разговора.

По словам разработчиков, включение в YandexGPT поддержки контекста потребовало решения ряда технически сложных задач. «Нужно было научить нейросеть понимать, когда следует учитывать предыдущие реплики, а когда нет. Для этого её дообучили на эталонных примерах обезличенных диалогов. Менее чем за три недели пользователи задали «Алисе» десятки тысяч вопросов, требующих контекстного ответа, а AI-тренеры научили модель давать на такие запросы максимально релевантный ответ. Также были использованы диалоги из Open Source датасета Open Assistant», — поясняют специалисты компании.

YandexGPT была представлена широкой публике 17 мая 2023 года. Языковая ИИ-модель нового поколения доступна в «Яндекс.Браузере», мобильном приложении «Яндекса», в линейке умных колонок и телевизоров компании, а также на главной странице «Яндекса» (ya.ru). В планах разработчика — обучение нейросети новым знаниям и её внедрение в другие сервисы и продукты компании, прежде всего в поиск.

window-new
Soft
Hard
Тренды 🔥
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 3 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 5 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 6 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 7 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 8 ч.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 9 ч.
В Японии порекомендовали добавить в завещания свои логины и пароли 11 ч.
Обновления Windows 11 больше не будут перезагружать ПК, но обычных пользователей это не касается 11 ч.
VK похвасталась успехами «VK Видео» на фоне замедления YouTube 13 ч.
GTA наоборот: полицейская песочница The Precinct с «дозой нуара 80-х» не выйдет в 2024 году 15 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 4 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 4 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 5 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 7 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 10 ч.
Представлена технология охлаждения чипов светом — секретная и только по предварительной записи 10 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 10 ч.
Грузовик «Прогресс МС-29» улетел к МКС с новогодними подарками и мандаринами для космонавтов 11 ч.
Meta планирует построить за $5 млрд кампус ЦОД в Луизиане 11 ч.
Arm задаёт новый стандарт для ПК, чтобы навязать конкуренцию x86 11 ч.