реклама
Теги → openai
Быстрый переход

Картинки в стиле Ghibli перегрузили серверы OpenAI — выпуск новых функций замедлен

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что из-за высокой популярности нового инструмента генерации изображений в ChatGPT компания столкнулась с перегрузкой оборудования, из-за чего выход новых продуктов и функций придётся ограничить.

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

По словам Альтмана, OpenAI пытается справиться с ситуацией, но пользователям следует ожидать как минимум задержек в релизах, а также перебоев в работе сервисов и замедления работы платформы. Тем не менее, как отмечает TechCrunch, компания уверяет, что держит ситуацию под контролем. «Что-то будет ломаться, а обслуживание иногда будет медленным, поскольку мы справляемся с проблемами, связанными с пропускной способностью, — написал Альтман. — Мы стараемся решать проблемы оперативно, чтобы всё действительно работало».

Напомним, выпущенный недавно новый генератор изображений вызвал буквально ажиотаж благодаря способности имитировать различные стили, в частности популярный стиль анимационной студии Studio Ghibli. Однако компания не успевает справляться с наплывом пользователей, а сотрудники вынуждены работать допоздна и даже в выходные, чтобы поддерживать работоспособность системы.

Чтобы снизить нагрузку на свои серверы, OpenAI задержала запуск нового инструмента генерации изображений для бесплатных пользователей ChatGPT, а возможность создания видео с помощью Sora временно отключена для новых пользователей. Компания не уточняет, когда проблемы с перегрузкой будут окончательно решены и пока продолжает работать над улучшением инфраструктуры.

В понедельник ChatGPT зафиксировал регистрацию в сервисе одного миллиона новых пользователей всего за один час. Также отметим, что на сегодня системой пользуются 500 миллионов еженедельных пользователей и 20 миллионов подписчиков, что значительно больше по сравнению с концом 2024 года, когда показатели составляли 300 миллионов и 15,5 миллиона соответственно.

ChatGPT остаётся самым популярным чат-ботом с ИИ, но у конкурентов аудитория тоже растёт

Чат-бот с искусственным интеллектом OpenAI ChatGPT остаётся самым популярным сервисом этого типа в мире. Но активно наращивают аудиторию и конкурирующие платформы, гласит статистика аналитических компаний SimilarWeb и Sensor Tower.

 Источник изображения: Levart_Photographer / unsplash.com

Источник изображения: Levart_Photographer / unsplash.com

SimilarWeb специализируется на оценке трафика веб-сайтов, включая веб-версии чат-ботов, и, как утверждают в компании, по итогам марта сервис Google Gemini нарастил аудиторию на 7,4 % в сравнении с февралём — показатель достиг 10,9 млн посетителей в день; Microsoft Copilot за месяц нарастил аудиторию на 2,1 млн до 2,4 млн; Anthropic Claude достиг в марте посещаемости в 3,3 млн человек; чат-бот китайской DeepSeek преодолел отметку 16,5 млн пользователей в день — такой же результат показал xAI Grok. У ChatGPT по состоянию на конец марта были 500 млн посетителей в день.

Платформа OpenAI остаётся впереди с колоссальным отрывом, но за второе место развернулась нешуточная битва. Занявший по итогам марта второе место DeepSeek растерял 25 % февральской аудитории, xAI Grok по сравнению с предшествующим месяцем показал рост почти на 800 %, и это крупнейшая положительная динамика в рейтинге, говорят в SimilarWeb.

Динамика посещаемости мобильных приложений чат-ботов связывается с выпуском новых моделей ИИ. В течение недели, начавшейся 24 февраля, когда Anthropic выпустила Claude 3.7 Sonnet, аудитория приложения Claude выросла на 21 %, гласит статистика Sensor Tower. Двумя неделями ранее, вскоре после выхода Google Gemini 2.0 Flash аудитория приложения Gemini показала недельный рост на 42 %. Помимо выхода обновлённых моделей, пользователей интересуют и новые возможности сервисов: функция Canvas в Gemini, которая позволяет запускать программный код; или новые функции Claude, которые Anthropic добавляет постоянно.

Но и здесь поводов для паники у OpenAI пока не отмечается. По состоянию на март число активных пользователей мобильного приложения ChatGPT десятикратно превзошло аудиторию Gemini и Claude вместе взятых.

OpenAI пообещала выпустить открытую рассуждающую ИИ-модель в ближайшие месяцы

«В ближайшие месяцы» OpenAI намерена выпустить открытую большую языковую модель искусственного интеллекта — она станет первой со времён GPT-2. Об этом говорится на специальной странице на сайте компании; здесь же размещена форма, которую предлагается заполнить «разработчикам, исследователям и всему сообществу».

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

«Мы рады сотрудничеству с разработчиками, исследователями и сообществом, чтобы собрать мнения и сделать эту модель максимально полезной. Если вы заинтересованы дать обратную связь команде OpenAI, сообщите нам об этом [через форму] ниже», — говорится на сайте OpenAI. Дополнительно собрать отзывы и показать прототипы модели компания хочет на мероприятиях, которые проведёт сама. Первое через несколько недель пройдёт в Сан-Франциско, за ним последуют встречи в Европе и Азиатско-Тихоокеанском регионе.

OpenAI приходится всё активнее отбивать атаки конкурентов, в том числе китайской DeepSeek, которые выпускают открытые модели ИИ. Конкуренты позволяют сообществу использовать эти системы как для экспериментов, так и в коммерческих целях. Значительные средства в разработку моделей семейства Llama вложила Meta — в марте эти модели набрали более 1 млрд загрузок. Большую базу пользователей быстро собрала DeepSeek.

«[Лично я считаю,] нам нужно выработать другую стратегию в отношении открытого исходного кода. Эту точку зрения в OpenAI разделяют не все, и сейчас это нашим приоритетом не является. [В будущем] мы станем выпускать лучшие модели, но наше лидерство станет меньшим, чем в предыдущие годы», — рассказал ранее глава OpenAI Сэм Альтман (Sam Altman).

Новая открытая модель будет поддерживать функцию рассуждений, добавил он накануне в соцсети X. Компания проведёт все стандартные проверки, как перед выпуском коммерческих моделей, и ряд дополнительных, учитывая, что после выпуска пользователи начнут её дорабатывать самостоятельно. Развёртывать её будут крупные компании и правительственные учреждения, считает господин Альтман.

Завирусившийся новый генератор изображений в ChatGPT стал доступен всем пользователям

Новый генератор изображений OpenAI, работающий на базе большой языковой модели GPT-4o, теперь доступен всем пользователям. Об этом на своей странице в социальной сети X написал гендиректор OpenAI Сэм Альтман (Sam Altman). До этого момента использовать новый ИИ-генератор изображений могли только платные подписчики ChatGPT.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Бесплатные пользователи сервиса сейчас могут генерировать не больше двух изображений в сутки. Ранее Альтман упоминал о возможности введения лимита в три изображения в день. Инструмент генерации изображений OpenAI мгновенно стал сверхпопулярным сразу после его запуска в массы. Альтман заявлял, что спрос на генерацию картинок был так высок, что используемые компанией графические ускорители попросту «плавились».

Генератор быстро стал известен тем, что его использовали для преобразования изображений в стиль японской анимационной студии Studio Ghibli. Это вызвало обеспокоенность по поводу нарушения авторских прав, поскольку создаваемые ИИ-генератором изображения были очень похожи на работы студии. Некоторые люди также использовали данный инструмент для создания поддельных квитанций, например, ресторанных счетов. В компании на это заявили, что все сгенерированные ИИ изображения содержат метаданные, указывающие на их происхождение.

Вместе с этим OpenAI заявила о привлечении $40 млрд инвестиций, за счёт чего рыночная стоимость компании составила $300 млрд. В качестве основного инвестора в рамках этого раунда финансирования выступил Softbank. Компания также объявила, что ИИ-бот ChatGPT еженедельно используют более 500 млн человек по всему миру, тогда как количество ежемесячно активных пользователей выросло до 700 млн человек.

OpenAI привлекла $40 млрд инвестиций от «синдиката инвесторов» — деньги пойдут на создание AGI

В ходе очередного раунда финансирования OpenAI привлекла $40 млрд от группы инвесторов во главе с SoftBank — разработчика ИИ при этом оценили в $300 млрд. Это крупнейший в истории раунд финансирования частной технологической компании, сообщает CNBC.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

OpenAI получит авансом $10 млрд, $7,5 млрд из которых поступят от SoftBank и $2,5 млрд — от «синдиката инвесторов». Остальные $30 млрд будут переведены к концу года при условии, что к тому времени OpenAI проведёт реорганизацию и станет коммерческой компаний. В противном случае объём сделки сократится на четверть.

В январе OpenAI объявила о проекте Stargate — совместное предприятие с бюджетом $500 млрд при поддержке SoftBank, Oracle и фонда MGX из Абу-Даби в ближайшие четыре года намеревается построить сеть гигантских центров обработки данных для систем искусственного интеллекта. Сейчас компания в ударе: накануне её гендиректор Сэм Альтман (Sam Altman) сообщил, что всего за час платформа привлекла 1 млн пользователей благодаря функции Images в ChatGPT, ставшей вирусной из-за возможности генерировать изображения в стиле аниме Studio Ghibli. В ближайшие месяцы OpenAI намеревается выпустить мощную большую языковую модель с открытыми весами. Еженедельная аудитория сервисов OpenAI составляет 500 млн пользователей, сообщалось в ходе раунда финансирования.

Несмотря на бурный рост из-за ChatGPT, у компании сохраняются колоссальные издержки. По итогам текущего года она намеревается получить $12,7 млрд дохода — в прошлом году этот показатель был $3,7 млрд. На положительный денежный поток компания намеревается выйти в 2029 году, когда её выручка достигнет $125 млрд. В ходе раунда финансирования OpenAI в очередной раз озвучила цель своей работы — «создание сильного ИИ (AGI), который принесёт пользу всему человечеству». Для достижения этой цели компании потребуются значительные вычислительные и энергетические ресурсы, глобальная инфраструктура и очень большие деньги, дал понять Сэм Альтман.

Amazon представила ИИ-агента Nova Act, который заменит человека в интернет-серфинге

Amazon представила универсального ИИ-агента Nova Act, который может управлять веб-браузером и самостоятельно выполнять некоторые простые действия. В будущем Nova Act будет поддерживать все функции Alexa+ — обновлённого голосового помощника Amazon. Одновременно с агентом компания выпустила набор инструментов Nova Act SDK, который позволяет разработчикам создавать собственные прототипы агентов.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Nova Act разработан недавно открытой в Сан-Франциско лабораторией AGI Amazon, возглавляемой бывшими исследователями OpenAI Дэвидом Луаном (David Luan) и Питером Аббелем (Pieter Abbeel). Amazon называет выпуск ИИ-агента «исследовательским предварительным просмотром». Разработчики уже сейчас могут получить доступ к набору инструментов Nova Act на специализированном ресурсе nova.amazon.com, который также служит «витриной» для различных моделей Nova Foundation от Amazon.

Nova Act — это попытка Amazon составить конкуренцию OpenAI Operator и Anthropic Computer Use с помощью технологии агентов ИИ общего назначения. Многие лидеры рынка искусственного интеллекта считают, что агенты ИИ, которые могут исследовать интернет по заданию пользователей, сделают чат-ботов ИИ значительно более полезными. Amazon рассчитывает, что распространённость Alexa+ обеспечит новому агенту широкий охват.

Разработчики, использующие Nova Act SDK, смогут автоматизировать базовые действия от имени пользователей, такие как заказ продуктов или бронирование столика в ресторане. С помощью Nova Act разработчики могут объединить инструменты, которые позволят ИИ-агенту перемещаться по веб-страницам, заполнять формы или выбирать даты в календаре.

По данным Amazon, Nova Act превосходит агентов от OpenAI и Anthropic в нескольких внутренних тестах компании. Например, в ScreenSpot Web Text, который измеряет, как агент ИИ взаимодействует с текстом на экране. Nova Act набрал 94 %, превзойдя CUA OpenAI (88 %) и Claude 3.7 Sonnet от Anthropic (90 %).

По мнению экспертов, основная проблема с недавно выпущенными ИИ-агентами от OpenAI, Google и Anthropic заключается в их низкой надёжности. Во многих тестах они работают медленно, с трудом принимают самостоятельные решения и склонны к ошибкам, которые человек бы не допустил. В скором времени станет ясно, удалось ли Amazon избавить свой продукт от этих недостатков.

«Наши GPU плавятся»: ажиотаж вокруг нового генератора картинок в ChatGPT заставил OpenAI ввести ограничения

Представленная на днях функция 4o Image Generation генерации качественных изображений вызвала огромный интерес у пользователей. Ажиотаж даже вынудил OpenAI «временно» ограничить частоту отправки запросов на генерацию изображений, сообщил в соцсети X гендиректор компании Сэм Альтман (Sam Altman). «Очень забавно наблюдать, как людям нравятся изображения в ChatGPT, но наши графические процессоры плавятся», — отметил он в своём сообщении.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Альтман не уточнил, какой предел скорости был установлен, лишь выразив надежду, что это ограничение не понадобится надолго, поскольку OpenAI пытается повысить эффективность обработки огромного числа запросов.

Высочайший спрос уже заставил компанию отсрочить запуск обновлённого генератора изображений на базе GPT-4o для бесплатных пользователей ChatGPT — Альтман ранее пообещал, что бесплатные пользователи «скоро» смогут генерировать с его помощью до трёх изображений в день. Но, по-видимому, этого оказалось недостаточно, чтобы как-то снизить нагрузку на инфраструктуру OpenAI.

Улучшенный инструмент генерации изображений использует мультимодальную большую языковую модель GPT-4o. Получающиеся с его помощью изображения выглядят качественно, более реалистично и лучше соответствуют запросам. Также имеются успехи в преодолении прошлых проблем, например, с отображением текста. В интервью ресурсу The Verge представитель компании назвал улучшение генерации как «шаговое изменение» по сравнению с предыдущими моделями. Тем не менее возникшие проблемы служат напоминанием о том, сколько технической мощности и энергии требуется для реализации функции генерации изображений в ChatGPT, отметил The Verge.

Microsoft вынашивает идею разработки собственного мощного ИИ

Выступающая в роли крупнейшего инвестора OpenAI корпорация Microsoft до сих пор предпочитала полагаться на возможности больших языковых моделей первой и её же чат-бота ChatGPT, но в дальнейшем не исключена возможность создания собственных производительных систем искусственного интеллекта, как дал понять генеральный директор Сатья Наделла (Satya Nadella).

 Источник изображения: Microsoft

Источник изображения: Microsoft

Соответствующие заявления он сделал в интервью группе японских журналистов во время своего визита в Токио, как сообщает Nikkei. По мнению главы Microsoft, создание собственной платформы для искусственного интеллекта позволит оптимизировать работу с программным обеспечением корпорации для корпоративных клиентов. «Мы построим свои собственные возможности для дополнения всего того, что мы делаем с OpenAI», — заявил Наделла. Внедрять собственный ИИ в приложения и сервисы для корпоративного сегмента Microsoft будет в том случае, если поймёт, что он будет полезен для потребителей.

Microsoft не только адаптирует решения OpenAI к своей программной инфраструктуре. Компания расширит команду разработчиков приложений для искусственного интеллекта, и ожидается, что со временем её собственные разработки в этой сфере не будут уступать передовым решениям OpenAI. «Мы все будем подчиняться реальному спросу. То, куда пойдёт ИИ, будет зависеть исключительно от происходящего с мировым ростом ВВП», — пояснил глава Microsoft стратегию инвестиций в сферу искусственного интеллекта.

В прошлом году Microsoft открыла в Японии первый исследовательский центр, связанный с разработкой ИИ для робототехники и автомобилей. Корпорация полна готовности глубоко сотрудничать с японскими компаниями и разработчиками, использующими открытый исходный код. Наделла считает, что использование единых стандартов в сфере безопасности ИИ пойдёт на пользу всем и сократит возможные издержки, связанные с рисками.

OpenAI рассчитывает более чем утроить выручку в этом году, а затем удвоить её в следующем

Занимающая лидирующие позиции на рынке систем генеративного искусственного интеллекта компания OpenAI номинально остаётся стартапом, её финансовая отчётность официально не публикуется, поэтому приходится получать данные из неофициальных источников. Они гласят, что в текущем году выручка OpenAI вырастет более чем в три раза.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В прошлом году, по имеющимся у Bloomberg данным, выручка компании не превысила $3,7 млрд, но в этом прогнозируется её рост до $12,7 млрд. В следующем году темпы роста замедлятся, но выручка всё равно увеличится более чем в два раза до $29,4 млрд. По данным на сентябрь прошлого года, OpenAI на тот момент рассчитывала выручить в 2025 году только $11,6 млрд.

OpenAI несёт огромные расходы на развитие вычислительной инфраструктуры и расширение штата сотрудников, поэтому на окупаемость она рассчитывает выйти не ранее 2029 года, когда её выручка достигнет $125 млрд. Значительную часть дохода компания получает от подписчиков ChatGPT. Корпоративной версией чат-бота по состоянию на сентябрь прошлого года пользовался миллион человек. Сейчас для доступа к самым продвинутым языковым моделям OpenAI пользователи должны отдавать по $200 в месяц. Кроме того, руководством компании обсуждается возможность введения тарифного плана, подразумевающего абонентскую плату в размере нескольких тысяч долларов в месяц. Капитализация OpenAI оценивается в $300 млрд, но чтобы привлечь больше инвесторов, она должна изменить организационную структуру, поскольку сейчас ею командует некоммерческая организация.

OpenAI решила попридержать запуск 4o Image Generation для бесплатных пользователей

Компания OpenAI вынуждена перенести сроки предоставления доступа к встроенному генератору изображений в ChatGPT для пользователей бесплатной версии. Сэм Альтман (Sam Altman) в своём сообщении признал, что новый инструмент 4o Image Generation оказался популярнее, чем ожидалось, поэтому развёртывание для бесплатного использования будет отложено на некоторое время, сообщает The Verge.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Новый ИИ-генератор изображений был интегрирован в ChatGPT буквально на днях. С его помощью можно создавать картинки непосредственно в приложении, используя новейшую модель рассуждений GPT-4o. Функция так понравилась пользователям, что они уже вовсю стали делиться в социальных сетях изображениями, в частности, стилизованными под работы студии Ghibli, — тренд, к которому присоединился даже сам Альтман.

По словам разработчиков, 4o Image Generation отличается улучшенным рендерингом текста и использует для генерации изображений так называемый авторегрессионный подход, когда изображение создаётся последовательно, слева направо и сверху вниз, а не одномоментно целиком, что позволяет создавать картинки без каких-либо ошибок или искажений в тексте, чего раньше добиться в других генераторах не удавалось.

В настоящее время доступ к функции имеют только подписчики платных тарифов ChatGPT Plus, Pro и Team. Когда именно пользователи бесплатной версии смогут опробовать новый ИИ-генератор, пока не совсем ясно из-за неожиданно высокого спроса на эту функцию.

OpenAI представила функцию генерации точных изображений в ChatGPT на базе GPT-4o — она доступна бесплатно

OpenAI встроила функцию генерации точных изображений непоcредственно в ChatGPT. Новая функция, именуемая 4o Image Generation, опирается на мультимодальную большую языковую модель GPT-4o. Она понимает контекст, сложные инструкции, взаимодействия объектов и даже генерирует текстовые надписи без артефактов. Доступ для всех откроют сегодня.

 Источник изображения: OpenAI

Источник изображений: OpenAI

ChatGPT и прежде умел генерировать изображения с помощью нейросети Dall-E 3. Однако обновлённая функция работает куда лучше и точнее. Представитель OpenAI Тайя Кристиансон (Taya Christianson) уточнила, что лимиты для бесплатных пользователей останутся такими же, как у DALL-E, то есть три изображения в день. Доступ к DALL-E по-прежнему возможен через пользовательский интерфейс ChatGPT.

Как отметил глава исследований Габриэль Го (Gabriel Goh), использование GPT-4o позволяет ИИ работать с любыми типами данных — текстом, изображениями, аудио и видео. Кроме того, Sora получила ключевое улучшение, заключающееся в корректном соотношении атрибутов и объектов (binding). Го объяснил, что большинство ИИ путаются при обработке 5–8 элементов. Например, ИИ может получить запрос нарисовать синюю звезду и красный треугольник, но создать красную звезду и нечто отличное от треугольника. 4o Image Generation справляется с 15–20 объектами без ошибок.

 Источник изображения: OpenAI

Пользователи также заметят улучшение в отрисовке текста, что позволяет генерировать на изображениях читаемый текст без опечаток. В существующих инструментах для генерации изображений текст часто искажался и достижение качественного рендеринга в этом смысле было серьёзной проблемой, так как даже небольшие ошибки в заголовках или текстовых элементах могут сделать всё изображение полностью непригодным.

 Генерация по запросу «сделайте очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha)

Генерация по запросу «Cделай очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha)

Система также использует теперь нестандартный метод генерации. Изображения создаются последовательно, слева направо и сверху вниз, а не целиком, как это происходит в DALL-E. По мнению Го, это объясняет превосходство 4o Image Generation в работе с текстом и сложными сценами.

OpenAI продемонстрировала возможности 4o Image Generation на научных диаграммах, например, эксперимент Ньютона с призмой, комиксах и постерах. Также были показаны практические применения в создании изображений с прозрачным фоном для стикеров, меню ресторанов и логотипов. 4o Image Generation со всеми заданиями справилась успешно, не допустив в тексте никаких ошибок.

Также 4o Image Generation способен редактировать загруженные пользователем изображения по простым запросам, добавляя на них элементы или наоборот убирая.

 Пример добавление элементов на фотографию с помощью GPT-4o

Пример добавление элементов на фотографию с помощью GPT-4o

Однако новая система генерирует изображения дольше, чем предыдущие, но OpenAI считает это оправданным компромиссом. «Хотя у нас определённо есть возможности для улучшения времени отклика, качество этих изображений, возможности, знание о мире действительно компенсируют дополнительные секунды ожидания», — сказали в компании.

 Источник изображения: OpenAI

Отвечая на вопросы о мерах безопасности, упоминая скандальные дипфейки Тейлор Свифт (Taylor Swift), созданные с помощью модели Microsoft, способность Grok от xAI изобразить Камалу Харрис (Kamala Harris) с оружием и удаление водяных знаков в Google Gemini, команда OpenAI подчеркнула наличие надёжных механизмов защиты от злоупотреблений.

Директор по дизайну OpenAI Шеннон Джагер (Jackie Shannon) заявила, что инструмент предотвращает удаление водяных знаков, блокирует генерацию дипфейков, связанных с телом человека и отказывает в запросах на создание материалов с различным родом насилия над детьми (CSAM). Кроме того, Шеннон пояснила, что все сгенерированные изображения будут включать стандартные метаданные C2PA, чтобы отметить изображение как созданное OpenAI.

OpenAI: ИИ бесполезно наказывать за ложь — он начинает хитрить ещё больше

Галлюцинации, то есть заведомо неверные ответы, которые иногда дают модели искусственного интеллекта, стали одной из основных проблем всей отрасли — из-за этого некоторые граждане вообще отказываются пользоваться ИИ. Избавиться от таких сбоев может оказаться сложнее, чем предполагалось ранее, выяснили исследователи OpenAI.

 Источник изображения: openai.com

Источник изображения: openai.com

Учёные компании OpenAI опубликовали результаты исследования, в котором описали свои попытки наладить управление сложными, в том числе рассуждающими, моделями ИИ, чтобы не допустить их выхода за установленные рамки. Исследователи применяли уникальные стратегии и методы, в том числе наказания за вредоносные действия и попытки обмануть пользователя. В проекте использовалась, помимо прочего, некая созданная OpenAI, но не вышедшая на рынок модель ИИ, которой поручали различные задачи — их выполнение можно было облегчить, обманув пользователя или отбросив некоторые действия.

Результат обучения модели во многом зависит от этапа обучения с подкреплением, когда за выполнение команды или генерацию правильного ответа она получает вознаграждение. Моделям ИИ свойственно пытаться получить вознаграждение посредством манипуляций, в том числе нарушая некоторые правила и рекомендации, чтобы добиться желаемого результата. Исследователи надеялись, что смогут выявить лазейки и лучше понять поведение ИИ, отслеживая цепочку её рассуждений, но это не помогло. Попытки оптимизировать цепочку рассуждений напрямую, то есть отдать команду не обходить инструкции, дают лишь краткосрочный эффект, установили учёные: «это не устраняет всё нежелательное поведение и может привести к тому, что модель станет скрывать свои истинные намерения».

Авторам проекта пришлось признать, что механизмы мониторинга моделей «хрупки». Строгий надзор за цепочкой рассуждений может побудить ИИ скрывать свои ошибки, чтобы обеспечить себе вознаграждение в обход ограничений. Для наблюдения за испытуемой моделью при выполнении заданий по написанию программного кода использовалась коммерческая GPT-4o — подопытная же допускала небрежности и открыто признавала в цепочке рассуждений, что делала это для получения вознаграждения; например, она преждевременно завершала выполнение некоторых программ. После этого исследователи попытались наказать модель, но эффект от этого оказался недолговечным: в цепочке рассуждений оставались признаки попытки получить вознаграждение обходными путями и дать неправильный ответ. То есть она нашла способ скрывать свои мотивы от контролирующего ИИ.

В этой связи остаётся неясным, готов ли мир к ИИ уровня человека, если проблема сохранится, и вмешиваться человек уже не сможет. Исследователи выразили надежду, что в будущем появятся способы оказывать влияние на модели через их цепочку рассуждений без обмана и скрытых тактик — они предлагают сделать методы оптимизации менее навязчивыми и прямолинейными.

Голосовая версия ChatGPT стала приятнее в общении, сообщили в OpenAI

OpenAI накануне обновила функцию Advanced Voice Mode — формат голосового общения с ChatGPT в реальном времени. Помощник с искусственным интеллектом стал приятнее в общении и научился реже прерывать пользователей.

 Источник изображения: openai.com

Источник изображения: openai.com

С последним обновлением OpenAI попыталась решить проблему, характерную для многих голосовых помощников с ИИ — они часто прерывают пользователей, если те приостанавливают речь, чтобы подумать или сделать глубокий вдох. Обновлённая версия Advanced Voice Mode стала доступной для пользователей бесплатного варианта ChatGPT, которая теперь позволяет делать продолжительные паузы в речи и не прерывает собеседника. Подписчики платных вариантов сервиса, в том числе тарифов ChatGPT Plus, Teams, Edu, Business и Pro получили не только более деликатного, но и более индивидуализированного голосового помощника — его ответы стали «более прямыми, интересными лаконичными, конкретными и творческими», рассказали в OpenAI.

OpenAI зарекомендовала себя как мирового лидера в области искусственного интеллекта, но ей приходится прилагать всё более значительные усилия, чтобы оставаться впереди конкурентов. В сегменте голосовых помощников в последнее время вирусную популярность приобрёл стартап Sesame соучредителя Oculus Брендана Ирибе (Brendan Iribe) — он выпустил варианты сервиса Maya и Miles, которые отличаются естественным звучанием. Голосовых помощников с мощным ИИ выпускают и крупные игроки: Amazon недавно представила Alexa+ с генеративным ИИ, а Apple была вынуждена перенести выпуск поумневшей Siri, что обернулось нешуточным скандалом.

Сэм Альтман сосредоточился на исследованиях — OpenAI перераспределила роли в руководстве

OpenAI объявила о расширении полномочий главного операционного директора Брэда Лайткэпа (Brad Lightcap) и повышении двух топ-менеджеров в руководстве компании. Эти изменения связаны с тем, что генеральный директор Сэм Альтман (Sam Altman) намерен уделять больше внимания технологическим аспектам работы компании.

 Источник изображения: Rolf van Root / Unsplash

Источник изображения: Rolf van Root / Unsplash

По сообщению Bloomberg, Лайткэп возьмёт на себя больше ответственности за повседневную деятельность компании, включая контроль за международной экспансией и партнёрством с такими фирмами, как Microsoft и Apple, а Альтман сосредоточится на исследовательской деятельности и разработке продуктов и дальнейшем развитии ChatGPT.

С момента непродолжительного увольнения Альтмана в конце 2023 года OpenAI значительно расширила управленческую команду, и последние кадровые перестановки указывают на стремление компании ускорить исследования в области ИИ, что может привести к созданию новых мощных продуктов.

Марк Чен (Mark Chen) и Джулия Виллагра (Julia Villagra) были назначены на должности директора по исследованиям и директора по персоналу соответственно. При этом OpenAI не планирует искать замену бывшему техническому директору Миру Мурати (Mira Murati), которая покинула компанию в сентябре и основала собственный ИИ-стартап.

«Мы по-прежнему сосредоточены на передовых исследованиях в области искусственного интеллекта, способствующих прогрессу человечества», — написал Альтман в блоге компании. Он также подчеркнул, что продуктами OpenAI уже пользуются миллионы людей. Однако ранее ушедшие из компании сотрудники, такие как Илья Суцкевер (Ilya Sutskever), соучредитель Джон Шульман (John Schulman) и Мира Мурати (Mira Murati), публично выражали скептицизм по поводу того, сможет ли OpenAI обеспечить безопасное использование ИИ.

В своём обращении Альтман отметил, что активное использование технологий OpenAI помогает совершенствовать исследования. Компания также подтвердила цель по созданию так называемого искусственного общего интеллекта (AGI), который превзойдёт человека в большинстве интеллектуальных задач, но при этом будет полезен для общества. OpenAI также рассматривает возможность преобразования компании в публичную корпорацию с социальными обязательствами и уже ведёт переговоры о привлечении до $40 млрд инвестиций при оценке в $300 млрд.

Сэм Альтман призвал вместо программирования учиться «хорошо использовать ИИ-инструменты»

Генеральный директор OpenAI Сэм Альтман (Sam Altman) считает, что в настоящее время освоение инструментов на базе искусственного интеллекта является главной задачей для тех, кто хочет научиться программировать. Во время недавнего интервью он также добавил, что помогающие писать программный код ИИ-алгоритмы уже используются в крупнейших компаниях.

 Источник изображения: wikipedia.org

Источник изображения: wikipedia.org

В ходе беседы с американским аналитиком Беном Томсоном (Ben Thompson) глава OpenAI рассказал, что во времена, когда он заканчивал школу, очевидной тактической задачей было научиться хорошо писать код. В настоящее время, по мнению Альтмана, «очевидная тактическая задача — просто научиться по-настоящему хорошо использовать ИИ-инструменты».

Эту точку зрения разделяют многие другие руководители ведущих технологических компаний, отмечая, что ИИ становится всё лучше в написании программного кода. В этом месяце гендиректор Anthropic Дарио Амодей (Dario Amodei) заявил, что в течение года ИИ начнёт писать весь код за инженеров-программистов. Гендиректор Meta Марк Цукерберг (Mark Zuckerberg) также заявлял в начале года о том, что его компания работает над новым ИИ-алгоритмом, который сможет писать «большую часть кода в наших приложениях».

По мнению Альтмана, освоение инструментов на базе искусственного интеллекта является «новой версией» обучения программированию. Он добавил, что в настоящее время уже автоматизирована как минимум половина работы по написанию кода. «Я думаю, что во многих компаниях этот процесс уже перевалил за 50 %. Я думаю, что большое значение будет иметь агентское кодирование, которым пока никто по-настоящему не занимается», — добавил Альтман.

На вопрос о планах OpenAI по найму на работу инженеров-программистов Альтман сказал, что сейчас работы хватает. При этом он отметил, что в долгосрочной перспективе именно создаваемый сейчас ИИ может привести к сокращению рынка труда. «Мое предположение заключается в том, что каждый инженер-программист какое-то время будет нагружен работой. А потом, в какой-то момент, возможно, нам действительно понадобится меньше инженеров-программистов», — считает Альтман.

window-new
Soft
Hard
Тренды 🔥
Благодаря ИИ Microsoft из отстающих вышли в лидеры по темпам роста своих акций 38 мин.
Microsoft продолжила массовые увольнения, несмотря на сокращение 7000 сотрудников в мае 42 мин.
Owlcat Games заинтриговала фанатов тизером новой научно-фантастической игры — анонс уже совсем скоро 2 ч.
Broadcom: на рынке происходит «облачная перезагрузка» — доверие к частным облакам только растёт 3 ч.
Генератор видео Sora компании OpenAI стал бесплатным в приложении Bing 6 ч.
Wizards of the Coast анонсировала грандиозный боевик по Dungeons & Dragons от новой студии режиссёра God of War III и Star Wars Jedi: Survivor 13 ч.
Календарь релизов — 2–8 июня: Nintendo Switch 2, Deltarune и Atomfall: Wicked Isle 13 ч.
CD Projekt Red покажет «инновационные технологии» в основе The Witcher 4 на презентации State of Unreal — где и когда смотреть 14 ч.
Apple намекнула на масштабный редизайн iOS 26 в новом слогане WWDC25 14 ч.
«Алиса» научится сама бронировать столики и не только — «Яндекс» превратит помощницу в ИИ-агента 14 ч.