реклама
Теги → chatgpt
Быстрый переход

Для обучения GPT-5 не хватит качественных данных из всего интернета

Разработчики передовых моделей искусственного интеллекта столкнулись с неожиданной проблемой — нехваткой качественного материала для их обучения. Ситуация усугубляется тем, что некоторые ресурсы блокируют доступ ИИ к своим данным. По словам исследователей, попытки обучать ИИ на материалах других моделей и прочем «синтетическом контенте» могут обернуться «большими проблемами».

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Учёные и руководители компаний-разработчиков ИИ обеспокоены, что в ближайшие два года качественных текстов может не хватить для дальнейшего обучения больших языковых моделей (LLM), что замедлит развитие отрасли. Разрабатывающая ChatGPT компания OpenAI уже рассматривает возможность обучения GPT-5 на транскрипциях публичных роликов на YouTube.

Языковые модели ИИ собирают тексты из интернета — научные исследования, новости, статьи из «Википедии» — и разбивают их на отдельные слова или их части, используя их, чтобы научиться отвечать как человек. Чем больше входящих данных, тем лучше результат — именно на это уповала OpenAI, что помогло ей стать одним из лидеров отрасли. По словам изучающего искусственный интеллект в Исследовательском институте Epoch Пабло Вильялобоса (Pablo Villalobos), GPT-4 обучался на 12 триллионах токенов данных, а в соответствии с законами масштабирования Шиншиллы, ИИ вроде GPT-5 потребуется 60–100 триллионов токенов. Если собрать все высококачественные текстовые и графические данные в интернете, для обучения GPT-5 не хватит от 10 до 20 триллионов токенов, а может и больше — и пока непонятно, где их взять. Два года назад Вильялобос и другие исследователи уже предупреждали, что к середине 2024 года с вероятностью 50 % ИИ уже не будет хватать данных для обучения, к 2026 — с вероятностью 90 %.

По словам учёных, большинство данных в интернете непригодно для обучения ИИ, поскольку содержит бессвязный текст или не добавляет новой информации к уже имеющейся. Для этой цели подходит лишь малая часть материала — примерно десятая доля собранного некоммерческой организацией Common Crawl, чей веб-архив широко используется разработчиками ИИ. Тем временем, крупные платформы вроде социальных сетей и новостных агентств закрывают доступ к своим данным, а общественность не горит желанием открывать личную переписку для обучения языковых моделей. Марк Цукерберг (Mark Zuckerberg) считает огромным преимуществом в разработке ИИ доступ Meta к данным на своих платформах, среди которых текст, изображения и видео — правда, трудно сказать, какую долю этих материалов можно считать качественной.

 Ари Моркос. Источник изображения: arimorcos.com

Ари Моркос. Источник изображения: arimorcos.com

Стартап DatologyAI пытается бороться с нехваткой контента, используя методику «учебного плана», согласно которой данные «скармливаются» ИИ в определённом порядке, помогающем установить связь между ними. В опубликованной в 2022 году работе бывшего сотрудника Meta Platform и Google DeepMind, а ныне основателя DatologyAI Ари Моркоса (Ari Morcos) подсчитано, что данный подход помогает добиваться сопоставимых успехов в обучении ИИ при сокращении входящих данных вдвое. Впрочем, другие исследования эти данные не подтвердили.

Сэм Альтман (Sam Altman) также рассказал, что OpenAI разрабатывает новые методики обучения ИИ. По слухам, в стенах компании обсуждается возможность создания рынка данных, на котором бы определялась ценность конкретных материалов для каждой модели и справедливая цена, которую можно за них заплатить. Эта же идея обсуждается в Google, однако конкретных подвижек в этом направлении пока нет, поэтому компании-разработчики ИИ стараются дотянутся до всего, что только можно, в том числе видео- и аудиоматериалов — по словам источников в OpenAI, их собираются расшифровывать инструментом распознавания речи Whisper.

 Сэм Альтман. Источник изображения: wikipedia.org

Сэм Альтман. Источник изображения: wikipedia.org

Исследователи из OpenAI и Anthropic экспериментируют с так называемыми «высококачественными синтетическими данными». В недавнем интервью главный научный сотрудник Anthropic Джаред Каплан (Jared Kaplan) сказал, что подобные «сгенерированные внутри компании данные» могут быть полезные и использовались в последних версиях Claude. Пресс-секретарь OpenAI также подтвердил подобные разработки.

Многие исследователи проблемы нехватки данных не верят, что смогут с ней справиться, однако Вильялобос не теряет оптимизма, и верит, что впереди ещё много открытий. «Самая большая неопределённость в том, что мы не знаем, какие революционные открытия ещё предстоят», — сказал он.

По словам Ари Моркоса, нехватка данных — одна из важнейших проблем отрасли. Однако её развитие тормозит не только это — необходимые для работы больших языковых моделей чипы также в дефиците, а лидеры отрасли обеспокоены нехваткой центров обработки данных и электроэнергии.

Американским парламентариям запретили использовать Microsoft Copilot в служебных целях

Существующие системы искусственного интеллекта в большинстве своём используют облачные информационные ресурсы, подгружая в них обрабатываемые пользовательские данные, и это может представлять определённую угрозу для безопасности. Конгресс США, как следует из опубликованных рекомендаций, запрещает своим членам использовать сервис Microsoft Copilot в служебных целях.

 Источник изображения: Unsplash, Louis Velazquez

Источник изображения: Unsplash, Louis Velazquez

Поскольку указанный сервис призван упрощать работу с документами, у американских парламентариев, как предполагают авторы рекомендации, может возникать соблазн оптимизировать свою деятельность с помощью данного инструмента, но облачные ресурсы Microsoft, используемые сервисом Copilot, не одобрены данным органом власти как достаточно безопасные, а потому от подобных действий членам обеих палат парламента США рекомендовано воздержаться.

Все служебные ПК с операционной системой Windows, которые используются американскими парламентариями, подвергнутся настройке, подразумевающей блокировку сервиса Microsoft Copilot или даже его удаление при наличии такой технической возможности. В свою очередь, корпорация Microsoft к лету этого года планирует разработать специальный защищённый сервис для правительственных учреждений, который предоставит им доступ к искусственному интеллекту с более высокой степенью безопасности. Представители профильного комитета Конгресса США дали понять, что после выхода подобной версии Copilot проведут отдельную экспертизу пригодности данного сервиса для работы с данными правительственных структур. Ещё в прошлом году американским законодателям было запрещено использовать бесплатную версию ChatGPT из тех же соображений, но более продвинутый сервис ChatGPT Plus остался им доступен, пусть и только для анализа уже хранящейся в облаке информации.

Магазин чат-ботов ChatGPT провалился, но им пользуются ученики школ и университетов

Генеральный директор OpenAI Сэм Альтман (Sam Altman) рассчитывал, что площадка кастомных чат-ботов на основе ChatGPT поможет компании расширить бизнес, но на практике она привлекла довольно специфический контингент, а некоторые проекты, возможно, нарушают правила использования платформы.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Среди наиболее популярных спецверсий ChatGPT значатся проекты, работающие в образовательных целях, есть и инструменты для поиска и пересказа научных работ, сообщает Financial Times со ссылкой на данные исследования LikeWeb. В этом году отметился рост популярности дизайнерских инструментов с генерацией изображений, переводчики и средства для кадровиков, помогающие обрабатывать резюме и сопроводительные письма. Некоторые из проектов, возможно, нарушают политику OpenAI, которая запрещает создавать чат-боты, предоставляющие финансовые, юридические и медицинские консультации без одобрения квалифицированными специалистами.

Пять из наиболее просматриваемых приложений провозглашаются разработчиками как способные создавать контент, который проходит проверку применяемых в школах и университетах средств обнаружения материалов, созданных ИИ. Эти кастомные чат-боты в общей сложности набрали не менее 3 млн просмотров, хотя OpenAI напрямую запрещает приложения, позволяющие жульничать в академической среде или пропагандирующие такие действия.

 Источник изображения: ft.com

Источник изображения: ft.com

Более 200 тыс. раз люди пользовались приложением Finance Wizard, которое якобы предсказывает будущую динамику акций. Оно составляет прогнозы на основе исторических данных, а его описание включает заявление об отказе от ответственности, предостерегающее от его использования как инструмента финансовых рекомендаций, подчеркнул разработчик.

В прошлом году Сэм Альтман пообещал, что OpenAI позаботится о соответствии чат-ботов её политике — в этом компании должны помогать автоматизированные средства, анализ сотрудников компании и отзывы пользователей. Аудитория оригинальной версии ChatGPT составляет 100 млн пользователей в неделю, и цифровая платформа с кастомизированными версиями чат-бота призвана способствовать развитию бизнеса компании — иногда эта стратегия рассматривается как попытка повторить успех магазина приложений Apple App Store. В этом году ожидается запуск программы монетизации для разработчиков передовых проектов.

На кастомные чат-боты в феврале пришлись лишь 1,5 % посещений сайта ChatGPT с десктопных компьютеров; еженедельный трафик расти перестал. В OpenAI сообщили, что платформу посетили миллионы пользователей — она будет улучшаться, а отзывы от разработчиков для неё очень важны. Собственные проекты здесь запустили и известные разработчики: туристическое приложение AllTrails, некоммерческая образовательная организация Khan Academy и поисковая система для путешествий Kayak. Одной из первых собственный чат-бот запустила австралийская технологическая компания Canva — он генерирует изображения для соцсетей, а число его просмотров превысило 4,4 млн.

В середине года ИИ выйдет на новый уровень — OpenAI выпустит «существенно улучшенную» нейросеть GPT-5

В ближайшие месяцы OpenAI готовится выпустить новую версию своей модели генеративного искусственного интеллекта, лежащей в основе сервиса ChatGPT — этот сервис положил начало теперешнему буму ИИ.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Компания OpenAI планирует выпустить модель GPT-5 где-то в середине 2024 года, вероятно, летом, сообщает Business Insider со ссылкой на собственные источники. Некоторые корпоративные клиенты уже получили демонстрационные версии модели нового поколения и связанных с ней функций ChatGPT. «Она действительно хороша, даже существенно лучше», — прокомментировал один из испробовавших GPT-5 глав компаний. OpenAI показала работу модели со сценариями её использования и уникальными для его компании данными. Разработчик также упомянул о других, ещё не реализованных функциях модели, в том числе о возможности вызывать ИИ-агентов для автономного выполнения задач. Дата выпуска GPT-5 ещё не намечена.

Сейчас OpenAI продолжает обучать GPT-5. Когда обучение завершится, компания проверит модель на безопасность собственными силами, после чего она будет подвергнута стресс-тестированию: сотрудники OpenAI и сторонние специалисты будут различными способами её провоцировать, чтобы обнаружить возможные проблемы, прежде чем GPT-5 станет общедоступной. Конкретных сроков завершения тестирования пока тоже нет, поэтому её выпуск может откладываться.

Модель OpenAI GPT-4, ставшая последним крупным обновлением ChatGPT, вышла уже год назад. Разработчик заявлял, что она предоставляет более точные и оперативные ответы, но со временем в GPT-4 обнаружились такие проблемы как деградация и «лень» — отказ ИИ отвечать на запросы. Попыткой решить последнюю проблему стал выпуск GPT-4 Turbo. Наиболее важные данные обучающего массива ИИ принадлежат правообладателям, и OpenAI выступает против попыток ограничить доступ к этой информации для больших языковых моделей.

В плагинах ChatGPT нашли уязвимости, позволявшие взламывать учётные записи на сторонних платформах

Компания Salt Security обнаружила в некоторых плагинах ChatGPT критические уязвимости, через которые злоумышленники могли получать несанкционированный доступ к учётным записям пользователей на сторонних платформах. Речь идёт о плагинах, позволяющих ChatGPT выполнять такие операции, как, например, правка кода на GitHub или получение данных с «Google Диска».

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

Плагины ChatGPT — это альтернативные версии чат-бота на основе искусственного интеллекта, и публиковать их может любой разработчик. Эксперты Salt Security обнаружили три уязвимости. Первая касается процесса установки плагина — ChatGPT отправляет пользователю код подтверждения установки, но у злоумышленников есть возможность подменять его кодом для установки вредоносного плагина.

Вторая уязвимость обнаружена на платформе PluginLab, которая используется для разработки плагинов ChatGPT, — здесь отсутствовала достаточная защита при аутентификации пользователей, в результате чего хакеры могли перехватывать доступ к их учётным записям. Одним из плагинов, которые затронула эта проблема, был AskTheCode, предусматривающий интеграцию ChatGPT и GitHub.

Третья уязвимость обнаружилась в нескольких плагинах, и в её основу легли манипуляции с перенаправлениями при авторизации через протокол OAuth. Она тоже позволяла перехватывать доступ к учётным записям на сторонних платформах. Плагины не имели механизма проверки URL-адресов при перенаправлении, что позволяло злоумышленникам отправлять пользователям вредоносные ссылки для кражи их аккаунтов.

Salt Security заверила, что следовала стандартной процедуре и уведомила о своих открытиях OpenAI и другие стороны. Ошибки были исправлены оперативно, и свидетельств о наличии эксплойтов обнаружить не удалось.

Microsoft добавила мощнейшую нейросеть GPT-4 Turbo в бесплатную версию Copilot

Microsoft существенно повысила производительность и расширила возможности своего чат-бота Copilot. Теперь все бесплатные пользователи Copilot могут получить доступ к большой языковой модели (LLM) GPT-4 Turbo от OpenAI. Раньше доступ к GPT-4 Turbo можно было получить только при покупке подписки Microsoft Copilot Pro стоимостью $20 в месяц.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Сегодня руководитель отдела рекламы и веб-сервисов Microsoft Михаил Парахин объявил, что «после немалой работы» GPT-4 Turbo теперь доступен для бесплатных пользователей Copilot. Он отметил, что подписчики Copilot Pro, которые предпочитают более старую версию LLM GPT-4 в Copilot, могут переключиться на эту модель, выбрав соответствующую опцию в меню.

Партнёр Microsoft по разработке генеративного ИИ, компания OpenAI, впервые анонсировала GPT-4 Turbo в ноябре 2023 года. «Турбо-версия» предлагает пользователям доступ к гораздо большему контекстному окну размером 128 тыс. символов, что доводит объём текстовой подсказки до 300 страниц. Поддержка ChatGPT-4 Turbo появилась в подписке Copilot Pro в декабре.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Эта неделя была очень важной для команды Copilot. В понедельник Microsoft подтвердила, что все пользователи Copilot Pro теперь могут получить доступ к Copilot GPT Builder. Новый инструмент позволяет без навыков программирования создавать собственных чат-ботов, «заточенных» отвечать на конкретные вопросы по целевым темам. Подписчики Copilot Pro смогут предоставлять неограниченный доступ к своим чат-ботам кому угодно, независимо от устройства и наличия учётной записи Copilot Pro.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Недавняя утечка некоторых рекламных материалов от Samsung указывает на то, что в ближайшее время будет представлено ещё больше новых функций Copilot, включая улучшенную интеграцию с приложением Microsoft Phone Link на смартфонах Samsung Galaxy.

ChatGPT научился читать свои ответы вслух

Компания OpenAI добавила в свой ИИ-бот ChatGPT функцию «Чтение вслух», которая озвучивает ответы на запросы пользователей с помощью одним из пяти голосов. Функция может пригодиться, например, в дороге, когда отвлечься на экран устройства для чтения ответа на запрос может оказаться невозможно. Новая функция «Чтение вслух» уже доступна как в веб-версии ChatGPT, так и в приложениях ChatGPT для iOS и Android.

 Источник изображения: Unsplash, Andrew Neel

Источник изображения: Unsplash, Andrew Neel

Функция «Чтение вслух» поддерживает 37 языков и автоматически определяет язык ответа. Она доступна как для чат-ботов на базе GPT-4, так и для GPT-3.5. Следует добавить, что аналогичные возможности для своих ИИ-моделей ранее добавила компания Anthropic, один из основных конкурентов OpenAI.

В сентябре минувшего года ChatGPT запустил функцию голосового запроса, благодаря которой пользователи могут голосом проговаривать запрос для чат-бота, не печатая его в форме. Новая же функция позволяет настроить чат-бота таким образом, чтобы он всегда устно отвечал на запросы пользователя.

Для работы функции «Чтение вслух» в мобильных приложениях необходимо нажать и удерживать поле введённого запроса. В результате откроется специальный плеер «Чтение вслух», где можно выбрать настройки воспроизведения, приостановки или перемотки аудио-ответа. В веб-версии чат-бота для активации функции «Чтение вслух» под текстом ответа отображается значок динамика.

Поставки ИИ-заменителя смартфонов AI Pin начнутся с задержкой

В конце прошлого года стартап Humane объявил о старте поставок носимого ИИ-устройства AI Pin в марте, футуристический заменитель смартфона поступит к пользователям с небольшой задержкой. Как пишет The Verge со ссылкой на переписку в официальном канале Humane в Discord, первые покупатели получили уведомления о том, что заказы поступят не раньше середины апреля.

 Источник изображений: Humane

Источник изображений: Humane

Humane также сообщила, что доставка AI Pin, позиционируемого в качестве альтернативы смартфону, будет осуществляться бесплатно. Кроме того, покупателям, сделавшим заказ до 31 марта, компания предоставит бесплатно подписку на фирменные сервисы, в том числе на услуги сотовой связи, на три месяца, стоимость которой составляет $24 в месяц.

Стартап Humane, основанный бывшими топ-менеджерами Apple, позиционирует свою разработку как будущее портативных компьютеров. Небольшое носимое устройство весом около 34 г, оснащённое процессором Snapdragon, 13-Мп камерой и проектором, обладает поддержкой сотовой связи с собственным номером и облачных сервисов с доступом к ИИ-чат-боту ChatGPT. Управлять AI Pin, который не имеет экрана, можно с помощью голосовых команд, камеры, жестами, а также используя проектор. Стоимость AI Pin составляет $699 — недёшево с учётом того, что его предлагают в качестве замены смартфонам, средний уровень цен на которые находится гораздо ниже.

Volkswagen представила электрический универсал ID.7 Tourer с запасом хода до 685 км и ChatGPT

Компания Volkswagen представила ID.7 Tourer — электрический универсал по цене от €55 000. Его базовые характеристики идентичны характеристикам седана ID.7, а программная часть опережает предшественника на поколение. В частности, новинка получила интеллектуального помощника, который поддерживает работу с ИИ-ботом ChatGPT.

 Источник изображений: volkswagen-newsroom.com

Источник изображений: volkswagen-newsroom.com

Габариты Volkswagen ID.7 Tourer составляют 4961 × 1862 × 1536 мм (без боковых зеркал), длина колёсной базы — 2971 мм. То есть хэтчбек-седан и универсал имеют одинаковые размеры, зато последний в лучшую сторону отличается доступным пространством для хранения вещей: 605 л против 532 л у седана. При сложенных сиденьях у ID.7 Tourer оказываются доступны 1714 л багажника, а у обычного ID.7 — 1586 л; сложенные сиденья также предлагают «практически плоскую» грузовую площадку длиной 1948 мм.

Характеристики электродвигателей и аккумуляторов Volkswagen ID.7 Tourer напрямую унаследованы от седана. Когда машина выйдет в первом квартале, она будет доступна в версиях ID.7 Tourer Pro и ID.7 Tourer Pro S с задним приводом и мощностью 210 кВт (286 л.с.); ID.7 Tourer Pro получит батарею на 77 кВт·ч, а ID.7 Tourer Pro S — 86 кВт·ч. Старший вариант обеспечит запас хода до 685 км, тогда как седан предлагает от 700 км. Аккумулятор младшей версии поддерживает зарядку мощностью 175 кВт, старшая выдерживает все 200 кВт. От седана ID.7 Tourer также унаследовал систему MIB4 с 15-дюймовым экраном; а программная платформа здесь уже ID.Software 5.0, и она будет поддерживать установку дополнительных приложений.

В частности, сама Volkswagen выпустит приложение Wellness-App, которое поможет водителю улучшить самочувствие. В зависимости от комплектации приложение поможет подстроить под нужды владельца освещение в салоне, режим работы кондиционера, панорамную крышу и массажные функции сидений, предлагая программы Fresh Up («Освежись»), Calm Down («Успокойся») и Power Break («Сделай паузу»). В техническое оснащение также входит проекционный дисплей дополненной реальности, подающий изображение в поле зрения водителя: поддерживается навигация Apple CarPlay или Android Auto, а запуск дисплея сопровождается выводом логотипа VW в качестве приветствия.

На борту Volkswagen ID.7 Tourer присутствует помощник IDA, который позволяет управлять функциями автомобиля при помощи голосовых команд естественным языком и поддерживает ChatGPT. Владельцу машины не нужно создавать новую учётную запись или устанавливать дополнительное приложение: когда штатный голосовой помощник не справляется с поставленной задачей, запрос анонимно адресуется ИИ. Автопроизводитель уверяет, что ChatGPT не имеет доступа к данным машины, а вопросы и ответы немедленно удаляются из системы. Об интеграции ChatGPT автопроизводитель рассказал на выставке CES 2024 в январе.

Система помощи водителю останется на втором уровне, который не позволяет убирать руки с рулевого колеса и заниматься посторонними делами. Доработанная технология Travel Assist стала работать «гармоничнее» — машина может сама менять полосы движения на автомагистрали. Система Park Assist Plus запоминает предыдущий процесс парковки на расстоянии до 50 м от парковочного места и впоследствии выполняет эти операции автономно. Технология Side Assist поможет проконтролировать процесс открытия дверей, проверяя, не приближается ли сзади велосипедист или другая машина — в случае угрозы дверь не откроется.

Volkswagen ID.7 Tourer поступит в продажу по цене от €55 000. В базовой комплектации немецким покупателям предлагаются светодиодные фары и задние фонари; 19-дюймовые легкосплавные диски и рейлинги на крыше; центральный замок и система запуска без ключа Keyless Access; сетка для разделения багажа; 10-цветное освещение салона; проекционный дисплей дополненной реальности; камера заднего вида; двухзонный автоматически климат-контроль; подогрев передних сидений. В качестве опции доступна панорамная крыша с регулируемой электроникой прозрачностью; «светодиодные матричные фары» IQ.LIGHT со светодиодными рейками по обе стороны от переднего логотипа, а также автоматическое освещение Dynamic Light Assist. Можно выбрать 20- или 21-дюймовые диски. Заднюю светодиодную полосу можно заменить фонарями 3D с анимированными стоп-сигналами; доступна и подсветка самого логотипа.

OpenAI разрабатывает ИИ-поисковик, который составит конкуренцию Google

Заняв лидирующие позиции в гонке генеративного ИИ, OpenAI вступает в борьбу с Google «на её поле». Хотя OpenAI официально не подтверждала этого, инсайдеры сообщают, что компания уже более года занимается разработкой продукта для поиска в интернете. Пока неясно, будет ли новый инструмент интегрирован непосредственно в платную или бесплатную версию чат-бота ChatGPT или станет отдельным решением.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

ChatGPT изначально имел ограничение на доступ к самой последней информации в интернете. В марте 2023 года OpenAI объявила о поддержке плагинов, включая разработанный ею плагин для веб-обозревателя. В сентябре OpenAI сообщила, что ChatGPT получил доступ к актуальной информации в Сети и способен просматривать веб-страницы. Эта функциональность предназначалась прежде всего для поисковой системы Microsoft Bing, которая в течение многих лет оставалась аутсайдером интернет-поиска.

Microsoft вложила в OpenAI миллиарды долларов и в значительной степени полагается на технологический стек OpenAI при переосмыслении своих собственных продуктов, включая Bing. Microsoft запустила собственный чат-бот на базе ИИ Bing Chat, затем расширила возможности генеративного ИИ на другие свои продукты, и в конечном итоге в 2024 году распространила ИИ повсюду под отдельным брендом Copilot.

Похоже, что OpenAI, при активной поддержке со стороны Microsoft, готова начать атаку на занимаемые Google позиции в сфере веб-поиска. Microsoft некоторое время назад проиграла Google войну поисковых систем, и искусственный интеллект может стать для неё прекрасной возможностью переманить существенную часть пользователей в свою экосистему.

Пока неизвестно, как именно будет работать секретный продукт веб-поиска OpenAI, но можно сделать некоторые предположения, основываясь на появляющихся продуктах других разработчиков. Например, приложение Arc Search, разработанное The Browser Company, предлагает функцию «Просмотр для меня». Она собирает в сети информацию, соответствующую поисковому запросу, компилирует данные из шести авторитетных источников, а затем представляет результаты в виде специальной веб-страницы, избавляя пользователей от необходимости тратить время на просмотр всей поисковой выдачи.

ИИ-бот ChatGPT научился запоминать факты о пользователях и их предпочтения

Регулярная работа с чат-ботом на базе искусственного интеллекта может начать раздражать, поскольку для улучшения опыта взаимодействия пользователю каждый раз приходится объяснять некоторые факты о себе и своих предпочтениях. Компания OpenAI, являющаяся разработчиком ИИ-бота ChatGPT, намерена исправить это, сделав алгоритм более персонализированным за счёт добавления ему «памяти».

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Такой подход позволит ChatGPT со временем извлекать информацию о пользователе и его предпочтениях из диалогов с ним. Функция памяти работает двумя способами. Пользователь может прямо указать на свои предпочтения или иную информацию, которую ChatGPT должен запомнить. Если этого не делать, то чат-бот будет сам получать нужную информацию в процессе взаимодействия с пользователем. Цель разработчиков состоит в том, чтобы сделать ChatGPT более персонализированным и удобным.

Во многих отношениях память является той функцией, которой действительно не хватает ChatGPT. Однако для её реализации алгоритм будет собирать информацию о пользователях, что может вызвать опасения по поводу конфиденциальности данных. OpenAI выбрала стратегию, которая во многом напоминает принцип работы разных интернет-сервисов. Речь идёт о наблюдении за действиями пользователя для постепенного формирования цифрового профиля. Такой метод работы неоднозначен, поскольку сразу возникают опасения по поводу того, что ChatGPT будет использовать собранные данные для дальнейшего обучения алгоритма и повышения уровня персонализации.

OpenAI заявила, что пользователи будут иметь возможность контроля функции памяти ИИ-бота. Также отмечается, что алгоритм не будет запоминать конфиденциальные данные, например, информацию о здоровье. Можно спросить ChatGPT о том, что именно ему известно о пользователе, после чего эти данные при необходимости без особого труда удаляются из памяти. Если же пользователь не заинтересован в функции памяти, то её попросту можно отключить, но по умолчанию она будет активирована.

На данный момент функция памяти ChatGPT находится на этапе тестирования и доступна ограниченному числу пользователей ИИ-бота. Когда именно она может стать общедоступной, пока неизвестно.

Годовая выручка OpenAI выросла до $2 млрд, но компания тратит больше

Доходы стартапа из Сан-Франциско OpenAI на фоне всплеска популярности разработанного им ИИ-чат-бота ChatGPT стремительно растут. По данным источников Financial Times, в декабре 2023 года годовой оборот OpenAI (показатель выручки за предыдущий месяц, умноженный на 12) достиг отметки в $2 млрд, хотя ещё в октябре годовой доход компании, по данным The Information, составлял $1,3 млрд.

 Источник изображения: Andrew Neel/unsplash.com

Источник изображения: Andrew Neel/unsplash.com

Компания считает возможным удвоить эту сумму в 2025 году на фоне сильного интереса к её решениям со стороны бизнес-клиентов, стремящихся использовать инструменты генеративного ИИ для повышения эффективности своей работы. Благодаря стремительному росту у OpenAI есть все шансы войти в число немногих компаний Кремниевой долины, таких как Google и Meta, которым удалось получить годовой доход в $1 млрд в первые десять лет с момента своего основания.

По словам генерального директора OpenAI Сэма Альтмана (Sam Altman), по состоянию на ноябрь прошлого года 92 % компаний из списка Fortune 500 использовали продукты OpenAI, включая ChatGPT и лежащую в его основе модель искусственного интеллекта GPT-4, в то время как аудитория чат-бота выросла до 100 млн пользователей в неделю.

Интерес потребителей и бизнеса к генеративному ИИ — системам, которые могут генерировать код, текст, изображения, видео и анализировать информацию из подсказок пользователя — резко возрос, отметила Financial Times. Крупные технологические конкуренты OpenAI, такие, как Google и Meta, а также стартапы, включая Anthropic, Mistral и Cohere, тоже начали коммерциализацию своих ИИ-продуктов. Например, на этой неделе Google сделала доступной для широкой публики нейросеть Gemini Ultra, стоимость подписки на которую составляет всего $20 в месяц.

Вместе с тем Альтман отметил, что OpenAI по-прежнему работает с убытками из-за огромных затрат на создание и эксплуатацию её ИИ-моделей. По всей видимости эта тенденция сохранится ещё какое-то время из-за разработки ещё более сложных моделей, и компании, вероятно, придётся дополнительно привлекать значительные суммы, чтобы покрыть растущие расходы. Microsoft инвестировала в OpenAI до $13 млрд, но этого явно недостаточно.

«Расходы на обучение просто огромны, но это вполне ожидаемо», — сообщил Альтман газете Financial Times в ноябре прошлого года.

ChatGPT появится во всех новых автомобилях Peugeot

Концерн Stellantis объявил о намерении использовать ИИ-чат-бота ChatGPT для улучшения голосового помощника в легковых автомобилях и фургонах бренда Peugeot. Таким образом, французский бренд присоединился к другим производителям, таким как Volkswagen и Mercedes, которые уже используют популярного чат-бота в своих авто.

 Источник изображений: stellantis.com

Источник изображений: stellantis.com

«Мы интегрируем ChatGPT во все автомобили, включая новую модель e-3008, и небольшие коммерческие автомобили», — приводит источник слова директора по продуктовому плану Peugeot Жерома Мишерона (Jerome Micheron).

Уже на этой неделе Peugeot запустит пилотную версию сервиса с ChatGPT, который сможет подключаться к элементам управления транспортным средством, а также будет отвечать на вопросы навигационного и общего характера. На данном этапе нововведение будет доступно владельцам авто бренда во Франции, Великобритании, Германии, Италии и Испании. Ожидается, что в течение года эта услуга станет стандартной функцией и будет доступна всем владельцам авто Peugeot.

В прошлом году владельцы автомобилей Mercedes-Benz в США получили возможность использования ChatGPT. В компании заявили, что интеграция ИИ-бота позволит голосовому помощнику давать более естественные и развёрнутые ответы. Не так давно Volkswagen объявила, что ChatGPT будет интегрирован с фирменным голосовым помощником компании к середине года.

OpenAI создаст детский отдел в интернет-магазине ИИ-чат-ботов

OpenAI откроет раздел для детей в своём интернет-магазине ИИ-чат-ботов на основе ChatGPT. В рамках сотрудничества с организацией Common Sense Media, занимающейся оценкой средств массовой информации на предмет их пригодности для младшей аудитории, OpenAI нацелит свои усилия на минимизацию рисков, связанных с использованием ИИ подрастающим поколением.

 Источник изображения: Alexandra_Koch / Pixabay

Источник изображения: Alexandra_Koch / Pixabay

Совместные планы компаний включают разработку руководств и образовательных материалов, ориентированных на молодёжь, их родителей и учителей. Важным аспектом является курирование коллекции семейных версий GPT в онлайн-магазине OpenAI, основываясь на рейтингах Common Sense Media, что значительно упростит выбор подходящих продуктов для детской аудитории.

«Вместе Common Sense Media и OpenAI будут работать над тем, чтобы ИИ оказывал положительное влияние на всех подростков и семьи. Наши руководства и материалы будут направлены на обучение семей и педагогов безопасному и ответственному использованию ChatGPT, чтобы мы все вместе могли избежать любых нежелательных последствий этой новой технологии», — заявил Джеймс Стейер (James Steyer), основатель и генеральный директор Common Sense Media.

Эта инициатива была объявлена в ходе саммита Common Sense Media по вопросам детей и семьи. В рамках мероприятия Сэм Альтман (Sam Altman), генеральный директор OpenAI, выразил уверенность в положительном влиянии ИИ на обучение детей и важности интеграции таких технологий в образовательный процесс.

«Люди — это пользователи инструментов, и нам лучше научить их пользоваться теми инструментами, которые появятся в мире. Не обучать людей их использованию было бы ошибкой», — заявил он. Альтман также подчеркнул, что благодаря ИИ старшеклассники в будущем смогут достигать высот в областях, требующих абстрактного мышления, опережая своих предшественников.

OpenAI обвинили в нарушении европейских законов о конфиденциальности пользователей

После многомесячного расследования, проведённого итальянским органом по защите данных DPA (Data Protection Authority) в отношении ИИ-чат-бота ChatGPT, компанию OpenAI обвинили в нарушении законов о конфиденциальности ЕС. Подтверждённые нарушения в обращении с персональными данными могут повлечь за собой штрафы на сумму до €20 млн, или до 4 % годового оборота. У OpenAI есть 30 дней, чтобы ответить на обвинения.

 Источник изображения: Pixabay

Источник изображений: Pixabay

Итальянские власти выразили обеспокоенность по поводу соблюдения OpenAI Общего регламента защиты данных (GDPR) в прошлом году, что привело к временной приостановке работы чат-бота на европейском рынке. DPA Италии 30 марта в так называемом «реестре мер», подчеркнул отсутствие подходящей правовой основы для сбора и обработки персональных данных с целью обучения алгоритмов, лежащих в основе ChatGPT, склонность инструмента ИИ к «галлюцинациям» и потенциальные проблемы с безопасностью детей. Власти обвинили OpenAI в нарушении статей 5, 6, 8, 13 и 25 GDPR.

DPA располагают полномочиями требовать внесения изменений в способы обработки данных, чтобы прекратить нарушения конфиденциальности граждан ЕС. Таким образом, регуляторы могут заставить OpenAI изменить свой подход к обработке персональных данных или вынудить компанию прекратить предлагать свои услуги в странах Евросоюза.

Весной 2023 года OpenAI смогла относительно быстро возобновить функционирование ChatGPT в Италии после того, как устранила ряд нарушений, указанных DPA. Однако итальянские власти продолжили расследование и пришли к предварительным выводам, что инструмент ИИ от OpenAI нарушает законодательство ЕС. Итальянские власти пока не опубликовали список подтверждённых нарушений ChatGPT, но главной претензией к OpenAI, скорее всего, станет сам принцип обработки персональных данных для обучения моделей ИИ.

ChatGPT был разработан с использованием массы данных, извлечённых из общедоступного интернета — информации, которая включает личные данные отдельных лиц. А проблема, с которой OpenAI сталкивается в ЕС, заключается в том, что для обработки данных жителей ЕС требуется действительная правовая основа. GDPR перечисляет шесть возможных правовых оснований, большинство из которых просто не имеют отношения к данному контексту. В апреле прошлого года DPA Италии оставил для OpenAI только две законные возможности для обучения моделей ИИ: «подтверждённое согласие» или «законные интересы».

Учитывая, что OpenAI никогда и не пыталась получить согласие миллионов (а, возможно, миллиардов) пользователей интернета, чью информацию она собирала и обрабатывала для построения моделей ИИ, любая попытка заявить о наличии разрешения от европейцев на обработку их персональных данных обречена на провал. Поэтому у OpenAI осталась лишь возможность опираться на утверждение о «законных интересах». Однако эта основа также предусматривает право владельцев данных выдвигать возражения и требовать прекращения обработки своей персональной информации.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Теоретически, каждый житель ЕС имеет право потребовать от OpenAI изъять и уничтожить незаконно обученные модели и переобучить новые модели без использования его данных. Но даже если предположить возможность идентификации всех незаконно обработанных данных, подобную процедуру предстоит произвести для каждого возражающего гражданина ЕС, что практически невозможно реализовать на практике.

Существует и более широкий вопрос: признает ли в конце концов DPA, что «законные интересы» вообще являются действительной правовой основой в этом контексте. Такое решение регулятора выглядит маловероятным. Ведь обработчики данных должны сбалансировать свои собственные интересы с правами и свободами людей, чьи данные обрабатываются, оценить возможность причинения им неоправданного вреда, а также учесть, ожидали ли люди такого использования их данных.

Примечательно, что в подобной ситуации Верховный суд ЕС ранее признал «законные интересы» неподходящим основанием для Meta при отслеживании и профилировании пользователей в целях таргетирования рекламы в своих социальных сетях. Таким образом, существует негативный судебный прецедент для OpenAI, стремящейся оправдать обработку данных людей в огромных масштабах для создания коммерческого генеративного ИИ-бизнеса — особенно когда рассматриваемые инструменты создают всевозможные новые риски для названных лиц (дезинформация, клевета, кража личных данных и мошенничество лишь некоторые из них). OpenAI также находится под пристальным вниманием к соблюдению GDPR в Польше, где начато отдельное расследование по этому поводу.

OpenAI пытается нивелировать потенциальные регуляторные риски в ЕС, создавая отдельную организацию в Ирландии, которая в будущем должна стать поставщиком услуг ИИ для пользователей из ЕС. OpenAI надеется получить статус так называемого «основного учреждения» в Ирландии, что позволит ей использовать оценку соответствия требованиям GDPR только от Ирландской комиссии по защите данных и действовать в Евросоюзе через механизм «единого окна» регулирования, избежав надзора органов DPA каждой страны-члена ЕС.

Однако пока OpenAI ещё не получила этот статус, поэтому ChatGPT все ещё может столкнуться с расследованиями со стороны DPA в других странах ЕС. И даже получение статуса «основного учреждения» в Ирландии не прекратит уже открытое расследование и правоприменение в Италии.

DPA Италии сообщает, что органы по защите данных стремятся координировать надзор за ChatGPT, создав рабочую группу при Европейском совете по защите данных. Эти усилия могут, в конечном итоге, привести к более согласованным результатам в рамках отдельных расследований в отношении OpenAI. Тем не менее, на данный момент DPA каждого члена ЕС остаются независимыми и компетентными принимать решения на своих рынках самостоятельно.

window-new
Soft
Hard
Тренды 🔥
У TikTok появились шансы остаться в США — теперь в этом замешан Илон Маск 14 мин.
Microsoft тестирует новый браузер для геймеров, который выводится поверх игры 35 мин.
Квартальная выручка на рынке облачных инфраструктур подскочила на 21 %, превысив $80 млрд 3 ч.
Новая статья: Little Big Adventure – Twinsen's Quest — криво, но всё ещё мило. Рецензия 4 ч.
Microsoft сломала игры Ubisoft последним крупным обновлением Windows 11 4 ч.
«Сердечное спасибо всем»: аудитория олдскульной ролевой игры Sea of Stars превысила 6 млн игроков 4 ч.
World of Warcraft исполнилось 20 лет — это до сих пор самая популярная ролевая игра в мире 23 ч.
Microsoft хочет, чтобы у каждого человека был ИИ-помощник, а у каждого бизнеса — ИИ-агент 23-11 12:20
«Атака на ближайшего соседа» сработала — хакеры удалённо взломали компьютер через Wi-Fi поблизости 23-11 11:08
Илон Маск отделался выплатой $2923 за неявку для дачи показаний по делу о покупке Twitter 23-11 06:25
Справится даже ребёнок: роботы на базе ИИ оказались совершенно неустойчивы ко взлому 2 ч.
LG поможет Samsung с нуля создать «настоящий ИИ-смартфон» — он выйдет в 2025 году и вы не сможете его купить 3 ч.
AIC и ScaleFlux представили JBOF-массив на основе NVIDIA BlueField-3 4 ч.
Nvidia нарастила выручку в Китае на 34 % даже в условиях санкций 7 ч.
Nvidia заинтересована в получении HBM3E от Samsung и верит в сохранение международного сотрудничества при Трампе 8 ч.
xMEMS представила бескатушечные МЭМС-динамики для открытых наушников, ноутбуков и носимой электроники 16 ч.
Microsoft и Meta представили дизайн ИИ-стойки с раздельными шкафами для питания и IT-оборудования 22 ч.
Eviden создаст для Финляндии ИИ-суперкомпьютер Roihu производительностью 49 Пфлопс 23 ч.
iFixit не нашли улучшений ремонтопригодности у нового Apple MacBook Pro на чипе M4 Pro 23-11 13:42
Вселенское ДТП на скорости 3,2 млн км/ч — «Джемс Уэбб» пролил свет на столкновение галактик 23-11 13:40