Опрос
|
реклама
Быстрый переход
OpenAI для обучения GPT-4 расшифровала миллионы видео с YouTube — текстов в интернете не хватило. Google тоже так делает
09.04.2024 [00:00],
Владимир Чижевский
Несколько дней назад сообщалось, что разработчики ИИ столкнулись с нехваткой данных для обучения передовых моделей, в том числе о планах Open AI обучать GPT-5 на видео с YouTube. Согласно материалу The New York Times, в погоне за новыми данными корпорации забывают об этике и морали. К концу 2021 года OpenAI столкнулась с нехваткой авторитетных англоязычных текстов в интернете для обучения новейшей модели искусственного интеллекта — ей требовалось гораздо больше данных. Тогда разработчики OpenAI создали расшифровывающую аудиозаписи из видеороликов на YouTube систему распознавания речи Whisper, которая выдаёт текст для обучения ИИ. По словам нескольких сотрудников, в компании понимали, что такой шаг может противоречить правилам использования YouTube, запрещающим использовать видеоролики «независимо» от платформы. Это не остановило OpenAI, расшифровавшую более миллиона часов видеороликов с YouTube. Полученный текст использовался для обучения GPT-4 — одной из мощнейших систем искусственного интеллекта в основе последней версии ChatGPT. В исследовании The New York Times говорится, что в гонку за данными включились все передовые разработчики ИИ, включая OpenAI, Google и Meta✴, причём компании зачастую игнорируют корпоративные политики, а иногда и закон. В январе 2020 года физик-теоретик из Университета Джонса Хопкинса Джаред Каплан (Jared Kaplan) опубликовал работу об ИИ, которая разожгла аппетиты их разработчиков. Он высказался однозначно: чем больше данных используется для обучения языковой модели, тем лучше она работает, подобно тому, как студенты получают всё больше знаний из прочитанных книг. Языковые модели могут устанавливать закономерности и взаимосвязи, что позволяет точнее обрабатывать новую информацию. Позднее Сэм Альтман (Sam Altman) из OpenAI заявил, что данные рано или поздно кончатся — он знает, о чём говорит, ведь компания годами собирала данные, обрабатывала и обучали на них ИИ. Среди использованных данных был программный код с GitHub, базы данных шахматных ходов, школьные тесты и домашние задания старшеклассников. К концу 2021 года они закончились. Помимо расшифровки аудио- и видеоматериалов, рассматривалась покупка компаний, имеющих доступ к огромным объёмам цифровых данных. Глава Meta✴ Марк Цукерберг (Mark Zuckerberg) годами развивал ИИ-направление, но выход ChatGPT в конце 2022 года оставил его компанию далеко позади. Трое бывших и нынешних сотрудников Meta✴ рассказали, что стремясь догнать OpenAI, он день и ночь донимал менеджеров и ведущих инженеров, чтобы те как можно скорее выпустили конкурирующий продукт. Но как и все остальные, Meta✴ упёрлась лбом в стену нехватки данных. На одном из записанных совещаний руководства Meta✴ говорилось, что компания наняла субподрядчиков из Африки для сбора защищённых авторским правом материалов. «Мы не можем не собирать их», — сказали на одном из таких совещаний. Кроме того, подчёркивалось, что OpenAI тоже не стесняется использовать защищённые авторским правом материалы без разрешения их владельцев, и получать эти разрешения «слишком долго». Глава YouTube предостерёг OpenAI от обучения ИИ на видео с платформы
05.04.2024 [16:56],
Павел Котов
С активным развитием технологий искусственного интеллекта особенно остро встал вопрос о том, на каких материалах можно обучать эти системы, и что делать с авторскими правами на эти материалы. Гендиректор YouTube отметил, что компании OpenAI не следует рассматривать платформу в качестве источника материалов для обучения ИИ. Крупные игроки в своих сферах, включая New York Times и Getty Images, уже инициировали судебные иски в отношении разработчиков ИИ; аналогичные меры приняли некоторые художники и писатели. Масла в огонь подлила в марте технический директор OpenAI Мира Мурати (Mira Murati). В интервью The Wall Street Journal она заявила, что не уверена, используются ли для генератора видео Sora материалы YouTube, Instagram✴ или Facebook✴. Это побудило главу YouTube Нила Мохана (Neal Mohan) отреагировать и чётко предупредить, что использование материалов крупнейшего в мире видеосервиса для обучения OpenAI Sora будет «явным нарушением» условий использования платформы. «С точки зрения автора, когда он загружает плоды своей нелёгкой работы на нашу платформу, у него есть определённые ожидания. Одно из таких ожиданий в том, что будут соблюдаться условия обслуживания. Они не позволяют скачивать расшифровки или фрагменты видео, и это явное нарушение условий обслуживания. Это [своего рода] правила дорожного движения на нашей платформе», — заявил гендиректор YouTube в интервью Bloomberg. Чёткие сведения о том, на каких материалах OpenAI обучает ИИ для своих служб Sora, ChatGPT и DALL-E, отсутствуют до сих пор. Для обучения модели GPT-5 компания намеревается применять расшифровки видео YouTube. Google же, будучи владельцем YouTube и конкурентом OpenAI, уверяет, что соблюдает правила: обучение Gemini требует аналогичных данных, но, как заявил Нил Мохан, использует лишь определённые видео в зависимости от разрешений, предоставленных каждым автором. OpenAI расширила программу доработки и обучения специализированных ИИ-моделей
04.04.2024 [23:38],
Владимир Чижевский
Компания OpenAI расширяет программу Custom Model, помогающую корпоративным клиентам разрабатывать специализированные генеративные модели ИИ для использования в конкретных целях. Суть Custom Model заключается в привлечении специалистов OpenAI к обучению и оптимизации моделей ИИ для определённых задач. С момента запуска программы в прошлом году в ней успели поучаствовать «десятки клиентов», после чего OpenAI решила её расширить. Инженеры компании могут оптимизировать параметры сторонней модели, организовать процесс обучения, выработать системы оценки и создать инфраструктуру для улучшения эффективности работы ИИ в конкретных задачах. Вторая услуга, «обучение на заказ», подразумевает дообучение и настройку собственных базовых моделей OpenAI (например, GPT-4) для клиентов, которым необходимы ИИ, «заточенные» для определённого применения и обладающие пониманием необходимой специфики. «Мы считаем, что в будущем подавляющее большинство организаций будут разрабатывать ИИ под специфику собственной отрасли, бизнеса или направления. Благодаря разнообразию методов доработки, организации любого уровня могут получить ИИ-модель, необходимую для максимизации эффекта от её внедрения», — пишет в своём блоге OpenAI. Cпециализированные модели ИИ зачастую работают быстрее и потребляют меньше ресурсов, чем аналоги общего назначения, поэтому доработка и дообучение собственных и чужих моделей ИИ теоретически поможет снизить нагрузку на собственную инфраструктуру OpenAI. Tesla повысила зарплаты ИИ-специалистам, чтобы противостоять «браконьерству» со стороны OpenAI
04.04.2024 [18:37],
Сергей Сурабекянц
Бум ИИ радикально повысил ценность специалистов в этой сфере. Ярким свидетельством этому является решение Tesla, которая была вынуждена увеличить зарплату своим инженерам по ИИ в попытке «предотвратить браконьерство со стороны таких компаний, как OpenAI», заявил генеральный директор компании Илон Маск (Elon Musk). По его словам, OpenAI «агрессивно набирает инженеров Tesla, предлагая огромные компенсационные предложения». К примеру, известный учёный в области машинного обучения Итан Найт (Ethan Knight) собирался покинуть Tesla, чтобы присоединиться к OpenAI, и Маску пришлось приложить немалые усилия, чтобы отговорить Найта от перехода к конкурентам и убедить его перейти на работу в xAI, стартап Маска в области ИИ. Технологические компании предлагают компенсационные пакеты в миллионы долларов в год, ускоряют графики передачи акций и пытаются переманивать целые команды инженеров для привлечения людей с знаниями и опытом в области генеративного ИИ. Одновременно продолжаются увольнения специалистов в других областях IT, поскольку компании перераспределяют ресурсы в пользу технологий ИИ. Маск назвал происходящее «самой сумасшедшей войной талантов, которую он когда-либо видел». Комментарии Маска прозвучали на фоне напряжённости в отношениях с генеральным директором OpenAI Сэмом Альтманом (Sam Altman). В феврале Маск подал иск против OpenAI, обвинив компанию в коммерциализации ИИ и погоне за прибылью. Маск, который был одним из учредителей OpenAI в 2015 году, считает, что тесные отношения OpenAI с Microsoft противоречат первоначальной цели компании — общедоступному ИИ с открытым исходным кодом. OpenAI отрицает эти обвинения. В настоящее время компания возглавляет рынок ИИ, в то время как xAI пытается догонять организацию, которую Маск в своё время финансировал. Усилия Tesla в области ИИ до сих пор были сосредоточены на беспилотных автомобилях и роботах-гуманоидах. В 2022 году Маск продемонстрировал прототип робота-гуманоида на мероприятии Tesla, что стало частью его усилий по формированию имиджа компании как чего-то большего, чем просто производителя электромобилей. Летом 2023 года Tesla сообщила о планах потратить более $1 млрд до конца 2024 года на создание суперкомпьютера Dojo, который будет использоваться при разработке и проектировании беспилотных автомобилей. Подобные инициативы помогли повысить капитализацию Tesla и являются частью долгосрочной стратегии роста компании. DALL-E 3 научился дорабатывать картинки и менять их части по текстовому запросу
03.04.2024 [18:58],
Владимир Чижевский
OpenAI рассказала о новых возможностях редактирования картинок, созданных генеративным искусственным интеллектом DALL-E 3, который помимо прочего входит в платную подписку ChatGPT Plus за $20 в месяц. Теперь при щелчке по созданной DALL-E 3 картинке открывается специальный редактор, главная особенность которого — выбор и редактирование отдельных частей изображения без необходимости генерировать его заново. Картинку можно изменять глобально, задав уточняющий запрос в диалоговом пространстве в правой части редактора — например, попросить DALL-E 3 сделать её чёрно-белой. Однако очевидно, что OpenAI куда больше гордится возможностью точечных правок. Для этого необходимо выбрать инструмент выделения, определиться с его размерами, а затем выделить необходимые области и ввести запрос. Как и полная генерация, правки происходят посредством ввода текстовых подсказок. Простейшее, что сразу приходит на ум — удаление и добавление объектов, однако возможности инструмента гораздо шире. В примере с котёнком можно выделить его мордочку и попросить ИИ изобразить определённую эмоцию. Аналогичным образом происходит редактирование изображений в мобильном приложении ChatGPT, где перечисленные возможности также доступны. Сэм Альтман более не управляет венчурным фондом, связанным с OpenAI
02.04.2024 [05:13],
Алексей Разин
В конце 2021 года компания OpenAI основала собственный венчурный фонд OpenAI Startup Fund, который был должен поддерживать перспективные проекты в области искусственного интеллекта, и главой фонда до недавних пор оставался генеральный директор OpenAI Сэм Альтман (Sam Altman). Теперь в структуре собственности фонда произошли изменения. Специфика ситуации, как поясняет Axios, ранее заключалась в формальной принадлежности данного венчурного фонда самому Сэму Альтману, а не компании OpenAI или связанной с ней одноимённой некоммерческой организацией. К маю прошлого года фонд распоряжался средствами на общую сумму $175 млн, а сейчас она выросла до $325 млн. По данным свежих отчётов, теперь контроль за фондом перешёл к Йену Хэтэвэю (Ian Hathaway), который в структуре управления фондом ранее руководил инвестиционной деятельностью. Данный фонд уже вложил свои средства в молодые компании Harvey, Cursor, Speak и Ambience Healthcare. По словам представителей OpenAI, первоначальная структура собственности венчурного фонда, которая предусматривала его принадлежность лично Сэму Альтману, носила временный характер, и теперь произошли запланированные ранее изменения. Собственных средств в этот фонд Альтман никогда не вкладывал, а также не получал от его деятельности никаких доходов. Без регистрации и SMS: для работы с ChatGPT больше не нужна учётная запись
01.04.2024 [23:49],
Владимир Чижевский
Теперь для доступа к бесплатной версии популярного чат-бота с искусственным интеллектом ChatGPT не потребуется заводить учётную запись. Впрочем, это не относится к платным продуктам OpenAI вроде DALL-E 3 или более продвинутой версии ChatGPT Plus. Учётная запись по-прежнему нужна не только для генератора изображений DALL-E, но и для доступных ограниченному кругу пользователей и партнёров продуктов OpenAI, таких как платформа для генерации видеороликов Sora или недавно анонсированный ИИ VoiceEngine. Также для использования платной версии ChatGPT на базе нейросети GPT-4 потребуется завести аккаунт. Чат-бот доступен через chatgpt.com и пока работает только в США. OpenAI подчеркнула, что незарегистрированные пользователи также смогут отказаться от использования передаваемых ими чат-боту данных для обучения ИИ. Чтобы обезопасить себя и пользователей от возможных проблем, OpenAI ввела «дополнительные меры защиты », включающие блокировку запросов «на самые разные [запретные] темы », список которых не приводится. По словам OpenAI, еженедельно ChatGPT пользуются более 100 миллионов человек в 185 странах. Сервис по отслеживанию трафика SimilarWeb сообщает о 1,6 млрд посетителей лишь за февраль 2024 года, что делает ChatGPT популярнейшем чат-ботом в мире. Хотя на пятки ему наступает Gemini от Google, месячное количество уникальных посетителей которого в мае прошлого года предположительно достигало 1,8 млрд. Для обучения GPT-5 не хватит качественных данных из всего интернета
01.04.2024 [23:09],
Владимир Чижевский
Разработчики передовых моделей искусственного интеллекта столкнулись с неожиданной проблемой — нехваткой качественного материала для их обучения. Ситуация усугубляется тем, что некоторые ресурсы блокируют доступ ИИ к своим данным. По словам исследователей, попытки обучать ИИ на материалах других моделей и прочем «синтетическом контенте» могут обернуться «большими проблемами». Учёные и руководители компаний-разработчиков ИИ обеспокоены, что в ближайшие два года качественных текстов может не хватить для дальнейшего обучения больших языковых моделей (LLM), что замедлит развитие отрасли. Разрабатывающая ChatGPT компания OpenAI уже рассматривает возможность обучения GPT-5 на транскрипциях публичных роликов на YouTube. Языковые модели ИИ собирают тексты из интернета — научные исследования, новости, статьи из «Википедии» — и разбивают их на отдельные слова или их части, используя их, чтобы научиться отвечать как человек. Чем больше входящих данных, тем лучше результат — именно на это уповала OpenAI, что помогло ей стать одним из лидеров отрасли. По словам изучающего искусственный интеллект в Исследовательском институте Epoch Пабло Вильялобоса (Pablo Villalobos), GPT-4 обучался на 12 триллионах токенов данных, а в соответствии с законами масштабирования Шиншиллы, ИИ вроде GPT-5 потребуется 60–100 триллионов токенов. Если собрать все высококачественные текстовые и графические данные в интернете, для обучения GPT-5 не хватит от 10 до 20 триллионов токенов, а может и больше — и пока непонятно, где их взять. Два года назад Вильялобос и другие исследователи уже предупреждали, что к середине 2024 года с вероятностью 50 % ИИ уже не будет хватать данных для обучения, к 2026 — с вероятностью 90 %. По словам учёных, большинство данных в интернете непригодно для обучения ИИ, поскольку содержит бессвязный текст или не добавляет новой информации к уже имеющейся. Для этой цели подходит лишь малая часть материала — примерно десятая доля собранного некоммерческой организацией Common Crawl, чей веб-архив широко используется разработчиками ИИ. Тем временем, крупные платформы вроде социальных сетей и новостных агентств закрывают доступ к своим данным, а общественность не горит желанием открывать личную переписку для обучения языковых моделей. Марк Цукерберг (Mark Zuckerberg) считает огромным преимуществом в разработке ИИ доступ Meta✴ к данным на своих платформах, среди которых текст, изображения и видео — правда, трудно сказать, какую долю этих материалов можно считать качественной. Стартап DatologyAI пытается бороться с нехваткой контента, используя методику «учебного плана», согласно которой данные «скармливаются» ИИ в определённом порядке, помогающем установить связь между ними. В опубликованной в 2022 году работе бывшего сотрудника Meta✴ Platform и Google DeepMind, а ныне основателя DatologyAI Ари Моркоса (Ari Morcos) подсчитано, что данный подход помогает добиваться сопоставимых успехов в обучении ИИ при сокращении входящих данных вдвое. Впрочем, другие исследования эти данные не подтвердили. Сэм Альтман (Sam Altman) также рассказал, что OpenAI разрабатывает новые методики обучения ИИ. По слухам, в стенах компании обсуждается возможность создания рынка данных, на котором бы определялась ценность конкретных материалов для каждой модели и справедливая цена, которую можно за них заплатить. Эта же идея обсуждается в Google, однако конкретных подвижек в этом направлении пока нет, поэтому компании-разработчики ИИ стараются дотянутся до всего, что только можно, в том числе видео- и аудиоматериалов — по словам источников в OpenAI, их собираются расшифровывать инструментом распознавания речи Whisper. Исследователи из OpenAI и Anthropic экспериментируют с так называемыми «высококачественными синтетическими данными». В недавнем интервью главный научный сотрудник Anthropic Джаред Каплан (Jared Kaplan) сказал, что подобные «сгенерированные внутри компании данные» могут быть полезные и использовались в последних версиях Claude. Пресс-секретарь OpenAI также подтвердил подобные разработки. Многие исследователи проблемы нехватки данных не верят, что смогут с ней справиться, однако Вильялобос не теряет оптимизма, и верит, что впереди ещё много открытий. «Самая большая неопределённость в том, что мы не знаем, какие революционные открытия ещё предстоят», — сказал он. По словам Ари Моркоса, нехватка данных — одна из важнейших проблем отрасли. Однако её развитие тормозит не только это — необходимые для работы больших языковых моделей чипы также в дефиците, а лидеры отрасли обеспокоены нехваткой центров обработки данных и электроэнергии. OpenAI в этом месяце откроет офис в Японии
01.04.2024 [11:54],
Алексей Разин
В прошлом году американский стартап OpenAI, который подарил миру популярный чат-бот ChatGPT, открыл два офиса за пределами США: в Лондоне и Дублине соответственно. Следующим шагом, если опираться на публикуемую Bloomberg информацию, станет открытие офиса OpenAI в Японии. Данное событие намечено на текущий месяц, как поясняют осведомлённые источники. Системы искусственного интеллекта востребованы японскими компаниями. SoftBank и Nippon Telegraph & Telephone собираются предложить свои профильные услуги носителям японского языка. После встречи с японским премьер-министром в апреле прошлого года основатель и генеральный директор OpenAI Сэм Альтман (Sam Altman) признался, что стартап рассматривает вопрос об открытии офиса в Японии. Компания собирается предлагать собственные сервисы носителям японского языка и взаимодействовать с властями в сфере формирования правил использования систем искусственного интеллекта. Корпорация Microsoft, которая инвестирует в OpenAI и сотрудничает с ней, также предлагает японским компаниям разработанные американским стартапом большие языковые модели. В офисе OpenAI, который расположится в Токио, будут курироваться услуги, предоставляемые японским корпоративным клиентам. В перспективе OpenAI собирается нанимать японских специалистов, как отмечает Nikkei. Отметим, что важность адаптации систем искусственного интеллекта к японскому языку и традициям недавно уже подчёркивал основатель Nvidia Дженсен Хуанг (Jensen Huang), объясняя это национальной спецификой. Microsoft и OpenAI построят ИИ-суперкомпьютер Stargate за $100 миллиардов
30.03.2024 [12:19],
Павел Котов
Microsoft и OpenAI разрабатывают проект Центра обработки данных нового поколения с бюджетом $100 млрд и суперкомпьютером для искусственного интеллекта. Объекту присвоено кодовое наименование Stargate, а начало работы над ним намечено на 2028 год. О масштабном совместном проекте Microsoft и OpenAI сообщил ресурс The Information и «три человека, которые участвовали в частных беседах по поводу этого предложения». Один из источников лично обсуждал вопрос с главой OpenAI Сэмом Альтманом (Sam Altman) и ознакомился с предварительными сметами расходов Microsoft: строительство нового ЦОД и ИИ-суперкомпьютера обойдётся в $100 млрд, то есть в сто раз дороже ряда наиболее крупных и мощных ЦОД на планете. План по разработке и строительству суперкомпьютеров Microsoft и OpenAI включает пять этапов — сейчас компании находятся в середине третьего, а значительная часть бюджетов двух последующих будет направлена на приобретение ИИ-ускорителей в необходимых объёмах. Четвёртый этап, о котором будет объявлено в 2026 году, включает создание суперкомпьютера для OpenAI. Пятый предполагает строительство крупнейшего на рынке суперкомпьютера Stargate с миллионами чипов для ИИ — его планируют завершить к 2030 году. В действительности расходы на объект могут превысить $115 млрд, передаёт The Information, и это втрое превышает расходы Microsoft на серверы, здания и другое оборудование в 2023 году. «Мы всегда планируем новое поколение инфраструктурных инноваций, чтобы продолжать раздвигать границы возможностей ИИ», — прокомментировал проект представитель Microsoft агентству Reuters. В конце минувшего года Microsoft представила два собственных ИИ-чипа, а Nvidia недавно анонсировала самый мощный ускоритель Blackwell B200 — он, по словам главы компании Дженсена Хуанга (Jensen Huang), обойдётся от от $30 000 до $40 000. OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу
30.03.2024 [06:32],
Владимир Чижевский
OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего. Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:
Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях. OpenAI попытается заинтересовать Голливуд ИИ-генератором видео Sora
29.03.2024 [19:16],
Владимир Мироненко
Компания OpenAI планирует провести на следующей неделе встречи в Лос-Анджелесе с представителями голливудских студий, руководителями СМИ и агентствами по поиску талантов. Компания хочет сформировать партнёрские отношения с представителями индустрии развлечений и предложить кинематографистам использовать в своей работе новый ИИ-сервис для генерации видео Sora, пишет Bloomberg со ссылкой на источники. До этого, в конце февраля главный операционный директор OpenAI Брэд Лайткеп (Brad Lightcap) вместе с коллегами демонстрировал в Голливуде возможности Sora, позволяющего генерировать реалистичные видеоролики продолжительностью до минуты на основе текстовых подсказок пользователей. Несколько дней спустя гендиректор OpenAI Сэм Альтман (Sam Altman) посетил мероприятия в Лос-Анджелесе, посвящённые церемонии вручения премии Оскар, на которых, по всей видимости тоже информировал представителей медиабизнеса о возможностях Sora. OpenAI представила ИИ-генератор видео Sora в середине февраля, и его возможности сразу привлекли внимание Голливуда и Кремниевой долины. Хотя нейросеть Sora пока недоступна для широкой публики, ею уже могут воспользоваться некоторые известные актёры и режиссёры. «У OpenAI есть продуманная стратегия работы в сотрудничестве с промышленностью посредством процесса итеративного развёртывания — поэтапного внедрения достижений ИИ — чтобы обеспечить безопасное внедрение и дать людям представление о том, что нас ждёт на горизонте», — сказал представитель OpenAI. «Мы рассчитываем на постоянный диалог с художниками и креативщиками», — добавил он. Конкуренты OpenAI, технологические гиганты Meta✴ Platforms и Google, ранее представили исследовательские проекты по преобразованию текста в видео. Над данной технологией также работают такие ИИ-стартапы, как Runway AI, Pika и Stability AI. Лидирующая в этом сегменте Runway ранее сообщила Bloomberg, что её сервис преобразования текста в видео Runway Gen-2 уже используют миллионы людей, включая профессионалов производственных и анимационных студий, которые полагаются на него при предварительной визуализации и раскадровке. Монтажёры фильмов с помощью сервиса создают видеоролики, сочетая их с другим отснятым контентом для создания рекламных роликов или визуальных эффектов. Магазин чат-ботов ChatGPT провалился, но им пользуются ученики школ и университетов
28.03.2024 [15:48],
Павел Котов
Генеральный директор OpenAI Сэм Альтман (Sam Altman) рассчитывал, что площадка кастомных чат-ботов на основе ChatGPT поможет компании расширить бизнес, но на практике она привлекла довольно специфический контингент, а некоторые проекты, возможно, нарушают правила использования платформы. Среди наиболее популярных спецверсий ChatGPT значатся проекты, работающие в образовательных целях, есть и инструменты для поиска и пересказа научных работ, сообщает Financial Times со ссылкой на данные исследования LikeWeb. В этом году отметился рост популярности дизайнерских инструментов с генерацией изображений, переводчики и средства для кадровиков, помогающие обрабатывать резюме и сопроводительные письма. Некоторые из проектов, возможно, нарушают политику OpenAI, которая запрещает создавать чат-боты, предоставляющие финансовые, юридические и медицинские консультации без одобрения квалифицированными специалистами. Пять из наиболее просматриваемых приложений провозглашаются разработчиками как способные создавать контент, который проходит проверку применяемых в школах и университетах средств обнаружения материалов, созданных ИИ. Эти кастомные чат-боты в общей сложности набрали не менее 3 млн просмотров, хотя OpenAI напрямую запрещает приложения, позволяющие жульничать в академической среде или пропагандирующие такие действия. Более 200 тыс. раз люди пользовались приложением Finance Wizard, которое якобы предсказывает будущую динамику акций. Оно составляет прогнозы на основе исторических данных, а его описание включает заявление об отказе от ответственности, предостерегающее от его использования как инструмента финансовых рекомендаций, подчеркнул разработчик. В прошлом году Сэм Альтман пообещал, что OpenAI позаботится о соответствии чат-ботов её политике — в этом компании должны помогать автоматизированные средства, анализ сотрудников компании и отзывы пользователей. Аудитория оригинальной версии ChatGPT составляет 100 млн пользователей в неделю, и цифровая платформа с кастомизированными версиями чат-бота призвана способствовать развитию бизнеса компании — иногда эта стратегия рассматривается как попытка повторить успех магазина приложений Apple App Store. В этом году ожидается запуск программы монетизации для разработчиков передовых проектов. На кастомные чат-боты в феврале пришлись лишь 1,5 % посещений сайта ChatGPT с десктопных компьютеров; еженедельный трафик расти перестал. В OpenAI сообщили, что платформу посетили миллионы пользователей — она будет улучшаться, а отзывы от разработчиков для неё очень важны. Собственные проекты здесь запустили и известные разработчики: туристическое приложение AllTrails, некоммерческая образовательная организация Khan Academy и поисковая система для путешествий Kayak. Одной из первых собственный чат-бот запустила австралийская технологическая компания Canva — он генерирует изображения для соцсетей, а число его просмотров превысило 4,4 млн. Claude 3 Opus сбросила GPT-4 с первого места в рейтинге языковых моделей
28.03.2024 [14:44],
Владимир Чижевский
Большая языковая модель (LLM) Claude 3 Opus от Anthropic впервые превзошла GPT-4 (модель в основе ChatGPT) от OpenAI на Chatbot Arena — популярной площадке, где пользователи оценивают качество работы чат-ботов. «Король мёртв», — написал в социальной сети X разработчик ПО Ник Добос [Nick Dobos]. Зашедшим на сайт пользователям Chatbot Arena предлагается ввести запрос, после чего демонстрируются два результата от неуказанных языковых моделей — человек должен выбрать, какой результат нравится больше. Проведя тысячи сравнений, Chatbot Arena заполняет обновляемую рейтинговую таблицу. Сайт управляется исследовательской организацией Large Model Systems Organization (LMSYS ORG), занимающейся открытыми ИИ-моделями. «Впервые на вершине рейтинга ИИ-модели не от OpenAI: Opus для сложных задач, Haiku — для вариантов, когда нужно дёшево и быстро. Это обнадёживает — от конкуренции разработчиков все только выиграют. Тем не менее, GPT-4 уже больше года, и конкуренты догнали её только сейчас», — прокомментировал событие независимый исследователь ИИ Саймон Уиллисон (Simon Willison). Сейчас в рейтинге Chatbot Arena представлены четыре версии GPT-4, поскольку с каждым обновлением вывод модели менялся, и некоторые пользователи предпочитают конкретные версии или же пользуются ими всеми для большей стабильности результатов. GPT-4 появилась в Chatbot Arena 10 мая 2023 года, через неделю после запуска рейтинга, и с тех пор различные версии GPT-4 неизменно занимали верхние строчки. Chatbot Arena ценится исследователями ИИ за возможность более-менее объективно оценить эффективность чат-ботов, что весьма непросто, и ключевым фактором здесь становится множество оценок, складывающихся в общую картину. Субъективные оценки играют немалую роль в сфере ИИ, где разработчик модели может выбрать конкретные показатели в рекламных целях. «Не так давно я долго программировал с использованием ИИ-модели Claude 3 Opus, и она полностью разгромила GPT-4», — написал в X разработчик ПО для ИИ Антон Бакай (Anton Bacaj). Успех рвущейся к вершинам рейтинга Claude 3 от Anthropic уже подтолкнул некоторых пользователей перейти на неё с GPT-4. Тем временем, набирает популярность Gemini Advanced от Google. Позиции OpenAI пошатнулись, но компания не почивает на лаврах и готовит новые модели, среди которых GPT-5. OpenAI показала короткометражки, созданные профессионалами на ИИ Sora
26.03.2024 [12:25],
Павел Котов
OpenAI опубликовала несколько короткометражных фильмов, созданных при помощи высокореалистичного генератора видео на основе искусственного интеллекта Sora. Сама модель, генерирующая видео по статическим изображениям и текстовым описаниям, пока остаётся недоступной для публики. Короткометражные ленты были созданы профессионалами творческой отрасли: кинематографистами, художниками, креативными работниками рекламных агентств и музыкантами, которым OpenAI предоставила доступ к модели. «Хотя нам предстоит внести в Sora множество улучшений, мы уже имеем представление о том, как эта модель способна помочь творческим личностям воплотить идеи в действительность», — рассказали в компании. Руководство OpenAI, по сведениям Bloomberg, уже провело несколько встреч с голливудскими кинематографистами и представителями студий, стремясь повысить интерес к применению Sora в обычном крупнобюджетном кинопроизводстве. Тем временем зрители уже подвергли критике создателей независимого фильма ужасов «Поздний вечер с дьяволом» (Late Night With The Devil), которые использовали при его создании созданные ИИ статические изображения. Звучали призывы бойкотировать ленту за то, что её создатели прибегли к помощи ИИ вместо традиционного найма художников. Эд Ньютон-Рекс (Ed Newton-Rex), гендиректор некоммерческой организации Fairly Trained, которая взялась сертифицировать модели ИИ, обученные добросовестно на лицензионных материалах, выразил сомнение, что Sora обучалась на лицензированном контенте. OpenAI продолжительное время не комментировала этот аспект разработки Sora, но впоследствии технический директор компании Мира Мурати (Mira Murati) заверила, что это были общедоступные и лицензированные данные, а также видеозаписи, полученные в рамках лицензионного соглашения с Shutterstock. Больше роликов можно найти в официальном блоге OpenAI. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |