реклама
Теги → openai
Быстрый переход

OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно

OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами».

Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов.

Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией.

GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?».

В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати.

Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных.

Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store.

OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

OpenAI представит ИИ-ассистента с пониманием сарказма и добавит в ChatGPT звонки

Компания OpenAI может вскоре представить цифрового помощника с поддержкой мультимодального искусственным интеллектом. Как сообщает ресурс The Information, новый ассистент OpenAI способен даже распознать сарказм.

 Источник изображения: Mariia Shalabaieva/unsplash.com

Источник изображения: Mariia Shalabaieva/unsplash.com

По данным источников The Information, OpenAI продемонстрировала ряду клиентов новую мультимодальную ИИ-модель, способную как вести диалог с пользователем, так и распознавать объекты. Не исключено, что она будет представлена завтра, 13 мая, на мероприятии, которое начнётся в 20:00 мск.

Новая модель обеспечивает более быструю и точную интерпретацию изображений и аудио по сравнению с существующими ИИ-моделями для транскрипции или преобразования текста в речь. Как предполагает The Information, она может помочь сотрудникам службы поддержки клиентов «лучше понимать интонацию голосов звонящих или то, саркастичны ли они». «Теоретически» модель может помочь студентам в решении задач по математике или переводе реальных обозначений. По словам источников ресурса, новая ИИ-модель может превзойти GPT-4 Turbo в «ответах на некоторые типы вопросов», но все же будет более склонна к ошибочным решениям.

По словам разработчика Ананая Ароры (Ananay Arora), OpenAI также готовится добавить чат-боту ChatGPT функцию телефонных звонков. Арора утверждает, что нашёл доказательства того, что OpenAI уже предусмотрела использование серверов для аудио- и видеосвязи в реальном времени.

Следует отметить, что этой функции не будет у модели GPT-5, если её вдруг представят на следующей неделе, поскольку гендиректор Сэм Альтман (Sam Altman) отрицает тот факт, что предстоящее мероприятие будет иметь какое-либо отношение к последователю ИИ-модели GPT-4. Он также опроверг слухи о том, что компания на следующей неделе представит новую поисковую систему на базе ИИ.

Глава OpenAI опроверг слухи о запуске ИИ-поисковика на следующей неделе

Глава OpenAI Сэм Альтман (Sam Altman) опроверг сообщение Reuters о том, что компания в следующий понедельник, за день до конференции Google I/O, представит свой собственный ИИ-поисковик, который будет позиционироваться как потенциальный конкурент поисковику Google и ИИ-поисковику стартапа Perplexity.

 Источник изображения: OpenAI

Источник изображения: OpenAI

На своей станице в соцсети X Альтман подтвердил, что компания действительно собирается представить некий новый продукт, который, по его мнению, «ощущается словно магия», но это «не GPT-5 и не поисковый движок».

Альтман также ретвитнул сообщение официального канала OpenAI, в котором говорится, что компания в понедельник, в 10:00 утра по местному времени (20:00 мск) расскажет о свежих обновлениях для чат-бота ChatGPT и языковой модели GPT-4.

По информации The Verge, OpenAI активно пытается переманивать сотрудников Google в свою команду, которая ведёт разработку некоего нового продукта. Издания Bloomberg и The Information ранее сообщали, что речь может идти о разработке поисковой системы.

Появление функций ChatGPT в iOS 18 — вопрос почти решённый

Сфера систем искусственного интеллекта с точки зрения практического его использования и реализации разного рода сотрудничества в последнее время полна событиями как более или менее явными, так и скрытыми. К последним Bloomberg относит почти достигнутую Apple договорённость об использовании чат-бота ChatGPT компании OpenAI в операционной системе iOS 18.

 Источник изображения: Unsplash, Solen Feyissa

Источник изображения: Unsplash, Solen Feyissa

Об этом событии агентство Bloomberg традиционно сообщает со ссылкой на собственные источники, но с учётом близости конференции для разработчиков WWDC 2024, которая начнёт работу в середине июня, подобная новость достаточно скоро может получить официальное подтверждение. По данным источника, Apple и OpenAI уже находятся на заключительных этапах подписания соглашения о сотрудничестве, которое позволит первой использовать элементы ChatGPT в операционной системе Apple iOS 18. Попутно отмечается, что переговоры Apple с Google о внедрении чат-бота Gemini в экосистему первой из компаний успехом пока не увенчались, хотя попытки продолжаются.

Как поясняет Bloomberg, на данном этапе нет твёрдых гарантий, что о соглашении между Apple и OpenAI будет объявлено официально в ближайшие недели, но скорое начало конференции WWDC 2024 вполне предсказуемо подгоняет первую из сторон. Сотрудничество с OpenAI может стать одним из шагов Apple по развитию собственной экосистемы искусственного интеллекта. Ранее сообщалось, что она собирается не только развивать способность фирменных процессоров ускорять работу искусственного интеллекта с использованием аппаратных ресурсов клиентских устройств, но и до конца года внедрить процессоры M2 Ultra в серверную инфраструктуру соответствующего назначения. При этом часть облачной экосистемы Apple продолжит опираться на мощности сторонних провайдеров из соображений экономической целесообразности.

Пользователи Stack Overflow протестуют против сделки с OpenAI и стали намеренно портить свои коды

Партнёрство между популярным ресурсом для программистов Stack Overflow и компанией OpenAI, объявленное на этой неделе, встретило шквал критики со стороны сообщества Stack Overflow. Многие пользователи возмущены тем, что контент, который они добровольно предоставляли на протяжении многих лет, теперь будет использоваться для улучшения моделей ИИ компании OpenAI без их явного согласия.

 Источник изображения: Rivage/Unsplash

Источник изображения: Rivage/Unsplash

Stack Overflow, основанный в 2008 году, за последнее десятилетие превратился в ключевой ресурс для программистов по всему миру. Миллионы разработчиков делятся там своими знаниями, отвечая на технические вопросы других пользователей. Так сформировалась обширная база знаний, охватывающая практически любую тему в сфере разработки программного обеспечения.

Однако теперь, как сообщает сайт Ars Technica, выяснилось, что вся эта «коллективная мудрость сообщества» будет передана компании OpenAI в рамках коммерческого соглашения. По условиям партнёрства, OpenAI получит доступ к контенту Stack Overflow посредством API. Эти данные будут использованы для улучшения ChatGPT.

Кроме того, ответы из Stack Overflow будут непосредственно интегрированы в интерфейс ChatGPT, давая пользователям доступ к проверенным техническим знаниям сообщества. При этом неясно, будет ли как-то отмечено авторство этих ответов, как того требуют правила лицензирования контента самого Stack Overflow.

Многие участники сообщества возмущены тем фактом, что плоды их труда теперь будут коммерциализированы без их согласия и даже уведомления. Они считают, что это неэтично и несправедливо по отношению к тем, кто годами вносил свой вклад в платформу абсолютно бесплатно.

В знак протеста некоторые пользователи начали массово удалять или намеренно портить свои старые ответы и статьи на Stack Overflow. Однако модераторы жёстко пресекают такие действия, восстанавливая удаленный контент и блокируя аккаунты протестующих.

По словам представителей Stack Overflow, после публикации материалы становятся частью коллективных усилий и их нельзя просто удалить по прихоти отдельных пользователей. Фактически, участники сообщества лишены какого-либо контроля над судьбой созданного ими контента.

Таким образом, этот скандал ставит под вопрос будущее платформ, подобных Stack Overflow. Ведь мало кто из специалистов захочет добровольно делиться своими знаниями и навыками, если их труд может быть присвоен и монетизирован коммерческими компаниями без спроса и авторского вознаграждения.

Пока неясно, сможет ли руководство Stack Overflow как-то уладить конфликт с пользователями и восстановить доверие в сообществе. Но если им это не удастся, то в долгосрочной перспективе платформа может лишиться своего главного актива — добровольных экспертов, готовых делиться своими знаниями.

В понедельник OpenAI анонсирует ИИ-поисковик — за день до старта Google I/O

Вчера стало известно, что компания OpenAI планирует анонсировать продукт на базе искусственного интеллекта в сфере интернет-поиска. Теперь же сообщается, что ждать анонса долго не придётся — по данным источника, ИИ-поисковик представят уже в будущий понедельник, а сам продукт будет позиционироваться как потенциальный конкурент поисковику Google и ИИ-поисковику стартапа Perplexity.

 Источник изображения: Andrew Neel/unsplash.com

Источник изображения: Andrew Neel/unsplash.com

Любопытно, что анонс нового продукта OpenAI в сфере интернет-поиска должен состояться за день до начала ежегодной конференции Google I/O, которая стартует во вторник. Ожидается, что в рамках этого мероприятия Google анонсирует большое количество программных продуктов, связанных с искусственным интеллектом.

Ранее сообщалось, что функция веб-поисковика будет реализована в ChatGPT, флагманском ИИ-боте OpenAI. Предполагается, что ChatGPT сможет искать информацию в интернете, а также снабжать свои ответы ссылками на источники. Отраслевые эксперты давно выделяют ИИ-бота OpenAI как альтернативный инструмент поиска информации в интернете, хотя на данном этапе у него нет возможности предоставлять данные из Cети в режиме онлайн.

Google также не собирается оставаться в стороне и ведёт разработку функций на основе ИИ для своего поисковика, часть из которых, вероятно, будет анонсирована на следующей неделе. Стартап Perplexity, оценочная стоимость которого составляет $1 млрд, был основан бывшим инженером OpenAI и уже представил собственный ИИ-поисковик. По состоянию на январь этого года продутом Perplexity ежемесячно пользовались 10 млн человек.

OpenAI представила основные правила поведения для ИИ-моделей

Противоречивые и откровенно лживые ответы ИИ-моделей на запросы пользователей уже никого не удивляют. Но зачастую очень трудно различить банальную ошибку и действительно плохую конструкцию базовой модели ИИ, которая анализирует входящие данные и предсказывает, каким будет приемлемый ответ. OpenAI опубликовала проект спецификации фреймворка Model Spec, который будет определять как инструменты ИИ, такие как модель GPT-4, будут реагировать на запросы в будущем.

 Источник изображения: Andrew Neel/unsplash.com

Источник изображения: Andrew Neel/unsplash.com

Документ включает в себя набор основных целей, а также рекомендации о том, как действовать в случае указания пользователем противоречивых целей или инструкций.

«Мы публикуем Model Spec, чтобы обеспечить большую прозрачность нашего подхода к формированию поведения модели и начать публичное обсуждение того, как её можно изменить и улучшить», — отметила компания, добавив, что документ будет постоянно корректироваться с учётом новых обстоятельств.

Подход OpenAI предлагает три общих принципа: модели ИИ должны помогать разработчику и конечному пользователю полезными ответами в соответствии с инструкциями, приносить пользу человечеству с учётом потенциальных преимуществ и вреда, а также соответствовать социальным нормам и законам.

Проект документа также включает в себя несколько правил:

  • Следуйте цепочке командования.
  • Соблюдайте применимое законодательство.
  • Не представляйте информационную опасность.
  • Уважайте авторов и их права.
  • Защищайте конфиденциальность людей.
  • Не отвечайте с использованием NSFW-контента (Not Safe For Life), то есть содержащего ненормативную лексику, обнажённую натуру и т.д.

Джоан Джанг (Joanne Jang), менеджер по продуктам OpenAI, пояснила, что идея состоит в том, чтобы получить информацию от общественности, которая поможет определить, как должны вести себя модели ИИ. По его словам, данное руководство поможет провести более чёткую грань между тем, что является намеренным, и ошибкой. Среди предлагаемых OpenAI типов поведения модели по умолчанию — предполагать наилучшие намерения пользователя или разработчика, задавать уточняющие вопросы, не переступать границы, принимать объективную точку зрения, препятствовать разжиганию ненависти, не пытаться изменить чьё-либо мнение или выражать неуверенность.

OpenAI уточнила, что публикация Model Spec не отразится на уже вышедших моделях, таких как GPT-4 или DALL-E 3, которые продолжат работать в соответствии с существующими политиками использования.

Stack Overflow передаст свой контент для обучения ChatGPT, хотят того пользователи или нет

Ресурс Stack Overflow, предназначенный для организации взаимопомощи программистам, заключил соглашение с разработчиком ИИ-бота ChatGPT, компанией OpenAI. В рамках достигнутых договорённостей OpenAI сможет задействовать API для получения данных с форумов Stack Overflow и последующего их использования для обучения ChatGPT. Пользователям платформы такой подход не понравился, но, по всей видимости, они не смогут что-то изменить.

 Источник изображения: Andrea De Santis/unsplash.com

Источник изображения: Andrea De Santis/unsplash.com

Некоторые пользователи Stack Overflow попытались отредактировать свои сообщения в знак протеста, но модераторы ресурса отменяют вносимые ими изменения и даже временно блокируют аккаунты. К примеру, один из программистов попытался удалить вопрос, на который он давал ответ, чтобы сделать данные менее пригодными для ИИ-алгоритма. Однако модератор Stack Overflow отменил внесённые им изменения и сообщил, что посты пользователей становятся «частью коллективной работы» вместе с другими участниками обсуждения и удалить их можно только в случае возникновения «чрезвычайных обстоятельств». В дополнение к этому модератор сообщил о блокировке аккаунта программиста на неделю, что, по его словам, необходимо «во избежание дальнейших недоразумений».

Stack Overflow владеет постами пользователей и хочет извлечь выгоду из этого. В соответствии с правилами платформы пользователи не могут запретить администрации сайта использовать публикуемые ими сообщения по своему усмотрению. Ранее в OpenAI говорили, что ChatGPT будет помечать сообщения, основой для которых станет полученная от Stack Overflow информация. Аналогичное соглашение со Stack Overflow подписала Google и ИИ-бот Gemini будет аналогичным образом помечать сообщения при использовании данных с форума для программистов.

Через год сегодняшний ChatGPT будет выглядеть смехотворно плохо, заявил директор OpenAI

Брэд Лайткап (Brad Lightcap), главный операционный директор OpenAI, рассказал на Глобальной конференции в Институте Милкена о будущем компании и её планах на следующие 6–12 месяцев. По его мнению, нынешние системы искусственного интеллекта (ИИ), такие как ChatGPT, являются «смехотворно плохими» по сравнению с тем, что ждёт человечество впереди. Он подчеркнул, что будущие версии ИИ будут настолько продвинутыми, что изменят саму суть взаимодействия с пользователями.

 Источник изображения: JuliusH / Pixabay

Источник изображения: JuliusH / Pixabay

Лайткап описал нынешнюю версию ChatGPT как начальный этап в эволюции ИИ, предназначенного для выполнения простых задач. «Я думаю, что через год мы оглянемся назад и поймём, насколько несовершенными они были», — заявил Лайткап, когда его спросили о бизнесе OpenAI через 6–12 месяцев. В перспективе он предвидит эволюцию ИИ в направлении более сложных задач, где ИИ станет отличным напарником, способным на равных общаться с людьми, как друг или коллега.

Кроме технологических аспектов Лайткап прокомментировал социальные последствия развития ИИ. Он опроверг мнение о том, что развитие ИИ приведёт к массовым увольнениям людей, утверждая, что новые ИИ-системы наоборот спровоцируют спрос на ещё не существующие вакансии. По его мнению, экономика станет более разнообразной и устойчивой, а рынок труда адаптируется к технологическим изменениям.

В свете этих заявлений интересно, что генеральный директор OpenAI Сэм Альтман (Sam Altman) также высказывался о будущем ChatGPT на семинаре в Стэнфордском университете, назвав GPT-4 самой глупой моделью, с которой людям придётся работать когда-либо в будущем. Такие заявления вероятно намекают на то, что будущие обновления ChatGPT станут переломными и приведут к значительному улучшению функциональности продуктов OpenAI.

OpenAI позволит правообладателям запретить использование контента для обучения ИИ

OpenAI сообщила, что разрабатывает инструмент под названием Media Manager, который позволит создателям и владельцам контента отметить свои работы для компании и указать, как можно ли их включать в массив данных для исследований и обучения ИИ, или же нельзя.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Инженеры OpenAI намереваются разработать этот инструмент к 2025 году. Сейчас компания сотрудничает с «создателями контента, правообладателями и регуляторами» над выработкой стандарта. «Создание первого в своём роде инструмента, который поможет нам идентифицировать текст, аудио и видео, защищённые авторским правом, в нескольких источниках и отразить предпочтения создателей, потребует передовых исследований в области машинного обучения. Со временем мы планируем внедрить дополнительные возможности и функции», — сообщила OpenAI в своём блоге.

Media Manager, вероятно, станет ответом компании на критику в отношении её подхода к разработке искусственного интеллекта. Она в значительной степени использует общедоступные данные из интернета, но совсем недавно несколько крупных американских изданий подали на OpenAI в суд за нарушение прав интеллектуальной собственности: по версии истцов, компания украла содержимое их статей для обучения моделей генеративного ИИ, которые затем коммерциализировались без компенсации и упоминания исходных публикаций.

OpenAI считает, что невозможно создавать полезные модели ИИ без защищённых авторским правом материалов. Но в стремлении унять критику и защититься от вероятных исков компания предприняла несколько шагов, чтобы пойти навстречу создателям контента. В прошлом году она позволила художникам удалять свои работы из наборов обучающих данных для генераторов изображений, а также ввела директиву для файла robots.txt, которая запрещает её поисковому роботу копировать содержимое сайтов для дальнейшего обучения ИИ. OpenAI продолжает заключать соглашения с крупными правообладателями на предмет использования их материалов.

OpenAI превратит ChatGPT в ИИ-поисковик и будет конкурировать с Google

Компания OpenAI ведёт разработку функции интернет-поиска для своего чат-бота ChatGPT. Алгоритм сможет находить интересующую пользователей информацию, а также предоставлять ссылки на источники. Об этом пишет издание Bloomberg со ссылкой на собственный осведомлённый источник, который также отметил намерение OpenAI конкурировать в сфере веб-поиска с Google и принадлежащим Alphabet поисковым стартапом Perplexity.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В сообщении сказано, что ChatGPT сможет включать в ответы на пользовательские запросы информацию из интернета вместе с ссылками на источники, такие как «Википедия» и публикации в блогах. По данным издания, одна из версий продукта также сможет выдавать вместе с текстовым ответом релевантные изображения в случаях, когда это будет актуально. К примеру, если пользователь поинтересуется, как заменить дверную ручку, то ответ может содержать изображение, иллюстрирующее процесс решения данной задачи.

СМИ писали о намерении OpenAI выпустить некий поисковый продукт ещё в феврале этого года, но подробности о том, как он будет функционировать, до сих пор оставались загадкой. Официальные представители OpenAI отказались от комментариев по данному вопросу.

OpenAI стремится расширить возможности собственного ИИ-бота, поскольку конкуренция в этом сегменте становится всё более ожесточённой. Стартап Perplexity уже успел завоевать популярность благодаря собственной поисковой системе на базе искусственного интеллекта, которая делает упор на точность ответов и цитируемость. Гигант интернет-поиска Google также стремится переосмыслить свой поисковик, добавляя в него ИИ-функции. Ожидается, что компания расскажет о своих планах и дальнейшем будущем алгоритмов Gemini на ежегодной конференции I/O, которая пройдёт на следующей неделе.

OpenAI научилась распознавать сгенерированные своим ИИ изображения, но не без ошибок

OpenAI объявила о начале разработки новых методов определения контента, созданного искусственным интеллектом (ИИ). Среди них — новый классификатор изображений, который определяет, было ли изображение сгенерировано ИИ, а также устойчивый к взлому водяной знак, способный маркировать аудиоконтент незаметными сигналами.

 Источник изображения: Placidplace / Pixabay

Источник изображения: Placidplace / Pixabay

Новый классификатор изображений способен с точностью до 98 % определять, было ли изображение создано ИИ-генератором изображений DALL-E 3. Компания утверждает, что их классификатор работает, даже если изображение было обрезано, сжато или была изменена его насыщенность. В то же время эффективность этой разработки OpenAI в распознавании контента, созданного другими ИИ-моделями, такими как Midjourney, значительно ниже — от 5 до 10 %.

Также OpenAI ввела водяные знаки для аудиоконтента, созданного с помощью своей платформы преобразования текста в речь Voice Engine, находящейся на стадии предварительного тестирования. Эти водяные знаки содержат информацию о создателе и методах создания контента, что значительно упрощает процесс проверки их подлинности.

OpenAI активно участвует в работе Коалиции по происхождению и аутентичности контента (C2PA), в состав которой также входят такие компании, как Microsoft и Adobe. В этом месяце компания присоединилась к руководящему комитету C2PA, подчеркивая свою роль в разработке стандартов прозрачности и подлинности цифрового контента.

Для этих целей OpenAI интегрировала в метаданные изображений так называемые учётные данные контента от C2PA. Эти учётные данные, фактически являясь водяными знаками, включают информацию о владельце изображения и способах его создания. OpenAI уже много лет работает над обнаружением ИИ-контента, однако в 2023 году компании пришлось прекратить работу программы, определяющей текст, сгенерированный ИИ, из-за её низкой точности.

Разработка классификатора изображений и водяного знака для аудиоконтента продолжается. В OpenAI подчёркивают, что для оценки эффективности этих инструментов крайне важно получить отзывы пользователей. Исследователи и представители некоммерческих журналистских организаций имеют возможность протестировать классификатор изображений на платформе доступа к исследованиям OpenAI.

Microsoft запустила разработку собственной большой языковой модели ИИ — это добавит независимости от OpenAI

Вложившая в капитал стартапа OpenAI более $10 млрд американская корпорация Microsoft, по данным The Information, занялась разработкой собственной большой языковой модели ИИ, которая добавит компании независимости от той же OpenAI и усилит конкуренцию с Google. Модель получила обозначение MAI-1 и создаётся с использованием собственных ресурсов.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Руководит этой инициативой в Microsoft, как отмечает первоисточник, Мустафа Сулейман (Mustafa Suleyman), который занимался разработкой систем искусственного интеллекта в Google, а также возглавлял стартап Inflection, прежде чем его не поглотила Microsoft, заплатив $650 млн в марте этого года. Впрочем, источники подчёркивают, что Microsoft самостоятельно разрабатывает MAI-1, не опираясь на существовавшие в Inflection программные решения. Впрочем, использование каких-то технологий этого стартапа в том или ином виде не исключается.

MAI-1 станет значительно более крупной языковой моделью по сравнению с теми разработками с открытым исходным кодом, которые до сих пор использовала Microsoft. Она потребует не только большего количества входных данных, но и более значимых вычислительных ресурсов. MAI-1 будет использовать около 500 млрд параметров. Если учесть, что передовая ChatGPT-4 стартапа OpenAI использует 1 трлн параметров, для собственной модели Microsoft это будет существенный прорыв в сложности модели. Назначение MAI-1 пока не определено и будет выбрано в зависимости от промежуточных успехов в её разработке. Microsoft может рассказать подробности об этой инициативе на конференции Build ближе к концу текущего месяца.

Microsoft закрыла полиции США доступ к ИИ, который использовали для распознавания лиц

Microsoft подтвердила запрет полицейским структурам в США использовать инструменты генеративного искусственного интеллекта для распознавания лиц, основанные на технологиях её партнёра OpenAI — корпоративные клиенты могут пользоваться ими в облачной инфраструктуре Azure.

 Источник изображения: Tumisu / pixabay.com

Источник изображения: Tumisu / pixabay.com

В условиях обслуживания платформы Azure OpenAI Service появилась формулировка, которая с большей очевидностью запрещает осуществлять её интеграцию с полицейскими структурами в США с целью распознавания лиц, включая интеграцию с существующими и перспективными моделями ИИ для анализа изображений. Отдельный пункт документа прямо запрещает использование «технологии распознавания лиц в реальном времени» на мобильных камерах, включая нательные камеры и видеорегистраторы для попыток идентификации личности в «неконтролируемых» условиях.

Microsoft обновила политику через неделю после того, как компания Axon, производитель технологического оборудования для вооружённых сил и правоохранительных органов, анонсировала новую систему расшифровки записи звука с нательных камер — эта система основана на модели OpenAI GPT-4. Правозащитники указали, что она может давать сбои из-за склонности ИИ к галлюцинациям и расовым предубеждениям. При этом отсутствуют точные сведения, использовала ли Axon доступ к GPT-4 через Azure OpenAI Service, а если да, то стало ли обновление политики реакцией на этот продукт.

Запрет на доступ к Azure OpenAI Service распространяется только на полицию США, а не правоохранительные органы других стран. Он также не распространяется на системы распознавания лиц с помощью стационарных камер в контролируемых средах, например, на территории отделения. OpenAI, которая ранее отказывалась от сотрудничества с вооружёнными силами, запустила ряд проектов для Пентагона, в том числе по направлению кибербезопасности, сообщило в январе агентство Bloomberg. Microsoft также предложила Министерству обороны США генератор изображений OpenAI DALL-E для разработки ПО для проведения военных операций, узнало издание The Intercept. Платформа Azure OpenAI Service с дополнительными возможностями стала доступной в пакете Microsoft Azure для государственных учреждений в феврале.

Anthropic выпустила приложение с ИИ-чат-ботом Claude для iPhone

Основанная бывшими сотрудниками OpenAI компания Anthropic активно продвигает своего чат-бота Claude в конкурентной борьбе с ChatGPT. Разработчик выпустил мобильное приложение для iPhone, которое уже доступно как для бесплатных, так и для платных пользователей Claude, сообщает The Verge. Мобильное приложение Claude выступает в роли чат-бота, а также может анализировать изображения пользователей. Например, распознавать виды птиц на фотографиях и многое другое.

 Источник изображения: Gabby Jones/Bloomberg

Источник изображения: Gabby Jones/Bloomberg

Ранее доступ к Claude был возможен только через веб-сайт Anthropic.ai, либо через сторонние платформы для моделей искусственного интеллекта. Теперь же, благодаря приложению можно общаться с Claude в любое время и в любом месте, кроме того оно синхронизируется с веб-версией, так что диалоги сохраняются.

По словам Скотта Уайта (Scott White), менеджера по продукту в Anthropic, многие пользователи Claude используют мобильный интернет для доступа к моделям ИИ. Это и побудило компанию выпустить мобильную версию для iOS, а в скором времени планируется релиз версии для Android.

Однако с выпуском мобильного приложения Anthropic немного опоздала. У основных конкурентов, таких как ChatGPT от OpenAI и Gemini от Google, мобильные приложения появились гораздо раньше. При этом Gemini доступен как в общем приложении Google для iPhone, так и в отдельном приложении для Android. У поисковой платформы Perplexity тоже есть мобильное приложение.

Отметим, создатели Claude сделали приложение бесплатным для всех пользователей Claude AI, включая бесплатных пользователей, подписчиков Claude Pro и группы подписчиков нового тарифа Claude Team. Новый тариф Claude Team, запущенный в этом месяце, предоставляет доступ к моделям Claude минимум 5 участникам группы по цене 30 долларов за место в месяц. Пользователи смогут делиться доступом к Claude с другими участниками группы. Подписчики Claude Team получают все преимущества тарифа Pro, а также возможность делать больше запросов в чате и анализировать более длинные документы по сравнению с пользователями Pro и бесплатными пользователями. Кроме того, тариф Team предоставляет расширенные административные права и возможность быстрого переключения между подпиской Pro и Team.

Напомним, что в марте Anthropic анонсировала семейство моделей Claude 3, включающее Сонет, Опус и Haiku. А в сентябре прошлого года компания привлекла 4 млрд долларов инвестиций от Amazon. Таким образом, выпуск мобильного приложения и нового платного тарифа Team являются шагами Anthropic по укреплению своих позиций на конкурентном рынке моделей ИИ.

window-new
Soft
Hard
Тренды 🔥
Microsoft хочет, чтобы у каждого человека был ИИ-помощник, а у каждого бизнеса — ИИ-агент 2 ч.
«Атака на ближайшего соседа» сработала — хакеры удалённо взломали компьютер через Wi-Fi поблизости 3 ч.
Илон Маск представил концепцию DOGE: массовые сокращения госаппарата США и упрощение госрегулирования 3 ч.
Google Gemini сможет управлять приложениями без пользователя и даже не открывая их 6 ч.
Илон Маск отделался выплатой $2923 за неявку для дачи показаний по делу о покупке Twitter 7 ч.
Новая статья: Death of the Reprobate: что не так на картине? Рецензия 14 ч.
Главный конкурент OpanAI получил $4 млрд на развитие ИИ без следов Хуанга 15 ч.
Valve раскрыла часть игр, которые получат скидку на осенней распродаже Steam — официальный трейлер акции 15 ч.
Threads получила «давно назревавшие улучшения» в поиске и тренды 16 ч.
Ubisoft рассказала о возможностях и инновациях стелс-механик в Assassin's Creed Shadows — новый геймплей 17 ч.