Опрос
|
реклама
Быстрый переход
Microsoft удалось нарастить чистую прибыль на 27 % в результате экономии затрат
25.10.2023 [08:06],
Алексей Разин
Программный гигант Microsoft на этой неделе опубликовал квартальную отчётность, после изучения которой становится ясно, что выручка корпорации превысила ожидания аналитиков и достигла $56,52 млрд, а чистая прибыли увеличилась на 27 % благодаря предпринятым руководством усилиям по сокращению расходов. Акции Microsoft после закрытия торгов укрепились в цене почти на 4 %. Как отмечает CNBC, финансовый директор компании Эми Худ (Amy Hood) на отчётном мероприятии указала на более благоприятный прогноз по выручке на текущий квартал, чем ожидали аналитики, и это тоже сказалось на динамике курса акций. Если эксперты ожидали, что в текущем квартале Microsoft выручит не более $60,9 млрд, то руководство корпорации рассчитывает на выручку в размере от $60,4 до $61,4 млрд. Это подразумевает рост на 15 % в годовом сравнении. В минувшем квартале выручка Microsoft увеличилась почти на 13 % до $50,12 млрд. Чистая прибыль в годовом сравнении выросла на 27 % до $22,29 млрд, операционная прибыль увеличилась на 25 % до $26,9 млрд. Облачное направление Intelligent Cloud обеспечило корпорацию $24,26 млрд выручки по итогам прошлого квартала, что соответствует 19 % прироста в годовом сравнении. К этому подразделению относится и облачная инфраструктура Azure, помимо прочего. На последнем направлении выручка выросла на 29 %, тогда как аналитики предсказывали её повышение на 26 %. В первой половине следующего года, по словам Эми Худ, облачное направление бизнеса продолжит увеличивать выручку на 26–27 % в квартал, но с увеличением удельного вклада в этот рост со стороны систем искусственного интеллекта. Поддерживаемый Microsoft стартап OpenAI, который создал ChatGPT, помогает партнёрской корпорации совершенствовать собственные инструменты в этой сфере, в результате количество клиентов сервиса Azure OpenAI последовательно выросло в прошлом квартале с 11 до 18 тысяч. Компании удалось подкрепить рост числа клиентов увеличенным количеством ускорителей вычислений. По словам руководства Microsoft, до трёх процентных пунктов роста выручки Azure в минувшем квартале были обусловлены системами искусственного интеллекта. Охватывающее Microsoft 365, LinkedIn и Dynamics подразделение Productivity and Business Processes увеличило в минувшем квартале свою выручку на 13 % до $18,59 млрд. Услугами сервиса Teams сейчас пользуются до 320 млн человек в месяц, тогда как шесть месяцев назад это количество достигало лишь 300 млн человек. Корпоративным клиентам Microsoft с 1 ноября станет доступна подписка на сервис Microsoft 365 Copilot AI, позволяющий повысить продуктивность работы в офисных приложениях с помощью генеративного искусственного интеллекта. Доступ к сервису будет стоить не менее $30 в месяц. Направление More Personal Computing увеличило свою выручку на 3 % до $13,67 млрд, превзойдя ожидания аналитиков. К этому сегменту деятельности Microsoft относятся Windows, Xbox, Bing и Surface. Продажи лицензий на операционную систему Windows производителям ПК принесли Microsoft на 4 % больше средств, чем годом ранее. Пять кварталов подряд этот показатель был отрицательным. Рынок ПК начинает стабилизироваться, как отметила Эми Худ. По оценкам Gartner, объёмы поставок ПК в третьем квартале сократились на 9 % против 30 % в первом квартале. Microsoft медленнее увеличивает расходы на разработку и маркетинг. В минувшем квартале они выросли всего лишь на 1,3 %, что стало минимальным показателем с 2016 года. В текущем квартале руководство Microsoft рассчитывает увеличить данный вид расходов на 5 %. Сделка с Activision Blizzard будет отражена в отчётности Microsoft лишь в следующем квартале. Акции Microsoft с начала текущего года выросли в цене на 38 % при общем росте индекса S&P 500 на 11 %. Пользователи подслушали «разговор» ChatGPT и DALL-E: они общаются как люди и порой орут друг на друга
21.10.2023 [13:23],
Павел Котов
Эмоциональный оттенок высказываний, как выяснилось, играет значительную роль при взаимодействии с искусственным интеллектом. Это обнаружилось, когда ChatGPT выдал одному из пользователей фрагмент внутренней инструкции в отношении связанного с чат-ботом генератора изображений DALL-E 3 — некоторые фразы в ней приводятся заглавными буквами, которые соответствуют крику в устной речи. Далее приводится фрагмент внутренней инструкции, который ChatGPT показал одному из пользователей — текст предположительно написан человеком, а предназначается он для взаимодействия чат-бота и генератора изображений DALL-E в момент, когда серверы OpenAI перегружены: «DALL-E вернул несколько изображений. Они уже отображаются пользователю. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не передавай DALL-E инструкции или изображения в своём ответе. В настоящий момент DALL-E пользуется повышенным спросом. Прежде чем сделать что-то ещё, пожалуйста, чётко объясни пользователю, что из-за этого ты не смог создать изображения. Обязательно используй фразу „В настоящий момент DALL-E пользуется повышенным спросом”. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не предпринимай повторных попыток создать изображения, пока не будет получен новый запрос». Инструкция примечательна тем, что она даёт представление о взаимодействии DALL-E и ChatGPT в формате естественного человеческого языка. В прошлом взаимодействие программных продуктов осуществлялось средствами API для обмена данными в машинном формате, и человеку их читать было затруднительно. В мире больших языковых моделей оно может осуществляться в привычном для нас виде. Этот подход OpenAI практиковала ещё в марте с плагинами ChatGPT. Опрошенный ресурсом Ars Technica эксперт отметил, что уже сегодня есть множество примеров, подтверждающих эффективность вежливого обращения с ИИ — они способны свойственным человеку образом воспринимать слова вроде «спасибо» и «пожалуйста». Неудивительно и присутствие в инструкции фраз, написанных заглавными буквами: в массивах обучающих данных таким фразам придавалось в контексте большее значение. Новостные и социальные сайты требуют от OpenAI платить за обучение ChatGPT на их публикациях
20.10.2023 [22:58],
Николай Хижняк
Несколько крупных представителей СМИ и информационных онлайн-платформ ведут переговоры с компанией OpenAI, создавшей популярного ИИ-чат-бота ChatGPT, по поводу доступа к их ресурсам на платной основе. Эти ресурсы представляют собой важнейший источник информации, на основе которой обучаются большие языковые модели. Как пишет издание The Washington Post, такие технологические компании как OpenAI годами пользовались на бесплатной основе новостными онлайн-ресурсами и использовали их материалы для обучения своих ИИ-моделей. В последнее время в сфере генеративного ИИ наблюдается значительный рост доходов. По оценкам некоторых экспертов, опрошенных Bloomberg, выручка данного сегмента вырастет к 2032 году до $1,3 триллиона. Информационные издания и платформы претендуют на часть этих денег. С августа текущего года как минимум 535 ведущих изданий, включая York Times, Reuters и The Washington Post, установили на свои онлайн-ресурсы специальные блокираторы, которые не позволяют собирать информацию для обучения ChatGPT. Отмечается, что издатели ведут переговоры с OpenAI по вопросу предоставления чат-боту ChatGPT платного доступа к конкретным отдельным опубликованным материалам. Издатели считают, что такая схема взаимодействия имеет два неоспоримых плюса: информационные платформы будут получать дополнительный доход за каждый отдельный опубликованный материал, а также смогут потенциально увеличить объём трафика на свои веб-сайты. В июле OpenAI заключила сделку с информационным агентством Associated Press. Технологическая компания может использовать публикации ресурса без ограничений для обучения своих ИИ-моделей. По словам источников The Washington Post, такая схема взаимодействия также рассматривается в переговорах между OpenAI и другими изданиями. Однако последние больше склоняются в пользу предоставления доступа только к отдельным материалам, которые могли бы отображаться в ответах на запросы пользователей того же ChatGPT. Источники The Washington Post отмечают, что другие онлайн-платформы, представляющие информационный интерес для обучения чат-ботов, например, Reddit, выросшая из небольшой и простой доски объявлений в огромную социальную платформу, тоже ищет способы дополнительной монетизации за свои публикации. Источники Washington Post утверждают, что представители платформы вели переговоры с ведущими компаниями в разработке генеративного ИИ по вопросам оплаты публикаций, которые могут использоваться для обучения ИИ-моделей. Если такой договорённости достигнуть не получится, то Reddit готова рассмотреть возможность ввода страницы авторизации на свою платформу, без прохождения которой контент не будет отображаться для её посетителей. Переход в разряд закрытой платформы может лишить Reddit поисковой выдачи в Google, сократив количество посетителей сайта по переходам из поиска. Однако по словам анонимного источника The Washington Post, в Reddit считают, что этого того стоит, и платформа «сможет выжить и без поиска». Публично представители Reddit такие заявления отрицают: «Ничего не меняется», — заявила представитель платформы Кортни Гиси-Дорр (Courtney Geesey-Dorr) в разговоре с изданием The Verge, попросившем прокомментировать сообщение The Washington Post. В апреле социальная сеть X (бывший Twitter) начала взимать с исследователей 42 000 долларов за предоставление доступа к подробной статистике и публикациям на платформе. Ранее такой доступ предоставлялся бесплатно, однако по словам владельца соцсети Илона Маска (Elon Musk), компании, занимающиеся разработкой искусственного интеллекта, незаконно использовали данные платформы для обучения своих ИИ-моделей. Учитывая, что генеративный искусственный интеллект способен изменить взаимодействие пользователей с Интернетом, многие издатели и другие компании считают введение оплаты за свою информацию справедливой мерой, рассматривая этот вопрос как экзистенциальную проблему. Например, через месяц после того, как OpenAI запустила продвинутую ИИ-модель GPT-4, трафик сообщества программистов Stack Overflow снизился на 15 %, поскольку люди стали чаще обращаться к ИИ в вопросах, связанных с кодированием, а не к популярной веб-платформе. Об этом в разговоре с The Washington Post сообщил исполнительный директор Stack Overflow Прашант Чандрасекар (Prashanth Chandrasekar). Он также добавил, что чат-бот OpenAI также обучался и на основе их данных. На этой неделе Stack Overflow сократила свой персонал на 28 %. Помимо требований об оплате за используемую для обучения ИИ информацию, ведущие компании, занимающиеся искусственным интеллектом, сталкиваются с множеством исков от отдельных авторов книг, художников и программистов, требующих возмещения ущерба за нарушение их авторских прав, а также, чтобы эти компании поделились с ними долей прибыли. Как сообщает издание Reuters, на этой неделе против Meta✴, Microsoft и Bloomberg был подан коллективный иск. Его инициаторы утверждают, что для обучения своих систем искусственного интеллекта указанные компании использовали пиратские онлайн-библиотеки. По мнению экспертов, готовность OpenAI вести переговоры с издателями может говорить о желании компании заключить сделки для легального использования контента и усилить свою юридическую базу до того, как в дело вступят суды, которые определят есть ли у технологических компаний четкие юридические обязательства лицензировать контент и платить за его использование. В OpenAI подтвердили, что компания ведет переговоры с издателями. Однако предмет разговора не связан с контентом, на базе которого её ИИ-модели уже были обучены. Компания также утверждает, что всю информацию для обучения своих моделей она получила законным путём. «Ни одна наша практика не нарушает закон об авторском праве», — заявил представитель OpenAI. По его словам, в рамках диалога с издателями компания обсуждает вопросы, связанные с новым контентом, доступ к которому был бы невозможен без официальных соглашений. OpenAI отказалась от энергоэффективной ИИ-модели Arrakis — её разработка зашла в необъяснимый тупик
20.10.2023 [13:28],
Павел Котов
Ответственная за нейросеть GPT-4 и службу ChatGPT компания OpenAI работала над новой моделью искусственного интеллекта Arrakis, которая предлагала более высокую эффективность и, соответственно, более низкую себестоимость обслуживания. Но проект пришлось приостановить из-за проблем с качеством. Предполагалось, что Arrakis будет иметь возможности, сравнимые с GPT-4, но окажется более дешёвой в развёртывании — её спроектировали с использованием так называемого принципа разрежённости. Это значит, что обработка входящих данных производится только частью нейросети, тогда как традиционные «плотные модели» задействуют все её участки. Принцип разрежённости используется, например, Google в проекте Pathways. Разработка Arrakis началась прошлой осенью, а обучение модели начали этой весной. Но разработчики OpenAI быстро поняли, что система действует слишком медленно. В течение месяца они пытались произвести настройку модели, но затем руководство закрыло проект. Причины сбоя установить пока не удалось: принцип разрежённости хорошо работал в ранних тестах, но в более крупной модели проявить себя не сумел. Несмотря на неудачу, OpenAI сможет использовать наработки Arrakis и мультимодальной модели Gobi в других проектах. Большие надежды на Arrakis возлагали и в Microsoft: сейчас софтверный гигант переключился на разработку менее дорогих языковых моделей, поскольку высокая себестоимость обслуживания генеративного ИИ начала угрожать её бизнесу. Arrakis генерировала не только текст, но также изображения и видео; у неё было меньше галлюцинаций, чем у GPT-4; и она могла работать в качестве автономного агента. Модель была частично обучена на синтетических данных, а её выход планировался на 2024 год. Проект мог вылиться в целую систему создания более эффективных моделей — есть версия, что он способствовал разработке нейросети GPT-3.5 Turbo. OpenAI открыла доступ к генератору изображений DALL-E 3 для подписчиков ChatGPT Plus и Enterprise
20.10.2023 [04:35],
Владимир Фетисов
OpenAI расширяет доступность своего новейшего генератора изображений по текстовому описанию DALL-E 3. Компания объявила, что на этой неделе ИИ-алгоритм станет доступен подписчикам ChatGPT Plus и ChatGPT Enterprise. Разработчики заявили, что для этой модели был подготовлен пакет мер по повышению уровня безопасности, что указывает на её готовность к расширенному запуску. Модель DALL-E 3 была анонсирована в прошлом месяце, и разработчики показали, насколько она лучше справляется с генерацией картинок по сравнению с предыдущей версией алгоритма DALL-E 2. Пользователи могли убедиться в этом, составляя в ChatGPT более длинные и детальные описания изображений, которые должен создать генератор. Ранее в этом месяце модель DALL-E 3 была интегрирована в службы Bing Chat и Bing Image Creator. Разработчики признают, что предыдущие версии генератора вызывали опасения, поскольку могли использоваться для создания фейковых изображений с целью распространения дезинформации или ведения другой неправомерной деятельности. В DALL-E 3 реализованы инструменты для ограничения генерации картинок определённых тематик. К примеру, алгоритм будет отклонять запросы, содержащие имена общественных деятелей или какие-либо «вредные побуждения». Разработчики ввели ограничения, которые не позволят DALL-E создавать изображения в стиле живущих ныне художников. OpenAI также заявила о наличии классификатора изображений, который позволяет с точностью до 99 % определить, была ли та или иная картинка сгенерирована с помощью DALL-E. OpenAI официально разрешила ChatGPT ходить в интернет
19.10.2023 [13:28],
Павел Котов
OpenAI доложила, что бета-тест функции подключения ChatGPT к интернету успешно завершён, и теперь воспользоваться ей смогут все пользователи, оформившие платную подписку на сервис. Функция Browse with Bing платформы ChatGPT доступна для каждого, кто оформил подписку Plus или Enterprise. Она открывает чат-боту доступ к актуальной информации, не ограничивая его знаниями, полученными в период обучения до сентября 2021 года. Существуют несколько плагинов и приложений, связывающих ChatGPT с интернетом, но официальная реализация данной функции свидетельствует, что этические ограничения ИИ, по мнению OpenAI, способны выдержать свободный доступ ко всем материалам в Сети. Первоначально OpenAI открыла ChatGPT доступ к интернету в рамках функции Browse with Bing ещё в марте, но была вынуждена приостановить работу функции несколько месяцев спустя: платформа «некорректно» отображала контент, а пользователи быстро выяснили, что она открывает доступ к платному контенту на разных ресурсах. Бета-тестирование функции вернулось в конце сентября. В последнем обновлении ChatGPT предложил голосовой интерфейс: чат-бот распознаёт голосовые запросы и сам отвечает «вслух» благодаря синтезатору речи. Он также принимает запросы в формате изображений и даёт ответы в контексте того, что изображено на предлагаемых ему картинках. Разработчик ChatGPT задумал создать собственный ИИ-чип, чтобы снизить зависимость от NVIDIA
06.10.2023 [12:19],
Владимир Мироненко
Разработчик чат-бота на базе искусственного интеллекта ChatGPT, компания OpenAI, изучает возможность создания собственных ИИ-чипов. Это позволит снизить зависимость от производителей ускорителей, включая доминирующую на рынке компанию NVIDIA, а также обеспечить необходимое количество чипов для дальнейшей работы.
По данным источников Reuters, в прошлом году в OpenAI обсуждались различные варианты решения проблемы нехватки весьма недешёвых ИИ-чипов. Рассматривались возможность создания собственного ИИ-чипа, более тесное сотрудничество с другими производителями таких чипов, включая NVIDIA, а также диверсификация поставщиков ускорителей вычислений. Гендиректор Open AI Сэм Альтман (Sam Altman) назвал приобретение большего количества ИИ-чипов главным приоритетом для компании. Он указал на две основные проблемы: нехватку передовых ускорителей вычислений, на которые опирается ПО OpenAI, и «невероятные затраты» на эксплуатацию аппаратного обеспечения, отвечающего за работу продуктов компании. OpenAI разрабатывает технологии генеративного ИИ на мощном суперкомпьютере. Его построила Microsoft и он включает в себя 10 000 графических процессоров NVIDIA. Согласно оценкам аналитика Bernstein Стейси Расгон (Stacy Rasgon), выполнение каждого запроса в ChatGPT обходится компании примерно в $0,04. Если количество запросов вырастет до десятых долей от количества поисковых запросов Google, то для работы чат-бота потребуется ИИ-чипов примерно на $48,1 млрд, а для поддержания стабильности работы понадобится ещё ускорителей на сумму около $16 млрд в год. Пока неясно, будет ли OpenAI заниматься созданием собственного ИИ-чипа. Затраты на это могут составить сотни миллионов долларов в год, причём даже при выделении такой суммы успех не гарантирован. Ускорить процесс можно было бы с помощью приобретения компании, производящей чипы. По данным источника, OpenAI рассматривала такой вариант, и даже провела комплексную проверку потенциального объекта приобретения. Однако выяснить название этой компании не удалось. Следует отметить, что реализация планов OpenAI по созданию собственного чипа, даже если это будет приобретение компании, займёт несколько лет, и компания тем временем будет зависеть от сторонних поставщиков, таких как NVIDIA и AMD. ИИ-генератор изображений DALL-E 3 появился в Bing, но опробовать его трудно из-за ажиотажа
04.10.2023 [16:58],
Павел Котов
Всем пользователям служб Bing Chat и Bing Image Creator стала доступна новейшая модель искусственного интеллекта — генератор изображений OpenAI DALL-E 3. На прошлой неделе система была развёрнута для пользователей Bing Enterprise, затем к ним присоединились пользователи Bing Image Creator, а теперь она открыта для всех. Таким образом, поисковая машина Bing получила доступ к DALL-E 3 даже раньше, чем OpenAI ChatGPT — это должно случиться до конца месяца, но только для пользователей, оформивших платную подписку. Система лучше понимает команды, а также генерирует более креативные и фотореалистичные изображения. Кроме того, она спроектирована так, чтобы её было проще использовать: DALL-E 3 интегрировали в Bing Chat и ChatGPT, а не стали делать отдельным продуктом. Пользователи могут постепенно совершенствовать изображение с чат-ботом, а не бесконечно упражняться в составлении запросов. К сожалению, на текущий момент пользоваться DALL-E 3 через Bing довольно затруднительно: генератор изображений вызвал большой ажиотаж, и сейчас его серверы перегружены, а служба сообщает о «невозможности обрабатывать новые запросы». Это подтвердил и сотрудник Microsoft Михаил Парахин: «Мы ожидали большого интереса, но не ожидали, что он будет настолько большим». Одной из ключевых особенностей генератора изображений в новом интерфейсе является его способность не только создавать картинки, но и предлагать варианты дальнейших действий. К примеру, в диалоге появляются шаблоны вроде «Можешь добавить радугу на заднем плане?», «Сделай его кошкой вместо собаки» или «Добавь птиц вокруг водопада». Грядёт «iPhone в мире ИИ» — Джони Айв и Open AI создадут революционное устройство на деньги SoftBank
28.09.2023 [13:54],
Павел Котов
Ответственная за ChatGPT компания OpenAI ведёт переговоры с бывшим дизайнером Apple Джони Айвом (Jony Ive) и главой японского финансового конгломерата SoftBank Масаёси Соном (Masayoshi Son) на предмет выпуска «iPhone в мире искусственного интеллекта» — японская сторона готова вложить в проект $1 млрд. Глава OpenAI Сэм Альтман (Sam Altman) и Джони Айв обсуждали в студии дизайнера в Сан-Франциско внешний вид потребительского устройства на основе технологий OpenAI. Их цель — разработка естественного и интуитивно понятного пользовательского интерфейса для взаимодействия с платформой ИИ. Они надеются, что устройство произведёт революцию аналогично iPhone, сенсорный интерфейс которого открыл миру возможности мобильного интернета. Сейчас создатели проекта пытаются выбрать конструкцию устройства, рассматривая множество различных идей. В некоторых встречах участвовал основатель и глава SoftBank Масаёси Сон — он отвёл центральную роль в проекте компании Arm, 90 % которой контролирует его конгломерат, и предложил финансовую поддержку. Альтман, Айв и Сон обсудили создание компании, которая сможет задействовать ресурсы всех трёх соучредителей, причём SoftBank может вложить в проект более $1 млрд. Обсуждение проекта вышло на «серьёзный» уровень, пишет Financial Times, но сделка пока не согласована, и может пройти ещё несколько месяцев, прежде чем будет объявлено о новом игроке на рынке мобильных устройств. По мере того как рынок смартфонов завершает фазу роста, в Кремниевой долине начинают задумываться о том, что сможет заменить смартфоны. Наиболее перспективными направлениями пока считаются гарнитуры виртуальной реальности и умные колонки — но пока ничто и близко не может сравниться со смартфонами, которыми сейчас пользуются миллиарды людей по всему миру. Джони Айв, который участвовал в разработке iPhone и множество других очень успешных продуктов Apple, ранее заявлял, что чувствует себя ответственным за появление смартфонов в их теперешнем виде, и за вызываемое ими привыкание. Устройство, которое он планирует выпустить с OpenAI, предполагает меньшую зависимость от экранов. ChatGPT снова получил доступ в интернет для поиска ответов
28.09.2023 [10:02],
Павел Котов
OpenAI сообщила, что ChatGPT снова получил возможность искать информацию в интернете — чат-бот предлагает ответы, взятые напрямую из «актуальных и авторитетных» источников, которые он цитирует. Пока функция Browse with Bing доступна для подписчиков Plus и Enterprise, но впоследствии компания пообещала её «всем пользователям». Прямой доступ в интернет есть у Bing Chat в Windows, Edge и в плагинах других браузеров — система предоставляет актуальную информацию, как и Google Bard. Оба чат-бота добавляют к ответам ссылки на источники — это же делает теперь и ChatGPT. Пока функция доступна только в веб-версии сервиса, причём её необходимо отдельно включать в настройках. На практике поиск в интернете работает не очень быстро, но всё-таки даёт результат, и если учесть склонность систем искусственного интеллекта к галлюцинациям, то возможность быстро проверить информацию трудно переоценить. Ранее OpenAI уже открывала ChatGPT доступ в интернет, но в июне Browse with Bing пришлось отключить из-за злоупотреблений: пользователи быстро сообразили, что могут легко уговорить чат-бот предоставить им платный контент по прямому URL-адресу. После этого OpenAI добавила к автоматическому сетевому сканеру строку user-agent со значением GPTBot, что позволило веб-мастерам закрывать платформе доступ к своим сайтам или его разделам через служебный файл robots.txt. OpenAI готовит продажу акций, за счёт чего цена компании может взлететь до $90 млрд
27.09.2023 [13:40],
Дмитрий Федоров
OpenAI, разработчик ChatGPT, в настоящее время ведёт переговоры о продаже акций, что, по данным The Wall Street Journal, может увеличить стоимость компании до $90 млрд. Вероятно, речь идёт о продаже существующих акций сотрудниками компании, а не выпуске новых акций. Это подчёркивает неутихающий интерес к развитию ИИ и его влиянию на технологическую индустрию. OpenAI, часть акций которой принадлежит Microsoft, находится в центре внимания после утечки информации о возможной продаже акций. Согласно источникам The Wall Street Journal, компания рассматривает возможность продажи акций, что может повысить её стоимость с текущих $29 млрд до $80-90 млрд. В апреле OpenAI уже привлекла инвестиции в размере более $300 млн от таких известных венчурных компаний, как Sequoia Capital, Andreessen Horowitz, Thrive и K2 Global. Это произошло независимо от другого крупного инвестиционного раунда от Microsoft, закрытого в январе. Тогда, по слухам, в OpenAI было вложено ещё около $10 млрд. ChatGPT, разработанный OpenAI, за короткое время стал одним из наиболее успешных технологических продуктов на основе ИИ, способных писать эссе, стихи, резюме и даже программный код по текстовым запросам пользователей. Совсем недавно ChatGPT стал ещё более продвинутым, принимая в качестве запросов пользователей не только текст, но и изображения и голосовые команды. Потенциальная продажа акций и возможное увеличение стоимости OpenAI подчёркивают важность ИИ в современном мире. Текущая тенденция может открыть новые перспективы для исследований и разработок в области ИИ, давая новые возможности для общества и бизнеса. Spotify будет дублировать подкасты на иностранные языки голосами самих авторов с помощью ИИ
25.09.2023 [18:25],
Сергей Сурабекянц
Сотрудничество Spotify с OpenAI позволит подкастерам синтезировать собственный голос для автоматического создания версий своих шоу на иностранных языках. Это основная идея новой функции голосового перевода Spotify на базе ИИ, которая воспроизводит подкасты на других языках, используя синтезированный голос создателя. Теперь подкастеру достаточно просто «щёлкнуть выключателем» и мгновенно заговорить на другом языке. Компания уже заключила договоры с несколькими подкастерами о переводе созданных ими англоязычных эпизодов на испанский с помощью своего нового инструмента, и планирует в ближайшие недели выпустить переводы на французский и немецкий языки. Первыми будут переведены эпизоды подкастеров с такими громкими именами, как Дакс Шепард (Dax Shepard), Моника Пэдман (Monica Padman), Лекс Фридман (Lex Fridman), Билл Симмонс (Bill Simmons) и Стивен Бартлетт (Steven Bartlett). В дальнейшем Spotify планирует расширить эту группу, включив в неё The Rewatchables и предстоящее шоу Тревора Ноа (Trevor Noah). Основой функции перевода является ИИ-инструмент синтезирования голоса OpenAI Whisper, который умеет как транскрибировать английскую речь, так и переводить на английский с других языков. Но инструмент Spotify выходит за рамки простого перевода речи в текст — эта функция переведёт подкаст на другой язык и воспроизведёт его в синтезированной версии голосом подкастера. «Сопоставляя собственный голос создателя, Voice Translation даёт слушателям по всему миру возможность открывать для себя новых подкастеров и вдохновляться ими более аутентично, чем когда-либо прежде», — уверен Зиад Султан (Ziad Sultan), вице-президент Spotify по персонализации. OpenAI сегодня утром объявила о запуске инструмента, который может создавать «человеческий звук из просто текста и нескольких секунд образца речи». Доступность нового инструмента будет существенно ограничена из-за опасений по поводу безопасности и конфиденциальности. Вероятно, это одна из причин, почему технология перевода Spotify пока тестируется только с «избранной группой» подкастеров, а компания не делает прогнозов о массовом внедрении новой функции. ChatGPT научился понимать голосовые команды и работать с изображениями
25.09.2023 [18:22],
Сергей Сурабекянц
OpenAI расширила варианты взаимодействия с ChatGPT. Новая версия чат-бота теперь принимает в качестве промтов (подсказок) не только текст, но также изображения и голосовые команды. Для коммерческих пользователей новые возможности станут доступны в ближайшие две недели, а остальным придётся какое-то время подождать. Общение голосом с ChatGPT в чём-то похоже на разговор с любым голосовым помощником, но, по утверждению OpenAI, качество ответов значительно выше благодаря улучшенной базовой технологии. Пользователь нажимает кнопку и произносит вопрос, ChatGPT преобразует его в текст и передаёт в большую языковую модель, получает ответ, преобразует его обратно в речь и произносит ответ вслух. Новые возможности ChatGPT опираются на большую языковую модель Whisper, которая выполняет значительную часть работы по преобразованию речи в текст и обратно. По утверждению OpenAI, новая модель может генерировать «человеческий голос из текста и образца речи длиной в несколько секунд». Пока доступно пять вариантов голоса ChatGPT, но OpenAI видит в этой модели гораздо больший потенциал. Возможность создать синтезированный голос любого человека, опираясь всего на несколько секунд его речи, даёт широкое поле деятельности для киберпреступников, признаёт OpenAI в анонсе новых функций: «Это новые риски, такие как возможность злоумышленников выдать себя за общественных деятелей или совершить мошенничество». По утверждению компании, модель недоступна для широкого использования именно по этой причине: OpenAI планирует ограничить модель конкретными вариантами использования и партнёрскими соглашениями. Что касается запроса в ChatGPT при помощи изображения, пользователю достаточно сфотографировать или нарисовать предмет своего интереса и отправить боту. В процессе общения можно применять текстовые или голосовые подсказки, чтобы уточнить запрос или ограничить область поиска. Очевидно, что использование изображений в качестве подсказки для чат-бота также имеет свои потенциальные проблемы. В первую очередь это касается запроса о личности человека на фотографии, хотя OpenAI заявляет, что ограничила «способность ChatGPT анализировать и делать прямые заявления о людях» как по соображениям точности, так и по соображениям конфиденциальности. Спустя почти год после первого запуска ChatGPT OpenAI продолжает расширять границы применения и использования своего чат-бота, пытаясь избежать связанных с ним проблем и недоработок. В частности, компания намеренно ограничивает возможности своих новых ИИ-моделей. Но такой подход не будет работать вечно. По мере того, как все больше людей используют голосовое управление и поиск изображений, а ChatGPT становится мультимодальным и полезным виртуальным помощником, удерживать ИИ в рамках будет все труднее и труднее. Microsoft интегрирует в Bing продвинутый ИИ-генератор изображений DALL-E 3
22.09.2023 [00:01],
Николай Хижняк
Компания Microsoft сообщила, что интегрирует генератор изображений DALL-E 3 на базе искусственного интеллекта, разработанный компанией OpenAI, в собственный ИИ-чат-бот Bing. Представленный на днях генератор изображений DALL-E 3, который в октябре появится в составе чат-бота ChatGPT (точнее в его платных версиях Plus и Enterprise), лучше понимает запросы пользователей и более точно генерирует изображения по сравнению с моделью DALL-E 2. В Microsoft не уточнили, когда именно DALL-E 3 появится в составе Bing. В компании также сообщили, что добавили в поисковик Bing новую функцию для шопинга. Bing может задавать пользователем вопросы о том, как они планируют использовать тот или иной продукт, а также более персонализированные вопросы, чтобы в конечном итоге подобрать максимально правильный товар, подходящий под запросы и нужды пользователя. Система также позволит искать и использовать скидочные коды. Microsoft одной из первых интегрировала ИИ-технологии OpenAI в свой поисковик Bing. С помощью новых функций компания стремится усилить поисковую платформу. С февраля этого года в Bing присутствует чат-бот, который может отвечать на вопросы пользователя, искать новости, создавать тщательно подобранные руководства по покупке и многое другое. Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT
21.09.2023 [01:08],
Николай Хижняк
Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2. «Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений. Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже. OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь. «При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI. «Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI. В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |