реклама
Теги → искусственный интеллект
Быстрый переход

OpenAI представила думающую языковую модель o1

Компания OpenAI представила новую языковую модель o1, обладающую способностью к рассуждению и логически решать задачи. В отличие от предыдущих моделей, o1 способна имитировать человеческий процесс мышления, разбивая сложные задачи на более простые шаги, анализируя разные подходы и исправляя собственные ошибки.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большая языковая модель (LLM) o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов-людей. По программированию o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89 % людей на платформе Codeforces. По математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), продемонстрировав способность решать задачи, предназначенные для самых одарённых школьников, сообщает OpenAI на своём сайте.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В естественных науках модель превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии. «Это не означает, что o1 умнее любого кандидата наук, — поясняют разработчики. — Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».

Модель o1 также продемонстрировала превосходство над предыдущими моделями в различных тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, новая модель значительно превосходит предшествующую версию GPT-4o на большинстве задач, связанных с логическим мышлением. «Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объёма ренфорсмент-обучения и времени, потраченного на размышления», — отмечают в компании. В частности, в тестах AIME модель o1 решила в среднем 83 % задач, тогда как результат GPT-4o — 13 %.

Модель о1 значительно меньше галлюцинирует, чем GPT-4o. Однако она медленнее и дороже. Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения. Кроме того, новая модель может манипулировать данными, подгоняя решение под результат.

Секрет успеха кроется в фундаментально новом алгоритме обучения — «цепочке мыслей». Модель может улучшать эту цепочку, обучаясь по методу «обучение с подкреплением», благодаря которому распознаёт и исправляет свои ошибки, разбивает сложные шаги на более простые и пробует разные подходы в решении задач. Эта методология значительно улучшает способность модели к рассуждению, которая «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос».

OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Компания признаёт, что предстоит ещё много работы, чтобы сделать o1 такой же простой в использовании, как и текущие модели. Также подчёркивается безопасность и этичность новой модели, так как её рассуждения можно контролировать, предотвращая потенциально нежелательное поведение. И прежде чем выпустить o1-preview для публичного использования, со стороны OpenAI были проведены тесты на безопасность.

Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов. Для сравнения, GPT-4o предлагает цену в $5 за 1 млн входных токенов и $15 за миллион выходных.

Китайские техногиганты бросили вызов США в гонке ИИ

За последние 18 месяцев Alibaba, Tencent и другие китайские компании представили собственные ИИ-модели, стремясь конкурировать с американскими лидерами рынка, такими как OpenAI, Google и Meta. Несмотря на строгое регулирование Пекина, китайскому бизнесу удаётся активно развивать генеративный ИИ, способный создавать текст, изображения и видео по запросам пользователей. Амбиции Поднебесной и намерение стать мировым лидером в области ИИ добавляют новый уровень технологического противостояния между Китаем и США.

 Источник изображения: vocablitz / Pixabay

Источник изображения: vocablitz / Pixabay

Baidu, одна из крупнейших китайских интернет-компаний, стала пионером в стране, запустив собственный генеративный ИИ. Её флагманская ИИ-модель лежит в основе Ernie Bot — ИИ-чат-бота, разработанного для прямой конкуренции с ChatGPT. По заявлению китайской компании, Ernie Bot уже насчитывает внушительную базу в 300 млн пользователей. До выхода оптимизированной версии «Turbo» Baidu утверждала, что возможности её последней версии — Ernie 4.0 — сопоставимы с GPT-4 компании OpenAI. Эта базовая модель демонстрирует продвинутые когнитивные способности, включая понимание контекста и логическое рассуждение, что ставит её в один ряд с ведущими мировыми разработками в этой области. Как и другие компании, Baidu продаёт возможность использования своей ИИ-модели через подразделение облачных вычислений.

Работающая в сфере электронной коммерции и облачных технологий Alibabaв 2023 году представила свой набор базовых ИИ-моделей под названием Tongyi Qianwen. Эта экосистема, часто сокращаемая до Qwen, включает различные специализированные версии ИИ, способные выполнять широкий спектр задач. Например, одна ИИ-модель специализируется на создании контента и решении сложных математических задач, а другая лучше интерпретирует аудиоинформацию и даёт текстовые ответы. Примечательно, что некоторые версии ИИ-моделей Qwen находятся в открытом доступе, но с определёнными ограничениями. В мае 2023 года Alibaba сообщила, что её ИИ-модели были внедрены более чем 90 000 корпоративными клиентами.

Tencent, другой технологический конгломерат, известный своими инновациями в сфере социальных медиа и игровой индустрии, не отстаёт от конкурентов. В 2023 году компания запустила собственную базовую ИИ-модель под названием Hunyuan, доступную через облачный бизнес Tencent, что позволяет компаниям интегрировать её возможности в свои продукты и сервисы. По заявлению Tencent, Hunyuan может применяться в различных сферах — от игр до социальных сетей и электронной коммерции. ИИ-модель обладает развитыми способностями обработки китайского языка, продвинутым логическим мышлением и способна генерировать изображения и распознавать текст. Tencent, управляющая WeChat — крупнейшим в Китае мессенджером с более чем миллиардом активных пользователей, в 2024 году запустила ИИ-чат-бот на основе Hunyuan, известный как Yuanbao, который обладает уникальной способностью извлекать информацию и контент непосредственно из WeChat.

Huawei, глобальный лидер в сфере телекоммуникаций и потребительской электроники, выбрала нестандартный подход к развитию ИИ, создав линейку ИИ-моделей Pangu. В отличие от универсальных решений конкурентов, Huawei разработала ряд специализированных ИИ-моделей, ориентированных на конкретные отрасли: государственное управление, финансы, производство, горнодобывающую промышленность и метеорологию. Этот подход позволяет предложить клиентам высокоэффективные решения, учитывающие специфику их сферы деятельности. Примером эффективности специализированных ИИ-моделей Huawei служит Pangu-Weather. Компания заявляет, что эта модель способна предсказать траекторию тайфуна на 10 дней вперёд всего за 10 секунд, а не за четыре-пять часов, как это было раньше. Эти ИИ-модели, продаваемые через бизнес облачных вычислений компании, также могут поддерживать генеративные функции, такие как генерация программного кода и виртуальных аватаров людей.

ByteDance, компания, стоящая за глобальным феноменом TikTok, поздно вступила в гонку ИИ и запустила собственную ИИ-модель по имени Doubao только в начале 2024 года. Однако компания компенсировала отставание агрессивной ценовой политикой, предложив доступ к своей ИИ-модели по более низкой цене, чем у конкурентов. Doubao способна на генерацию голосов и создание программного кода, что делает её привлекательной для широкого круга пользователей. Стратегия ByteDance по выходу на рынок ИИ с конкурентной ценой и широкой функциональностью отражает остроту конкуренции в китайском секторе ИИ. Это также демонстрирует, как компании, ранее не специализировавшиеся на ИИ, активно включаются в гонку, расширяя свои технологические портфели и стремясь занять нишу в быстрорастущем сегменте рынка.

Samsung начала массовое производство памяти QLC V-NAND 9-го поколения для ИИ

Спустя всего 4 месяца после запуска TLC V-NAND 9-го поколения, Samsung объявил о начале массового производства аналогичной памяти типа QLC, предлагая рынку более широкую линейку передовых решений для хранения данных. Новая память обеспечивает оптимальную производительность для самых различных сфер применения, в том числе для задач искусственного интеллекта (ИИ).

 Источник изображения: Samsung Electronics

Источник изображения: Samsung Electronics

Компания Samsung Electronics объявила о начале массового производства 9-го поколения вертикальной NAND-памяти (V-NAND) с четырьмя битами на ячейку (Quad Level Cell, QLC) ёмкостью 1 Тбит. «Успешный запуск массового производства QLC V-NAND 9-го поколения всего через четыре месяца после TLC-версии позволяет нам предложить полную линейку передовых SSD-решений, отвечающих потребностям эпохи искусственного интеллекта», — сказал Сон Хой Хур (SungHoi Hur), исполнительный вице-президент и руководитель подразделения флеш-памяти и технологий Samsung.

Samsung планирует расширить применение QLC V-NAND 9-го поколения, начиная с фирменных потребительских продуктов и заканчивая мобильной универсальной флеш-памятью (UFS), SSD для клиентских ПК и серверов, включая решения для поставщиков облачных сервисов. Новое поколение памяти отличается рядом технологических возможностей, лучше сказать — прорывов. Так, Channel Hole Etching (технология травления каналов) от Samsung позволила добиться максимального количества слоёв в отрасли с двухуровневой структурой. При этом, используя опыт, накопленный при разработке трёхуровневой структуры ячеек (TLC) V-NAND 9-го поколения, специалисты Samsung оптимизировали площадь ячеек и периферийных схем, достигнув ведущей в отрасли плотности битов, которая примерно на 86 % выше, чем у QLC V-NAND предыдущего поколения.

Помимо высокой плотности, QLC V-NAND девятого поколения отличается повышенной производительностью и надёжностью благодаря также технологиям Designed Mold, Predictive Program и Low-Power Design. Технология Designed Mold регулирует расстояние между Word Lines (WL) для обеспечения однородности и оптимизации характеристик ячеек во всех слоях. Технология Predictive Program прогнозирует и контролирует изменения состояния ячеек, чтобы минимизировать ненужные действия. В результате Samsung удалось удвоить скорость записи и повысить скорость ввода/вывода данных на 60 %, а энергопотребление снизить при чтении и записи данных примерно на 30 % и 50 % соответственно благодаря использованию Low-Power Design.

ИИ превзошёл учёных в генерации инновационных исследовательских идей

Большие языковые модели (LLM) оказались способны генерировать новые научно-исследовательские идеи на уровне экспертов. Более того, согласно новому исследованию, эти идеи оказались более оригинальными и интересными, чем предложенные специалистами. Это ставит под вопрос уникальность человеческого интеллекта в сфере научных инноваций и открывает новые горизонты для развития ИИ в научном сообществе.

 Источник изображения: NickyPe / Pixabay

Источник изображения: NickyPe / Pixabay

Достижения в области больших языковых моделей вызвали волну энтузиазма среди исследователей. Оказалось, что такие ИИ-модели, как ChatGPT компании OpenAI и Claude компании Anthropic, способны самостоятельно генерировать и подтверждать новые научные гипотезы. Считалось, что создание нового знания и совершение научных открытий являются исключительной прерогативой человека, в отличие от механического комбинирования ИИ знаний из обучающих данных. Однако, уже потеснив людей в сферах художественного самовыражения, музыки и программирования, теперь ИИ замахнулся на науку, показав способность генерировать исследовательские идеи — в среднем более новые, чем предлагали учёные.

Чтобы проверить эту гипотезу, было проведено исследование в области обработки естественного языка (NLP). NLP — это область ИИ, которая занимается коммуникацией между людьми и ИИ на языке, понятном обеим сторонам. Она охватывает не только базовый синтаксис, но и нюансы языка, понимание контекста, а в последнее время — даже вербальный тон и эмоциональные оттенки речи. В исследовании приняли участие 100 экспертов по NLP (кандидаты наук и доктора из 36 различных институтов), которые вступили в своеобразное научное соревнование с «идейными агентами» на основе LLM. Целью было выяснить, чьи исследовательские идеи окажутся более оригинальными, интересными и осуществимыми.

Для чистоты эксперимента 49 экспертов сформулировали идеи по 7 конкретным темам в области NLP, в то время как ИИ, специально обученный исследователями, генерировал идеи по тем же темам. Чтобы мотивировать участников «мозгового штурма» на создание качественных идей, за каждую предложенную экспертами концепцию выплачивалось $300, а каждая из пяти лучших человеческих идей получала дополнительную $1000. По завершении работы над проектом LLM использовался для стандартизации стилей написания каждой работы с сохранением оригинального содержания, чтобы уравнять шансы и сделать исследование максимально непредвзятым.

 Сравнение новизны научных идей, предложенных людьми и ИИ, по трём условиям: идеи людей, идеи ИИ и идеи ИИ с доработкой человеком. Источник изображения: @ChengleiSi / X

Сравнение новизны научных идей, предложенных людьми и ИИ, по трём условиям: идеи людей, идеи ИИ и идеи ИИ с доработкой человеком. Источник изображения: @ChengleiSi / X

Затем все присланные работы были рассмотрены 79 привлечёнными экспертами, которые вслепую оценили все исследовательские идеи. Группа экспертов представила 298 рецензий, дав каждой идее от двух до четырёх независимых отзывов. Результаты оказались поразительными. Идеи, сгенерированные ИИ, получили статистически значимо более высокие оценки по критериям новизны и увлекательности по сравнению с идеями людей. При этом по критерию осуществимости идеи ИИ оказались немного ниже, а по эффективности — немного выше, чем идеи людей, хотя эти различия не были статистически значимыми.

Исследование также выявило некоторые недостатки в работе ИИ, такие как отсутствие разнообразия идей. Даже при чётком указании не повторяться, ИИ быстро про это забывал. Кроме того, ИИ не смог последовательно проверять и оценивать идеи и получал низкие баллы за согласие с человеческими суждениями. Важно отметить, что исследование также выявило определённые ограничения в методологии. В частности, оценка «оригинальности» идеи, даже группой экспертов, остаётся субъективной, поэтому планируется провести более комплексное исследование, в котором идеи, генерируемые как ИИ, так и людьми, будут полностью оформлены в проекты, что позволит более глубоко изучить их влияние в реальных сценариях. Тем не менее, первые результаты исследования, безусловно, впечатляют.

 Сравнение оценок научных идей, предложенных людьми и ИИ, по пяти ключевым критериям: новизна, увлекательность, осуществимость, эффективность и общая оценка. Источник изображения: @ChengleiSi / X

Сравнение оценок научных идей, предложенных людьми и ИИ, по пяти ключевым критериям: новизна, увлекательность, осуществимость, эффективность и общая оценка. Источник изображения: @ChengleiSi / X

Сегодня, когда ИИ-модели, хотя и становятся невероятно мощными инструментами, они всё ещё грешат своей ненадёжностью и склонностью к «галлюцинациям», что в контексте научного подхода, требующего абсолютной точности и достоверности информации, становится критическим. По некоторым оценкам, не менее 10 % научных работ в настоящее время пишутся в соавторстве с ИИ. С другой стороны, не стоит недооценивать потенциал ИИ для ускорения прогресса в некоторых областях человеческой деятельности. Ярким примером тому может служить система GNoME компании DeepMind, которая за несколько месяцев совершила прорыв, эквивалентный примерно 800 годам исследований в области материаловедения, и сгенерировала структуру около 380 000 новых неорганических кристаллов, способных сделать революцию в самых разных сферах.

Сейчас ИИ — это самая быстро развивающаяся технология, которую когда-либо видело человечество, и поэтому разумно ожидать, что многие её недостатки будут исправлены в течение ближайших пары лет. Многие исследователи ИИ считают, что человечество приближается к рождению всеобщего сверхинтеллекта — точки, в которой ИИ общего назначения превзойдёт экспертные знания людей практически во всех областях. Способность ИИ генерировать более оригинальные и захватывающие идеи, чем учёные, может привести к переосмыслению процесса научного открытия и роли в нём человека.

OpenAI представит «думающий» ИИ «Strawberry» через 2 недели

OpenAI представит новый ИИ под названием «Strawberry» в составе своего популярного сервиса ChatGPT. Его запуск ожидается в течение ближайших двух недель, ориентировочно 26 сентября. Отличительной особенностью «Strawberry» станет способность «обдумывать» ответы перед их выдачей, что может значительно повысить качество взаимодействия пользователей с ИИ-чат-ботом.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Эти данные основаны на отзывах двух человек, уже протестировавших новую ИИ-модель. OpenAI, будучи пионером в сфере разработки больших языковых моделей, продолжает стимулировать не только интерес к ИИ, но и значительные инвестиции в эту область. Всё это подтверждается растущим числом компаний, стремящихся интегрировать ИИ в свои продукты и услуги. OpenAI, получающая существенную поддержку от Microsoft, недавно сообщила, что у неё более миллиона пользователей с платными подписками. Этот впечатляющий рост пользовательской базы во многом объясняется широким распространением чат-бота ChatGPT.

«Strawberry» выделяется среди других ИИ своим уникальным подходом к обработке запросов пользователей. В то время как большинство существующих ИИ-моделей стремится побыстрее дать ответ, «Strawberry» способна «обдумывать» свои ответы перед их выдачей. Этот инновационный процесс «размышления» потенциально может привести к более глубоким, точным и контекстуально релевантным ответам, что значительно повысит качество пользовательского опыта.

Ожидается, что новый ИИ будет интегрирован в ChatGPT, но при этом останется самостоятельным продуктом. Однако точный формат его предоставления пользователям пока остаётся неясным. Важно отметить, что первая версия «Strawberry» будет ограничена в своих возможностях — она сможет обрабатывать и генерировать только текстовую информацию. Это означает, что на данном этапе система не является мультимодальной и не способна работать с изображениями.

В первое время iPhone 16 обойдутся без ИИ — iOS 18.1 с Apple Intelligence выйдет только в октябре

Компания Apple сообщила сегодня, что функции на базе искусственного интеллекта Apple Intelligence в формате бета-версии станут доступны в составе iOS 18.1 в октябре этого года. То есть из коробки новые iPhone 16-й серии не будут поддерживать новейшие ИИ-возможности. Причём в первое время Apple Intelligence будут доступны только для пользователей из США.

 Источник изображений: Apple

Источник изображений: Apple

География выпуска Apple Intelligence со временем будет расширяться. В декабре компания сделает доступными ИИ-функции для жителей Австралии, Канады, Новой Зеландии, Южной Африки и Великобритании. В 2025 году планируется расширить поддержку на Китай, Францию, Японию и Испанию. Во всех этих странах Apple Intelligence будет выходить с поддержкой государственных языков.

Функции Apple Intelligence будут бесплатно доступны для владельцев iPhone 15 Pro, iPhone 16 и iPhone 16 Pro. Компьютеры Mac на базе процессоров Apple M1 и более новых также получат поддержку Apple Intelligence, равно как и планшеты iPad на компьютерных чипах Apple M-серии.

Apple официально не сообщила, когда будут выпущены те или иные функции экосистемы Apple Intelligence. Как пишет портал 9to5Mac, начиная с октября ожидается выпуск функции сводок уведомлений и электронной почты, новые возможности камеры, а также функции ИИ-редактирования изображений.

Согласно слухам, функции генерации изображений, такие как Genmoji для создания эмодзи по текстовым описания и Image Playgrounds, станут доступны в декабре.

Apple выпустит ИИ-генератор эмодзи Genmoji только в iOS 18.2

На прошедшей в этом году конференции WWDC 2024 компания Apple анонсировала функции на базе искусственного интеллекта Apple Intelligence. Несмотря на то, что iOS 18 будет представлена уже завтра на мероприятии Apple It’s Glowtime, многие ИИ-функции, такие как генератор уникальных эмодзи Genmoji, не будут доступны в этой версии операционной системы.

 Источник изображения: appleinsider.com

Источник изображения: appleinsider.com

По данным Bloomberg, Apple отложит развёртывание многих ИИ-функций до выхода обновления iOS 18.2. К таким функциям относятся инструмент Image Playground для генерации изображений по текстовому описанию и Genmoji для создания уникальных эмодзи по текстовым подсказкам. В бета-версиях ОС для разработчиков они станут доступны раньше, но простым пользователям, вероятно, придётся ждать до декабря.

Таким образом, на момент запуска iOS 18 пользователям будет доступна функция Photo Clean Up и несколько инструментов для взаимодействия с текстом. В это же время широко разрекламированная интеграция ChatGPT с голосовым помощником Siri появится не ранее 2025 года.

Отмечается, что дольше других ждать появления функций Apple Intelligence придётся владельцам iPhone в Евросоюзе. В июне этого года Apple объявила, что не будет разворачивать ИИ-функции на iPhone в регионе из-за необходимости соответствия Закону о цифровых рынках. Тем не менее, не исключено, что в конечном счёте инструменты Apple Intelligence будут доступны по всему миру.

Процессор Apple iPhone 16 будет использовать архитектуру Armv9

Отсчёт до презентации нового поколения iPhone можно вести буквально в десятках часов, но это не мешает интересной информацией о новинках Apple появляться с завидным упорством. Издание Financial Times сообщило, что используемый в семействе iPhone 16 процессор A18 будет использовать архитектуру Armv9, отвечающую за реализацию функций генеративного искусственного интеллекта.

 Источник изображения: Apple

Источник изображения: Apple

Для британского разработчика Arm появление ещё одного процессора Apple с новой архитектурой будет означать заметный рост выручки, поскольку архитектура v9 подразумевает в два раза более высокие роялти по сравнению с архитектурой v8. Компания Apple является крупным клиентом Arm, у них заключено долгосрочное лицензионного соглашение, а iPhone формирует примерно половину выручки американского гиганта.

Представленная Arm в 2021 году архитектура v9 уже используется процессорами Apple семейства M4, которые можно встретить в компьютерах и планшетах этой марки. В продвижении смартфонов семейства iPhone 16 компания будет делать упор на комплекс функций Apple Intelligence, связанных с генеративным искусственным интеллектом. В линейке существующих смартфонов Apple поддержку данных функций получили только iPhone 15 Pro и iPhone 15 Pro Max, оснащённые наиболее производительным процессором A17 Pro, использующим архитектуру Armv8. В программной сфере поддержку Apple Intelligence обеспечит бета-версия операционной системы iOS 18.1, которая только готовится к выходу.

Музыкант с помощью ИИ обманом заработал $10 млн на стриминговых сервисах

По словам прокуроров, житель Северной Каролины (США) использовал искусственный интеллект для создания сотен тысяч поддельных песен поддельных групп, а затем выкладывал их на стриминговые сервисы, где ими наслаждалась аудитория поддельных слушателей. Теперь музыканту грозит по меньшей мере 20 лет тюрьмы.

 Источник изображения: Alexander Sinn/Unsplash

Источник изображения: Alexander Sinn/Unsplash

По сообщению The New York Times, 52-летний музыкант Майкл Смит (Michael Smith) был обвинён в мошенничестве, связанном с манипуляцией стриминговыми сервисами. Как утверждают прокуроры, он использовал нейросети для создания сотен тысяч фальшивых песен, которые затем размещал на популярных платформах, таких как Spotify, Apple Music и Amazon Music. В результате своего мошеннического плана Смит заработал по меньшей мере 10 миллионов долларов, подделывая роялти и обманывая слушателей, которых на самом деле не существовало.

Афера с фальшивыми исполнителями привела к серьёезным обвинениям, включая мошенничество с использованием электронной почты и заговор с отмыванием денег. Прокуроры заявили, что Смит использовал программное обеспечение для автоматического стриминга своих сгенерированных композиций, что создавало иллюзию, будто за ними стоят реальные исполнители. Утверждается, что у него были такие вымышленные группы, как «Callous Post», «Calorie Screams» и «Calvinistic Dust», которые выпускали треки с необычными названиями, подобными «Zygotic Washstands» и «Zymotechnical».

Прокуроры подчеркнули, что «Смит украл миллионы в виде роялти, которые должны были быть выплачены музыкантам, композиторам и другим правопреемникам, чьи песни транслировались легитимно». В итоге это дело стало первым уголовным делом, связанным с манипуляциями в области музыкальных стримингов, возбуждённым прокурором Южного округа Нью-Йорка. Если Смит будет признан виновным, он может получить до 20 лет тюремного заключения, причём по каждому из предъявленных обвинений.

Схема Смита была тщательно продумана. Он создал тысячи фальшивых аккаунтов для стриминга, купив электронные адреса на онлайн-площадках. Имея до 10 000 таких аккаунтов он, в виду трудоёмкости процесса, привлёк других пользователей (соучастников) для оплачиваемой помощи в их создании. Смит также разработал программное обеспечение для многократного воспроизведения своих песен с разных компьютеров, создавая видимость, что за музыкой следят реальные слушатели. В 2017 году, по данным прокуроров, он рассчитал, что сможет стримить свои треки 661 440 раз в день, что обеспечивало ему доход более $3000 в день.

Смит начинал с размещения своей собственной оригинальной музыки на стриминговых платформах, но вскоре осознал, что количество его треков недостаточно для получения значительных роялти. Попытки использовать музыку, принадлежащую другим, и предложение услуг по продвижению таких композиций не увенчались успехом. В 2018 году он объединился с главой компании, занимающейся ИИ-музыкой, и музыкальным промоутером для создания огромного каталога поддельных песен, которые загружал на стриминговые платформы.

По состоянию на июнь 2019 года Смит зарабатывал около 110 000 долларов в месяц, часть из которых уходила его соучастникам. В одном из своих писем в феврале этого года он похвалился, что достиг 4 миллиардов стримов и 12 миллионов долларов в виде роялти с 2019 года. Однако, когда стриминговые компании начали подозревать его в мошенничестве и уведомили его о получении «нескольких сообщений о злоупотреблениях», Смит в ответ на это заявил: «Это абсолютная неправда, это безумие! Никакого мошенничества здесь не происходит! Как я могу это обжаловать?»

YouTube больше не станет терпеть дипфейки и ИИ-плагиат

YouTube сказал твёрдое «нет» дипфейкам и ИИ-плагиату, защищая права авторов на платформе. По данным The Verge, компания начинает разработку новых инструментов, которые дадут создателям контента больше контроля над использованием их голоса и образа, сгенерированного искусственным интеллектом.

 Источник изображения: convertcrypto.ru

Источник изображения: convertcrypto.ru

Первый инструмент, получивший название «технология идентификации синтезированного пения», позволит артистам и авторам автоматически распознавать и управлять контентом YouTube, в котором их голоса имитируются с помощью искусственного интеллекта. Эта технология будет интегрирована в существующую систему идентификации авторских прав Content ID и запущена в рамках пилотной программы в следующем году.

Решение YouTube связано с растущим беспокойством в музыкальной индустрии по поводу использования ИИ для создания копий песен и голосов артистов. В открытом письме, опубликованном ранее в этом году, более 200 артистов, включая Билли Айлиш (Billie Eilish), Pearl Jam (Pearl Jam) и Кэти Перри (Katy Perry), назвали несанкционированное ИИ-копирование «посягательством на человеческий творческий потенциал» и потребовали от видеохостинга большей ответственности в этом отношении.

Помимо защиты голосов, YouTube на своей платформе также разрабатывает инструмент для выявления дипфейков лиц и образов авторов, актёров, музыкантов и спортсменов. Однако система ещё находится в разработке и не сообщается, когда она будет запущена.

В дополнение к этому, YouTube обещает бороться с теми, кто собирает данные с платформы для обучения ИИ-моделей. «Мы ясно дали понять, что несанкционированный доступ к контенту авторов нарушает наши условия обслуживания», — заявили представители YouTube. Однако это не помешало таким компаниям, как OpenAI, Apple, Anthropic, Nvidia, Salesforce и Runway AI, обучать свои ИИ-системы на тысячах скачанных с YouTube видео. Для защиты контента от ботов-сканеров YouTube планирует блокировать им доступ полностью и для этого начнёт инвестировать в систему обнаружения сбора данных.

Также заявляется, что разрабатываются способы предоставления авторам больше возможностей в отношении того, как сторонние компании, занимающиеся ИИ, всё же смогли бы использовать их контент на платформе, очевидно делясь заработками. Более подробная информация об этом выйдет позднее в этом году.

Новая статья: ИИтоги августа 2024 г.: безопасный спуск в урочище?

Данные берутся из публикации ИИтоги августа 2024 г.: безопасный спуск в урочище?

Microsoft отделалась предупреждением по антимонопольному расследованию квазислияния с Inflection AI

Управление по конкуренции и рынкам Великобритании (CMA) завершило предварительное расследование сделки Microsoft по найму команды стартапа Inflection AI, не найдя угрозы конкуренции на рынке. Однако регулятор предупредил, что подобные сделки в будущем могут быть подвергнуты более тщательному анализу.

 Источник изображения: Español / pixabay.com

Источник изображения: Español / pixabay.com

Специалисты CMA завершили расследование сделки, в рамках которой Microsoft в марте этого года наняла почти всю команду стартапа Inflection AI, включая двух его основателей, в том числе сооснователя Google DeepMind Мустафу Сулеймана (Mustafa Suleyman), но не обнаружили нарушений антимонопольного законодательства. Как поясняет издание TechCrunch, это значит, что полное расследование не будет проводиться.

Однако, несмотря на положительный исход для Microsoft, CMA подчеркнуло, что данная сделка всё же подпадает под определение «релевантной ситуации слияния», и подобные сделки, где крупные технологические компании нанимают ключевые команды небольших стартапов, могут в будущем подвергаться более тщательному изучению с точки зрения конкуренции, даже если речь не идёт о полноценном поглощении.

В основе решения регулятора лежит анализ ситуации, когда ключевые специалисты, обладающие уникальными знаниями в области ИИ, переходят в другую компанию, передавая ей свой опыт и разработки. «Передача сотрудников, в сочетании с другими тактическими соглашениями, означает, что две компании больше не являются отдельными», — написал в LinkedIn Джоэл Бэмфорд (Joel Bamford), исполнительный директор CMA. В данном случае, хоть Inflection AI и продолжает существовать как самостоятельная организация, её ключевые разработчики работают в Microsoft, что может быть расценено как слияние. При этом, важно отметить, что CMA не видит в данной сделке угрозы конкуренции, так как Inflection AI не был достаточно сильным конкурентом для Microsoft в области потребительских чат-ботов, таких как Copilot и ChatGPT.

Сделка Microsoft и Inflection AI является ярким примером нового тренда в сфере слияний и поглощений в сфере ИИ, который некоторые эксперты называют «квазислияние». Такой подход позволяет крупным компаниям получить доступ к необходимым технологиям и талантам, избегая при этом формального поглощения, которое могло бы вызвать более пристальное внимание регуляторов. Квазислияния могут принимать разные формы, от стратегических инвестиций до найма ключевых сотрудников, как в случае с Microsoft и Inflection AI.

В итоге, Microsoft избежала регуляторного вмешательства в этот раз, но CMA дало понять, что внимательно следит за сделками, в которых участвуют крупные технологические компании и небольшие стартапы в области ИИ, и готово рассматривать подобные сделки как «релевантные ситуации слияния», даже если речь не идёт о полном поглощении. То есть, квазислияния теперь станут объектом повышенного внимания со стороны регуляторов в будущем.

Интересно, что ранее также было запущено несколько расследований, связанных с аналогичными сделками в сфере ИИ. Речь идёт об инвестициях Microsoft во французский стартап Mistral AI и инвестициях Amazon на сумму $4 млрд в компанию Anthropic. Также CMA заинтересовалось связями Google и Anthropic, в который интернет-гигант инвестировал $300 млн в прошлом году и ещё 2 млрд долларов в этом.

Новая статья: Практикум по ИИ-рисованию, часть десятая: да будет FLUX!

Данные берутся из публикации Практикум по ИИ-рисованию, часть десятая: да будет FLUX!

В Windows 11 появится ИИ-функция поиска по аудио- и видеозаписям

В сборке Windows 11 под номером 27695, которая недавно стала доступна участникам программы предварительной оценки Windows Insider на канале Canary, появились упоминания функции «интеллектуального поиска мультимедиа». Этот инструмент задействует работающий локально ИИ-алгоритм для сканирования всех слов, которые есть в аудио- и видеозаписях, которые хранятся на устройстве пользователя.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Функция интеллектуального поиска мультимедиа описывается как инструмент, который расшифровывает все аудиофайлы и видео на пользовательском компьютере. В дальнейшем пользователь сможет задействовать поиск в Windows для того, чтобы отыскать на устройстве аудио или видео по словам, содержащимся в записи. По данным источника, в настоящее время данный инструмент недоступен ни в одной тестовой сборке Windows 11. Однако появление упоминаний новой функции указывает на то, что вскоре интеллектуальный поиск мультимедиа может стать доступен инсайдерам.

«Поиск по произнесённым словам в проиндексированных аудио- и видеофайлах. Нажимая «Я согласен», вы соглашаетесь на сканирование медиафайлов, хранящихся на вашем устройстве. При необходимости нужная модель будет загружена и установлена в фоновом режиме. После настройки ИИ-модели ей необходимо расшифровать ваши медиафайлы и проиндексировать их, прежде чем они будут добавлены в поиск по контенту. Мы сообщим вам, как только процесс настройки завершится», — говорится в описании функции интеллектуального поиска мультимедиа.

Похоже, что новая функция тесно связана с функцией Recall, которая станет доступна инсайдерам в октябре. Recall задействует работающие локально ИИ-алгоритмы для регистрации всех действий пользователя в приложениях, при просмотре веб-контента и др. Собранные таким образом данные отображаются на временной шкале, что позволяет пользователю легко найти интересующую его информацию из прошлого и продолжить взаимодействие с ней. Для работы Recall потребуется наличие компьютера с Windows 11 и производительным процессором со встроенным нейронным сопроцессором (NPU) для ускорения выполнения задач искусственного интеллекта.

В российские ПК с ИИ производства «Гравитон» попали процессоры AMD Ryzen 8000

Российский производитель электроники «Гравитон» представил новые настольные ПК Д31А и Д51А с поддержкой ИИ, основанные на передовых процессорах AMD с технологией Ryzen AI на архитектуре Zen 4 и разъёмом АМ5 — Ryzen 5 8600G, Ryzen 7 8700F и Ryzen 7 8700G. Новинки будут включены в реестр российской промышленной продукции Минпромторга России в следующем квартале.

Процессоры Ryzen 5 8600G, Ryzen 7 8700F и Ryzen 7 8700G включают ИИ-сопроцессор NPU, построенный на архитектуре XDNA с производительностью на уровне 16 TOPS, предназначенный для максимально эффективной обработки данных.

Как сообщает «Гравитон», ПК Д31А и Д51А на базе новых процессоров позволяют запускать ИИ-интерфейсы на локальных компьютерах и ускоряют приложения, опирающиеся на алгоритмы ИИ. Например, с их помощью ускоряется работа виртуальных помощников, редакторов изображений и видео — в том числе в режиме реального времени, включая видеоконференции. С развитием ПО с поддержкой алгоритмов ИИ, функциональность клиентских решений «Гравитон» с интегрированным ИИ будет расширяться.

Д31А и Д51А предлагаются с оперативной памятью DDR5, поддерживают шину PCI Express 4-го поколения и имеют ряд портов и видеовыходов для подключения внешних устройств.

window-new
Soft
Hard
Тренды 🔥
YouTube добавил в Shorts функцию Dream Screen — ИИ-генератор фонов для роликов 2 ч.
ПК с ИИ снижают производительность труда пользователей — люди не умеют правильно общаться с ИИ 2 ч.
Разработчики Path of Exile 2 раскрыли, чего ждать от раннего доступа — геймплей, подробности и предзаказ в российском Steam 3 ч.
Приключение Hela про храброго мышонка в открытом мире получит кооператив на четверых — геймплейный трейлер новой игры от экс-разработчиков Unravel 5 ч.
OpenAI случайно удалила потенциальные улики по иску об авторских правах 6 ч.
Скрытые возможности Microsoft Bing Wallpaper напугали пользователей 6 ч.
В WhatsApp появилась расшифровка голосовых сообщений — она бесплатна и поддерживает русский язык 7 ч.
Новая игра создателей The Invincible отправит в сердце ада выживать и спасать жизни — первый трейлер и подробности Dante’s Ring 8 ч.
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 9 ч.
Android упростит смену смартфона — авторизовываться в приложениях вручную больше не придётся 9 ч.
Россия и США активно обсуждают, как будут топить МКС 23 мин.
Magssory Fold 3 в 1 — компактная и функциональная беспроводная зарядная станция для Apple, Samsung и не только 3 ч.
Nokia подписала пятилетнее соглашение о поддержке ЦОД Microsoft Azure с миграцией с 100GbE на 400GbE 3 ч.
Давно упавший на Землю кусочек Марса пролил свет на историю воды на Красной планете 4 ч.
TeamGroup представила SSD T-Force GA Pro на чипе InnoGrit — PCIe 5.0, до 2 Тбайт и до 10 000 Мбайт/с 4 ч.
Провалился крупнейший проект по производству электромобильных батарей в Европе — Northvolt объявила о банкротстве 4 ч.
«Уэбб» открыл в ранней Вселенной три огромные галактики — учёные не понимают, почему они так быстро сформировались 4 ч.
В Зеленограде начнут выпускать чипы для SIM-карт и паспортов — на этом планируется заработать триллионы рублей 4 ч.
Смартфоны Poco X6 Pro 5G, M6 Pro и C75 предлагают современный дизайн и продвинутые характеристики 5 ч.
В России стартовали продажи полностью беспроводных наушников Tecno True 1 Air, Buds 4 и Buds 4 Air 6 ч.