Опрос
|
реклама
Быстрый переход
Сэму Альтману и Марку Цукербергу прислали перчатки с лишними пальцами — это намёк на опасности ИИ
03.10.2024 [10:25],
Геннадий Детинич
Киношный преступник всегда оставляет на месте преступления визитную карточку — предмет-загадку, намекающий на новые злодейства. Альтман, Цукерберг, Йоханссон и верхушка Европейского союза получили по почте перчатки с шестью пальцами, символизирующие будущие ужасы, которые последуют за бесконтрольным внедрением искусственного интеллекта. Эту пиар-кампанию организовал финский стартап Saidot, у которого есть идеи, как не допустить неизбежное. Шесть пальцев на руках стали своеобразной визитной карточкой изображений, сгенерированных ИИ-алгоритмами. Сегодня этот баг ушёл или почти ушёл в прошлое. Будут новые несуразности, но их тоже исправят — это всё дело техники и наработка базы. Беда в том, что многие вещи плохо поддаются прогнозу, а сфера ИИ развивается так быстро, что времени не хватает не только на прогноз, но даже на анализ простейших ситуаций. Железо куют, пока горячо. Финны просто красиво напомнили об этом. «Искусственный интеллект развивается так быстро, что никто не может в полной мере предвидеть его последствия и возникающие риски, — предупредила Вира Сиивонен (Veera Siivonen ), технический директор и соучредитель компании. — Вот почему мы хотим рассказать как о шагах, которые были предприняты для обеспечения более безопасного ИИ, так и о некоторых шагах, которые следует предпринять». Сэму Альтману (Samuel Altman) из OpenAI перчатки прислали с требованием привести искусственный интеллект в соответствие с общечеловеческими ценностями. Но финны также похвалили его за то, что он проявляет осторожность — сдерживает выпуск всё более мощных версий больших языковых моделей. Урсула фон дер Ляйен (Ursula von der Leyen), президент Европейской комиссии, также получила жуткую посылку. Компания Saidot пояснила, что перчатки, отправленные лидеру ЕС, символизируют необходимость эффективного регулирования отрасли ИИ. Ещё один комплект был доставлен Скарлетт Йоханссон (Scarlett Johansson). В мае 2024 года актриса попала в заголовки газет после того, как OpenAI запустила чат-бота с «её» голосом. Перчатки актрисе — это напоминание о цифровых правах на личное. Четвёртая пара была отправлена Марку Цукербергу (Mark Zuckerberg). Финны похвалили главу компании Meta✴ за поддержку моделей с открытым исходным кодом, но предупредили, что данные для обучения должны быть из надёжных источников. Руководители компаний Hugging Face и Klarna также удостоились шестипалого напоминания. Оно же досталось премьер-министру Великобритании Сэру Киру Стармеру (Keir Starmer), техническому комиссару ЕС Хенне Вирккунен (Henna Virkkunen) и эксперту по искусственному интеллекту Риши Боммасани (Rishi Bommasani). Всем им компания Saidot посоветовала опасаться предвзятых результатов, нарушений авторских прав и ложной информации. Среди прочего финны прозрачно намекнули, что они располагают собственной платформой для управления ИИ. Тем, кто откажется от предложения, придется столкнуться с последствиями. Заметим, как в любом хорошем детективе, улики на месте киношного преступления должны запутать зрителя и главных героев. Но ИИ — не злодей. Недальновидно поступают те, кто безоговорочно доверяет этому так называемому искусственному интеллекту. Это как доверять поисковику в браузере. Его дело предложить, но анализировать ответы будет пользователь, опираясь на собственные знания или мнения живых специалистов. Google надеется догнать OpenAI, создав собственный рассуждающий ИИ
03.10.2024 [10:13],
Владимир Фетисов
Компания Google работает над созданием модели искусственного интеллекта, способной рассуждать подобно человеку. За счёт этого IT-гигант намерен усилить конкуренцию с OpenAI, которая уже представила аналогичный продукт под названием o1. Об этом пишет Bloomberg со ссылкой на собственные осведомлённые источники. В сообщении сказано, что за последние месяцы Google добилась значительного прогресса в разработке моделей искусственного интеллекта, способных справляться с решением многоэтапных задач в таких областях, как математика и программирование. По данным источника, как и OpenAI, Google пытается создать рассуждающий ИИ-алгоритм с помощью техники, называемой «цепочка мыслей». Она подразумевает, что прежде чем дать ответ на письменный запрос ИИ-алгоритм на несколько секунд берёт паузу, чтобы проанализировать связанные с запросом тематики и затем дать обобщённый ответ на поставленный вопрос. Официальные представители Google отказались от комментариев по данному вопросу. Google и OpenAI ведут напряжённую борьбу за доминирование в сфере искусственного интеллекта. Противостояние обострилось с появлением ИИ-бота ChatGPT, который, как считают некоторые инвесторы, со временем способен устранить необходимость в поисковике Google. IT-гигант всячески стремится избежать этого, для чего ведущие исследовательские команды разработчиков компании были объединены в подразделение DeepMind. Несмотря на это, Google продолжает двигаться медленнее, когда дело доходит да запуска новых ИИ-продуктов, делая паузу, чтобы рассмотреть этические проблемы, необходимость оправдать ожидания общественности в отношении доверия к бренду компании и др. Анонимный источник издания сообщил, что после того, как в середине сентября OpenAI представила алгоритм o1, некоторые сотрудники DeepMind были разочарованы отставанием Google в гонке за лидерство в сфере ИИ. Однако сотрудники уже не так обеспокоены, как после запуска ChatGPT, поскольку сейчас Google успела выпустить некоторые из своих собственных разработок. Adobe выпустила Photoshop и Premiere Elements 2025 с продвинутыми ИИ-функциями и ценой по $90
02.10.2024 [19:39],
Сергей Сурабекянц
Photoshop Elements и Premiere Elements — «облегчённые» версии самого популярного ПО для редактирования изображений и видео компании Adobe, которые стоят в разы меньше, чем подписка на Adobe Creative Cloud. Теперь в них появились ИИ-функции, которые упрощают исправление, ретушь или превращение фотографий и видео в произведения визуального искусства путём изменения размера, обрезки, добавления звукового сопровождения или включения анимации. В Adobe Photoshop Elements 2025 добавлены функции редактирования фотографий, включая возможность объединять несколько изображений, изменять цветовую гамму, удалять нежелательные объекты или добавлять размытие глубины резкости с помощью новой технологии ИИ. При помощи новых ИИ-инструментов Remove и Object Removal Guided Edit можно одним движением удалить нежелательные объекты на фотографиях. Для добавления реалистичного эффекта боке к фотографии достаточно использовать фильтр Depth Blur на базе ИИ, просто указав точку фокусировки. Доступна регулировка таких параметров, как интенсивность размытия, фокусное расстояние и диапазон фокусировки. Цвет любого объекта на фотографии можно легко изменить при помощи нового ИИ-инструмента. Достаточно выбрать объект, изменить оттенок и другие параметры, а затем применять изменения к объекту. Добавлены быстрые действия для имитации эффектов движения одним движением мыши. Пользователю также доступны такие элементы оформления, как анимированные блёстки, мигающее сердце или «живые» рамки. Ещё одна новая функция — возможность объединять несколько изображений, накладывая объект с одного изображения на фон другого и добавляя элементы с других фотографий. Редактирование в Premiere Elements 2025 значительно ускорено благодаря новой и упрощённой временной шкале. Возможность видеть сгруппированные видеодорожки и аудиодорожки упрощает навигацию. Появилось новое меню быстрых инструментов, а отдельные дорожки теперь можно заблокировать, чтобы предотвратить случайное редактирование. В заголовках стал доступен пользовательский стиль текста. Динамические заголовки видео получили больше элементов управления текстом. Имеется набор готовых шаблонов, которые можно стилизовать в соответствии с историей, используя элементы управления выравниванием, размером, направлением, цветом и интервалом. Новый инструмент баланса белого гарантирует, что облака, снег и другие белые объекты будут отображаться без цветовых искажений. Точные настройки цвета и яркости теперь можно вносить в сцену или даже в определённые области с помощью новых кривых цветокоррекции. Цветовую гамму видео теперь можно корректировать или преобразовывать с помощью предустановок. Имеется возможность импорта пользовательских настроек. Появилась возможность экспорта видео в несколько мест назначения одним щелчком мыши. Видеоматериалы можно импортировать и перемещаться по клипам с помощью нового медиабраузера. Использование сочетаний клавиш существенно ускоряет рабочий процесс. Помимо обновления программных пакетов Elements, Adobe также улучшила веб-приложения-компаньоны, которые в настоящее время находятся в стадии бета-тестирования. Представлены функции добавления движущихся наложений, автоматической смены фона и настройки внешнего вида фотографии перед публикацией в социальных сетях с помощью QR-кодов. Новая функция редактирования и создания фотографий в мобильном приложении-компаньоне предлагает украсить изображение забавными фигурами и узорами. Появились настройки яркости, цветности и насыщенности эффектов. Изображения можно обрезать и корректировать их поворот, а фон удалять одним нажатием. Пользователи Apple Mac будут рады услышать, что последние версии Photoshop и Premiere Elements теперь поддерживают чип Apple M3, что заметно повышает производительность при работе на компьютерах Mac. Adobe Photoshop Elements 2025 и Adobe Premiere Elements 2025 уже доступны по одинаковой цене $89,99. В комплекте обе программы обойдутся существенно дешевле — $129,99. Системные требования Windows:
Системные требования macOS:
Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4
02.10.2024 [19:27],
Сергей Сурабекянц
Nvidia представила новое семейство больших мультимодальных языковых моделей NVLM 1.0, включая обученную на 72 миллиардах параметров NVLM-D-72B. Модели демонстрируют высокую производительность в широком спектре задач, таких как машинное зрение, создание программного кода, анализ изображений, решение математических задач и генерация текстов. Похоже, что лидерам отрасли во главе с OpenAI и Google придётся потесниться. «Мы представляем NVLM 1.0, семейство передовых мультимодальных больших языковых моделей, которые достигают самых современных результатов в задачах зрения и языка, конкурируя с ведущими фирменными моделями (например, GPT-4o) и моделями с открытым доступом», — утверждают разработчики Nvidia. По их мнению, открытый исходный код предоставляет исследователям и разработчикам беспрецедентный доступ к передовым технологиям. Флагманская модель NVLM-D-72B демонстрирует адаптивность при обработке сложных визуальных и текстовых входных данных. Исследователи подчёркивают способность модели интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Разработчики также отметили, что NVLM-D-72B улучшает свою производительность в текстовых задачах после мультимодального обучения, в отличие от большинства аналогичных моделей. Проект NVLM также представляет инновационные архитектурные решения, включая гибридный подход, который объединяет различные методы мультимодальной обработки. По оценкам сторонних исследователей, модель NVLM-D-72B «находится на одном уровне с Llama 3.1 405B по математике и кодированию, а также имеет видение». Выпуск Nvidia NVLM 1.0 знаменует собой поворотный момент в разработке ИИ. Открывая исходный код модели, которая конкурирует с проприетарными гигантами, Nvidia не просто делится кодом — она бросает вызов самой структуре индустрии ИИ. Благодаря Nvidia множество небольших организаций и независимых исследователей смогут вносить более значительный вклад в развитие ИИ, что может открыть эру беспрецедентного сотрудничества и инноваций в области ИИ. Этот шаг может вызвать цепную реакцию — другим лидерам в области ИИ также придётся открыть свои исследования, что потенциально ускорит прогресс ИИ по всем направлениям. Нужно отметить, что выпуск NVLM 1.0 не лишён рисков. По мере того, как мощный ИИ становится все более доступным, возрастают и опасения по поводу его неправильного использования и возможных этических последствий. Сообщество ИИ уже столкнулось с необходимостью ответственного использования новых технологий. Одно можно сказать наверняка: политика Nvidia в отношении ИИ затронет всю индустрию. Вопрос только в том, насколько радикальным окажется её влияние, и смогут ли конкуренты адаптироваться достаточно быстро, чтобы преуспеть в этом новом мире открытого ИИ. OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений
02.10.2024 [17:53],
Владимир Фетисов
Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций. Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео. Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм. В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI. Microsoft улучшила поиск в Windows 11 с помощью ИИ и добавила в ОС аналог Circle to Search
02.10.2024 [12:13],
Владимир Фетисов
Microsoft задействовала алгоритмы на базе искусственного интеллекта, чтобы улучшить поиск в Windows 11 на новых компьютерах Copilot Plus PC. Одним из заметных нововведений стала функция Click to Do, которая похожа на представленный ранее инструмент Google Circle to Search и предназначена для упрощения поиска по изображениям, электронным письмам, документам и даже видео. Эта и другие ИИ-функции поиска Windows 11 будут развёрнуты на Copilot Plus PC в следующем месяце. «Поиск на основе искусственного интеллекта значительно упростит поиск практически чего угодно. Вам больше не нужно запоминать имена файлов и расположение документов, а также какие-то конкретные слова. Windows будет лучше понимать ваши намерения и найдёт нужный документ, изображение, файл или электронное письмо», — прокомментировал запуск новых функций Юсуф Мехди (Yusuf Mehdi), вице-президент Microsoft, отвечающий за развитие Windows. Улучшенный поиск также будет доступен «в ближайшие месяцы» в основном интерфейсе поиска Windows 11 и поле поиска, которое появляется в разделе настроек. Это облегчит поиск не только файлов, но и определённых разделов с настройками. Например, в поиске по настройкам можно будет написать «добавить мои наушники», чтобы быстро перейти к взаимодействию с соответствующим меню. Много лет поиск в Windows был не очень хорош, поэтому возможность искать что-либо на основе запросов на естественном языке должна существенно улучшить ситуацию. В дополнение к этому в следующем месяце Microsoft начнёт развёртывание функции Click to Do. Для взаимодействия с ней достаточно зажать клавишу Windows на клавиатуре и кликнуть по экрану левой кнопкой мыши. После этого на экране появится инструмент интерактивного наложения, с помощью которого можно выделить часть изображения или текста для выполнения дальнейших действий. Функцию Click to Do можно задействовать в разных ситуациях, например, для осуществления поиска в интернете по каким-то визуальным элементам, которые пользователь увидел при просмотре видео на YouTube. В дополнение к этому функция может работать с текстами, поэтому будет полезна при обобщении или переписывании документов, отправке электронных писем и др. Microsoft начнёт тестировать функцию Click to Do и улучшенный поиск в Windows в рамках программы предварительной оценки на компьютерах Copilot Plus PC в этом месяце. В ноябре начнётся постепенное развёртывание нововведений на совместимых устройствах. Ранее анонсированная функция Recall, которая фиксирует все действия пользователей в ОС, также станет доступна инсайдерам с устройствами на базе процессоров от Qualcomm в октябре, а в ноябре она появится на компьютерах Copilot Plus PC с чипами от Intel и AMD. Когда планируется начать массовое развёртывание функции Recall, пока неизвестно. Сбежавшую от Сэма Альтмана Миру Мурати осаждают венчурные инвесторы с деньгами
01.10.2024 [22:33],
Сергей Сурабекянц
Технический директор OpenAI Мира Мурати (Mira Murati) объявила о своём уходе из компании на прошлой неделе. По её словам, она решила «освободить время и пространство для собственных исследований». Сразу после увольнения Мурати несколько крупных венчурных компаний объявили о желании профинансировать её следующий проект. Интрига заключается в том, что Мурати пока не делала никаких заявлений о своих дальнейших планах и отказалась комментировать возникшие слухи. «Мои шесть с половиной лет в команде OpenAI были исключительной привилегией… Никогда не бывает идеального времени, чтобы уйти из места, которое ты лелеешь, но этот момент кажется правильным» — написала Мурати в своём аккаунте в соцсети X. Генеральный директор OpenAI Сэм Альтман (Sam Altman) прокомментировал внезапный уход Мурати в X: «Я, конечно, не буду притворяться, что такая внезапность [увольнения] естественна, но мы не обычная компания, и я думаю, что причины, которые мне объяснила Мира, имеют смысл». Мурати присоединилась к OpenAI в 2018 году. До этого она занималась проектированием электромобиля Model X в Tesla. В OpenAI Мурати возглавила разработку двух флагманских продуктов компании — ChatGPT и Dall-E. Уход Мурати произошёл на фоне реструктуризации OpenAI из некоммерческой организации в коммерческую, что даст Альтману возможность получить пакет акций. Очередной недавний сбор средств принёс OpenAI инвестиции в размере $6,5 млрд от таких компаний, как Thrive Capital, SoftBank, Coatue и Microsoft. Венчурные капиталисты конкурируют за право быть первыми инвесторами стартапов, основанных выходцами из OpenAI, так как все эти проекты выглядят очень многообещающе. Десятки бывших сотрудников OpenAI, включая уволившихся соучредителей стартапа, за последние несколько лет основали свои компании, к примеру:
Одновременно с Мурати о своём уходе из OpenAI заявили ещё два технических специалиста — главный научный сотрудник Боб МакГрю (Bob McGrew) и вице-президент по исследованиям Барретт Зоф (Barret Zoph). Теперь Альтман и Войцех Заремба (Wojciech Zaremba) — единственные оставшиеся учредители из одиннадцати основателей компании. «Их уход заставил меня задуматься о трудностях, с которыми сталкивались родители в Средние века, когда 6 из 8 детей умирали преждевременно, — написал Заремба в сообщении в соцсети X, ставшем вирусным. — Несмотря на тяжёлую утрату, родителям пришлось смириться с ней и найти глубокую радость и удовлетворение в тех двоих, кто выжил». AMD выпустила свою первую языковую модель ИИ — AMD-135M
01.10.2024 [01:18],
Николай Хижняк
Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M. Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования. Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных. Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250. Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности. SoftBank вызвалась заменить Apple в списке ключевых инвесторов OpenAI
30.09.2024 [23:12],
Анжелла Марина
Японская инвестиционная холдинговая компания SoftBank планирует вложить $500 млн в OpenAI, разработчика чат-бота ChatGPT, сообщает Bloomberg. Инвестирование станет частью более крупного раунда финансирования, в ходе которого OpenAI рассчитывает привлечь $6,5 млрд при оценке компании в $150 млрд. Лидером раунда предположительно выступит Thrive Capital при участии Microsoft, крупнейшего инвестора OpenAI, а также других инвесторов. В частности, компания обсуждала инвестиции с Nvidia и Apple. Однако последняя больше не участвует в переговорах об участии в раунде, зато в списке инвесторов возможно будет фигурировать SoftBank через свой фонд Vision Fund. Если сделка состоится, OpenAI закрепит за собой статус одного из самых дорогих стартапов в мире. Официальные представители OpenAI и SoftBank пока не дали комментариев по этому поводу. В то же время компания переживает не самый простой период. На прошлой неделе о своём уходе объявила технический директор и ключевой сотрудник OpenAI Мира Мурати (Mira Murati), что стало ещё одним звеном в цепи увольнений топ-менеджеров компании в этом году. Кроме того, по данным Bloomberg, OpenAI рассматривает возможность реструктуризации, чтобы стать полностью коммерческой организацией. Напомним, ранее основатели OpenAI позиционировали свою компанию как некоммерческую организацию, сосредоточившись на исследованиях в «создании положительного долгосрочного воздействия на человека». Отметим, что SoftBank ранее не проявлял инвестиционного интереса к OpenAI, однако поддерживал одного из его конкурентов. В частности, в июне Vision Fund, управляемый SoftBank Investment Advisers, дочерней компанией SoftBank, вложился в Perplexity AI — стартап, занимающийся поиском на основе искусственного интеллекта, оценив его в $3 млрд. Raspberry Pi и Sony представили модуль ИИ-камеры для «малинки» стоимостью $70
30.09.2024 [18:50],
Сергей Сурабекянц
Компании Raspberry Pi и Sony совместно разработали для микрокомпьютера Raspberry Pi модуль камеры с искусственным интеллектом. Новинка совместима со всеми версиями микрокомпьютера и не нуждается в дополнительных ускорителях или графическом процессоре. По утверждению Raspberry Pi, камера позволит пользователям с лёгкостью разрабатывать «передовые решения ИИ для обработки визуальных данных». Камера уже поступила в продажу по цене $70. Новая 12,3-мегапиксельная камера Raspberry Pi AI может снимать видео со скоростью 10 кадров в секунду с разрешением 4056 × 3040 пикселей или 40 кадров в секунду с разрешением 2028 × 1520 точек. Она имеет ручную регулировку фокуса, поле зрения 76 градусов и размеры 25 × 24 × 11,9 мм, что делает её практически идентичной по размерам модулю камеры 3, выпущенному Raspberry Pi в прошлом году. Камера совместима со всеми одноплатными компьютерами Raspberry Pi и объединяет чип микроконтроллера RP2040 с датчиком изображения Sony IMX500, который обеспечивает ИИ-функциональность устройства. Такое сочетание устраняет необходимость в дополнительных компонентах, таких как ускорители ИИ или графический процессор, которые обычно используются для обработки визуальных данных. Новая камера стала дальнейшим развитием планов Raspberry Pi по расширению ассортимента чипов и дополнений для своего микрокомпьютера. Начиная с 2013 года, компания выпустила несколько модулей камер без ИИ, а теперь предлагает и вариант с ИИ. «Обработка изображений на базе ИИ становится привлекательным инструментом для разработчиков по всему миру, — сказал генеральный директор Raspberry Pi Эбен Аптон (Eben Upton). — Мы с нетерпением ждём, чего смогут достичь члены нашего сообщества, используя мощь камеры на базе ИИ Raspberry Pi». Google запустила новую ИИ-функцию в NotebookLM для краткого пересказа видео на YouTube
27.09.2024 [05:11],
Анжелла Марина
Google представила обновлённую версию ИИ-приложения для заметок NotebookLM, которая теперь умеет анализировать видео на YouTube и быстро извлекать ключевые моменты из длинных видеороликов, преобразуя их в текст и тематические ссылки. Раньше приложение могло обрабатывать только текстовые форматы. В основе новой функции лежит технология транскрибирования — преобразование аудио в текст. После того, как пользователь вставит ссылку в NotebookLM на видео, которое нет возможности посмотреть целиком, искусственный интеллект самостоятельно создаст краткий обзор основных тем, обсуждаемых в видео, поясняет издание The Verge. Пользователи также смогут получить более подробную информацию, кликнув на ссылку с определённой темой. При тестировании новой функции в видеообзоре iPhone 16 Pro на канале The Verge, NotebookLM сгенерировало такие темы, как «Искусственный интеллект Apple», «Камера iPhone 16 Pro» и «Обработка фотографий». При выборе одной из тем приложение не только предоставляло информацию, но и ссылалось на конкретные моменты в видео, где эта информация упоминается, что позволило быстро найти нужные фрагменты. Примечательно, что на основе содержимого видео пользователи также могут создать аудиорезюме для прослушивания в формате подкаста. Стоит отметить, что новая функция может не сработать с недавно добавленными роликами, в частности, опубликованными менее чем за два дня до запроса. Тем не менее, в большинстве случаев приложение NotebookLM продемонстрировало высокую степень точности и надёжности. В то время как Gemini от Google и Copilot от Microsoft могут транскрибировать и обобщать видео, новая версия NotebookLM способна обрабатывать также и аудиозаписи, что делает приложение универсальным инструментом для использования в различных областях. Защита от роботов перестала работать: ИИ научился идеально проходить проверку reCAPTCHAv2
26.09.2024 [20:10],
Сергей Сурабекянц
Исследователи Андреас Плеснер (Andreas Plesner), Тобиас Фонтобель (Tobias Vontobel), Роджер Ваттенхофер (Roger Wattenhofer) из Швейцарской высшей технической школы Цюриха с помощью ИИ взломали систему проверки reCAPTCHAv2, которая используется на сайтах для подтверждения того, что пользователь является человеком, а не роботом. Учёные утверждают, что обученная ими нейросеть способна пройти 100 % проверок, тогда как раньше этот процент не превышал 71 %. Исследователи изучали эффективность использования передовых методов машинного обучения для решения проверок (капч) из системы reCAPTCHAv2 от Google. Они пытались оценить эффективность автоматизированных систем в решении капч, используя передовые модели YOLO (You Only Look Once) для сегментации и классификации изображений. reCAPTCHAv2 требует от пользователей отмечать на изображении области с определёнными предметами, подразумевая, что бот на такое не способен. Исследователи пришли к выводу, что на современном этапе развития ИИ разница в сложности подобных задач для человека или нейросети нивелируется. Это означает, что современные технологии ИИ могут без проблем проходить проверки, основанные на распознавании изображений. «Мы также заглядываем под капот reCAPTCHAv2 и находим доказательства того, что reCAPTCHAv2 в значительной степени основана на данных cookie и истории браузера при оценке того, является ли пользователь человеком или нет», — добавили исследователи. Европейцы могут остаться без «Яблочного интеллекта» — Apple не согласна с правилами ЕС по регулированию ИИ
26.09.2024 [18:51],
Владимир Фетисов
Компания Apple, возможно, откажется от запуска функций на базе искусственного интеллекта Apple Intelligence на территории Евросоюза. Разработанный в регионе Закон об искусственном интеллекте, представляющий собой свод правил для регулирования отрасли, обязались соблюдать ряд крупных компаний, включая OpenAI, Microsoft и Google. Однако производитель iPhone не спешит поступать аналогичным образом. Apple заявила, что «сотрудничает» с регулирующими органами Евросоюза, чтобы предоставить пользователям в регионе доступ к функциям Apple Intelligence. Однако на данном этапе нет признаков того, что компании удалось продвинуться в этом направлении. Любопытно, что новые правила регулирования ИИ-сегмента были согласованы со 115 компаниями. Многие из них входят в число крупнейших игроков сферы искусственного интеллекта на мировом рынке. Соответствовать действующему законодательству согласились, в том числе, Adobe, Amazon, Google, Microsoft, OpenAI, Samsung и Snap. «Инициатива Евросоюза по внедрению мер по контролю над искусственным интеллектом получила в среду не самый удачный старт, поскольку технологические гиганты Meta✴ и Apple отказались соответствовать выдвинутым требованиям <…> Все компании и отрасли должны будут соблюдать правила, перечисленные в Пакте в рамках принятого в ЕС Закона об искусственном интеллекте, который будет поэтапно внедряться в ближайшие годы. Цель добровольного пакта в том, чтобы заставить компании как можно раньше начать соблюдать правила Закона об искусственном интеллекте», — пишет издание Politico со ссылкой на собственные источники. Apple и Meta✴ трудно назвать дружественными компаниями, когда речь заходит о множестве других вопросов. Однако в плане отсутствия оптимизма по поводу мер регулирования ИИ-сферы в ЕС они, похоже, заняли одну позицию. Google потратила $2,7 млрд, чтобы вернуть бывшего сотрудника
26.09.2024 [16:23],
Владимир Фетисов
Google заплатила $2,7 млрд за лицензии на технологии ИИ-стартапа Character AI, который в 2021 году создал бывший сотрудник IT-гиганта Ноам Шазир (Noam Shazeer). По данным источника, главной целью Google было возвращение в компанию IT-гения, прославившегося исследованиями в сфере искусственного интеллекта. В настоящее время Шазир является вице-президентом Google и работает над развитием ИИ-алгоритмов компании, таких как Gemini. В сообщении сказано, что именно ради возвращения Шазира Google дала согласие на выплату огромного лицензионного сбора. По данным осведомлённого источника, Шазир заработал сотни миллионов долларов на своей доле в стартапе Character AI. Отмечается, что выплаченная Google сумма является необычно большой для основателя, который не продал свою компанию и не вывел её на биржу. Ноам Шазир работал в Google с 2000 года. В 2017 году он вместе с группой других авторов опубликовал статью под названием «Внимание — это всё, что вам нужно», которая стала основой для технологии генеративных нейросетей. Позднее он вместе с коллегами создал чат-бота Meena и предсказал, что в скором будущем чат-ботом сможет заменить поисковую систему Google и принесёт триллионы долларов дохода. Google отказалась от публичного запуска чат-бота, и в 2021 году Шазир покинул компанию, обвинив её в бюрократической волоките при интеграции технологий в пользовательские продукты. Позднее он создал стартап Character AI, который через два года привлёк $150 млн инвестиций и был оценён в 1 млрд. На фоне конкуренции с OpenAI и Microsoft Шазир пытался привлечь для своего стартапа больше средств и в конечном счёте сумел договориться с Alphabet, материнской компанией Google. В результате сделки Шазир и ещё несколько десятков сотрудников Character AI перешли в Google. Tecno рассказала об ИИ-функциях складных смартфонов Phantom V Fold2 5G и Phantom V Flip2 5G
25.09.2024 [10:30],
Владимир Мироненко
Компания Tecno раскрыла подробности об ИИ-функциях второго поколения складных смартфонов Phantom V Fold2 5G и Phantom V Flip2 5G, а также многофункционального стилуса для работы на большом экране — Phantom V Pen, анонсированных в этом месяце. По сравнению с предшественниками новинки получили целый ряд улучшений. Обновлённый помощник Ella AI Assistant, интегрированный с Google Gemini, теперь поддерживает более сложные диалоги с пользователями. В частности, он может помочь в планировании дня, а также окажет содействие в решении повседневных задач, например, подскажет нужный рецепт или сообщит прогноз погоды. «AI Редактор» предложит мощные инструменты для работы с текстом:
ИИ также используется в новых смартфонах для повышения качества фотосъёмки. Технология Tecno Universal Tone с помощью ИИ-алгоритмов позволяет более точно улавливать разнообразие оттенков кожи и более корректно отображать их при съёмке, а функция AIGC Portrait позволяет создавать портретные снимки с различными темами и шаблонами. С помощью «Ластик AI» можно легко удалять объекты при редактировании снимка, а One Click Cutout автоматически распознает и выделяет объекты на фото при долгом нажатии, обеспечивая быстрый и простой обмен изображениями. Смартфон Phantom V Fold2 5G имеет внешний экран с диагональю 6,42 дюйма и основной 7,85-дюймовый экран с адаптивной частотой обновления от 10 до 120 Гц. Надёжная шарнирная конструкция позволяет выдержать до 400 000 складываний. Среди складных смартфонов новинка выделяется аккумулятором повышенной энергоёмкости на 5750 мА·ч и мощной комплектной зарядкой на 70 Вт. Также Phantom V Fold2 5G поддерживает беспроводную зарядку мощностью 15 Вт. Продвинутая система из пяти камер обеспечит высокое качество снимков. Основной складной экран поддерживает управление стилусом Phantom V Pen. Что очень удобно, Phantom V Fold2 5G фиксируется под любым углом от 30° до 120°, предоставляя широкий выбор сценариев использования. В свою очередь, «раскладушка» Phantom V Flip2 5G обладает двумя яркими AMOLED-экранами — внешним с диагональю 3,64 дюйма и основным складным 6,9-дюймовым. Смартфон получил систему из трёх камер на 50 Мп FreeCam с возможностью съёмки под любым углом. Также у Phantom V Flip2 5G один из самых энергоёмких среди вертикальных складных устройств аккумулятор ёмкостью 4720 мА·ч. В комплекте предоставляется адаптер мощностью 70 Вт. Новый стилус Phantom V Pen позволяет раскрыть весь потенциал большого экрана. С его помощью можно управлять смартфоном с точностью до 0,0625 пикселя, делая доступным более широкий набор пользовательских сценариев для разных задач. В частности, с помощью стилуса можно оставлять пометки на скриншотах, делать записи на большом складном экране, выполнять расчёты, работать с визуальным контентом и многое другое. Кроме того, стилус имеет две кнопки, с помощью которых можно управлять смартфоном на расстоянии, чтобы переключать слайды или запускать съёмку фото и видео. Аккумулятор ёмкостью 80 мА·ч обеспечивает до двух недель автономной работы при ежедневном использовании в течение двух часов. Сбоку у стилуса есть порт Type-C, совместимый с зарядными устройствами для смартфонов. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |