реклама
Новости Hardware

Waymo и Gemini научат роботакси справляться со сложными дорожными ситуациями

Waymo, дочерняя компания Alphabet, представила новый подход к обучению своих беспилотных транспортных средств, используя модель Gemini — большую мультимодальную языковую модель (MLLM) от Google. Модель улучшит навигацию автономных автомобилей и позволит лучше справляться со сложными дорожными ситуациями.

 Источник изображения: waymo.com

Источник изображения: waymo.com

В новом исследовательском докладе Waymo дала определение своей разработке как «сквозной мультимодальной модели для автономного вождения» (EMMA), которая обрабатывает данные с сенсоров и помогает роботакси принимать решения о направлении движения, избегая препятствий. Как пишет The Verge, Waymo давно подчёркивала своё стратегическое преимущество благодаря доступу к научным исследованиям в области искусственного интеллекта (ИИ) Google DeepMind, ранее принадлежавшей британской компании DeepMind Technologies.

Новая система EMMA представляет собой принципиально иной подход к обучению автономных транспортных средств. Вместо традиционных модульных систем, которые разделяют функции на восприятие, планирование маршрута и другие задачи, EMMA предлагает единый подход, который позволит обрабатывать данные комплексно, поможет избежать ошибок, возникающих при передаче данных между модулями, и улучшит адаптацию к новым, незнакомым условиям на дороге в реальном масштабе времени.

Одним из ключевых преимуществ использования моделей MLLM, в частности Gemini, является их способность к обобщению знаний, почерпнутых из огромных объёмов данных, полученных из интернета. Это позволяет моделям лучше адаптироваться к нестандартным ситуациям на дороге, таким как неожиданное появление животных или ремонтные работы. Кроме того, модели, обученные на основе Gemini, способны к «цепочке рассуждений». Это метод, который помогает разбивать сложные задачи на последовательные логические шаги, улучшая процесс принятия решений.

Несмотря на успехи, Waymo признает, что EMMA имеет свои ограничения. Например, модель пока не поддерживает обработку 3D-данных с таких сенсоров, как лидар или радар, из-за высокой вычислительной сложности. Кроме того, EMMA способна обрабатывать лишь ограниченное количество кадров изображений одновременно. Подчёркивается, что потребуется дальнейшее исследование для преодоления всех этих ограничений перед полноценным внедрением модели в реальных условиях.

Waymo также осознает и риски, связанные с использованием MLLM в управлении автономными транспортными средствами. Модели, подобные Gemini, могут допускать ошибки или «галлюцинировать» в простых задачах, что конечно недопустимо на дороге. Тем не менее, есть надежда, что дальнейшие исследования и улучшения архитектуры ИИ-моделей для автономного вождения преодолеют эти проблемы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Ubisoft прокомментировала слухи о ещё одном переносе Assassin’s Creed Shadows 2 ч.
Минцифры РФ подготовит единый прайс-лист на ПО для государственных структур 2 ч.
В Windows обнаружена опасная уязвимость нулевого дня, которую закрыл сторонний разработчик 3 ч.
Call of Duty: Black Ops 6 показала крупнейший запуск в истории серии и помогла Game Pass установить новый рекорд 3 ч.
Microsoft переманила ведущего разработчика Marvel’s Wolverine — он возглавил команду Perfect Dark 4 ч.
Поражённый зомби-вирусом Сеул в трейлере PvPvE-экшена Nakwon: Last Paradise 4 ч.
Троян FakeCall для перехвата звонков на Android получил ворох новых функций для кражи данных пользователей 5 ч.
Падение продаж, неудачи Star Wars Outlaws и «глубокая трансформация»: Ubisoft отчиталась о результатах за первую половину финансового года 5 ч.
Покупка Activision помогла Microsoft нарастить игровую выручку, но консоли продаются всё хуже 5 ч.
В работе TikTok в России опять произошли массовые сбои 6 ч.
DIGITIMES Research: в 2024 году Google увеличит долю на рынке кастомных ИИ ASIC до 74 % 17 мин.
Asus выпустила 27-дюймовый профессиональный монитор ProArt Display 5K PA27JCV за $799 18 мин.
Лучше не связываться: Ernst & Young отказалась от аудита Supermicro, акции которой тут же рухнули почти на треть 36 мин.
Представлен OnePlus 13 — большой флагман со Snapdragon 8 Elite, тремя 50-Мп камерами и ёмкой батареей за $630 40 мин.
Avride, выделившаяся из «Яндекса», показала четырёхколёсного робота-курьера на чипе Nvidia 2 ч.
Несостоявшиеся звёзды могут иметь собственные планеты, подсказывает «Джеймс Уэбб» 2 ч.
Ученые вычислили скрытый океан на спутнике Урана — там есть потенциал для зарождения жизни 2 ч.
Рынок смартфонов показал рекордный рост с 2021 года: сильнее всех поднялись Vivo и Apple, а Samsung теряет рынок 2 ч.
ИИ-гонка очень дорого обходится Microsoft, Google и другим IT-гигантам — инвесторы обеспокоены 3 ч.
KKR подписала соглашение о партнёрстве с ECP для строительства ЦОД и реализации энергетических проектов на $50 млрд 4 ч.