реклама
Новости Software

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
OpenAI случайно удалила потенциальные улики по иску об авторских правах 15 мин.
Скрытые возможности Microsoft Bing Wallpaper напугали пользователей 53 мин.
WhatsApp научился расшифровывать голосовые сообщения в текст — русский язык поддерживается 2 ч.
Новая игра создателей The Invincible отправит в сердце ада выживать и спасать жизни — первый трейлер и подробности Dante’s Ring 3 ч.
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 4 ч.
Android упростит смену смартфона — авторизовываться в приложениях вручную больше не придётся 4 ч.
OpenAI обдумывает создание собственного интернет-браузера и поисковых систем для противостояния Google 5 ч.
Apple разрабатывает LLM Siri — она будет больше похожа на человека и выйдет с iOS 19 6 ч.
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 12 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 13 ч.
В России стартовали продажи полностью беспроводных наушников Tecno True 1 Air, Buds 4 и Buds 4 Air 16 мин.
Одна из структур Минпромторга закупит ИИ-серверы на 665 млн рублей 54 мин.
Kioxia подала заявку на IPO — третьего крупнейшего производителя флеш-памяти оценили всего в $4,85 млрд 2 ч.
«Джеймс Уэбб» первым в истории нашёл «зигзаг Эйнштейна» — уникальное искривление пространства-времени 2 ч.
Второй электромобиль Xiaomi выйдет через год после первого и будет заметно от него отличаться 3 ч.
Oracle объявила о доступности облачного ИИ-суперкомпьютера на базе NVIDIA H200 3 ч.
Positive Technologies получила сертификат ФСТЭК на межсетевой экран PT NGFW 4 ч.
Google снова уходит с рынка планшетов, сворачивая разработку Pixel Tablet 2 5 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 13 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 13 ч.