реклама
Новости Software

«VK Мессенджер» научили переводить видеосообщения в текст

«ВКонтакте» представила новую функцию «VK Мессенджера» — текстовую расшифровку видеосообщений при помощи искусственного интеллекта. В её работе участвуют три нейросети, решающие отдельные задачи: распознавание звуков, формирование слов, определение границ предложений и расстановку знаков препинания.

 Источник изображения: vk.com/press

Источник изображения: vk.com/press

Расшифровка видеосообщений производится при помощи технологии ASR (Automatic Speech Recognition) тремя нейросетями: акустическая отвечает за распознавание звуков, языковая объединяет звуки в слова, а пунктуационная выявляет границы предложений и ставит знаки препинания. Всё происходит без участия человека.

Функция работает как для полученных, так и для отправленных видеосообщений. Для её запуска достаточно нажать на значок «Аа» — всё остальное ИИ сделает сам. Инструмент пригодится, когда смотреть или слушать видеосообщение неудобно. Расшифровка также помогает найти в переписке нужную информацию — можно найти нужное место при помощи поиска по тексту.

Нововведение уже доступно в веб-версии сервиса, а также для некоторых пользователей Android-версии приложений «ВКонтакте» и «VK Мессенджер», включая учебный профиль «Сферум». В ближайшем будущем расшифровка видеосообщений появится и в версии приложений под iOS. В приложении под iOS также до трёх минут увеличилась максимальная продолжительность видеосообщений и появилась возможность ускорять воспроизведение в полтора или два раза. Дебютировали новые эксклюзивные формы видеосообщений — звезда и котёнок. В Android-версии приложения эти возможности появятся позже.

Ещё одним нововведением при обмене сообщениями стали анимированные реакции в чатах на всех платформах: лайки, сердечки, огоньки и прочие реакции — каждая сопровождается анимированным представлением.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
У Ubisoft пока нет чёткого плана работы новой компании с Tencent — инвесторы и сотрудники нервничают 2 ч.
«Загрузки быстрее, чем в Doom (2016)»: эксперт Digital Foundry остался в восторге от Doom: The Dark Ages 3 ч.
Консоли задержат релиз постапокалиптического стелс-экшена Steel Seed от создателей Close to the Sun — объявлена новая дата выхода 5 ч.
ИИ-модель Llama запустили на ПК из прошлого тысячелетия на базе Windows 98 5 ч.
Telegram продал виртуальных первоапрельских кирпичей почти на 100 млн рублей 6 ч.
Nintendo подтвердила рекордную продолжительность презентации Switch 2 и устроит две демонстрации игр для консоли 6 ч.
ChatGPT остаётся самым популярным чат-ботом с ИИ, но у конкурентов аудитория тоже растёт 7 ч.
Google сделает сквозное шифрование в Gmail доступным для всех 7 ч.
Антиутопия на колёсах: новый геймплейный трейлер раскрыл дату выхода приключения Beholder: Conductor про кондуктора легендарного поезда 7 ч.
Путин запретил госорганам и банкам общаться с клиентами через иностранные мессенджеры 8 ч.
Новая статья: Выбираем кулер для процессора Intel LGA1700 до 2 000 рублей 36 мин.
Garmin представила смарт-часы Vivoactive 6 с мониторингом энергии пользователя за $300 3 ч.
Экспериментальный мозговой имплантат на лету превратил мысли пациента в беглую речь 3 ч.
В Калифорнии зарядных станций для электромобилей теперь на 48 % больше, чем бензоколонок 5 ч.
Японская Rapidus к концу апреля запустит опытное производство 2-нм чипов 7 ч.
В Лондоне появится экобезопасный ЦОД AWS для ленточных накопителей 9 ч.
Blue Origin выяснила, почему потеряла многоразовую ступень ракеты New Glenn при первом запуске 9 ч.
Arm намерена занять 50 % рынка чипов для ЦОД к концу 2025 года — NVIDIA ей в этом поможет 10 ч.
Bharti Airtel подключила Мумбаи к мировой сети с помощью кабеля 2Africa Pearls с пропускной способностью 100 Тбит/с 10 ч.
$100 млрд для отвода глаз: эксперты усомнились в планах TSMC по развитию фабрик в США 11 ч.