Оригинал материала: https://3dnews.kz/597998

Угадай мелодию, или Системы идентификации музыкальных композиций

Любителей слушать музыку несть числа. Для одних меломанов она является источником вдохновения и играет важную роль в жизни, другим она позволяет расслабиться и собраться с мыслями, а третьим - увидеть в ней отражение собственных эмоций и переживаний. Немало находится и тех, для кого данный вид искусства является лишь средством развлечения, скрашивающим суровые будни и заставляющим изредка ломать голову над идентификацией той или иной композиции, доносящейся из колонок или наушников. Да что говорить, наверняка, каждый из читателей 3DNews хоть раз да сталкивался с ситуацией, когда по радио звучит красивая мелодия, а вспомнить ее название и исполнителя (для последующего пополнения личной фонотеки, например) не получается. В таких случаях приходится еще долго прокручивать в памяти полюбившееся произведение и сожалеть о том, что ди-джей поскупился на слова и умолчал о том, кто же был автором композиции. Обычные поисковые машины в решении данной задачи не помогут, а вот специальные сервисы, по небольшому записанному отрывку песни определяющие ее название и исполнителя, вполне могут с ней справиться. Обзору таких необычных инструментов мы и посвятим данный материал.

Прежде чем перейти непосредственно к знакомству с героями сегодняшней статьи, позволим себе сделать небольшое лирическое отступление и вкратце рассказать о принципах работы рассматриваемых систем. В самом простом изложении техническая суть работы систем распознавания музыки сводится к использованию метода идентификации композиций с применением технологии акустических отпечатков, представляющих собой компактную цифровую последовательность, которая описывает характерные частотные составляющие звукового сигнала. Для каждой записи аудиоотпечаток уникален и может быть использован для определения треков, записанных с разным качеством, подвергнутых искажениям и преобразованиям. Эта особенность делает упомянутую методику крайне эффективной и обеспечивает высокий уровень распознавания.

Принцип распознавания песни таков: с записанного на скорую руку фрагмента неизвестной мелодии продолжительностью от 15 до 45 секунд снимается отпечаток, который затем отправляется в базу данных используемой системы, где происходит поиск совпадений с аудиоотпечатками уже опознанных композиций. В результате такого распознавания обнаруживаются один или несколько треков-кандидатов, совпадающих с обработанным файлом с той или иной вероятностью.

Для оценки возможностей каждого рассматриваемого сервиса мы подготовили три тестовых аудиофрагмента в формате MP3 продолжительностью по 30 секунд: один из известной всем поклонникам группы The Beatles композиции Michelle, второй из песни Владимира Высоцкого "Кругом пятьсот" (альтернативное название - "Дорожная история") и третий из созданного по книге Эдуарда Успенского "Дядя Федор, Пес и Кот" мультипликационного фильма "Зима в Простоквашино" (помните строчки "А я все чаще замечаю, что меня как будто кто-то подменил"?). Для чистоты эксперимента все информационные теги, содержащиеся в проверочных композициях, были удалены, а сами файлы были переименованы в ни о чем не говорящие объекты с именами track1.mp3, track2.mp3 и track3.mp3.

AudioTag.info. Первый попавший в поле нашего зрения ресурс для распознавания музыки начал свою работу 6 марта 2009 года и умеет общаться с пользователем на русском и английском языках. Несмотря на молодость, проект может похвастаться не только внушительных размеров базой данных, хранящей сведения о более чем 1,3 млн музыкальных треках самых разных жанров, но и универсальным движком, распознающим файлы в форматах WAV, MP3, OGG, FLV, AMR, MP4 и многих других. Регистрации для работы с AudioTag.info не требуется: достаточно открыть браузер, загрузить фрагмент композиции (оптимальная продолжительность 15-45 секунд), ввести проверочный код, и робот, проанализировав доставшийся ему файл, постарается распознать его и выдать о нем подробную информацию. В нашем случае система безошибочно распознала все три отрывка тестовых композиций, что, конечно же, не может не радовать.

Shazam. Мобильный сервис, представляющий собой альтернативу присутствующему в телефонах Sony Ericsson инструментарию TrackID и реализованный с прицелом на широкий спектр портативных устройств, функционирующих на базе Windows Mobile, Symbian, Android, Apple iOS и BlackBerry. Клиентское приложение Shazam записывает отрывок (10-12 секунд) музыкального произведения с помощью встроенного микрофона телефона, формирует аудиоотпечаток и отсылает его на сервер, где он сравнивается с представленными в базе данных образцами треков. В случае успеха, на дисплее смартфона высвечивается информация о песне с обложкой соответствующего альбома и прочими полезными сведениями. Работает мобильная служба на удивление быстро и просто - от пользователя требуется только нажимать клавишу Tag Now и успевать анализировать поступающие от системы сообщения. С нашими тестовыми заданиями установленная на WM-девайс программа справилась на "четверку", оставив инкогнито только произведение Владимира Семеновича. Впрочем, вряд ли стоит записывать в недостатки Shazam отсутствие в базе данных одной из композиций Высоцкого, так как другую взятую для пробы песню отечественного барда заморский сервис распознал на "ура". Согласно предоставленным разработчиками сведениям, музыкальная база данных проекта насчитывает более восьми миллионов треков. Впечатляет.

Midomi. Сервис, предоставляющий любому посетителю сайта возможность вспомнить врезавшуюся в память композицию путем напевания или насвистывания оной в микрофон компьютера или мобильного устройства. Владельцам последних предоставлен также стандартный функционал, подразумевающий запись отрывка музыкального произведения с микрофона телефона и последующую отправку акустических отпечатков на сайт с базой данных аудиофайлов. Клиентские приложения Midomi доступны для портативных устройств под управлением ОС Windows Mobile, Symbian, Android и Apple iOS. Результат сканирования файлов упомянутым сервисом продемонстрировал англоязычную направленность службы, опознавшей только творение британской рок-группы из Ливерпуля. С творчеством отечественных исполнителей заморский музыкальный эксперт оказался не знаком.

Tunatic. Еще одно решение для идентификации музыки, выполненное в виде небольшой утилиты для операционных систем Windows и Mac OS X. Программа перехватывает звуковой поток с аудиокарты, производит анализ акустической информации в онлайновой базе данных и выдает вердикт о проигрываемой композиции. В случае обнаружения совпадения в БД, Tunatic отображает название песни и имя автора вместе со ссылкой на страницу, где указаны интернет-магазины, в которых можно приобрести полюбившееся произведение. Как показала практика, с определением композиций приложение справляется не ахти как, и разработчики продукта открыто предупреждают, что с классической музыкой к программе можно не обращаться. Знаменитую песню ансамбля "Битлз" утилита определила с ходу, а вот песню кота Матроскина в исполнении Олега Табакова и творчество Владимира Высоцкого не признала.

MusicBrainz. Открытая база данных, хранящая акустические отпечатки для самых разных музыкальных композиций, количество которых усилиями энтузиастов медленно, но верно приближается к планке в 10 миллионов треков. Будучи развиваемым на добровольных началах, проект предлагает пользователя внушительную коллекцию клиентских приложений для разных платформ, функциональная начинка которых позволяет работать не только с отдельными аудиофайлами, но и с целыми альбомами, наводя порядок в хранящихся на компьютере медиабиблиотеках. Потенциал MusicBrainz огромен, однако на практике выяснилось, что 30-секундных отрывков песен системе явно недостаточно для определения композиций, и что в ее познаниях русской музыки фигурируют обширные пробелы.

В случае если ни один из рассмотренных выше сервисов не помог в деле опознания неизвестной мелодии, на помощь может прийти музыкальная энциклопедия Musipedia, предлагающая несколько вариантов поиска песен: посредством напевания или насвистывания их в микрофон ПК, "настукивания" произведения с помощью клавиши "пробел", наигрывания мелодии на виртуальном фортепиано или введения кодов Парсонса. Естественно, качество поиска зависит от многих факторов, важнейшим из которых, по сути, является тривиальное наличие у пользователя чувства ритма и слуха. Кому понравилось стучать по клавиатуре и играть с компьютером в "Угадай мелодию", тому мы может порекомендовать сервис SongTapper и его отечественный аналог "Ритмотека". С одной стороны, работа с упомянутыми инструментами может напоминать забавный аттракцион, с другой - их использование может стать последней возможностью найти песню, мелодия которой никак не выходит из головы.

Если у кого-то из уважаемых читателей возникнет желание поделиться своими находками и опытом в данной области, таковых милости просим в наш форум. Не исключено, что совместными усилиями удастся собрать наиболее полную подборку способов определения авторства неизвестных мелодий.



Оригинал материала: https://3dnews.kz/597998