Как работает функция Google Hum to Search

Оглавление:

Как работает функция Google Hum to Search
Как работает функция Google Hum to Search
Anonim

Ключевые выводы

  • Google запустил новый инструмент, который позволяет пользователям искать песни, напевая, напевая или насвистывая.
  • Новый инструмент использует машинное обучение для сопоставления напеваемого трека с постоянно обновляемой базой данных, содержащей более полумиллиона песен.
  • Пользователи Google спрашивают, какая песня звучит почти 100 раз в месяц.
Image
Image

Google запустил новую функцию под названием «Напевать в поиск», чтобы решить неприятную проблему: у вас в голове застряла песня, и вы не можете понять, как она называется.

Идея напевать, чтобы найти песню, кажется невероятно простой, так почему же Google запускает эту функцию только в 2020 году? Что ж, оказывается, что идентифицировать песни таким образом на самом деле довольно сложно, отчасти потому, что наши напевные версии, как правило, сильно отличаются от оригинального трека. В недавнем посте в своем блоге об искусственном интеллекте Google объясняет, как он использовал машинное обучение, чтобы решить эту проблему и, в конечном итоге, помочь людям найти песню, напевая, насвистывая или напевая мелодию, даже если их исполнение не совсем точное.

«Наша цель в Hum to Search - помочь людям идентифицировать и найти музыку, которая застряла у них в голове», - сообщил Lifewire представитель Google в электронном письме.

Просто начните напевать

Пользователи Google спрашивают, какая песня звучит почти 100 миллионов раз в месяц, – сказала Апарна Ченнапрагада, вице-президент Google и генеральный менеджер по потребительским покупкам, в видеоролике, представляющем несколько новых функций поиска. Теперь есть способ узнать это.

Функция «Hum to Search» встроена в мобильное приложение Google, виджет Google Search и Google Assistant. Чтобы получить к нему доступ через приложение, коснитесь значка микрофона и произнесите «Что это за песня?» Также работает кнопка «Найти песню».

Для правильной работы функция требует, чтобы вы напевали не менее 10-15 секунд. Пользователи Android могут напевать песни на более чем 20 языках, в то время как на iPhone работают только песни на английском языке. Инструмент не всегда может сразу идентифицировать песню, но как только он это делает, результаты довольно хорошие.

Более половины песен широкого набора переменных (тембр, высота тона, громкость и т.д.) распознаются нашими алгоритмами, но, конечно, точность зависит от качества гудения, типа песня и многое другое», - сообщил Lifewire представитель Google в электронном письме. «Но как только он распознан, примерно четыре из пяти ответов верны».

Это не первый раз, когда напевание используется в приложении для идентификации музыки. SoundHound предлагает аналогичную функцию, как отмечает CNN Business, и она также доступна на Android и iOS. По словам представителя Google, новая функция не вызывает никаких проблем с конфиденциальностью и «не меняет способ, которым Google обрабатывает аудио-взаимодействия», сообщили они Lifewire в электронном письме.

Машинное обучение

Несмотря на простоту концепции, напевать мелодию, чтобы найти студийную запись, технически довольно сложно. Этому есть несколько причин, объясняет Кристиан Франк из Google Research в своем блоге от 12 ноября. Во-первых, напевная версия песни может сильно отличаться от реальной записи, что затрудняет их сопоставление. Таким образом, хотя Shazam и множество других приложений уже существуют для идентификации той песни, которую вы слышите в ресторане или другом общественном месте, использование напевной мелодии в качестве основы для этого поиска может быть более сложным..

"С текстами, бэк-вокалом и инструментами звук мюзикла или студийной записи может сильно отличаться от напевной мелодии", - пишет Фрэнк.«По ошибке или намеренно, когда кто-то напевает свою интерпретацию песни, часто высота тона, тональность, темп или ритм могут незначительно или даже значительно отличаться».

Image
Image

Поскольку напевные версии песен могут сильно отличаться от оригиналов, Фрэнк отмечает, что многие прошлые методы требовали сопоставления напева человека с версией песни, в которой есть только мелодия, или с треком, который включает в себя напевание. Это усложнило реальные сценарии использования, поскольку базы данных с этими песнями могут быть ограничены и должны обновляться вручную.

Google объясняет, что для функции Hum to Search он использует модели машинного обучения для преобразования звука в «числовую последовательность», которая представляет мелодию песни - то, что она говорит, можно рассматривать как «отпечаток пальца».."

Более удобный

Использование машинного обучения в функции Google Hum to Search в конечном счете делает этот инструмент намного проще в использовании в реальном мире. Поскольку Hum to Search сопоставляет напевную мелодию искателя с реальной песней, инструмент может работать с новыми песнями по мере их выпуска, а не с базой данных, которую необходимо постоянно обновлять напевными версиями каждого трека. Кроме того, вам не нужен абсолютный слух, чтобы использовать его.

«Существующая система достигает высокого уровня точности в базе данных песен, которая содержит более полумиллиона песен, которые мы постоянно обновляем», - говорится в сообщении Google Hum to Search. «Этому песенному корпусу еще есть куда расти, чтобы включить в него больше мелодий со всего мира».

Рекомендуемые: