Как беглое распознавание голоса остается быстрым, точным и конфиденциальным

Оглавление:

Как беглое распознавание голоса остается быстрым, точным и конфиденциальным
Как беглое распознавание голоса остается быстрым, точным и конфиденциальным
Anonim

Ключевые выводы

  • Fluent - это сверхбыстрая система распознавания голоса, обеспечивающая конфиденциальность и не требующая подключения к Интернету.
  • Его можно встроить практически в любое устройство.
  • Работает на любом языке.
Image
Image

Fluent.ai - это виртуальный движок распознавания голоса, который не отправляет ваши команды в интернет, действует почти мгновенно, может работать на любом языке и настолько мал, что его можно встроить даже в дешевый, недорогой -устройства питания, такие как фитнес-часы, например.

В отличие от Siri и Alexa, Fluent - это автономный помощник, который мгновенно понимает вас и учится у вас, поэтому чем больше вы его используете, тем лучше он становится. У него нет глубины обычных виртуальных помощников, но это и не предназначено. Наоборот, он быстрее, точнее и приватнее, чем усилия Apple, Amazon и Google.

«Преобразование речи в текст использует обработку естественного языка, а затем определяет намерение», - сказал Lifewire генеральный директор Fluent Пробал Лала во время интервью Zoom. «Для этого требуется много данных и большая вычислительная мощность. Fluent переходит непосредственно от речи к намерению, беря ваш голос и преобразовывая его непосредственно в действие».

Итог

Fluent - это программа для голосового управления. Он работает, слушая вашу команду и удаляя все ненужные слова, оставляя только необходимые существительные и глаголы. «Выключите свет», становится просто выключенным и загорается. Основные элементы вырезаны из беспорядочного человеческого предложения и превращены в шаги. Это почти как программировать компьютер, превращая сложную идею в простейший набор инструкций.

Для чего это можно использовать?

Fluent можно использовать для чего угодно. Суть в том, что он обучен для конкретной ситуации. Например, смарт-часы можно обучить командам для фитнеса или домашней автоматизации, создания календаря и таймера и так далее. Ограничение базы данных делает все более сфокусированным и сохраняет скорость.

«Правда в том, что с носимыми устройствами вы не хотите разговаривать, - сказала Лала, - я хочу, может быть, начать свою любимую тренировку, и хочу, чтобы это произошло очень быстро».

Скорость и точность решают все. Включение и выключение света занимает миллисекунды, вместо того, чтобы ждать, пока Siri отправит ваш голос в облако, дождаться его обработки, а затем, через несколько секунд, свет погаснет.

Это узкое обучение также снижает размер приложения. В прошлом году Google предоставил загружаемую автономную версию своего помощника. Он был, говорит Лала, 85 Мегабайт, работал только на английском языке, и на его обучение ушло полгода.

"У нас есть одна модель, работающая с 13 000 команд и работающая с 500 килобайтами", - сказал он.

Итог

Другим преимуществом автономного механизма распознавания голоса является конфиденциальность. В детских смарт-часах, например, «вы же не хотите, чтобы детский голос уходил в облако», - говорит Лала. Фактически, Fluent может работать внутри устройств, которые никогда не подключаются к Интернету. Это хорошо не только для конфиденциальности, но и для безопасности. Вы можете использовать автономный механизм распознавания голоса в исследовательских лабораториях, военных объектах и других местах, где запрещены сотовые телефоны и камеры.

Ограничения

Конечно, у этой модели есть и недостатки. Во-первых, команды не могут быть добавлены позже. После того, как начальная подготовка завершена, все. Помощник, использующий Fluent, также не может искать информацию в Интернете для вас - спортивные результаты, актера, которого вы узнали в этом фильме, но просто не можете определить, и так далее.

Image
Image

Вместо этого система достаточно умна, чтобы распознать, когда она не может помочь, и передать запрос тому, кто может. Если вы спросите у часов прогноз погоды, Fluent поймет, что они их не понимают. «Затем он вызовет службу, предварительно запрограммированную в часах, будь то Amazon Alexa или Google, а затем сделает вызов в облако», передав вам необработанную голосовую команду, чтобы получить ответ.

Этот гибридный подход сохраняет скорость локального автономного помощника с мощью Alexa или Google Assistant в качестве резервной копии.

Можете ли вы купить устройства Fluent?

Пока нет. Компания лицензирует свои технологии и проводит обучение для других компаний. Из-за COVID два крупных запуска были перенесены на следующий год. Но вы можете ожидать, что он появится в часах и других фитнес-устройствах, колонках, центрах домашней автоматизации и так далее.

Было бы здорово, если бы это также было встроено непосредственно в смартфоны, такие как iPhone, что ускоряло выполнение повседневных задач и прибегало к помощи Siri только в случае необходимости. Это было бы настоящее убойное приложение.

Обновление: 22 октября, 10:12. Внесены изменения, чтобы называть Fluent механизмом распознавания голоса, а не голосовым помощником.

Рекомендуемые: