Ключевые выводы
- Fluent - это сверхбыстрая система распознавания голоса, обеспечивающая конфиденциальность и не требующая подключения к Интернету.
- Его можно встроить практически в любое устройство.
- Работает на любом языке.
Fluent.ai - это виртуальный движок распознавания голоса, который не отправляет ваши команды в интернет, действует почти мгновенно, может работать на любом языке и настолько мал, что его можно встроить даже в дешевый, недорогой -устройства питания, такие как фитнес-часы, например.
В отличие от Siri и Alexa, Fluent - это автономный помощник, который мгновенно понимает вас и учится у вас, поэтому чем больше вы его используете, тем лучше он становится. У него нет глубины обычных виртуальных помощников, но это и не предназначено. Наоборот, он быстрее, точнее и приватнее, чем усилия Apple, Amazon и Google.
«Преобразование речи в текст использует обработку естественного языка, а затем определяет намерение», - сказал Lifewire генеральный директор Fluent Пробал Лала во время интервью Zoom. «Для этого требуется много данных и большая вычислительная мощность. Fluent переходит непосредственно от речи к намерению, беря ваш голос и преобразовывая его непосредственно в действие».
Итог
Fluent - это программа для голосового управления. Он работает, слушая вашу команду и удаляя все ненужные слова, оставляя только необходимые существительные и глаголы. «Выключите свет», становится просто выключенным и загорается. Основные элементы вырезаны из беспорядочного человеческого предложения и превращены в шаги. Это почти как программировать компьютер, превращая сложную идею в простейший набор инструкций.
Для чего это можно использовать?
Fluent можно использовать для чего угодно. Суть в том, что он обучен для конкретной ситуации. Например, смарт-часы можно обучить командам для фитнеса или домашней автоматизации, создания календаря и таймера и так далее. Ограничение базы данных делает все более сфокусированным и сохраняет скорость.
«Правда в том, что с носимыми устройствами вы не хотите разговаривать, - сказала Лала, - я хочу, может быть, начать свою любимую тренировку, и хочу, чтобы это произошло очень быстро».
Скорость и точность решают все. Включение и выключение света занимает миллисекунды, вместо того, чтобы ждать, пока Siri отправит ваш голос в облако, дождаться его обработки, а затем, через несколько секунд, свет погаснет.
Это узкое обучение также снижает размер приложения. В прошлом году Google предоставил загружаемую автономную версию своего помощника. Он был, говорит Лала, 85 Мегабайт, работал только на английском языке, и на его обучение ушло полгода.
"У нас есть одна модель, работающая с 13 000 команд и работающая с 500 килобайтами", - сказал он.
Итог
Другим преимуществом автономного механизма распознавания голоса является конфиденциальность. В детских смарт-часах, например, «вы же не хотите, чтобы детский голос уходил в облако», - говорит Лала. Фактически, Fluent может работать внутри устройств, которые никогда не подключаются к Интернету. Это хорошо не только для конфиденциальности, но и для безопасности. Вы можете использовать автономный механизм распознавания голоса в исследовательских лабораториях, военных объектах и других местах, где запрещены сотовые телефоны и камеры.
Ограничения
Конечно, у этой модели есть и недостатки. Во-первых, команды не могут быть добавлены позже. После того, как начальная подготовка завершена, все. Помощник, использующий Fluent, также не может искать информацию в Интернете для вас - спортивные результаты, актера, которого вы узнали в этом фильме, но просто не можете определить, и так далее.
Вместо этого система достаточно умна, чтобы распознать, когда она не может помочь, и передать запрос тому, кто может. Если вы спросите у часов прогноз погоды, Fluent поймет, что они их не понимают. «Затем он вызовет службу, предварительно запрограммированную в часах, будь то Amazon Alexa или Google, а затем сделает вызов в облако», передав вам необработанную голосовую команду, чтобы получить ответ.
Этот гибридный подход сохраняет скорость локального автономного помощника с мощью Alexa или Google Assistant в качестве резервной копии.
Можете ли вы купить устройства Fluent?
Пока нет. Компания лицензирует свои технологии и проводит обучение для других компаний. Из-за COVID два крупных запуска были перенесены на следующий год. Но вы можете ожидать, что он появится в часах и других фитнес-устройствах, колонках, центрах домашней автоматизации и так далее.
Было бы здорово, если бы это также было встроено непосредственно в смартфоны, такие как iPhone, что ускоряло выполнение повседневных задач и прибегало к помощи Siri только в случае необходимости. Это было бы настоящее убойное приложение.
Обновление: 22 октября, 10:12. Внесены изменения, чтобы называть Fluent механизмом распознавания голоса, а не голосовым помощником.