Ключевые выводы
- Исследователи разработали метод шифрования разговоров, чтобы предотвратить запись наших разговоров с помощью мошеннических микрофонов.
- Метод важен, поскольку он работает в режиме реального времени с потоковым аудио и требует минимального обучения.
- Эксперты приветствуют исследование, но считают, что оно не очень полезно для обычного пользователя смартфона.
Нас окружают смарт-устройства с микрофонами, но что, если они были скомпрометированы, чтобы нас подслушивать?
Стремясь оградить наши разговоры от прослушивания, исследователи Колумбийского университета разработали метод Neural Voice Camouflage, который нарушает работу автоматических систем распознавания речи в режиме реального времени, не причиняя неудобств людям.
«С вторжением [умных устройств с голосовым управлением] в нашу жизнь идея конфиденциальности начинает испаряться, поскольку эти подслушивающие устройства всегда включены и следят за тем, что говорят», - Чарльз Эверетт, директор Cyber Advocacy, Deep Instinct, сообщил Lifewire по электронной почте. «Это исследование является прямым ответом на необходимость скрыть или замаскировать голос и разговоры человека от этих электронных подслушивающих устройств, известных или неизвестных в этом районе».
Обсуждение
Исследователи разработали систему, генерирующую тихие звуки, которые вы можете воспроизводить в любой комнате, чтобы не дать мошенническим микрофонам шпионить за вашими разговорами.
То, как этот тип технологии противостоит подслушиванию, напоминает Эверетту о наушниках с шумоподавлением. Вместо того, чтобы генерировать тихий шепот для устранения фонового шума, исследователи транслируют фоновые звуки, которые нарушают работу алгоритмов искусственного интеллекта (ИИ), которые преобразуют звуковые волны в понятный звук.
Такие механизмы маскировки голоса человека не уникальны, но что отличает Neural Voice Camouflage от других методов, так это то, что он работает в режиме реального времени при потоковом аудио.
«Чтобы работать с живой речью, наш подход должен предсказывать [правильный скремблированный звук] в будущем, чтобы их можно было воспроизводить в реальном времени», - отмечают исследователи в своей статье. В настоящее время метод работает для большинства англоязычных языков.
Ханс Хансен, генеральный директор Brand3D, сказал Lifewire, что исследование очень важно, поскольку оно направлено на борьбу с одним из основных недостатков современных систем искусственного интеллекта.
В разговоре по электронной почте Хансен объяснил, что современные системы искусственного интеллекта с глубоким обучением в целом и естественное распознавание речи в частности работают после обработки миллионов записей речевых данных, собранных от тысяч говорящих. Напротив, Neural Voice Camouflage работает после того, как обучится всего двум секундам входной речи.
Лично, если я беспокоюсь о прослушивающих устройствах, мое решение не будет состоять в том, чтобы добавить еще одно прослушивающее устройство, которое стремится генерировать фоновый шум.
Не то дерево?
Брайан Чаппелл, главный специалист по безопасности BeyondTrust, считает, что исследование более полезно для бизнес-пользователей, которые опасаются, что могут оказаться среди взломанных устройств, прослушивающих ключевые слова, указывающие на то, что речь идет о ценной информации.
«Эта технология потенциально может быть более интересной, так это в более авторитарном государстве наблюдения, где ИИ анализирует видео и голосовые отпечатки против граждан», - сказал Lifewire Джеймс Мод, ведущий исследователь кибербезопасности BeyondTrust.
Мод предположила, что лучшей альтернативой будет внедрение контроля конфиденциальности в отношении того, как данные собираются, хранятся и используются этими устройствами. Более того, Чаппелл считает, что полезность метода исследователя ограничена, поскольку он не предназначен для предотвращения подслушивания людей.
"Что касается дома, имейте в виду, что, по крайней мере теоретически, использование такого инструмента приведет к тому, что Siri, Alexa, Google Home и любая другая система, которая активируется произнесенным триггерным словом, будет игнорировать вас", - сказал Чаппелл.
Но эксперты считают, что с увеличением числа технологий искусственного интеллекта и машинного обучения в наших смарт-устройствах вполне возможно, что в ближайшем будущем эта технология может оказаться внутри наших телефонов.
Мод обеспокоена тем, что технологии искусственного интеллекта могут быстро научиться отличать шум от реального звука. Он считает, что хотя изначально система может быть успешной, она может быстро превратиться в игру в кошки-мышки, поскольку подслушивающее устройство научится отфильтровывать помехи.
Что еще более тревожно, Мод отметила, что любой, кто использует его, может на самом деле привлечь внимание к себе, поскольку нарушение распознавания голоса может показаться необычным и может указывать на то, что вы пытаетесь что-то скрыть.
«Лично, если я беспокоюсь о прослушивающих устройствах, мое решение не будет состоять в том, чтобы добавить еще одно прослушивающее устройство, которое стремится генерировать фоновый шум», - поделилась Мод. «Особенно потому, что это увеличивает риск того, что устройство или приложение будет взломано и сможет меня слушать».