Ключевые выводы
- Все больше программ могут понимать вашу речь.
- Новая технология генерирует пользовательский звуковой шум на заднем фоне, когда вы говорите, чтобы сбить с толку программное обеспечение, которое может прослушивать.
-
Новая техника обеспечивает производительность в режиме реального времени, прогнозируя атаку на будущее сигнала или слова.
Многие программы могут понимать вашу речь во время телефонных или видеозвонков, и эксперты говорят, что они могут представлять угрозу конфиденциальности.
Новая технология, разработанная исследователями Колумбийского университета под названием Neural Voice Camouflage, может предложить защиту. Когда вы говорите, он создает пользовательский звуковой шум в фоновом режиме, сбивая с толку искусственный интеллект (ИИ), который слушает и расшифровывает голоса.
«Присутствие транскрипции ИИ вызывает вопросы доверия», - Майкл Хут, соучредитель Xayn, поисковой системы, защищающей конфиденциальность, и глава компьютерного факультета Имперского колледжа Лондона, который не участвовал в исследование, сказал Lifewire в интервью по электронной почте. «Участники встречи могут быть более осторожными в отношении того, какие вопросы они поднимают и как транскрибируется их речь. Это может быть хорошо, поскольку может улучшить уважительное поведение, но также может быть и плохо, поскольку разговор может быть менее открытым из-за оговорки по поводу используемой технологии."
Слушать и учиться
Исследователи из Колумбийского университета работали над созданием алгоритма, который мог бы взломать нейронные сети в режиме реального времени. Новый подход использует «прогностические атаки» - сигнал, который может разрушить любое слово, которое модели автоматического распознавания речи обучены расшифровывать. Кроме того, когда звуки атаки воспроизводятся в эфире, они должны быть достаточно громкими, чтобы нарушить работу любого постороннего «подслушивающего» микрофона, который может находиться далеко.
«Ключевая техническая задача для достижения этого заключалась в том, чтобы заставить все это работать достаточно быстро», - сказал в новостях Карл Вондрик, профессор компьютерных наук в Колумбийском университете и один из авторов исследования, описывающего новый подход. выпускать. «Наш алгоритм, который блокирует неправильный микрофон, не позволяя правильно слышать ваши слова в 80% случаев, является самым быстрым и точным на нашем испытательном стенде».
Новая техника обеспечивает производительность в режиме реального времени, прогнозируя атаку на будущее сигнала или слова. Команда оптимизировала атаку, поэтому она имеет громкость, подобную обычному фоновому шуму, что позволяет людям в комнате разговаривать естественно и без успешного контроля со стороны автоматической системы распознавания речи.
Участники собрания могут быть более осторожными в отношении того, какие вопросы они поднимают и как транскрибируется их речь.
Ученые заявили, что их метод работает, даже если вы ничего не знаете о мошенническом микрофоне, например, о его местонахождении или даже о работающем на нем программном обеспечении. Он маскирует голос человека в эфире, скрывая его от этих систем прослушивания и не мешая разговору между людьми в комнате.
"Пока что наш метод работает для большей части словарного запаса английского языка, и мы планируем применить алгоритм на большем количестве языков, а также в конечном итоге сделать звук шепота совершенно незаметным", - Миа Шикье, ведущий автор. исследования и аспиранта в лаборатории Вондрика, говорится в пресс-релизе.
Сохранение ваших разговоров в тайне
Как будто всего этого было недостаточно, рекламные объявления могут быть нацелены на вас на основе звука, записанного с вашего смартфона или устройств умного дома.
«С такими устройствами, как [Amazon Echo] и их аналогами, эти устройства не только всегда находятся в вашем доме, постоянно слушая все, что вы говорите или делаете, но и благодаря многолетнему сбору данных от своих пользователей усовершенствованная обработка естественного языка (преобразование устной речи в текст/полезные данные для устройств с помощью комбинации микрофонов, программного обеспечения и искусственного интеллекта)», - написал в электронном письме Эрик Хейг, сотрудник Harbour Research, фирмы, занимающейся стратегическим консалтингом и венчурным развитием.
Транскрипция разговорной речи ИИ теперь является стандартной частью стандартного коммерческого программного обеспечения, сказал Хут. Например, в Microsoft Teams есть возможность записи собрания со встроенными транскрипциями ИИ, которые могут просматривать все участники в режиме реального времени. Полная стенограмма может служить протоколом встречи. Обычно такие стенограммы позволяют вести протокол (т. н. ведение заметок), при этом протокол утверждается на следующем собрании.
«Люди могут быть обеспокоены возможностью слежки, когда включена транскрипция ИИ», - добавил Хут.«Это очень похоже на опасения, что разговор будет записан без согласия или тайно».
Но не все согласны с тем, что смарт-устройства представляют собой угрозу. Большинству людей не нужно беспокоиться о программах, прослушивающих ваши разговоры, сказал Lifewire по электронной почте Брэд Хонг, руководитель отдела по работе с клиентами в фирме по кибербезопасности Horizon3. Он сказал, что сейчас самое серьезное беспокойство вызывает не то, кто вас записывает, а то, как они хранят данные.
«Все истории, которые можно услышать об активации микрофона на компьютере или мобильном устройстве, подслушивании Alexa или Google Home или даже о слежке со стороны правительства, - это правда, что все это вызывает у непрофессионала желудок», - добавил Хонг.. «Но в целом люди редко оказываются в ситуации, которая действительно требует маскировки их голоса».