Система предугадывает, что пользователь скажет в следующий момент, и генерирует звуковой фоновый шум.
Специалисты Колумбийского университета
Алгоритм работает предиктивно. То есть, он способен предугадывать, что пользователь скажет в следующий момент, и генерирует звуковой фоновый шум (шепот), мешающий расслышать разговор.
В настоящее время система работает только с английским языком, а ее эффективность достигает 80%. Громкость шума сравнительно низкая, чтобы не мешать пользователю спокойно разговаривать.
Как показали тестирования, система может делать разговор невозможным для распознавания автоматическими технологиями обработки естественной речи, независимо от используемого ПО и местоположения микрофона.
На сегодняшний день встроенными микрофонами оснащены практически все электронные устройства, которые «слушают» разговоры пользователей, чтобы потом подбирать им релевантную рекламу.
Многие исследователи пытались снизить риск подобной прослушки с помощью белого шума. Однако существующие в настоящее время методы маскировки звука в режиме реального времени использовать на практике невозможно, поскольку для аудио требуется почти мгновенное вычисление, а современное оборудование этого не позволяет.
Единственный способ решить проблему – создать предиктивную модель, которая следила бы за речью, выявляла ее характеристики и генерировала шумовые помехи на базе того, что будет сказано дальше.
На основе моделей прогнозирования глубоких нейронных сетей, применяемых для сокрытия потери пакетов, исследователи Колумбийского университета разработали новый алгоритм, который они назвали моделью «прогнозирующих атак». То есть, чтобы учитывать каждое произнесенное слово, модели распознавания речи обучены расшифровывать, предсказывать, когда пользователь произнесет эти слова, и в нужный момент генерировать шум.
Модель обучалась в течение двух дней с помощью восьми графических процессоров NVIDIA RTX 2080Ti на 100-часовом наборе данных.
В будущем специалисты намерены добавить в систему больше языков и сделать шум практически неразличимым для человеческого уха.
Специалисты Колумбийского университета
Для просмотра ссылки необходимо нажать
Вход или Регистрация
инновационный алгоритм, способный блокировать прослушку разговоров пользователей через микрофоны в смартфонах, голосовых помощниках и других IoT-устройствах.Алгоритм работает предиктивно. То есть, он способен предугадывать, что пользователь скажет в следующий момент, и генерирует звуковой фоновый шум (шепот), мешающий расслышать разговор.
В настоящее время система работает только с английским языком, а ее эффективность достигает 80%. Громкость шума сравнительно низкая, чтобы не мешать пользователю спокойно разговаривать.
Как показали тестирования, система может делать разговор невозможным для распознавания автоматическими технологиями обработки естественной речи, независимо от используемого ПО и местоположения микрофона.
На сегодняшний день встроенными микрофонами оснащены практически все электронные устройства, которые «слушают» разговоры пользователей, чтобы потом подбирать им релевантную рекламу.
Многие исследователи пытались снизить риск подобной прослушки с помощью белого шума. Однако существующие в настоящее время методы маскировки звука в режиме реального времени использовать на практике невозможно, поскольку для аудио требуется почти мгновенное вычисление, а современное оборудование этого не позволяет.
Единственный способ решить проблему – создать предиктивную модель, которая следила бы за речью, выявляла ее характеристики и генерировала шумовые помехи на базе того, что будет сказано дальше.
На основе моделей прогнозирования глубоких нейронных сетей, применяемых для сокрытия потери пакетов, исследователи Колумбийского университета разработали новый алгоритм, который они назвали моделью «прогнозирующих атак». То есть, чтобы учитывать каждое произнесенное слово, модели распознавания речи обучены расшифровывать, предсказывать, когда пользователь произнесет эти слова, и в нужный момент генерировать шум.
Модель обучалась в течение двух дней с помощью восьми графических процессоров NVIDIA RTX 2080Ti на 100-часовом наборе данных.
В будущем специалисты намерены добавить в систему больше языков и сделать шум практически неразличимым для человеческого уха.
Для просмотра ссылки необходимо нажать
Вход или Регистрация