Детальная информация

Название Выявление синтетической речи в аудиосообщениях на основе спектрального анализа: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Авторы Дзюнов Герман Маратович
Научный руководитель Москвин Дмитрий Андреевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика дипфейк ; классификатор ; акустические признаки ; анализ аудиосигнала ; синтетическая речь ; deepfake ; classifier ; acoustic features ; audio signal analysis ; synthetic speech
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 10.03.01
Группа специальностей ФГОС 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2025/vr/vr25-834
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\35666
Дата создания записи 30.07.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Целью данной работы является автоматизация выявления синтетической речи на основе спектрального анализа. Объектом исследования являются технологии обнаружения синтетической речи в аудиосообщениях. Задачи, решаемые в ходе исследования: 1. Анализ современных технологий генерации и обнаружения синтетической речи. 2. Анализ акустических признаков аудиосигнала, используемых для обнаружения синтетической речи. 3. Разработка модели обнаружения синтетической речи. 4. Реализация программного прототипа модели и интеграция в Telegram-бота. В ходе работы проанализированы современные системы обнаружения дипфейков, которые имеют недостатки в виде низкой точности классификации для зашумленных и сжатых аудиосигналов. Сделаны выводы о необходимости создания быстрого и надежного решения. Для общей доступности, полученное средство интегрировано в Telegram-бота. Полученные результаты могут быть применены в целях борьбы с фишинговыми атаками, использующие голосовые дипфейки. Для достижения данных результатов написан собственный классификатор, использующий архитектуру 2D CNN + MLP, позволяющий быстро и с высокой точность анализировать зашумленные и сжатые аудиосигналы.

The purpose of the study is to automate the detection of synthetic speech based on spectral analysis. The object of the study is technologies for detecting synthetic speech in audio messages. The research sets the following goals: 1. Analysis of modern technologies for generating and detecting synthetic voice speech. 2. Analysis of acoustic features of the audio signal used to detect synthetic speech. 3. Development of a synthetic speech detection model. 4. Implementation of the software prototype of the model and integration into the Telegram bot. During the work, modern deepfake detection systems were analyzed, which have disadvantages in the form of low classification accuracy for noisy and compressed audio signals. Conclusions were drawn about the need to create a fast and reliable solution. For general accessibility, the received tool has been integrated into the Telegram bot. The results obtained can be applied to combat phishing attacks using voice deepfakes. To achieve these results, we wrote our own classifier using the 2D CNN + MLP architecture, which allows fast and accurate analysis of noisy and compressed audio signals.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика