Details

Title Выявление синтетической речи в аудиосообщениях на основе спектрального анализа: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Creators Дзюнов Герман Маратович
Scientific adviser Москвин Дмитрий Андреевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects дипфейк ; классификатор ; акустические признаки ; анализ аудиосигнала ; синтетическая речь ; deepfake ; classifier ; acoustic features ; audio signal analysis ; synthetic speech
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 10.03.01
Speciality group (FGOS) 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2025/vr/vr25-834
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\35666
Record create date 7/30/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Целью данной работы является автоматизация выявления синтетической речи на основе спектрального анализа. Объектом исследования являются технологии обнаружения синтетической речи в аудиосообщениях. Задачи, решаемые в ходе исследования: 1. Анализ современных технологий генерации и обнаружения синтетической речи. 2. Анализ акустических признаков аудиосигнала, используемых для обнаружения синтетической речи. 3. Разработка модели обнаружения синтетической речи. 4. Реализация программного прототипа модели и интеграция в Telegram-бота. В ходе работы проанализированы современные системы обнаружения дипфейков, которые имеют недостатки в виде низкой точности классификации для зашумленных и сжатых аудиосигналов. Сделаны выводы о необходимости создания быстрого и надежного решения. Для общей доступности, полученное средство интегрировано в Telegram-бота. Полученные результаты могут быть применены в целях борьбы с фишинговыми атаками, использующие голосовые дипфейки. Для достижения данных результатов написан собственный классификатор, использующий архитектуру 2D CNN + MLP, позволяющий быстро и с высокой точность анализировать зашумленные и сжатые аудиосигналы.

The purpose of the study is to automate the detection of synthetic speech based on spectral analysis. The object of the study is technologies for detecting synthetic speech in audio messages. The research sets the following goals: 1. Analysis of modern technologies for generating and detecting synthetic voice speech. 2. Analysis of acoustic features of the audio signal used to detect synthetic speech. 3. Development of a synthetic speech detection model. 4. Implementation of the software prototype of the model and integration into the Telegram bot. During the work, modern deepfake detection systems were analyzed, which have disadvantages in the form of low classification accuracy for noisy and compressed audio signals. Conclusions were drawn about the need to create a fast and reliable solution. For general accessibility, the received tool has been integrated into the Telegram bot. The results obtained can be applied to combat phishing attacks using voice deepfakes. To achieve these results, we wrote our own classifier using the 2D CNN + MLP architecture, which allows fast and accurate analysis of noisy and compressed audio signals.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics