Выявление синтетической речи в аудиосообщениях на основе спектрального анализа: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»

Дзюнов, Герман Маратович

Details

Title	Выявление синтетической речи в аудиосообщениях на основе спектрального анализа: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Creators	Дзюнов Герман Маратович
Scientific adviser	Москвин Дмитрий Андреевич
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint	Санкт-Петербург, 2025
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	дипфейк ; классификатор ; акустические признаки ; анализ аудиосигнала ; синтетическая речь ; deepfake ; classifier ; acoustic features ; audio signal analysis ; synthetic speech
Document type	Bachelor graduation qualification work
File type	PDF
Language	Russian
Level of education	Bachelor
Speciality code (FGOS)	10.03.01
Speciality group (FGOS)	100000 - Информационная безопасность
DOI	10.18720/SPBPU/3/2025/vr/vr25-834
Rights	Доступ по паролю из сети Интернет (чтение)
Additionally	New arrival
Record key	ru\spstu\vkr\35666
Record create date	7/30/2025

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

Целью данной работы является автоматизация выявления синтетической речи на основе спектрального анализа. Объектом исследования являются технологии обнаружения синтетической речи в аудиосообщениях. Задачи, решаемые в ходе исследования: 1. Анализ современных технологий генерации и обнаружения синтетической речи. 2. Анализ акустических признаков аудиосигнала, используемых для обнаружения синтетической речи. 3. Разработка модели обнаружения синтетической речи. 4. Реализация программного прототипа модели и интеграция в Telegram-бота. В ходе работы проанализированы современные системы обнаружения дипфейков, которые имеют недостатки в виде низкой точности классификации для зашумленных и сжатых аудиосигналов. Сделаны выводы о необходимости создания быстрого и надежного решения. Для общей доступности, полученное средство интегрировано в Telegram-бота. Полученные результаты могут быть применены в целях борьбы с фишинговыми атаками, использующие голосовые дипфейки. Для достижения данных результатов написан собственный классификатор, использующий архитектуру 2D CNN + MLP, позволяющий быстро и с высокой точность анализировать зашумленные и сжатые аудиосигналы.

The purpose of the study is to automate the detection of synthetic speech based on spectral analysis. The object of the study is technologies for detecting synthetic speech in audio messages. The research sets the following goals: 1. Analysis of modern technologies for generating and detecting synthetic voice speech. 2. Analysis of acoustic features of the audio signal used to detect synthetic speech. 3. Development of a synthetic speech detection model. 4. Implementation of the software prototype of the model and integration into the Telegram bot. During the work, modern deepfake detection systems were analyzed, which have disadvantages in the form of low classification accuracy for noisy and compressed audio signals. Conclusions were drawn about the need to create a fast and reliable solution. For general accessibility, the received tool has been integrated into the Telegram bot. The results obtained can be applied to combat phishing attacks using voice deepfakes. To achieve these results, we wrote our own classifier using the 2D CNN + MLP architecture, which allows fast and accurate analysis of noisy and compressed audio signals.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 0
Last 30 days: 0

Detailed usage statistics