Details
Title | Выявление синтетической речи в аудиосообщениях на основе спектрального анализа: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем» |
---|---|
Creators | Дзюнов Герман Маратович |
Scientific adviser | Москвин Дмитрий Андреевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | дипфейк ; классификатор ; акустические признаки ; анализ аудиосигнала ; синтетическая речь ; deepfake ; classifier ; acoustic features ; audio signal analysis ; synthetic speech |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 10.03.01 |
Speciality group (FGOS) | 100000 - Информационная безопасность |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-834 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\35666 |
Record create date | 7/30/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Целью данной работы является автоматизация выявления синтетической речи на основе спектрального анализа. Объектом исследования являются технологии обнаружения синтетической речи в аудиосообщениях. Задачи, решаемые в ходе исследования: 1. Анализ современных технологий генерации и обнаружения синтетической речи. 2. Анализ акустических признаков аудиосигнала, используемых для обнаружения синтетической речи. 3. Разработка модели обнаружения синтетической речи. 4. Реализация программного прототипа модели и интеграция в Telegram-бота. В ходе работы проанализированы современные системы обнаружения дипфейков, которые имеют недостатки в виде низкой точности классификации для зашумленных и сжатых аудиосигналов. Сделаны выводы о необходимости создания быстрого и надежного решения. Для общей доступности, полученное средство интегрировано в Telegram-бота. Полученные результаты могут быть применены в целях борьбы с фишинговыми атаками, использующие голосовые дипфейки. Для достижения данных результатов написан собственный классификатор, использующий архитектуру 2D CNN + MLP, позволяющий быстро и с высокой точность анализировать зашумленные и сжатые аудиосигналы.
The purpose of the study is to automate the detection of synthetic speech based on spectral analysis. The object of the study is technologies for detecting synthetic speech in audio messages. The research sets the following goals: 1. Analysis of modern technologies for generating and detecting synthetic voice speech. 2. Analysis of acoustic features of the audio signal used to detect synthetic speech. 3. Development of a synthetic speech detection model. 4. Implementation of the software prototype of the model and integration into the Telegram bot. During the work, modern deepfake detection systems were analyzed, which have disadvantages in the form of low classification accuracy for noisy and compressed audio signals. Conclusions were drawn about the need to create a fast and reliable solution. For general accessibility, the received tool has been integrated into the Telegram bot. The results obtained can be applied to combat phishing attacks using voice deepfakes. To achieve these results, we wrote our own classifier using the 2D CNN + MLP architecture, which allows fast and accurate analysis of noisy and compressed audio signals.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0