Details

Title Методы повышения быстродействия и точности распознавания ключевых слов для сквозных систем автоматического распознавания речи: специальность 2.3.5. Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей: автореферат диссертации на соискание ученой степени кандидата технических наук
Creators Андрусенко Андрей Юрьевич
Scientific adviser Дробинцев Павел Дмитриевич
Organization Санкт-Петербургский политехнический университет Петра Великого
Imprint Санкт-Петербург, 2025
Collection Научные работы аспирантов/докторантов ; Общая коллекция
Subjects Речь — Распознавание ; сквозное моделирование ; быстродействие ; распознавание ключевых слов ; смещение контекста
UDC 004.934.1'1
Document type Author's Abstract
Language Russian
Speciality code (OKSVNK) 2.3.5.
Speciality group (OKSVNK) 2.0000
DOI 10.18720/SPBPU/2/r25-99
Rights Свободный доступ из сети Интернет (чтение)
Additionally New arrival
Record key RU\SPSTU\edoc\77596
Record create date 12/2/2025

Allowed Actions

Read

Group Anonymous
Network Internet

Данная диссертационная работа посвящена разработке методов повышения быстродействия и точности распознавания ключевых слов для сквозных систем автоматического распознавания речи. Научная новизна работы состоит в разработке новой архитектуры глубокой нейронной сети с прогрессивным сжатием и последующим восстановлением временной последовательности, что снижает вычислительные затраты энкодера при сохранении точности. Также в работе были разработаны методы смещения контекста для заранее известных ключевых слов с использованием акустического детектора слов на основе графа контекста с альтернативными транскрипциями; и для внесловарных слов с использованием модифицированного графа декодирования и дообучением энкодера по критерию максимальной взаимной информации. Экспериментальные исследования показали ускорение работы модели более чем в 1,8 раза, снижение пословной ошибки распознавания на 0,6–1,8%, рост F-меры для ключевых слов до 0,88 и уменьшение ошибки распознавания внесловарных слов на 39,6%. Полученные результаты подтверждают эффективность предложенных решений для их практического применения в системах на основе голосовых интерфейсов и речевой аналитики.

Network User group Action
ILC SPbPU Local Network All
Read
Internet All

Access count: 10 
Last 30 days: 10

Detailed usage statistics