Details
Title | Полуавтоматическое извлечение часто задаваемых вопросов из обращений в службу поддержки: магистерская диссертация: 09.04.01 |
---|---|
Creators | Жук Павел Павлович |
Scientific adviser | Ицыксон Владимир Михайлович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2017 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | Распознающие системы и устройства ; Вычислительные машины электронные персональные — Процессоры текстовые ; Информация — Обработка на вычислительных машинах ; Моделирование ; анализ текста ; естественный язык |
UDC | 004.383.8(043.3) ; 004.932.75'1(043.3) |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.01 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/2/v17-4109 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Record key | RU\SPSTU\edoc\44852 |
Record create date | 10/17/2017 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Часто задаваемые вопросы (ЧЗВ) содержат актуальную информацию о программном продукте и позволяют снизить нагрузку на отдел технической поддержки. Формирование ЧЗВ и поддержка их в актуальном состоянии требует существенных затрат от разработчика. Описываемый в данной работе способ позволяет в автоматическом режиме выбрать наиболее релевантные для добавления в ЧЗВ вопросно-ответные пары, которые затем передаются эксперту для редактирования перед публикацией. Для этого применяются методы интеллектуального анализа текста и тематического моделирования. Данный подход может быть применен и для других источников ИТ-дискуссий, таких как: форумы, вопросно-ответные системы. Практические результаты показывают, что используемый подход позволяет упростить формирование актуальных ЧЗВ.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- ВВЕДЕНИЕ
- 1. Анализ методов извлечения часто задаваемых вопросов
- 1.1. Существующие подходы к задаче извлечения ЧЗВ
- 1.2. Тематическое моделирование
- 1.3. Методы построения тематической модели
- 1.3.1. Кластеризация и классификация
- 1.3.2. Латентно-семантическое индексирование
- 1.3.3. Вероятностный латентно-семантический анализ
- 1.3.4. Латентное размещение Дирихле
- 1.3.5. Другие методы
- 1.4. Сравнение тематических моделей
- 1.5. Резюме
- 2. Постановка задачи извлечения вопросно-ответных пар
- 2.1. Анализируемые данные
- 2.2. Формулирование требований
- 2.3. Решаемые задачи
- 2.4. Резюме
- 3. Разработка технологии извлечения вопросно-ответных пар
- 3.1. Обзор этапов подхода
- 3.2. Предобработка данных
- 3.2.1. Эвристики отображения
- 3.2.2. Эвристики тематического моделирования
- 3.2.3. Фильтрация обращений
- 3.3. Тематическое моделирование
- 3.3.1. Скрытое размещение Дирихле
- 3.4. Формирование пар вопрос-ответ
- 3.4.1. Дополнительная фильтрация
- 3.4.2. Определение вопросов и ответов
- 3.4.3. Удаление расфокусированных тем
- 3.5. Резюме
- 4. Реализация алгоритма извлечения вопросно-ответных пар
- 4.1. Используемые технологии
- 4.2. Структура проекта
- 4.3. Получение исходных данных
- 4.4. Модель данных
- 4.5. Взаимодействие с базой данных
- 4.6. Реализация предобработки данных
- 4.6.1. Фильтрация данных
- 4.6.2. Эвристики предобработки
- 4.7. Построение тематической модели
- 4.7.1. Выбор реализации LDA
- 4.7.2. Пакет org.jetbrains.zkb.lda
- 4.8. Поиск вопросно-ответных пар
- 4.9. Резюме
- 5. Оценка эффективности разработанного подхода извлечения вопросно-ответных пар
- 5.1. Определение доли найденных ВОП
- 5.2. Оценка влияния эвристик и параметров на качество ВОП
- 5.3. Экспертная оценка
- 5.4. Резюме
- ЗАКЛЮЧЕНИЕ
- СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
- ПРИЛОЖЕНИЕ А. Регулярные выражения
- ПРИЛОЖЕНИЕ Б. Примеры вопросно-ответных пар
Access count: 478
Last 30 days: 0