Details

Title: Разработка средств поддержания беседы вне сценария для корпоративного диалогового ассистента: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Creators: Владыкина Елизавета Андреевна
Scientific adviser: Тимофеев Дмитрий Андреевич
Other creators: Трифонов Петр Владимирович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: BERT; NLP; чатбот; премия лебнера; тест тьюринга; transformer; chatbot; lebner prize; turing test
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 02.03.02
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1181
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\8115

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Цель работы - разработка, программная реализация и исследование диалогового ассистента, наиболее осмысленно поддерживающего выходящий за рамки сценария диалог с пользователем. В ходе проведенной работы была изучена предметная область, выбраны алгоритмы нахождения близости реплик, обработки естественного языка и обучения нейронных сетей. Для оценки близости реплик применяются различные метрики, реализованные как в библиотеке, так и в процессе самой работы: индекс Жаккара, расстояние Левенштейна, метрики на основе эмоциональной и таксономической близости слов, а также метрика, основанная на предсказании предложений нейросетью BERT. В ходе работы был разработан модуль, включающий адаптеры различных методов поиска ответа, на основе библиотеки Chatterbot, была добавлена возможность вычисления близости реплик с помощью векторного представления реплик и дальнейшем нахождении вероятности связности ответа на нее с входной репликой. Полученный модуль использует API для получения и передачи реплик и способен интегрироваться через него с другими модулями. По результатам проведенных исследований выявлено преимущество разработанной метрики по сравнению с другими, тестирование проводилось экспертной оценкой ответов метками разумности.

The purpose of the work is the development, software implementation and research of a dialogue assistant that most meaningfully supports a dialogue with the user that goes beyond the scope of the script. In the course of the work, the subject area was studied, algorithms were selected to find the proximity of replicas, process natural language and learn neural networks. To measure the proximity of replicas, various metrics are used that are implemented both in the library and in the process: Jacquard index, Levenshtein distance, metrics based on the emotional and taxonomic proximity of words, and a metric based on prediction of sentences by the BERT neural network. In the course of work, a module was developed, including adapters of various response search methods, based on the Chatterbot library, the ability to calculate the proximity of replicas using the vector representation of replicas and further finding the likelihood of a response to it with the input replica was added. The resulting module uses the API to receive and transmit replicas and is able to integrate through it with other modules. According to the results of the studies, the advantage of the developed metric compared with others was revealed, testing was carried out by an expert evaluation of the answers with rationality marks.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 24
Last 30 days: 1
Detailed usage statistics