Детальная информация

Название: Разработка средств поддержания беседы вне сценария для корпоративного диалогового ассистента: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Авторы: Владыкина Елизавета Андреевна
Научный руководитель: Тимофеев Дмитрий Андреевич
Другие авторы: Трифонов Петр Владимирович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: BERT; NLP; чатбот; премия лебнера; тест тьюринга; transformer; chatbot; lebner prize; turing test
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 02.03.02
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1181
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Цель работы - разработка, программная реализация и исследование диалогового ассистента, наиболее осмысленно поддерживающего выходящий за рамки сценария диалог с пользователем. В ходе проведенной работы была изучена предметная область, выбраны алгоритмы нахождения близости реплик, обработки естественного языка и обучения нейронных сетей. Для оценки близости реплик применяются различные метрики, реализованные как в библиотеке, так и в процессе самой работы: индекс Жаккара, расстояние Левенштейна, метрики на основе эмоциональной и таксономической близости слов, а также метрика, основанная на предсказании предложений нейросетью BERT. В ходе работы был разработан модуль, включающий адаптеры различных методов поиска ответа, на основе библиотеки Chatterbot, была добавлена возможность вычисления близости реплик с помощью векторного представления реплик и дальнейшем нахождении вероятности связности ответа на нее с входной репликой. Полученный модуль использует API для получения и передачи реплик и способен интегрироваться через него с другими модулями. По результатам проведенных исследований выявлено преимущество разработанной метрики по сравнению с другими, тестирование проводилось экспертной оценкой ответов метками разумности.

The purpose of the work is the development, software implementation and research of a dialogue assistant that most meaningfully supports a dialogue with the user that goes beyond the scope of the script. In the course of the work, the subject area was studied, algorithms were selected to find the proximity of replicas, process natural language and learn neural networks. To measure the proximity of replicas, various metrics are used that are implemented both in the library and in the process: Jacquard index, Levenshtein distance, metrics based on the emotional and taxonomic proximity of words, and a metric based on prediction of sentences by the BERT neural network. In the course of work, a module was developed, including adapters of various response search methods, based on the Chatterbot library, the ability to calculate the proximity of replicas using the vector representation of replicas and further finding the likelihood of a response to it with the input replica was added. The resulting module uses the API to receive and transmit replicas and is able to integrate through it with other modules. According to the results of the studies, the advantage of the developed metric compared with others was revealed, testing was carried out by an expert evaluation of the answers with rationality marks.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
Интернет Авторизованные пользователи (не СПбПУ)
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 11
За последние 30 дней: 2
Подробная статистика