Details

Title Электронное управление средствами массовой информации, понимание текста и генерация текста с использованием глубокого обучения: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
Creators Зейти Бассел
Scientific adviser Черноруцкий Игорь Георгиевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2021
Collection Научные работы аспирантов/докторантов; Общая коллекция
Subjects Искусственный интеллект; генерация текста; чат-бот; средства массовой информации; обработка текста; text generation; chatbot; mass media; text processing
UDC 004.8
LBC 76.00; 81.112
Document type Scientific report
File type Other
Language Russian
Level of education Graduate student
Speciality code (FGOS) 09.06.01
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
Rights Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Record key ru\spstu\vkr\14860
Record create date 9/24/2021

Основная цель этого исследования - разработать систему распознавания комментариев клиентов и генерации ответных сообщений. Основная задача в понимании разговорного языка в целенаправленных системах человеко-машинного разговорного понимания состоит в том, чтобы автоматически извлекать семантические концепции или заполнять набор аргументов или «слотов», встроенных в семантический фрейм, для достижения цели в человеческом теле - машинный диалог. Работа была разделена на две части: 1 - первая часть работы - разработка алгоритмов заполнения слотов и обнаружение сущностей, которые являются основной частью понимания текста. 2 - Вторая часть работы - генерация текста, которая позволит генерировать автоматические ответы на комментарии пользователей. Для достижения поставленной цели должны быть решены следующие задачи: 1 - Исследовать архитектуры и алгоритмы сетей глубокого обучения, используемых в области обработки текстов. 2 - Исследовать существующие решения в области распознавания и генерации текста. 3 - Спроектировать новые нейронные сети для достижения лучших результатов и более высокой точности распознавания и генерации текста. 4 - Проверка стабильности и достоверности результатов улучшенных нейронных сетей. 5 - Соединить алгоритм распознавания текста с алгоритмом генерации текста, разработать чат-бота, способного понимать вопросы и генерировать ответы.

The main goal of this research is to develop a system for recognizing customer comments and generating response messages. The main challenge in understanding spoken language in targeted systems is to automatically extract semantic concepts or fill in a set of arguments or "slots" embedded in a semantic frame to achieve a goal in the human body -machine dialogue. The work was divided into two parts: 1 - the first part of the work is the development of algorithms for filling the slots and the detection of entities, which are the basic understanding of the text. 2 - The second part of the work is the generation of text, which will generate automatic replies to user comments. To achieve this goal, the following tasks must be solved: 1 - Explore the architecture and algorithms of deep learning networks, use in the field of word processing. 2 - Explore Considerations in OCR and Text Generation. 3 - Design new neural networks to achieve better results and higher recognition and generation accuracy. 4 - Checking the stability and reliability of the results of the improved neural networks. 5- Combine a text recognition algorithm with a text generation algorithm, develop a bot, a way to understand questions and generate answers.