Детальная информация

Название: Электронное управление средствами массовой информации, понимание текста и генерация текста с использованием глубокого обучения: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
Авторы: Зейти Бассел
Научный руководитель: Черноруцкий Игорь Георгиевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2021
Коллекция: Научные работы аспирантов/докторантов; Общая коллекция
Тематика: Искусственный интеллект; генерация текста; чат-бот; средства массовой информации; обработка текста; text generation; chatbot; mass media; text processing
УДК: 004.8
ББК: 76.00; 81.112
Тип документа: Научный доклад
Тип файла: Другой
Язык: Русский
Уровень высшего образования: Аспирантура
Код специальности ФГОС: 09.06.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Права доступа: Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Ключ записи: ru\spstu\vkr\14860

Аннотация

Основная цель этого исследования - разработать систему распознавания комментариев клиентов и генерации ответных сообщений. Основная задача в понимании разговорного языка в целенаправленных системах человеко-машинного разговорного понимания состоит в том, чтобы автоматически извлекать семантические концепции или заполнять набор аргументов или «слотов», встроенных в семантический фрейм, для достижения цели в человеческом теле - машинный диалог. Работа была разделена на две части: 1 - первая часть работы - разработка алгоритмов заполнения слотов и обнаружение сущностей, которые являются основной частью понимания текста. 2 - Вторая часть работы - генерация текста, которая позволит генерировать автоматические ответы на комментарии пользователей. Для достижения поставленной цели должны быть решены следующие задачи: 1 - Исследовать архитектуры и алгоритмы сетей глубокого обучения, используемых в области обработки текстов. 2 - Исследовать существующие решения в области распознавания и генерации текста. 3 - Спроектировать новые нейронные сети для достижения лучших результатов и более высокой точности распознавания и генерации текста. 4 - Проверка стабильности и достоверности результатов улучшенных нейронных сетей. 5 - Соединить алгоритм распознавания текста с алгоритмом генерации текста, разработать чат-бота, способного понимать вопросы и генерировать ответы.

The main goal of this research is to develop a system for recognizing customer comments and generating response messages. The main challenge in understanding spoken language in targeted systems is to automatically extract semantic concepts or fill in a set of arguments or "slots" embedded in a semantic frame to achieve a goal in the human body -machine dialogue. The work was divided into two parts: 1 - the first part of the work is the development of algorithms for filling the slots and the detection of entities, which are the basic understanding of the text. 2 - The second part of the work is the generation of text, which will generate automatic replies to user comments. To achieve this goal, the following tasks must be solved: 1 - Explore the architecture and algorithms of deep learning networks, use in the field of word processing. 2 - Explore Considerations in OCR and Text Generation. 3 - Design new neural networks to achieve better results and higher recognition and generation accuracy. 4 - Checking the stability and reliability of the results of the improved neural networks. 5- Combine a text recognition algorithm with a text generation algorithm, develop a bot, a way to understand questions and generate answers.