Details

Title: Генерация кода на основе естественного языка: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_01 «Математическое моделирование и искусственный интеллект»
Creators: Келарев Михаил Алексеевич
Scientific adviser: Беляев Сергей Юрьевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: генерация кода; RNN; Seq2Seq; Word2vec; TF-IDF; CodeT5; сode generation
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 01.03.02
Speciality group (FGOS): 010000 - Математика и механика
DOI: 10.18720/SPBPU/3/2023/vr/vr23-4096
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\25283

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе рассматривается задачи генерации кода на основе описания на естественном языке с применением нейронных сетей и метрики для оценки важности терминов в документе. Задачи, которые решались в ходе работы: Анализ и подготовка данных, реализация и оценка метода TF-IDF, рассмотрена предо­бученная модель CodeT5, разработан плагин для среды разработки DataSpell. В плагин интегрирована модель нейронной сети и метод TF-IDF. Плагин был разработан на языке Java c использованием PsiFile.

In this thesis, we consider the tasks of generating code based on a description in natural language using neural networks and metrics to assess the importance of terms in a document. The tasks that were solved during the work: Data analysis and preparation, implementation and evaluation of the TF-IDF method, the pre-trained CodeT5 model was considered, a plugin for the DataSpell development environment was developed. The neural network model and the TF-IDF method are integrated into the plugin. The plugin was developed in Java using PsiFile.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • 6b4aeb5e6f9f1a2b549040e015f3fa6add8e880159efd6633ad8f9a2c025abae.pdf
  • 6b4aeb5e6f9f1a2b549040e015f3fa6add8e880159efd6633ad8f9a2c025abae.pdf
  • 6b4aeb5e6f9f1a2b549040e015f3fa6add8e880159efd6633ad8f9a2c025abae.pdf
    • Генерация кода на основе естественного языка
      • Генерация кода на основе естественного языка
        • Генерация кода на основе естественного языка
          • Генерация кода на основе естественного языка
            • Введение
            • 1. Обзор литературы
            • 2. Анализ данных
            • 3. Baseline
            • 4. Векторизация
            • 5. Нейронная сеть
            • 6. Результаты
            • 7. Разработка расширения для DataSpell
            • Заключение
            • Список использованных источников

Usage statistics

stat Access count: 10
Last 30 days: 0
Detailed usage statistics