Details

Title: Разработка программного модуля для детектирования текста, сгенерированного искусственными нейросетями: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Creators: Демянко Александра Сергеевна
Scientific adviser: Хитров Егор Германович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint: Санкт-Петербург, 2024
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: машинное обучение; классификация текста; оптимизация гиперпараметров; веб-приложение; нейронные сети; machine learning; text classification; hyperparameter optimization; web application; neural networks
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.03
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-3139
Rights: Доступ по паролю из сети Интернет (чтение)
Additionally: New arrival
Record key: ru\spstu\vkr\30433

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе объектами исследования являются модели машинного обучения для задач классификации текста. Целью работы является  разработка программного модуля-классификатора, позволяющего эффективно определять один из двух классов, к которому принадлежит текст: сгенерированный нейросетью или написанный человеком. Работа проведена путем обзора существующих решений, а также возможных инструментов для достижения поставленной цели, анализом различных алгоритмов и дальнейшим составлением сравнительной характеристики по различным представленным решениям. Были исследованы и протестированы различные модели машинного обучения, а также проведена настройка и поиск оптимальных гиперпараметров. В результате было создано веб-приложение, обеспечивающее интеграцию выбранных моделей машинного обучения и предоставляющее пользователям возможность классификации текстов в реальном времени. Результаты данного исследования также могут быть применены для последующего улучшения моделей машинного обучения, применяемых для классификации текстовых данных.

In this work, the objects of study are machine learning models for text classification problems. The goal of the work is to develop a software module-classifier that allows you to effectively determine one of the two classes to which the text belongs: generated by a neural network or written by a person. The work was carried out by reviewing existing solutions, as well as possible tools to achieve the goal, analyzing various algorithms and further compiling comparative characteristics of the various presented solutions. Various machine learning models were researched and tested, and optimal hyperparameters were tuned and searched for. The result was a web application that integrates selected machine learning models and provides users with real-time text classification capabilities. The results of this study can also be applied to further improve machine learning models used to classify text data.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Table of Contents

  • Тема практики
    • Введение
    • 1. Теоретические аспекты разработки моделей машинного обучения
    • 2. Выбор методов и инструментов для решения задачи классификации текстов
    • 3. Разработка сервиса для классификации текста
    • 4. Тестирование и аппробация
    • Заключение
    • Список использованных источников
    • Приложение 1. Код для загрузки и предобработки данных
    • Приложение 2. Код моделей машинного обучения
    • Приложение 3. Код веб сервиса
    • Приложение 4. Код end-to-end тестирования
    • Приложение 5. Код unit тестирования
    • Приложение 6. Описание API

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics