Детальная информация

Название: Разработка программного модуля для детектирования текста, сгенерированного искусственными нейросетями: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Авторы: Демянко Александра Сергеевна
Научный руководитель: Хитров Егор Германович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; классификация текста; оптимизация гиперпараметров; веб-приложение; нейронные сети; machine learning; text classification; hyperparameter optimization; web application; neural networks
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.03
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-3139
Права доступа: Доступ по паролю из сети Интернет (чтение)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\30433

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе объектами исследования являются модели машинного обучения для задач классификации текста. Целью работы является  разработка программного модуля-классификатора, позволяющего эффективно определять один из двух классов, к которому принадлежит текст: сгенерированный нейросетью или написанный человеком. Работа проведена путем обзора существующих решений, а также возможных инструментов для достижения поставленной цели, анализом различных алгоритмов и дальнейшим составлением сравнительной характеристики по различным представленным решениям. Были исследованы и протестированы различные модели машинного обучения, а также проведена настройка и поиск оптимальных гиперпараметров. В результате было создано веб-приложение, обеспечивающее интеграцию выбранных моделей машинного обучения и предоставляющее пользователям возможность классификации текстов в реальном времени. Результаты данного исследования также могут быть применены для последующего улучшения моделей машинного обучения, применяемых для классификации текстовых данных.

In this work, the objects of study are machine learning models for text classification problems. The goal of the work is to develop a software module-classifier that allows you to effectively determine one of the two classes to which the text belongs: generated by a neural network or written by a person. The work was carried out by reviewing existing solutions, as well as possible tools to achieve the goal, analyzing various algorithms and further compiling comparative characteristics of the various presented solutions. Various machine learning models were researched and tested, and optimal hyperparameters were tuned and searched for. The result was a web application that integrates selected machine learning models and provides users with real-time text classification capabilities. The results of this study can also be applied to further improve machine learning models used to classify text data.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Оглавление

  • Тема практики
    • Введение
    • 1. Теоретические аспекты разработки моделей машинного обучения
    • 2. Выбор методов и инструментов для решения задачи классификации текстов
    • 3. Разработка сервиса для классификации текста
    • 4. Тестирование и аппробация
    • Заключение
    • Список использованных источников
    • Приложение 1. Код для загрузки и предобработки данных
    • Приложение 2. Код моделей машинного обучения
    • Приложение 3. Код веб сервиса
    • Приложение 4. Код end-to-end тестирования
    • Приложение 5. Код unit тестирования
    • Приложение 6. Описание API

Статистика использования

stat Количество обращений: 0
За последние 30 дней: 0
Подробная статистика