Details
Title | Выявление фактов использования генеративных моделей при написании научных публикаций: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
---|---|
Creators | Бабелюк Федор Сергеевич |
Scientific adviser | Уткин Лев Владимирович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | трансформер ; табличные данные ; плагиат ; генеравтивные модели ; нейронные сети ; transformer ; tabular data ; plagiarism ; generative models ; neural networks |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 02.04.01 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3620 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\39140 |
Record create date | 9/24/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Цель дипломной работы – разработка и исследование метода выявления использования текстовых генеративных моделей в научных работах. Предметом исследования является разработка метода распознавания сгенерированного текста, способного упростить и ускорить задачу выявления использования генеративных моделей при написании научных публикаций. Задачи, решаемые в ходе исследования: 1. Обзор существующих методов для выявления сгенерированного текста; 2. Разработка алгоритма для выявления факта использования генеративных сетей в научной литературе; 3. Составление выборки данных для тестирования алгоритма; 4. Реализация предложенного алгоритма на языке программирования Python с использованием соответствующих фреймворков; 5. Проведение экспериментов для оценки эффективности и объяснимости разработанной модели на исходных данных; 6. Анализ результатов экспериментов и оценка их значимости. В результате работы был реализован алгоритм, способный выявить использование генеративных моделей в научной публикации независимо от направленности статьи. Была продемонстрирована работа данного инструмента на наборе данных, что позволило получить результаты, подтверждающие его эффективность и применимость. Полученные результаты могут быть использованы в качестве основы для дальнейших исследований и разработки приложений в области выявления плагиата и проверки текста.
The goal of this thesis is to develop and research a method to identify the usage of text generative models in academic writing. Subject of research: development of a method for recognizing machine-generated text that can simplify and speed up the task of identifying the use of generative models in writing scientific publications. Research tasks: 1. Conduct a review of existing methods for detecting generated text. 2. Develop an algorithm for identifying the fact of using generative networks in scientific journalism. 3. Create a data sample for testing the algorithm. 4. Implement the proposed algorithm in Python using appropriate frameworks and libraries. 5. Conduct experiments to evaluate the effectiveness and interpretability of the developed model on real-world data. 6. Analyze experimental results and evaluate their significance. As a result of the work, an algorithm was implemented that can detect the use of generative models in a scientific publication regardless of the focus of the article. The work of this tool on a data set was demonstrated, which allowed us to obtain results confirming its effectiveness and applicability. The results obtained can be used as a basis for further research and development of applications in the field of plagiarism detection and text verification.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0