Детальная информация
Название | Выявление фактов использования генеративных моделей при написании научных публикаций: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
---|---|
Авторы | Бабелюк Федор Сергеевич |
Научный руководитель | Уткин Лев Владимирович |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | трансформер ; табличные данные ; плагиат ; генеравтивные модели ; нейронные сети ; transformer ; tabular data ; plagiarism ; generative models ; neural networks |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 02.04.01 |
Группа специальностей ФГОС | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3620 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\39140 |
Дата создания записи | 24.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Цель дипломной работы – разработка и исследование метода выявления использования текстовых генеративных моделей в научных работах. Предметом исследования является разработка метода распознавания сгенерированного текста, способного упростить и ускорить задачу выявления использования генеративных моделей при написании научных публикаций. Задачи, решаемые в ходе исследования: 1. Обзор существующих методов для выявления сгенерированного текста; 2. Разработка алгоритма для выявления факта использования генеративных сетей в научной литературе; 3. Составление выборки данных для тестирования алгоритма; 4. Реализация предложенного алгоритма на языке программирования Python с использованием соответствующих фреймворков; 5. Проведение экспериментов для оценки эффективности и объяснимости разработанной модели на исходных данных; 6. Анализ результатов экспериментов и оценка их значимости. В результате работы был реализован алгоритм, способный выявить использование генеративных моделей в научной публикации независимо от направленности статьи. Была продемонстрирована работа данного инструмента на наборе данных, что позволило получить результаты, подтверждающие его эффективность и применимость. Полученные результаты могут быть использованы в качестве основы для дальнейших исследований и разработки приложений в области выявления плагиата и проверки текста.
The goal of this thesis is to develop and research a method to identify the usage of text generative models in academic writing. Subject of research: development of a method for recognizing machine-generated text that can simplify and speed up the task of identifying the use of generative models in writing scientific publications. Research tasks: 1. Conduct a review of existing methods for detecting generated text. 2. Develop an algorithm for identifying the fact of using generative networks in scientific journalism. 3. Create a data sample for testing the algorithm. 4. Implement the proposed algorithm in Python using appropriate frameworks and libraries. 5. Conduct experiments to evaluate the effectiveness and interpretability of the developed model on real-world data. 6. Analyze experimental results and evaluate their significance. As a result of the work, an algorithm was implemented that can detect the use of generative models in a scientific publication regardless of the focus of the article. The work of this tool on a data set was demonstrated, which allowed us to obtain results confirming its effectiveness and applicability. The results obtained can be used as a basis for further research and development of applications in the field of plagiarism detection and text verification.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0