Details

Title: Разработка модификации моделей предсказания возможных путей синтеза химических веществ с использованием глубоких нейронных сетей: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Creators: Просвирнин Евгений Николаевич
Scientific adviser: Лукашин Алексей Андреевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2022
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Нейронные сети; Машинное обучение; Химия; ретросинтез; предиктивная химия; анализ данных; трансформеры; retrosynthesis; data analysis; transformers
UDC: 004.032.26; 004.85; 54
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 02.04.01
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2023/vr/vr23-516
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\20814

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Разработка модификаций semi-template based моделей предсказания возможных путей синтеза химических веществ с использованием глубоких нейронных сетей». Данная работа посвящена исследованию методов решающих задачу предсказания возможных путей ретросинтеза химических соединений и разработке модификаций semi-template based методов для повышения разнообразия результатов генерируемых моделью. Задачи, которые решались в ходе работы: 1. анализ существующих методов и подходов предиктивной химии для решения задачи предсказания путей ретросинтеза; 2. разработка модификаций, которые позволяют увеличить разнообразие предсказания для semi-template based методов; 3. исследование эффективности реализованных модификаций методов.Работа выполнена с использование открытых наборов данных химических реакций USPTO-50K и USPTO-full. На языке программирования Python 3.7 c использованием фрэймворков Pytorch и Open-NMT были реализованы модификации для semi-template based методов RetroXpert и GraphRetro, которые улучшают показатели предложенных метрик для оценки разнообразия предсказаний, Diversity и Class Diversity. В итоге выполнено исследование реализованных модификаций с точки зрения предложенных метрик. На основании исследований можно сделать вывод,что разработанные модификации позволяют повысить значение метрики Diversity на 2% и Class Diversity 3% с помощью первой модификации и Diversity на 3% и Class Diversity 1.3% с помощью второй модификации.

The subject of the graduate qualification work: "Development of modifications of semi-template based models for predicting possible ways of synthesizing chemicals using deep neural networks". The given work is devoted to the study of methods that solve the problem of predicting possible pathways for the retrosynthesis of chemical compounds and the development of modifications of semi-template based methods to increase the diversity of results generated by the model.The research set the following goals: 1. analysis of existing methods and approaches of predictive chemistry for solving the problem of predicting retrosynthesis pathways; 2. development of modifications that allow increasing the variety of predictions for semi-template based methods; 3. research about the performance of implemented modifications of methods. The work was performed using USPTO-50K and USPTO-full open chemical reaction datasets. In the Python 3.7 programming language using the Pytorch and Open-NMT frameworks, modifications were implemented for the semi-template based methods RetroXpert and GraphRetro, which improve the performance of the proposed metrics for assessing the diversity of predictions, Diversity and Class Diversity. As a result, a research of the implemented modifications was carried out in terms of the proposed metrics. Based on the research, it can be concluded that the developed modifications allow increasing the value of the Diversity by 2% and Class Diversity 3% with the first modification and Diversity by 3% and Class Diversity 1.3% with the second modification.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Usage statistics

stat Access count: 11
Last 30 days: 3
Detailed usage statistics