Разработка и исследование новых интерпретируемых моделей машинного обучения на основе композиций слабых базовых моделей: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_09 «Математическое моделирование, численные методы и комплексы программ»

Константинов, Андрей Владимирович

Details

Title	Разработка и исследование новых интерпретируемых моделей машинного обучения на основе композиций слабых базовых моделей: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_09 «Математическое моделирование, численные методы и комплексы программ»
Creators	Константинов Андрей Владимирович
Scientific adviser	Уткин Лев Владимирович
Organization	Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint	Санкт-Петербург, 2024
Collection	Научные работы аспирантов/докторантов ; Общая коллекция
Subjects	Машинное обучение ; интерпретация ; числа Шепли ; explanation ; Shapley values
UDC	004.85
Document type	Scientific report
File type	Other
Language	Russian
Level of education	Graduate student
Speciality code (FGOS)	09.06.01
Speciality group (FGOS)	090000 - Информатика и вычислительная техника
Rights	Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Record key	ru\spstu\vkr\33927
Record create date	10/23/2024

В настоящее время искусственный интеллект и машинное обучение широко применяются в самых различных прикладных областях, включая производственные системы, медицину, экономику. Эти области характеризуются табличным форматом данных, малыми размерами доступных выборок, а также сложностью формализации многих прикладных задач и необходимостью интерпретации и объяснения результатов моделирования. Учёт этих особенностей в совокупности не представлен в большинстве существующих на данный момент моделей машинного обучения,что не позволяет использовать их с максимальной эффективностью в этих областях. Отсутствие интерпретируемости также не позволяет в полной мере доверять результатам предсказаний,что является важнейшим элементом производственных и медицинских систем. Следует отметить,что существует ряд моделей машинного обучения,которые нашли применение в перечисленных областях. Однако эти модели обладают рядом существенных недостатков,включая низкую обобщающую способность при обучении на данных без предварительной обработки,необходимость ручной настройки большого числа параметров,сложность обработки наборов данных высокой размерности.Таким модели как,на пример,глубокие нейронные сети не обладают достаточной точностью при работе с малыми выборками табличных данных высокой размерности,что делает их малоэффективными при решении новых задач. Для построения более точных и эффективных моделей с учётом необходимости интерпретации их предсказаний требуются новые подходы,позволяющие обойти перечисленные выше недостатки.

Currently, artificial intelligence and machine learning are widely used in a wide variety of applied fields, including production systems, medicine, and economics. These areas are characterized by a tabular data format, small sizes of available samples, as well as the complexity of formalizing many applied tasks and the need to interpret and explain the modeling results. Taking these features into account together is not represented in most of the currently existing machine learning models, which does not allow them to be used with maximum efficiency in these areas. The lack of interpretability also makes it impossible to fully trust the results of predictions, which is an essential element of production and medical systems.It should be noted that there are a number of machine learning models that have found application in these areas.However, these models have a number of significant disadvantages, including low generalization ability when learning from data without preprocessing, the need to manually adjust a large number of parameters, and the complexity of processing high-dimensional datasets.Such models as, for example, deep neural networks do not. They have sufficient accuracy when working with small samples of high-dimensional tabular data, which makes them ineffective in solving new problems.To build more accurate and efficient models, taking into account the need to interpret their predictions, new approaches are required to circumvent the above disadvantages.