Детальная информация
Название | Разработка и исследование новых интерпретируемых моделей машинного обучения на основе композиций слабых базовых моделей: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_09 «Математическое моделирование, численные методы и комплексы программ» |
---|---|
Авторы | Константинов Андрей Владимирович |
Научный руководитель | Уткин Лев Владимирович |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Выходные сведения | Санкт-Петербург, 2024 |
Коллекция | Научные работы аспирантов/докторантов; Общая коллекция |
Тематика | машинное обучение; интерпретация; числа Шепли; machine learning; explanation; Shapley values |
Тип документа | Научный доклад |
Тип файла | Другой |
Язык | Русский |
Уровень высшего образования | Аспирантура |
Код специальности ФГОС | 09.06.01 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
Права доступа | Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141 |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\33927 |
Дата создания записи | 23.10.2024 |
В настоящее время искусственный интеллект и машинное обучение широко применяются в самых различных прикладных областях,включая производственные системы,медицину,экономику. Эти области характеризуются табличным форматом данных, малыми размерами доступных выборок, а также сложностью формализации многих прикладных задач и необходимостью интерпретации и объяснения результатов моделирования. Учёт этих особенностей в совокупности не представлен в большинстве существующих на данный момент моделей машинного обучения,что не позволяет использовать их с максимальной эффективностью в этих областях. Отсутствие интерпретируемости также не позволяет в полной мере доверять результатам предсказаний,что является важнейшим элементом производственных и медицинских систем.Следует отметить,что существует ряд моделей машинного обучения,которые нашли применение в перечисленных областях.Однако эти модели обладают рядом существенных недостатков,включая низкую обобщающую способность при обучении на данных без предварительной обработки,необходимость ручной настройки большого числа параметров,сложность обработки наборов данных высокой размерности.Таким модели как,на пример,глубокие нейронные сети не обладают достаточной точностью при работе с малыми выборками табличных данных высокой размерности,что делает их малоэффективными при решении новых задач.Для построения более точных и эффективных моделей с учётом необходимости интерпретации их предсказаний требуются новые подходы,позволяющие обойти перечисленные выше недостатки.
Currently, artificial intelligence and machine learning are widely used in a wide variety of applied fields, including production systems, medicine, and economics. These areas are characterized by a tabular data format, small sizes of available samples, as well as the complexity of formalizing many applied tasks and the need to interpret and explain the modeling results. Taking these features into account together is not represented in most of the currently existing machine learning models, which does not allow them to be used with maximum efficiency in these areas. The lack of interpretability also makes it impossible to fully trust the results of predictions, which is an essential element of production and medical systems.It should be noted that there are a number of machine learning models that have found application in these areas.However, these models have a number of significant disadvantages, including low generalization ability when learning from data without preprocessing, the need to manually adjust a large number of parameters, and the complexity of processing high-dimensional datasets.Such models as, for example, deep neural networks do not They have sufficient accuracy when working with small samples of high-dimensional tabular data, which makes them ineffective in solving new problems.To build more accurate and efficient models, taking into account the need to interpret their predictions, new approaches are required to circumvent the above disadvantages.