Разработка и исследование алгоритма интерпретации результатов функционирования моделей машинного обучения с использованием модели засорения: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Вычислительные, программные, информационные системы и компьютерные технологии»

Вишняков, Кирилл Александрович

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Разработка и исследование алгоритма интерпретации результатов функционирования моделей машинного обучения с использованием модели засорения: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Вычислительные, программные, информационные системы и компьютерные технологии»
Авторы:	Вишняков Кирилл Александрович
Научный руководитель:	Уткин Лев Владимирович
Другие авторы:	Голубева Ирина Эрнестовна
Организация:	Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения:	Санкт-Петербург, 2021
Коллекция:	Выпускные квалификационные работы; Общая коллекция
Тематика:	машинное обучение; искусственный интеллект; объяснительный искусственный интеллект; модель засорения; shap; machine learning; artificial intelligence; explainable artificial intelligence; contamination model
Тип документа:	Выпускная квалификационная работа бакалавра
Тип файла:	PDF
Язык:	Русский
Уровень высшего образования:	Бакалавриат
Код специальности ФГОС:	02.03.01
Группа специальностей ФГОС:	020000 - Компьютерные и информационные науки
Ссылки:	Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI:	10.18720/SPBPU/3/2021/vr/vr21-4359
Права доступа:	Доступ по паролю из сети Интернет (чтение, печать)
Ключ записи:	ru\spstu\vkr\14192

Разрешенные действия: –

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Объяснение предсказаний моделей машинного обучения является одной из важнейших задач в таких областях применения искусственного интеллекта как медицина, финансы и управление автономными системами. Одним из основных методов объяснительного искусственного интеллекта является метод SHAP. Обычная версия SHAP не предназначена для работы с распределениями вероятностей, что затрудняет интерпретацию моделей, решающих задачу многоклассовой классификации. Еще одним недостатком стандартного SHAP является то, что он не учитывает неточность модели при вычислении значений чисел Шепли. В работе описан способ реализации метода SHAP на случай многоклассовой классификации, в котором рассматриваются множества распределений вероятностей, построенных в соответствии со статистической моделью эпсилон-засорения, что позволяет получить интервалы значений чисел Шепли вместо одиночных значений. По результатам экспериментов, было показано, что одиночные значения чисел Шепли из-за возможной неточности предсказаний модели и возникающей неопределенности при их вычислении, часто выдают ненадежные результаты, и вместо них должны рассматриваться интервалы значений.

Explanation of the predictions of machine learning models is one of the most important tasks in such areas of artificial intelligence applications as medicine, finance, and control of autonomous systems. One of the main methods of explainable artificial intelligence is the SHAP method. The regular version of the SHAP is not intended to work with probability distributions, which makes it difficult to interpret models that solve the problem of multiclass classification. Another disadvantage of the standard SHAP is that it does not take into an account the imprecision of the model’s predictions when calculating the values of the Shapley numbers. This work describes a method for implementing the SHAP algorithm for the case of multiclass classification problem, which considers sets of distributions constructed in accordance with the statistical epsilon-contamination model, which allows obtaining intervals of Shapley numbers instead of single values. The experiments are presented showing that single values of the Shapley numbers often give unreliable results, due to the possible inaccuracy of the model's predictions and the resulting uncertainty in their calculation, and instead of them, intervals of values should be considered.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Авторизованные пользователи СПбПУ
	Интернет		Анонимные пользователи

Статистика использования

Количество обращений: 31
За последние 30 дней: 2
Подробная статистика