С 17 марта 2020 г. для ресурсов (учебные, научные, материалы конференций, статьи из периодических изданий, авторефераты диссертаций, диссертации) ЭБ СПбПУ, обеспечивающих образовательный процесс, установлен особый режим использования. Обращаем внимание, что ВКР/НД не относятся к этой категории.

Детальная информация

Название: Разработка метода композиции базовых алгоритмов машинного обучения для решения задачи прогнозирования на основе технологии Oracle Data Mining: выпускная квалификационная работа бакалавра: 02.03.03 - Математическое обеспечение и администрирование информационных систем ; 02.03.03_01 - Информационные системы и базы данных
Авторы: Соболева Александра Дмитриевна
Научный руководитель: Сабинин Олег Юрьевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2018
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; задача прогнозирования; классификация; регрессия
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 02.03.03
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
Ссылки: Отзыв руководителя
DOI: 10.18720/SPBPU/2/v18-3741
Права доступа: Свободный доступ из сети Интернет (чтение, печать, копирование)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе рассмотрены наиболее популярные алгоритмы машинного обучения и программные инструменты для их использования. Проанализированы алгоритмы машинного обучения, решающие задачу прогнозирования, и обозначены их достоинства и недостатки. Предложен и обоснован метод, решающий задачу прогнозирования посредством агрегирования результатов обобщенной линейной модели и метода опорных векторов. Проведено исследование метода на примере оценки рисков кардиологических заболеваний и прогнозирования пола и возраста моллюсков галиотисов, подтвердившее эффективность разработанного подхода.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • РЕФЕРАТ
  • СОДЕРЖАНИЕ
  • ОПРЕДЕЛЕНИЯ
  • ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
  • ВВЕДЕНИЕ
  • ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
    • 1.1. Анализ алгоритмов машинного обучения
      • 1.1.1. Прогностическое обучение
        • 1.1.1.1. Классификация
        • 1.1.1.2. Регрессия
      • 1.1.2. Дескриптивное обучение
        • 1.1.2.1. Кластеризация
        • 1.1.2.2. Поиск аномалий
        • 1.1.2.3. Поиск ассоциативных правил
        • 1.1.2.4. Снижение размерности исходных данных
    • 1.2. Анализ инструментов для построения интеллектуальных моделей прогнозирования
      • 1.2.1. Графические программные продукты
        • 1.2.1.1. IBM SPSS Modeler
        • 1.2.1.2. SAS Enterprise Miner
        • 1.2.1.3. Statistica
        • 1.2.1.4. Weka
        • 1.2.1.5. Rapid Miner
      • 1.2.2. Библиотеки для языков программирования
        • 1.2.2.1. Python
        • 1.2.2.2. Java
        • 1.2.2.3. R
      • 1.2.3. Инструменты для обработки больших данных алгоритмами машинного обучения, интегрированные в СУБД
        • 1.2.3.1. Intelligent Miner for Data
        • 1.2.3.2. SQL Server Analysis Services
        • 1.2.3.3. Oracle Data Mining
    • 1.3. Постановка задачи выпускной квалификационной работы
  • ГЛАВА 2. АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ КЛАССИФИКАЦИИ И РЕГРЕССИИ
    • 2.1. Классификация
      • 2.1.1. Линейный классификатор
      • 2.1.2. Логистическая регрессия
      • 2.1.3. Метод опорных векторов
      • 2.1.4. Байесовский классификатор
      • 2.1.5. Наивный байесовский классификатор
      • 2.1.6. Логические алгоритмы классификации
        • 2.1.6.1. Список решений или машина покрывающих множеств
        • 2.1.6.2. Дерево решений
      • 2.1.7. Алгоритмическая композиция
        • 2.1.7.1. Bootstrap Aggregating
        • 2.1.7.2. Случайный лес
        • 2.1.7.3. Метод усиления слабых моделей
    • 2.2. Регрессия
      • 2.2.1. Линейная регрессия
      • 2.2.2. Гребневая регрессия
      • 2.2.3. Нелинейная регрессия
      • 2.2.4. Метод опорных векторов
    • 2.3. Метод композиции алгоритмов машинного обучения
    • 2.4. Принцип построения прогнозирующей модели с помощью технологии Oracle Data Mining
      • 2.4.1. Подготовка данных
      • 2.4.2. Настройка модели
      • 2.4.3. Тестирование и оценка модели
  • ГЛАВА 3. РЕАЛИЗАЦИЯ МОДЕЛИ ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ТЕХНОЛОГИИ ORACLE DATA MINING
    • 3.1. Подготовка входных данных
    • 3.2. Построение прогнозирующей модели
      • 3.2.1. Выделение контрольной и тренировочной выборок
      • 3.2.2. Создание индивидуальной выборки
      • 3.2.3. Настройка конфигурации базовых моделей
      • 3.2.4. Описание процедур, реализующих метод композиции алгоритмов машинного обучения
  • ГЛАВА 4. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • Приложение 1
  • Описание набора данных «Framingham Heart Study»
  • Приложение 2
  • Описание набора данных «Abalone»
  • Приложение 3
  • Параметры конфигурации базовых алгоритмов композиции
  • Приложение 4
  • Код PL/SQL пакета, реализующего метод композиции алгоритмов машинного обучения

Статистика использования документа

stat Количество обращений: 370
За последние 30 дней: 1
Подробная статистика