Details

Title Основы анализа данных в Orange: учебное пособие
Creators Туральчук Константин Анатольевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности. Высшая школа программной инженерии
Imprint Санкт-Петербург, 2025
Collection Учебная и учебно-методическая литература; Общая коллекция
Subjects Информационные системы; Машинное обучение; Базы данных
UDC 004.7(075.8); 004.85(075.8); 004.6(075.8)
Document type Tutorial
File type PDF
Language Russian
Speciality code (FGOS) 09.03.03
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/5/tr25-55
Rights Доступ из локальной сети ИБК СПбПУ (чтение)
Additionally New arrival
Record key RU\SPSTU\edoc\75563
Record create date 3/25/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

В учебном пособии рассматриваются основные задачи в области анализа данных: классификация, кластеризация, регрессия и ассоциативный анализ. Представлено описание базовых алгоритмов решения задач и способов оценки качества решения. В практической части рассматривается среда анализа данных Orange. Показано, как использовать и настраивать блоки среды Orange для предобработки данных, построения моделей классификации и регрессии, визуализации результатов и оценки качества решения.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Anonymous
  • СОДЕРЖАНИЕ
  • Глава 1. Введение в анализ данных
    • 1.1. Средства для анализа данных
    • 1.2. Типовые задачи анализа данных
    • 1.3. Основные этапы анализа данных
    • 1.4. Практическая часть
  • Глава 2. Ассоциативный анализ
    • 2.1. Характерные комбинации
    • 2.2. Ассоциативные правила
    • 2.3. Практическая часть
      • 2.3.1. Ассоциативный анализ для подготовленных данных
      • 2.3.2. Ассоциативный анализ музыкальных предпочтений
  • Глава 3. Задача классификации
    • 3.1. Основные проблемы решения задачи
    • 3.2. Тестирование и оценка моделей
    • 3.3. Алгоритм ближайших соседей
    • 3.4. Дерево решений
    • 3.5. Случайный лес решений
    • 3.6. Практическая часть
      • 3.6.1. Классификационные правила для набора Titanic
      • 3.6.2. Алгоритм kNN и нормализация данных для набора Wine
      • 3.6.3. Древовидные алгоритмы для набора Glass
  • Глава 4. Регрессионный анализ
    • 4.1. Оценки качества регрессионной модели
    • 4.2. Линейная регрессия
    • 4.3. Полиномиальная модель
    • 4.4. Практическая часть
  • Глава 5. Кластеризация данных
    • 5.1. Алгоритм кластеризации k-means
    • 5.2. Алгоритм иерархической кластеризации
    • 5.3. Оценка качества кластеризации
    • 5.4. Практическая часть
      • 5.4.1. Кластеризация для набора Iris
      • 5.4.2. Кластеризация для набора Student Perfomance
      • 5.4.3. Иерархическая кластеризация для набора данных HDI
      • 5.4.4. Сопоставление алгоритмов на искусственных данных
  • Список литературы

Access count: 0 
Last 30 days: 0

Detailed usage statistics