Детальная информация

Название Основы анализа данных в Orange: учебное пособие
Авторы Туральчук Константин Анатольевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности. Высшая школа программной инженерии
Выходные сведения Санкт-Петербург, 2025
Коллекция Учебная и учебно-методическая литература; Общая коллекция
Тематика Информационные системы; Машинное обучение; Базы данных
УДК 004.7(075.8); 004.85(075.8); 004.6(075.8)
Тип документа Учебник
Тип файла PDF
Язык Русский
Код специальности ФГОС 09.03.03
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/5/tr25-55
Права доступа Доступ из локальной сети ИБК СПбПУ (чтение)
Дополнительно Новинка
Ключ записи RU\SPSTU\edoc\75563
Дата создания записи 25.03.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В учебном пособии рассматриваются основные задачи в области анализа данных: классификация, кластеризация, регрессия и ассоциативный анализ. Представлено описание базовых алгоритмов решения задач и способов оценки качества решения. В практической части рассматривается среда анализа данных Orange. Показано, как использовать и настраивать блоки среды Orange для предобработки данных, построения моделей классификации и регрессии, визуализации результатов и оценки качества решения.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Анонимные пользователи
  • СОДЕРЖАНИЕ
  • Глава 1. Введение в анализ данных
    • 1.1. Средства для анализа данных
    • 1.2. Типовые задачи анализа данных
    • 1.3. Основные этапы анализа данных
    • 1.4. Практическая часть
  • Глава 2. Ассоциативный анализ
    • 2.1. Характерные комбинации
    • 2.2. Ассоциативные правила
    • 2.3. Практическая часть
      • 2.3.1. Ассоциативный анализ для подготовленных данных
      • 2.3.2. Ассоциативный анализ музыкальных предпочтений
  • Глава 3. Задача классификации
    • 3.1. Основные проблемы решения задачи
    • 3.2. Тестирование и оценка моделей
    • 3.3. Алгоритм ближайших соседей
    • 3.4. Дерево решений
    • 3.5. Случайный лес решений
    • 3.6. Практическая часть
      • 3.6.1. Классификационные правила для набора Titanic
      • 3.6.2. Алгоритм kNN и нормализация данных для набора Wine
      • 3.6.3. Древовидные алгоритмы для набора Glass
  • Глава 4. Регрессионный анализ
    • 4.1. Оценки качества регрессионной модели
    • 4.2. Линейная регрессия
    • 4.3. Полиномиальная модель
    • 4.4. Практическая часть
  • Глава 5. Кластеризация данных
    • 5.1. Алгоритм кластеризации k-means
    • 5.2. Алгоритм иерархической кластеризации
    • 5.3. Оценка качества кластеризации
    • 5.4. Практическая часть
      • 5.4.1. Кластеризация для набора Iris
      • 5.4.2. Кластеризация для набора Student Perfomance
      • 5.4.3. Иерархическая кластеризация для набора данных HDI
      • 5.4.4. Сопоставление алгоритмов на искусственных данных
  • Список литературы

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика