Details
Title | Основы анализа данных в Orange: учебное пособие |
---|---|
Creators | Туральчук Константин Анатольевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности. Высшая школа программной инженерии |
Imprint | Санкт-Петербург, 2025 |
Collection | Учебная и учебно-методическая литература; Общая коллекция |
Subjects | Информационные системы; Машинное обучение; Базы данных |
UDC | 004.7(075.8); 004.85(075.8); 004.6(075.8) |
Document type | Tutorial |
File type | |
Language | Russian |
Speciality code (FGOS) | 09.03.03 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/5/tr25-55 |
Rights | Доступ из локальной сети ИБК СПбПУ (чтение) |
Additionally | New arrival |
Record key | RU\SPSTU\edoc\75563 |
Record create date | 3/25/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
В учебном пособии рассматриваются основные задачи в области анализа данных: классификация, кластеризация, регрессия и ассоциативный анализ. Представлено описание базовых алгоритмов решения задач и способов оценки качества решения. В практической части рассматривается среда анализа данных Orange. Показано, как использовать и настраивать блоки среды Orange для предобработки данных, построения моделей классификации и регрессии, визуализации результатов и оценки качества решения.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Anonymous |
|
- СОДЕРЖАНИЕ
- Глава 1. Введение в анализ данных
- 1.1. Средства для анализа данных
- 1.2. Типовые задачи анализа данных
- 1.3. Основные этапы анализа данных
- 1.4. Практическая часть
- Глава 2. Ассоциативный анализ
- 2.1. Характерные комбинации
- 2.2. Ассоциативные правила
- 2.3. Практическая часть
- 2.3.1. Ассоциативный анализ для подготовленных данных
- 2.3.2. Ассоциативный анализ музыкальных предпочтений
- Глава 3. Задача классификации
- 3.1. Основные проблемы решения задачи
- 3.2. Тестирование и оценка моделей
- 3.3. Алгоритм ближайших соседей
- 3.4. Дерево решений
- 3.5. Случайный лес решений
- 3.6. Практическая часть
- 3.6.1. Классификационные правила для набора Titanic
- 3.6.2. Алгоритм kNN и нормализация данных для набора Wine
- 3.6.3. Древовидные алгоритмы для набора Glass
- Глава 4. Регрессионный анализ
- 4.1. Оценки качества регрессионной модели
- 4.2. Линейная регрессия
- 4.3. Полиномиальная модель
- 4.4. Практическая часть
- Глава 5. Кластеризация данных
- 5.1. Алгоритм кластеризации k-means
- 5.2. Алгоритм иерархической кластеризации
- 5.3. Оценка качества кластеризации
- 5.4. Практическая часть
- 5.4.1. Кластеризация для набора Iris
- 5.4.2. Кластеризация для набора Student Perfomance
- 5.4.3. Иерархическая кластеризация для набора данных HDI
- 5.4.4. Сопоставление алгоритмов на искусственных данных
- Список литературы
Access count: 0
Last 30 days: 0