Детальная информация
Название | Основы анализа данных в Orange: учебное пособие |
---|---|
Авторы | Туральчук Константин Анатольевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности. Высшая школа программной инженерии |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Учебная и учебно-методическая литература; Общая коллекция |
Тематика | Информационные системы; Машинное обучение; Базы данных |
УДК | 004.7(075.8); 004.85(075.8); 004.6(075.8) |
Тип документа | Учебник |
Тип файла | |
Язык | Русский |
Код специальности ФГОС | 09.03.03 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/5/tr25-55 |
Права доступа | Доступ из локальной сети ИБК СПбПУ (чтение) |
Дополнительно | Новинка |
Ключ записи | RU\SPSTU\edoc\75563 |
Дата создания записи | 25.03.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В учебном пособии рассматриваются основные задачи в области анализа данных: классификация, кластеризация, регрессия и ассоциативный анализ. Представлено описание базовых алгоритмов решения задач и способов оценки качества решения. В практической части рассматривается среда анализа данных Orange. Показано, как использовать и настраивать блоки среды Orange для предобработки данных, построения моделей классификации и регрессии, визуализации результатов и оценки качества решения.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Анонимные пользователи |
|
- СОДЕРЖАНИЕ
- Глава 1. Введение в анализ данных
- 1.1. Средства для анализа данных
- 1.2. Типовые задачи анализа данных
- 1.3. Основные этапы анализа данных
- 1.4. Практическая часть
- Глава 2. Ассоциативный анализ
- 2.1. Характерные комбинации
- 2.2. Ассоциативные правила
- 2.3. Практическая часть
- 2.3.1. Ассоциативный анализ для подготовленных данных
- 2.3.2. Ассоциативный анализ музыкальных предпочтений
- Глава 3. Задача классификации
- 3.1. Основные проблемы решения задачи
- 3.2. Тестирование и оценка моделей
- 3.3. Алгоритм ближайших соседей
- 3.4. Дерево решений
- 3.5. Случайный лес решений
- 3.6. Практическая часть
- 3.6.1. Классификационные правила для набора Titanic
- 3.6.2. Алгоритм kNN и нормализация данных для набора Wine
- 3.6.3. Древовидные алгоритмы для набора Glass
- Глава 4. Регрессионный анализ
- 4.1. Оценки качества регрессионной модели
- 4.2. Линейная регрессия
- 4.3. Полиномиальная модель
- 4.4. Практическая часть
- Глава 5. Кластеризация данных
- 5.1. Алгоритм кластеризации k-means
- 5.2. Алгоритм иерархической кластеризации
- 5.3. Оценка качества кластеризации
- 5.4. Практическая часть
- 5.4.1. Кластеризация для набора Iris
- 5.4.2. Кластеризация для набора Student Perfomance
- 5.4.3. Иерархическая кластеризация для набора данных HDI
- 5.4.4. Сопоставление алгоритмов на искусственных данных
- Список литературы
Количество обращений: 0
За последние 30 дней: 0