Details

Title: Разработка подсистемы анализа данных для ИАС "Единый реестр результатов деятельности СПбПУ": бакалаврская работа: 09.03.01
Creators: Кирпиченков Павел Станиславович
Scientific adviser: Мяснов Александр Владимирович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2017
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: обработка данных; кластеризация; автоматизация
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/2/v17-4090
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В работе рассматривается подсистема анализа и обработки данных в ИАС “Единый реестр результатов деятельности СПБПУ”. Назначением подсистемы является поиск по данным о студентах, аспирантах и сотрудниках университета записей, которые относятся к одному и тому же человеку. В работе анализируются существующие подходы по объединению объектов в кластеры при заранее неизвестном их числе. По результатам анализа делаются выводы о возможности применения рассмотренных алгоритмов для предложенной задачи и формируется вариант решения. Результатом разработки является программная реализация выбранного алгоритма как часть существующей информационной системы.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
Internet Authorized users (not from SPbPU)
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • 1. Обзор задачи
    • 1.1. Архитектура реестра
    • 1.2. Модели данных НСИ
    • 1.3. Объединяющие сущности
    • 1.4. Постановка задачи
    • 1.5. Выбор программных средств
  • 2. Анализ методов кластеризации
    • 2.1. Общее описание кластеризации
    • 2.2. Эвристические методы
    • 2.3. Динамические методы
    • 2.4. Иерархические методы
    • 2.5. Применимость методов для задачи Реестра
  • 3. Разработка алгоритма объединения записей
    • 3.1. Модель данных
    • 3.2. Сравнение записей
    • 3.3. Алгоритм определения сходства
    • 3.4. Формирование новых групп
    • 3.5. Распределение по существующим группам
  • 4. Реализация подсистемы
    • 4.1. Django-проект
    • 4.2. Django-приложение
      • 4.2.1. Хранение объединенных групп
      • 4.2.2. Определение сходства записей
      • 4.2.3. Подготовка записей
      • 4.2.4. Формирование групп
      • 4.2.5. Поиск совпадений с существующими группами
      • 4.2.6. Слияние записей
      • 4.2.7. Работа с блокировками
      • 4.2.8. Типовой сценарий использования подсистемы
  • 5. Тестирование подсистемы
    • 5.1. Функциональное тестирование
    • 5.2. Тестирование производительности
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ А. ЛИСТИНГИ

Usage statistics

stat Access count: 20
Last 30 days: 0
Detailed usage statistics