Details

Title: Метод мониторинга и повышения стабильности ИТ-инфраструктуры на основе метрик доступности и надежности: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Creators: Варламов Дмитрий Андреевич
Scientific adviser: Никифоров Игорь Валерьевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: мониторинг; метрики; доступность; надежность; стабильность; информационно-технологическая инфраструктура; отключение; информационные панели; monitoring; metrics; availability; reliability; stability; IT infrastructure; outage; dashboards
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.04
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3914
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\25044

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Целью выпускной работы является разработка метода для мониторинга и повышения стабильности информационно-технологической инфраструктуры предприятия за счет анализа и учета статистики предыдущих отключений. В результате работы предложен новый метод, позволяющий выявлять и устранять проблемы в информационно-технологических сервисах предприятия до того, как они приведут к серьезным последствиям и сокращать время на поиск источника проблемы. Данный метод основан на использовании двух метрик: доступности и надежности, которые учитывают тяжесть отключений и позволяют находить уязвимые компоненты. Повышение стабильности достигается путем реконфигурации этих компонентов и повышения их вычислительных ресурсов. В работе представлена архитектура и реализация программного средства, которое реализует предложенный метод и позволяет в режиме реального времени осуществлять мониторинг и подсчет метрик стабильности. Эффективность данного средства была оценена во время эксперимента в крупной промышленной компании, в ходе которого было обнаружено и устранено слабое звено в одном из сервисов. После реконфигурации уязвимого компонента было зафиксировано сокращение на 25% времени, в течение которого ресурсы компании находились в состоянии частичной неработоспособности.

The aim of the work is to develop a method for monitoring and improving the stability of the information technology infrastructure of the enterprise through the analysis and accounting of statistics of previous outages. As a result of the work, a new method is proposed that allows to identify and eliminate problems in the information technology services of the enterprise before they lead to serious consequences and reduce the time to find the source of the problem. This method is based on the use of two metrics: availability and reliability, which take into account the severity of outages and allow you to find vulnerable components. Increased stability is achieved by reconfiguring these components and increasing their computing resources. The paper presents the architecture and implementation of a software tool that implements the proposed method and allows real-time monitoring and calculation of stability metrics. The effectiveness of this tool was evaluated during an experiment in a large industrial company, during which a weak link in one of the services was discovered and eliminated. After reconfiguration of the vulnerable component, a 25% reduction in the time during which the companys resources were in a state of partial inactivity was recorded.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 16
Last 30 days: 13
Detailed usage statistics