Details
Title | Разработка отказоустойчивой распределенной системы мониторинга для системы хранения данных: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_01 «Технология разработки и сопровождения качественного программного продукта» |
---|---|
Creators | Кулаковский Владислав Игоревич |
Scientific adviser | Леонтьева Татьяна Владимировна |
Other creators | Локшина Екатерина Геннадиевна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2020 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | мониторинг; система мониторинга; отказоустойчивость; высокая доступность; influxdb; telegraf; grafana; monitoring; monitoring system; fault-tolerance; high-availability |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.04 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
Links | Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований |
DOI | 10.18720/SPBPU/3/2020/vr/vr20-1392 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Record key | ru\spstu\vkr\7211 |
Record create date | 7/23/2020 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Тема выпускной квалификационной работы: «Разработка отказоустойчивой распределенной системы мониторинга для системы хранения данных». Работа посвящена исследованию существующих решений для построения системы мониторинга в сложных технических системах, а также проектированию и разработке решения, обеспечивающего, надежное хранение метрик, их высокую доступность и отказоустойчивость при частичной деградации системы. Работа проводилась на основе существующего продукта. Исходное решение обеспечивало необходимые требования, но обладало крайне низкой производительностью и накладывало ограничения на количество хранимых метрических значений. С целью повышения эффективности хранения метрик и увеличения их числа, без ущерба для надежности всей системы, было спроектировано и реализовано новое решение, в основе которого лежит использование базы данных временных рядов. Для обеспечения надежности и доступности, используется стандартный подход для систем, состоящих из нескольких узлов – дублирование компонентов. Для достижения цели были разработаны инструменты, которые обеспечивают согласованность данных между несколькими экземплярами баз данных, а также позволяют получить непротиворечивые результаты запросов из всех копий БД. Результаты апробации данного решения показали высокий потенциал для дальнейшего использования в существующей системе.
The subject if the graduate work is “Development of fault-tolerant distributed monitoring system for data storage system”. The given work is devoted to the research of existing solutions for building a monitoring system for complex technical systems, as well as the design and development of a solution that provides reliable storage of metrics, high availability, and fault-tolerance at partial degradation of the system. The work was carried out based on the existing product. The original solution provided the necessary requirements but had extremely low performance and imposed restrictions on the number of stored metric values. In order to increase the storage efficiency of metrics and increase their number, without compromising the reliability of the entire system, a new solution was designed and implemented, which is based on the use of a time-series database. To ensure reliability and availability, a standard approach is used for systems consisting of several nodes - duplication of components. To achieve the goal, tools have been developed that ensure data consistency between multiple database instances and allow you to get consistent query results from all copies of the database. The results of testing this solution showed a high potential for further use in the existing system.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 22
Last 30 days: 0