Details

Title: Выявление выбросов и аномалий типа сдвиг в данных лазерной локации Луны на основе неравенства Чебышева: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Математическое моделирование в науке и индустрии»
Creators: Кан Маргарита Олеговна
Scientific adviser: Шевляков Георгий Леонидович
Other creators: Арефьева Людмила Анатольевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: лазерная локация Луны; аномалия; выброс; сдвиг; среднее значение; стандартная ошибка среднего; неравенства типа Гаусса-Чебышева; неравенство Чебышева; доверительный интервал; минимизация верхней границы байесовского риска; моделирование тестовых данных; Lunar laser ranging; anomaly; outlier; shift; mean-value; standard error; Gauss-Chebyshev type inequalities; Chebyshev inequality; confidence interval; minimizing the upper bound of Bayesian risk; test data modelling
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 01.04.02
Speciality group (FGOS): 010000 - Математика и механика
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1884
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Данная работа посвящена разработке алгоритма поиска аномалий типа выброс и сдвиг в данных лазерной локации Луны. Наблюдения представлены в виде пар «среднее значение наблюдения – стандартная ошибка среднего». Такие пары не являются истинными наблюдениями, а описывают целую группу наблюдений. Выбросы здесь – это наблюдения, значительно отличающиеся от соседствующих с ними наблюдений. Под сдвигом понимается значительное и обычно резкое изменение средних и/или стандартных ошибок во времени. Насколько нам известно, на сегодня не существует универсального метода поиска аномалий в таких данных, однако эту задачу можно решить, используя неравенства типа Гаусса-Чебышева. Из них можно определить доверительные интервалы наблюдений, рассмотрение которых позволяет перейти к задаче минимизации верхней границы байесовского риска с учетом наложения естественных ограничений. Поскольку проверка корректности алгоритма на реальных данных не представляется возможной, была проведена работа по их анализу для моделирования тестовых данных со схожими свойствами. На тестовых данных алгоритм показал хорошие результаты. На реальных данных также были получены удовлетворительные результаты. Работа была проведена на базе ИПА РАН, где нам были предоставлены реальные данные лазерной локации Луны, рассмотренные в данной работе. Разработанный алгоритм планируется внедрить в комплекс обработки данных ИПА РАН.

The given work is devoted to developing the outlier and shift detection algorithm and applying it to LLR data. The observations are presented as pairs of mean and their standard deviations. These pairs are not real observations but summaries on their groups. An outlier in the data of this type is an observation which significantly differs from the neighbouring ones, while a shift is a significant change of means and/or standard errors over time. As far as we know, for today there is no universal algorithm which allows detecting anomalies in data of this type. However, this task could be solved using the Gauss-Chebyshev type inequalities. These inequalities let us determine so-called confidence intervals considering which allows us to move on the other problem of minimizing the upper bound of Bayesian risk under the natural constraints. Since performance evaluation on the real data does not seem possible, the analysis of real data in order to model similar test data was carried out. The algorithm showed good results for test data. We also obtained satisfactory results for real data. The work was fulfilled on the premises of IAA RAS, where we were provided real LLR data considered in the given paper. The algorithm is supposed to be implemented in the software system of data preprocessing of IAA RAS.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics