Details

Title Построение автоматизированной системы предиктивного анализа данных по недвижимости с использованием машинного обучения: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Creators Меркадо Оудалова Данило Анатоли
Scientific adviser Никифоров Игорь Валерьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects прогнозный анализ данных; контейнеры; модель машинного обучения; методы обработки данных; predictive data analysis; containers; machine learning model; data processing methods
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-4373
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\33211
Record create date 8/29/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

В настоящей работе предлагается метод построения автоматической системы прогнозного анализа недвижимости с машинным обучением с использованием распределенного подхода, который допускает соответствующее масштабирование и может быть применен в различных ситуациях. Данная работа посвящена изучению недостатков существующих систем прогнозной аналитики и приведению примера автоматической системы прогнозной аналитики, которая обладает передовым опытом, использует современные технологии и позволяет проводить анализ наиболее эффективным из возможных способов. Для достижения эти цели будут использованы передовые методы извлечения, преобразования и очистки данных с последующей реализацией модели машинного обучения с использованием Apache Spark. Кроме того, была использована архитектура "master worker", которая обеспечивает оптимальную емкость хранилища в сочетании с повышенной отказоустойчивостью за счет интеграции кластера Apache Kafka с использованием согласованного протокола Kraft, а также переносимости и контейнеров Docker. Этот комплексный подход разработан для того, чтобы предложить надежное и масштабируемое решение проблем принятия решений в сфере недвижимости. Результаты показывают, что такой подход сокращает временные и трудозатраты на выполнение этих задач.

This paper proposes a method for building an automatic predictive real estate analysis system with machine learning using a distributed approach that allows the appropriate scaling that can be applied in different situations. This work is devoted to studying the shortcomings of existing predictive analytics systems and giving an example of an automatic predictive analytics system that has advanced experience, uses modern technologies, and allows analysis to be carried out in the most effective way possible. To achieve this goal, advanced methods of data extraction, transformation and purification will be used, followed by the implementation of a machine learning model using Apache Spark. In addition, the "master worker" architecture was used, which provides optimal storage capacity combined with increased fault tolerance due to the integration of the Apache Kafka cluster using the agreed Kraft protocol, as well as portability and Docker containers. This comprehensive approach is designed to offer a reliable and scalable solution to real estate decision-making challenges. The results show that this approach reduces the time and labor cost of these tasks.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 1 
Last 30 days: 1

Detailed usage statistics