Детальная информация
| Название | Разработка геоинформационной системы для анализа пространственных данных с использованием методов машинного обучения: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных» |
|---|---|
| Авторы | Ермошко Даниил Андреевич |
| Научный руководитель | Малеев Олег Геннадьевич |
| Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Выходные сведения | Санкт-Петербург, 2025 |
| Коллекция | Выпускные квалификационные работы ; Общая коллекция |
| Тематика | машинное обучение ; геоинформационные системы ; коммерческая недвижимость ; алгоритмы ; анализ ; machine learning ; geoinformation systems ; commercial real estate ; algorithms ; analysis |
| Тип документа | Выпускная квалификационная работа магистра |
| Тип файла | |
| Язык | Русский |
| Уровень высшего образования | Магистратура |
| Код специальности ФГОС | 09.04.04 |
| Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-5166 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | ru\spstu\vkr\37779 |
| Дата создания записи | 23.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
Данное исследование посвящено конструированию интеллектуального программного решения, предназначенного для реализации задач прогнозного анализа в контексте пространственно-временных данных, с опорой на инструментарий современных алгоритмов машинного обучения. При достижении цели необходимо решить следующие задачи: 1. Провести анализ существующих подходов и технологий. 2. Разработать методику сбора и подготовки данных. 3. Разработать программное обеспечение. 4. Провести серию экспериментов и тестирование разработанной системы. В качестве объекта исследования рассматриваются методы автоматизированного выявления закономерностей в массивах геоинформационных данных, относящихся к характеристикам объектов коммерческой недвижимости, с акцентом на применение нейросетевых архитектур и статистических моделей. Целью исследования является построение интеллектуальной системы, способной на основе пространственно-временных признаков оценивать ключевые характеристики объектов и осуществлять точное прогнозирование. Теоретическая значимость работы заключается в исследовании подходов к описанию и построению прогнозной модели, а также рассмотрение основных методы машинного обучения и задач, которые они могут решать Была создана выборка данных путем сбора из разных открытых источников и заполнения пропущенных признаков и подготовлена для дальнейшей работы с ней методами машинного обучения. Для последующего обучения модели было произведено разделение набора данных на обучающий и тестовый набор соответственно. Предметом исследования выступают алгоритмы машинного обучения, такие как Random Forest, линейно многомерная регрессия и дерево принятия решений. Проанализирована и сопоставлена их предсказательная точность. Наиболее точной прогнозной моделью оказался Random Forest. Были определены наиболее важные признаки относительно целевого атрибута и проведена оценка предсказательной точности модели на основе полученных признаков. В результате чего была построена модель Random Forest на основе наиболее важных признаков, которая показала наилучший результат в прогнозировании цен коммерческой недвижимости. Разработан веб-интерфейс для собственников или потенциальных собственников коммерческой недвижимости, позволяющий оперативно получать данные об объекте. Проведён анализ практической применимости, выявлены сильные и слабые стороны решения. Область применения результатов – коммерческий решения. Для достижения данных результатов в работе были использованы следующие информационные технологии, в том числе программное обеспечение, облачные сервисы, базы данных и прочие: - Visual Studio Code; - Google Collab; - ЯндексКарты; - OpenStreetMap; - Python; - Node.js; - React.
This study is devoted to the design of an intelligent software solution designed to implement predictive analysis tasks in the context of spatiotemporal data, based on the tools of modern machine learning algorithms. When the goal is achieved, the following tasks must be solved:: 1. To analyze existing approaches and technologies. 2. Develop a methodology for data collection and preparation. 3. Develop the software. 4. Conduct a series of experiments and testing of the developed system. The object of the study is methods of automated identification of patterns in arrays of geoinformation data related to the characteristics of commercial real estate objects, with an emphasis on the use of neural network architectures and statistical models. The purpose of the research is to build an intelligent system capable of evaluating key characteristics of objects based on spatial and temporal features and making accurate predictions. The theoretical significance of the work lies in the study of approaches to the description and construction of a predictive model, as well as consideration of the main machine learning methods and the tasks they can solve. A data sample was created by collecting data from various open sources and filling in the missing features and prepared for further work with it using machine learning methods. For the subsequent training of the model, the data set was divided into a training and a test set, respectively. The subject of the research is machine learning algorithms such as Random Forest, linear multidimensional regression and decision tree. Their predictiveaccuracy is analyzed and compared. Random Forest turned out to be the most accurate predictive model. The most important features relative to the target attribute were identified and the predictive accuracy of the model was evaluated based on the features obtained. As a result, the Random Forest model was built based on the most important features, which showed the best result in predicting commercial real estate prices. A web interface has been developed for owners or potential owners of commercial real estate, allowing them to quickly obtain information about the facility. The analysis of practical applicability is carried out, the strengths and weaknesses of the solution are revealed. The scope of the results is commercial solutions. To achieve these results, the following information technologies were used in the work, including software, cloud services, databases, and others.: - Visual Studio Code; - Google Collab; - Yandex Maps; - OpenStreetMap; - Python; - Node.js; - React.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0