Details

Title: The development of house price forecast model based on machine learning: выпускная квалификационная работа магистра: направление 38.04.01 «Экономика» ; образовательная программа 38.04.01_27 «Количественные финансы (международная образовательная программа)»
Creators: Чжао Синьюй
Scientific adviser: Рытова Елена Владимировна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: прогноз цен на жилье; машинное обучение; микрофакторы; сравнение моделей множественной регрессии; Python; house price forecast; machine learning; micro factors; multiple regression models comparison
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 38.04.01
Speciality group (FGOS): 380000 - Экономика и управление
DOI: 10.18720/SPBPU/3/2023/vr/vr24-593
Rights: Доступ по паролю из сети Интернет (чтение, печать)
Additionally: New arrival
Record key: ru\spstu\vkr\27467

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Данная работа посвящена построению множественных моделей цен на жилье на основе машинного обучения. В ходе исследования были поставлены следующие цели: Кратко изложите текущее состояние развития машинного обучения и текущее состояние исследований в области прогнозирования цен на жилье. Предварительная обработка данных о ценах на подержанное жилье в Ханчжоу и анализ влияния характеристик дома на цену дома. Создайте шесть популярных моделей регрессии с помощью Python: линейную регрессию, регрессию Лассо, регрессию гребня, случайный лес, дерево решений, машину опорных векторов и модель K-ближайшего соседа. Отрегулируйте параметры модели, чтобы получить лучший результат прогнозирования для каждой модели. Сравните результаты всех моделей, найдите и проанализируйте модель с лучшими результатами прогнозирования. Результаты исследования показали, что в эмпирическом анализе цен на вторичное жилье в Ханчжоу модель линейной регрессии не соответствовала высокой точности и была менее точной. Хотя модель случайного леса показала лучшие результаты, R2 достиг 0,606, а RMSE — 0,088. Это исследование предлагает некоторые рекомендации покупателям жилья по выбору второго дома. И это может помочь застройщику принять разумное инвестиционное решение. Кроме того, это также поможет правительству разработать соответствующую политику и правила для контроля цен на жилье.

The given work is devoted to build multiple house price models based on machine learning.  The research set the following goals: Summarize the current state of development of machine learning and the current state of research on house price prediction. Pre-processing of Hangzhou second-hand house price data and analysis of the influence on house price of house features. Construct six popular regression models by using Python: linear regression, Lasso regression, ridge regression, random forest, decision tree, support vector machine and K-Nearest Neighbor model. Adjust model’s parameters to obtain the best prediction result of each model. Compare the results of all models , find out and analyse the model with the best prediction results. The study result revealed that in the Hangzhou second-house price empirical analysis, the linear regression model was not fitted with high precision and was less accurate. While the random forest model performed the best, R2 reached to 0.606 and  RMSE is 0.088. This study offers some guidance to house buyers to select the second-house. And it can assist housing developer to make a reasonable investment decision. Besides,it will also help the government to develop relevant policies and regulations to control house prices.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
Internet Authorized users SPbPU Read Print
-> Internet Anonymous

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics