Сайт использует файлы cookie для повышения удобства пользователей
Больше не показывать
Чижов А.С., Миролюбова А.А., Смирнова О.П. Сравнительный анализ методов машинного обучения для оценки рыночной стоимости подержанных автомобилей
Научная статья
УДК 004.021:330.133.2
https://doi.org/10.24158/tipor.2026.4.20
 

Сравнительный анализ методов машинного обучения для оценки рыночной

стоимости подержанных автомобилей

 
Александр Сергеевич Чижов1, Анастасия Александровна Миролюбова2,
Ольга Павловна Смирнова3
1,2,3Ивановский государственный химико-технологический университет, Иваново, Россия
1Alexchizh02@yandex.ru
2mirolubowa@mail.ru, https://orcid.org/0000-0003-3785-0538
3smirnowa07@rambler.ru, https://orcid.org/0009-0003-2941-5365
 
Аннотация. В статьеисследуется проблема высокоточного прогнозирования цен на вторичном рынке Индии с использованием алгоритмов машинного обучения. Авторами проведено сравнение классической линейной регрессии и ансамблевых методов: случайного леса и градиентного бустинга. Методика исследования основана на комплексном подходе машинного обучения, включая очистку и преобразование данных, логарифмирование целевой переменной, прогнозирование на базе поэтапного сравнения моделей по сложности и интерпретацию для бизнеса. Современные библиотеки Python, такие как Pandas, Numpy, Matplotlib, Seaborn, Scikit-learn Xgboost, Joblib, предоставляют широкие возможности для анализа и прогнозирования больших и разнородных данных, характерных для автомобильного рынка, а также гибкой настройки и интерактивной визуализации. В ходе работы аргументирована необходимость логарифмического преобразования целевой переменной для минимизации асимметрии данных. Результаты показали преимущество модели градиентного бустинга, обеспечивающего значение R2 = 0,94 и снижение абсолютной ошибки MAE до 1,387 лакха индийских рупий. Проведен анализ важности признаков, выявивший доминирующую роль мощности двигателя и года выпуска в ценообразовании.
Ключевые слова: машинное обучение, градиентный бустинг, прогнозирование цены, вторичный рынок автомобилей, линейная регрессия, случайный лес
Финансирование: инициативная работа.
Для цитирования: Чижов А.С., Миролюбова А.А., Смирнова О.П. Сравнительный анализ методов машинного обучения для оценки рыночной стоимости подержанных автомобилей // Теория и практика общественного развития. 2026. № 4. С. 162–172. https://doi.org/10.24158/tipor.2026.4.20.
 
Original article
 

A Comparative Analysis of Machine Learning Methods

for Estimating the Market Value of Used Cars

 
Alexander S. Chizhov1, Anastasia A. Mirolyubova2,
Olga P. Smirnova3
1,2,3Ivanovo State University of Chemical Technology, Ivanovo, Russia
1Alexchizh02@yandex.ru
2mirolubowa@mail.ru, https://orcid.org/0000-0003-3785-0538
3smirnowa07@rambler.ru, https://orcid.org/0009-0003-2941-5365
 
Abstract. This article examines the problem of high-precision price forecasting in the Indian secondary market using machine learning algorithms. The authors compare classical linear regression with ensemble methods: random forest and gradient boosting. The research methodology is based on a comprehensive machine learning approach, including data cleaning and transformation, logarithmization of the target variable, forecasting based on step-by-step comparison of models by complexity, and business interpretation. Modern Python libraries such as Pandas, Numpy, Matplotlib, Seaborn, Scikit-learn, XGBoost, Joblib provide extensive capabilities for analyzing and forecasting large and heterogeneous data typical of the automotive market, as well as flexible customization and interactive visualization. The study argued for the need for a logarithmic transformation of the target variable to minimize data skewness. The results demonstrated the advantage of the gradient boosting model, yielding an R2 value of 0,94 and reducing the MAE absolute error to INR 1,387 lakh. A feature importance analysis was conducted, revealing the dominant role of engine power and year of manufacture in pricing.
Keywords: machine learning, gradient boosting, price prediction, used car market, linear regression, random forest
Funding: Independent work.
For citation: Chizhov, A.S., Mirolyubova, A.A. & Smirnova, O.P. (2026) A Comparative Analysis of Machine Learning Methods for Estimating the Market Value of Used Cars. Theory and Practice of Social Development. (4), 162–172. Available from: doi:10.24158/tipor.2026.4.20 (In Russian).

© Чижов А.С., Миролюбова А.А, Смирнова О.П., 2026
Список источников:
 
Андриенко И.С. Применение методов машинного обучения для построения модели прогнозирования динамики цен на рынке автомобилей в среде Google Colaboratory // Постулат. 2024. № 6 (104).
Апалькова Т.Г., Левченко К.Г. Особенности инструментов проверки статистических гипотез в программных средах R, Python и Ms Excel // Modern Economy Success. 2023. № 6. С. 252–259.
Груздев А.В. Предварительная подготовка данных в Python : в 2 т. Т. 1: Инструменты и валидация. М., 2023. 816 с.
Колобовникова М.А. Обучение математических моделей для прогнозирования автомобильных цен // Фундаментальные и прикладные исследования молодых ученых : сборник научных трудов XV Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых / ред. Ю.М. Митьковец. Новокузнецк, 2025. С. 90–92.
Миролюбова А.А., Смирнова Н.В., Ворошин Д.А. Исследование влияния характеристик автомобиля на его стоимость: анализ и прогнозирование с помощью Python // Известия высших учебных заведений. Сер.: Экономика, финансы и управление производством. 2025. № 4 (66). С. 115–127. https://doi.org/10.6060/ivecofin.2025664.751.
Топоривский Д.В., Пономарев А.А. Построение математической предсказательной модели для рынка автомобилей // Неделя науки Санкт-Петербургского государственного морского технического университета. 2024. Т. 2, № 1. С. 372–380.
Щерба А.П., Нестеренков С.Н. Алгоритмы прогнозирования стоимости автомобилей с использованием методов машинного обучения // Информационные технологии и системы 2024 (ИТС 2024) : материалы международной научной конференции / под ред. Л.Ю. Шилина. Минск, 2024. С. 73–74.
 
References:
 
Andrienko, I.S. (2024) Application of machine learning methods to build a model for predicting price dynamics in the car market in the google colaboratory environment. Postulate. (6). (In Russian)
Apal’kova, T.G. & Levchenko, K.G. (2023) Features of statistical hypothesis testing tools in R, Python and Ms Excel. Modern Economy Success. (6), 252–259. (In Russian)
Gruzdev, A.V. (2023) Data pre-preparation in Python. Vol. 1: Tools and validation. Moscow, DMK-Press. (In Russian)
Kolobovnikova, M.A. (2025) Training mathematical models for forecasting automobile prices. In: Mitkovets, Yu.M. (ed.) Fundamental and applied research of young scientists: Collection of scientific papers of the XV All-Russian scientific and practical conference of students, graduate students and young scientists. Novokuznetsk, KemGU, 90–92. (In Russian)
Mirolyubova, A.A., Smirnova, N.V. & Voroshin, D.A. (2025) Investigating the impact of car characteristics on its value: Analysis and forecasting using Python. News of Higher Educational Institutions. The Series “Economics, Finance and Production Management”. (4), 115–127. Available from: doi:10.6060/ivecofin.2025664.751. (In Russian)
Shcherba, A.P. & Nesterenkov, S.N. (2024) Algorithms for predicting the cost of cars using machine learning methods. In: Shilin, L.Yu. (ed.) Information technologies and systems 2024 (ITS 2024): Proceedings of the International conference. Minsk, BGUIR, 73–74. (In Russian)
Toporivsky, D.V. & Ponomarev, A.A. (2024) The construction of a mathematical predictive model for the car market. Nedelya Nauki Sankt-Peterburgskogo Gosudarstvennogo Morskogo Tekhnicheskogo Universiteta. 2 (1), 372–380. (In Russian)