Record Details

Mathematical models building with polysegmented regression usage

Наукові журнали Національного Авіаційного Університету

View Archive Info
 
 
Field Value
 
Title Mathematical models building with polysegmented regression usage
Построение математических моделей с использованием полисегментной регрессии
Побудова математичних моделей з використанням полісегментної регрессії
 
Creator Кузьмин, Валерій Миколойович; Національний авіаційний університет, Київ, Україна
Заліський, Максим Юрійович; Національний авіаційний університет, Київ, Україна
Климчук, Володимир Павлович; Національний авіаційний університет, Київ, Україна
 
Subject Electronics, telecommunications and radio engineering
approximation; ordinary least squares method; two segmented regressions; optimization of the abscissa of the switching point; heteroskedasticity
UDC 656.7.071: 656.7.052.002.5 (045)
Электроника, телекоммуникации и радиотехника
аппроксимация; метод наименьших квадратов; двухсегментная регрессия; оптимизация абсциссы точки переключения; гетероскедастичность
УДК 656.7.071: 656.7.052.002.5 (045)
Електроніка, телекомунікації та радіотехніка
аппроксимация; метод наименьших квадратов; двухсегментная регрессия; оптимизация абсциссы точки переключения; гетероскедастичность
УДК 656.7.071: 656.7.052.002.5 (045)
 
Description The article deals with the approximation of empirical data and the mathematical models building. The mathematical models building is an important task of scientific research, since it allows us to solve the problems of long-term forecasting. In approximation theory, the ordinary least squares method is most often used. In this case, single approximating functions are often used even in cases when the statistical data set changes the geometric structure. In this paper, the authors considered such approximating functions: linear; linear that starts from the origin of the coordinate system; two segmented linear that starts from the origin of the coordinate system; exponential. The selection of such approximating functions was performed based on a visual analysis of the structure of statistical data. Unsatisfactory approximation results using the usual linear regression and linear regression that starts from the origin of the coordinate system are a background for the application of other more accurate approximating functions: two segmented usual and two segmented with taking into account heteroskedasticity and exponential. Obtaining an analytical expression for a two segmented linear regression became possible as a result of using the Heaviside step function. In order to find the best approximation option, the abscissa of the switching point between segments was optimized. To solve the optimization problem, standard deviations were calculated for several options of the abscissa of the switching point. The calculated standard deviations were approximated by a parabola of the second degree, the minimum of which corresponds to the optimal abscissa of the switching point. To improve the accuracy of the approximation during constructing the two segmented regression, heteroskedasticity was taken into account. Heteroskedasticity characterizes the property of the sample, in which different values have different variances. There are various tests for detecting heteroskedasticity. In this article, heteroskedasticity was taken into account in accordance with the following sequence of operations: 1) for several options of possible values of the heteroskedasticity index, the corresponding approximating functions were calculated; 2) the weighted sum of squared deviations was calculated for each obtained function; 3) the heteroskedasticity index was determined for which the weighted sum of squared deviations is minimal. A comparative analysis showed the advantage of two segmented regressions in terms of approximation accuracy and prediction veracity. The research results can be used as a methodological tool during mathematical models building and selection of the best one.  
Статья посвящена вопросам аппроксимации эмпирических данных и построения математических моделей. Построение математических моделей является важной задачей научных исследований, поскольку позволяет решать проблемы долгосрочного прогнозирования. В теории аппроксимации чаще всего используется обычный метод наименьших квадратов. При этом зачастую используются единые аппроксимирующие функции даже в случаях, когда совокупность исследуемых данных меняет геометрическую структуру. В этой работе авторы рассмотрели такие аппроксимирующей функции: линейную; линейную, исходящую из нуля; двухсегментную линейную, исходящую из нуля; показательную. Выбор таких аппроксимирующих функций выполнялся исходя из визуального анализа структуры статистических данных. Неудовлетворительные результаты аппроксимации с использованием обычной линейной регрессии и линейной, исходящая из начала системы координат, являются предпосылкой для применения других более точных аппроксимирующих функций: двухсегментной обычной, двухсегментной с учетом гетероскедастичности и показательной. Получение аналитического выражения для двухсегментной линейной регрессии стало возможным в результате использования функции Хевисайда. При этом для нахождения наилучшего варианта аппроксимации выполнялась оптимизация абсциссы точки переключения сегментов. Для решения задачи оптимизации были рассчитаны стандартные отклонения для нескольких вариантов значения абсциссы точки переключения. Рассчитанные стандартные отклонения были аппроксимированы параболой второй степени, минимум которой соответствует оптимальной абсциссе точки переключения. Для улучшения точности аппроксимации при построении двухсегментной регрессии выполнен учет гетероскедастичности. Гетероскедастичность характеризует свойства выборки, при котором различные отсчеты имеют различную дисперсию. Существуют различные тесты для обнаружения гетероскедастичности. В этой статье учет гетероскедастичности выполнялся в соответствии со следующей последовательностью: 1) для нескольких вариантов возможных значений индекса гетероскедастичности рассчитывались соответствующие аппроксимирующие функции; 2) для каждой полученной функции рассчитывалась взвешенная сумму квадратов отклонений; 3) определялся индекс гетероскедастичности, для которого взвешенная сумма квадратов отклонений является минимальной. Сравнительный анализ показал преимущество двухсегментной регрессии с точки зрения точности аппроксимации и надежности прогнозирования. Результаты исследования могут быть использованы в качестве методологического инструмента при построении и выбора лучшей математической модели.
Стаття присвячена питанням апроксимації емпіричних даних і побудови математичних моделей. Побудова математичних моделей є важливою задачею наукових досліджень, оскільки вона дозволяє вирішувати завдання довгострокового прогнозування. У теорії апроксимації найчастіше використовується звичайний метод найменших квадратів. При цьому найчастіше використовуються єдині апроксимуючі функції навіть у випадках, коли сукупність досліджуваних даних змінює геометричну структуру. У цій роботі автори розглянули такі апроксимуючі функції: лінійну; лінійну, яка виходить із початку системи координат; двосегментній лінійну, яка виходить із початку системи координат; показникову. Вибір таких апроксимуючих функцій виконувався виходячи із візуального аналізу структури статистичних даних. Незадовільні результати апроксимації з використанням звичайної лінійної регресії та лінійної регресії, яка виходить із початку системи координат, є передумовою для застосування інших більш точних апроксимуючих функцій: двосегментної звичайної, двосегментної з урахуванням гетероскедастичності і показникової. Отримання аналітичного виразу для двосегментної лінійної регресії стало можливим в результаті використання функції Хевісайда. При цьому для знаходження найкращого варіанту апроксимації була виконана оптимізація абсциси точки перемикання двох сегментів. Для вирішення завдання оптимізації були розраховані стандартні відхилення для декількох варіантів можливих значень абсциси точки перемикання. Розраховані стандартні відхилення були апроксимовані з використанням параболи другого ступеня, мінімум якої відповідає оптимальній абсцисі точки перемикання сегментів. Для підвищення точності апроксимації під час побудови двосегментної регресії було виконано урахування гетероскедастичності. Гетероскедастичність характеризує властивість вибірки, при якій різні відлікові значення мають різну дисперсію. Існують різноманітні тести для виявлення та урахування гетероскедастичності. У цьому дослідженні урахування гетероскедастичності виконувалося відповідно до наступної послідовності операцій: 1) для декількох варіантів можливих значень індексу гетероскедастичності розраховувались відповідні апроксимуючі функції; 2) для кожної отриманої функції розраховувалася зважена сума квадратів відхилень; 3) визначався індекс гетероскедастичності, для якого зважена сума квадратів відхилень є мінімальною. Порівняльний аналіз показав перевагу двосегментної регресії з точки зору точності апроксимації та надійності прогнозування. Результати дослідження можуть бути використані в якості методологічного інструменту під час побудови та вибору найкращої математичної моделі
 
Publisher National Aviation University
 
Contributor


 
Date 2020-04-30
 
Type


 
Format application/pdf
 
Identifier http://jrnl.nau.edu.ua/index.php/SBT/article/view/14578
10.18372/2310-5461.45.14578
 
Source Наукоємні технології; Том 45, № 1 (2020); 11-18
Science-based technologies; Том 45, № 1 (2020); 11-18
Наукоемкие технологии; Том 45, № 1 (2020); 11-18
 
Language uk
 

Технічна підтримка: НДІІТТ НАУ