Порівняльний аналіз двох методів урахування гетероскедастичності під час побудови математичних моделей
Наукові журнали Національного Авіаційного Університету
View Archive InfoField | Value | |
Title |
Порівняльний аналіз двох методів урахування гетероскедастичності під час побудови математичних моделей
СРАВНИТЕЛЬНЫЙ АНАЛИЗ ДВУХ МЕТОДОВ УЧЕТА ГЕТЕРОСКЕДАСТИЧНОСТИ ВО ВРЕМЯ ПОСТРОЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ COMPARATIVE ANALYSIS OF TWO METHODS FOR TAKING INTO ACCOUNT HETEROSKEDASTICITY DURING MATHEMATICAL MODELS BUILDING |
|
Creator |
Kuzmin, Valeriyi; Національний авіаційний університет
Zaliskyi, Maksym; Національний авіаційний університет Petrova, Yuliia; Національний авіаційний університет Cheked, Igor; Національний авіаційний університет |
|
Subject |
Електроніка
апроксимація; зважений метод найменших квадратів; гетероскедастичність; порівняльний аналіз; показник гетерос-кедастичності 656.7.071: 656.7.052.002.5 (045) Электроника аппроксимация; взвешенный метод наименьших квадратов; гетероскедастичность; сравнительный анализ; индекс гетероскедастичности 656.7.071: 656.7.052.002.5 (045) Electronics approximation; weighted least squares method; heteroskedasticity; comparative analysis; heteroskedasticity index 656.7.071: 656.7.052.002.5 (045) |
|
Description |
У статті розглянуто задачу порівняльного аналізу двох методів урахування гетероскедастичності під час побудови математичних моделей. Урахування гетероскедастичності є новим напрямом під час аналізу емпіричних даних. Гетероскедастичність характеризується різними значеннями дисперсії для даних в одній вибірці. Наявність гетероскедастичності може призвести до зниження точності апроксимації у разі використання звичайного методу найменших квадратів. Тому в цій статті розглядається задача урахування гетероскедастичності під час аналізування емпіричних даних. Першим етапом побудови математичної моделі є апроксимація даних з використанням звичайного методу найменших квадратів. При цьому попередньо обирається апроксимуюча функція, виходячи із візуального аналізу структури статистичних даних. Наступним етапом побудови математичної моделі є урахування гетероскедастичності. Існують різні тести для виявлення гетероскедастичності. У цій статті розглянуто прямий метод побудови рівняння гетерокедастичності та новий метод, який порівнюється з прямим. Прямий метод заснований на обчисленні середніх значень та стандартних відхилень для кожного перетину початкової вибірки. Вагові коефіцієнти гетероскедастичності розраховуються відповідно до апроксимаційної залежності стандартних відхилень від середніх значень для статистичних даних з використанням лінійної функції. Такий метод має суттєвий недолік: він потребує кратних вимірювань для кожного перетину вибірки. Під час вирішення задач синтезу нового алгоритму виявлення та урахування гетероскедастичності автори пропонують нову кількісну міру гетероскедастичності. Оцінка запропонованого індексу гетероскедастичності виконується у такій послідовності: 1) для декількох варіантів можливих значень індексу гетероскедастичності розраховують відповідні апроксимаційні функції; 2) для кожної отриманою функції розраховують зважену суму квадратів відхилень; 3) визначають індекс гетероскедастичності, для якого зважена сума квадратів відхилень є мінімальною. У статті також розглянуто унікальний приклад емпіричних даних з кратними вимірюваннями у кожному перетині. Аналіз таких даних дозволив обґрунтувати надійність та адекватність нового методу виявлення та урахування гетероскедастичності. Новий метод урахування гетероскедастичності дозволяє побудувати математичну модель без проведення декількох вимірювань для кожного перетину.
В статье рассмотрена задача сравнительного анализа двух методов учета гетероскедастичности при построении математических моделей. Учет гетероскедастичности является новым направлением при анализе эмпирических данных. Гетероскедастичность характеризуется различными значениями дисперсии для данных в одной выборке. Наличие гетероскедастичности может привести к снижению точности аппроксимации при использовании обычного метода наименьших квадратов. Поэтому в этой статье рассматривается задача учета гетероскедастичности во время анализа эмпирических данных. Первым этапом построения математической модели является аппроксимация данных с использованием обычного метода наименьших квадратов. При этом предварительно выбирается аппроксимирующая функция, исходя из визуального анализа структуры статистических данных. Следующим этапом построения математической модели является учет гетероскедастичности. Существуют различные тесты для выявления гетероскедастичности. В этой статье рассмотрены прямой метод построения уравнения гетероскедастичности и новый метод, который сравнивается с прямым. Прямой метод основан на вычислении средних значений и стандартных отклонений для каждого сечения выборки. Весовые коэффициенты гетероскедастичности рассчитываются в соответствии с аппроксимационной зависимостью стандартных отклонений от средних значений для статистических данных с использованием линейной функции. Такой метод имеет существенный недостаток: он требует кратных измерений для каждого сечения выборки. При решении задач синтеза нового алгоритма обнаружения и учета гетероскедастичности авторы предлагают новую количественную меру гетероскедастичности. Оценка предложенного индекса гетероскедастичности выполняется в следующей последовательности: 1) для нескольких вариантов возможных значений индекса гетероскедастичности рассчитывают соответствующие аппроксимирующие функции; 2) для каждой полученной функции рассчитывают взвешенную сумму квадратов отклонений; 3) определяют индекс гетероскедастичности, для которого взвешенная сумма квадратов отклонений является минимальной. В статье также рассмотрен уникальный пример эмпирических данных с кратными измерениями в каждом сечении. Анализ таких данных позволил обосновать надежность и адекватность нового метода обнаружения и учета гетероскедастичности. Новый метод учета гетероскедастичности позволяет построить математическую модель без проведения нескольких измерений для каждого сечения. The article deals with the problem of comparative analysis of two methods of taking into account heteroskedasticity during mathematical models building. Heteroskedasticity accounting is a new trend for the empirical data analysis. Heteroskedasticity is characterized by different values of variance for data in one sample. The presence of heteroskedasticity can lead to approximation accuracy decreasing in case of ordinary least squares method utilization. Therefore, this article concentrates on the problem of heteroskedasticity accounting in case of empirical data analysis. The first step during the mathematical model building is to approximate the data using the ordinary least squares method. In this case, the approximation function is pre-selected in advance based on visual analysis of the statistical data structure. The next step in mathematical model building is to take into account heteroscedasticity. There are different tests for heteroskedasticity detection. This article discusses the direct method of the heteroskedasticity equation construction and the new method that is compared with the direct one. The direct method is based on the calculation of average values and standard deviations for in each section of initial sample. Heteroskedasticity weighting coefficients are calculated according to the approximation of standard deviations dependence on the average values for statistics using a linear function. This method has a significant weakness: it requires multiple measurements for each sample section. During solving the problems of synthesizing a new algorithm for heteroskedasticity detecting and accounting, the authors propose a new quantitative measure of heteroskedasticity. The estimation of the proposed heteroskedasticity index is performed in the following sequence: 1) for several options of possible values of the heteroskedasticity index, the corresponding approximation functions are calculated; 2) the sum of squared deviations is calculated for each obtained function; 3) the heteroskedasticity index is equal to value for which the sum of squared deviations is minimal. A unique example of empirical data with multiple measurements in each section is considered. The analysis of such data allowed justifying the reliability and adequacy of the new method for heteroskedasticity detecting and accounting. The new method of heteroskedasticity accounting allows us to construct the mathematical model without carrying out multiple expensive measurements in each section. |
|
Publisher |
National Aviation University
|
|
Contributor |
—
— — |
|
Date |
2019-12-31
|
|
Type |
—
— — |
|
Format |
application/pdf
|
|
Identifier |
http://jrnl.nau.edu.ua/index.php/SBT/article/view/14321
10.18372/2310-5461.44.14321 |
|
Source |
Наукоємні технології; Том 44, № 4 (2019); 449-456
Science-based technologies; Том 44, № 4 (2019); 449-456 Наукоемкие технологии; Том 44, № 4 (2019); 449-456 |
|
Language |
uk
|
|