Comparative analysis of speech recognition algorithms in UAV voice control system
Наукові журнали Національного Авіаційного Університету
View Archive InfoField | Value | |
Title |
Comparative analysis of speech recognition algorithms in UAV voice control system
Сравнительный анализ алгоритмов распознавания речи в системе голосового управления БПЛА Comparative analysis of speech recognition algorithms in UAV voice control system |
|
Creator |
Lavrynenko, O.
Konakhovych, G. Bakhtiiarov, D. |
|
Subject |
—
MEL scale; BARK scale; UAV; speech recognition; MFCC; minimum mean square error 004.934 — шкала MEL; шкала BARK; БПЛА; распознавание речи; MFCC; минимальная среднеквадратическая ошибка — — : шкала MEL; шкала BARK; БПЛА; розпізнавання мови; MFCC; мінімальна середньоквадратична помилка 004.934 |
|
Description |
The article proposes to perform a comparative analysis of the presented algorithms for processing voice control signals for an unmanned aerial vehicle, which can be implemented on processors with low computing power using online processing in real time. It is shown that these approaches are effective in improving the accuracy of speech recognition in the presence of various types of noise and a sound-reflecting control environment, which is an important problem in voice control systems for an unmanned aerial vehicle. An algorithm for calculating the mel-frequency cepstral coefficients, which appear in the role of the main features of speech recognition, is presented. A comparative analysis of two methods of distinguishing informative features of speech recognition in the voice control system of an unmanned aerial vehicle was made, namely, mel-frequency cepstral factors and the coefficients obtained with the aid of a linear prediction algorithm, where as a result of the conducted scientific experiment, under the influence of given noise, it was concluded that in these problems, the optimal method of exclusion is the mel-frequency cepstral factors, since they show the best value for obsalutnomu criterion of speech recognition quality. The expediency of using the proposed system for recognizing voice commands of an unmanned aerial vehicle based on the cepstral analysis is substantiated and experimentally proved. The obtained results of the experimental research allow to draw a conclusion about the advisability of further practical application of the developed system for recognizing voice commands for the control of an unmanned aerial vehicle on the basis of a cepstral analysis.
В статье предлагается произвести сравнительный анализ представленных алгоритмов обработки сигналов голосового управления беспилотным летательным аппаратом, которые могут быть реализованы на процессорах с малой вычислительной способностью используя онлайн-обработку в режиме реального времени. Показано, что эти подходы эффективны в улучшении точности распознавания речи при наличии различных типов шумов и звукоотражающей среды управления, что является важной проблемой в системах голосового управления беспилотным летательным аппаратом. Представлен алгоритм вычисления мел-частотных кепстральных коэффициентов, которые выступают в роле основных признаков распознавания речи. Был проведен сравнительный анализ двух методов выделения информативных признаков распознавания речи в системе голосового управления беспилотным летательным аппаратом, а именно мел-частотные кепстральные коефициенты и коефициенты полученные с помощю алгоритма линейного предсказания, где в результате проведенного научного експереманта при воздействии заданных шумов были сделаны выводы, что в данных задачах оптимальным методом выдиления является мел-частотные кепстральные коефициенты, так как они показывают наилучший показатель по обсалютному критерию качества распознавания речи. Обосновано и экспериментально доказано целесообразность использования предложенной системы распознавания голосовых команд управления беспилотным летательным аппаратом на основе кепстрального анализа. Полученные результаты экспериментального исследования позволяют сделать вывод о целесообразности дальнейшего практического применения разработанной системы распознавания голосовых команд управления беспилотным летательным аппаратом на основе кепстрального анализа. У статті пропонується провести порівняльний аналіз представлених алгоритмів обробки сигналів голосового управління безпілотним літальним апаратом, які можуть бути реалізовані на процесорах з малою обчислювальною здатністю використовуючи онлайн-обробку в режимі реального часу. Показано, що запропоновані підходи ефективні в поліпшенні точності розпізнавання мови при наявності різних типів шумів і звуковідбиваючого середовища управління, що є важливою проблемою в системах голосового управління безпілотним літальним апаратом. Представлений алгоритм обчислення мел-частотних кепстральних коефіцієнтів, які виступають в ролі основних ознак розпізнавання мови. Був проведений порівняльний аналіз двох методів виділення інформативних ознак розпізнавання мови в системі голосового управління безпілотним літальним апаратом, а саме мел-частотні кепстральні коефіцієнти і коефіцієнти отримані за допомогою алгоритму лінійного передбачення, де в результаті проведеного наукового експерименту при впливі заданих шумів були зроблені висновки, що в даних задачах оптимальним методом виділення є мел-частотні кепстральні коефіцієнти, так як вони показують найкращий показник по абсолютному критерію якості розпізнавання мови. Обґрунтовано та експериментально доведено доцільність використання запропонованої системи розпізнавання голосових команд управління безпілотним літальним апаратом на основі кепстрального аналізу. Отримані результати експериментального дослідження дозволяють зробити висновок про доцільність подальшого практичного застосування розробленої системи розпізнавання голосових команд управління безпілотним літальним апаратом на основі кепстрального аналізу. |
|
Publisher |
National Aviation University
|
|
Contributor |
—
— — |
|
Date |
2018-07-03
|
|
Type |
—
— — |
|
Format |
application/pdf
application/pdf |
|
Identifier |
http://jrnl.nau.edu.ua/index.php/SBT/article/view/12858
10.18372/2310-5461.38.12858 |
|
Source |
Наукоємні технології; Том 38, № 2 (2018); 137-142
Science-based technologies; Том 38, № 2 (2018); 137-142 Наукоемкие технологии; Том 38, № 2 (2018); 137-142 |
|
Language |
uk
|
|