К ПРОБЛЕМЕ ГЕНЕРАЦИИ ВЫБОРКИ ПРИ ИДЕНТИФИКАЦИИ БЕЗЫНЕРЦИОННЫХ ПРОЦЕССОВ

Перевод названия: TO THE PROBLEM OF GENERATION SAMPLE IN SOLVING THE PROBLEM OF NON INTERIAL PROCESSES IDENTIFICATION

Тип публикации: статья из журнала

Год издания: 2015

Ключевые слова: безынерционный объект, H-процесс, noninterial processes H-process, identification, sample, data analysis, non-parametric modeling, идентификация, выборка, анализ данных, непараметрическое моделирование

Аннотация: Рассматривается задача повышения качества исходных данных при идентификации Н-процессов. Входные переменные такого рода процессов связаны стохастической зависимостью, вследствие этого процесс протекает не в гиперкубе, а лишь в некоторой его подобласти. Этот факт приводит к некоторым особенностям, которые необходимо учитывать при идентификации. При построении моделей в условиях большого объема априорных данных можно воспользоваться методами идентификации в широком смысле. Однако если нет достаточной априорной информации об изучаемом объекте, то необходимо применять методы идентификации в узком смысле. К таким методам относятся непараметрические оценки функции регрессии по наблюдениям. Качество решения задачи идентификации зависит от качества исходных данных. Целесообразно провести предварительный анализ данных для выявления и устранения всех недостатков в выборке. Под предварительным анализом данных принято понимать заполнение пробелов в наблюдениях и устранение выбросов. Подобного рода задачи встречаются при диагностике ракетных двигателей, процессов изготовления изделий электронной техники и др. Однако выборка может обладать другими дефектами (речь о них пойдет ниже), которые негативно влияют на точность оценивания, а в некоторых случаях приведут к тому, что полученная модель будет неадекватна исследуемому процессу. Если точки исходной выборки в области протекания процесса расположены неоднородно, присутствуют области разреженности и отсутствия наблюдений, то в таких областях точность восстановления будет низкой. Вследствие свойств непараметрических моделей, которые относятся к классу локальных аппроксимаций, прогноз в областях отсутствия наблюдений может оказаться достаточно грубым. Для устранения всех этих недостатков предлагается алгоритм получения рабочей выборки путем генерации новых точек в областях, где их плотность по сравнению с остальными областями невелика. После генерации новой рабочей выборки качество восстановления значительно улучшается, что подтверждается результатами численных экспериментов. Подобного рода алгоритмы являются актуальными и могут быть использованы при решении задачи распознавания в различных областях, где важна точность классификации. The problem of improving the quality of the original data in the identification of H-processes is considered. There is stochastic dependence between input variables of such processes so this process precedes not at all the regulated area but only at some of its subdomain. This fact leads to some features that must be considered when identifying. If there is large number of a priori data when building models, you can use the methods of identification in the “broad” sense. However, if there is sufficient a priori information about the object being studied, it is necessary to apply the methods of identification in the “narrow” sense. These methods include nonparametric estimation of regression function from observations. The quality of solving the problem of identification depends on the quality of input data. It is advisable to conduct a preliminary analysis of data to identify and address all the deficiencies in the sample. Under the preliminary analysis of the data is taken to mean filling gaps in observations and eliminating emissions. However, the sample may have other flaws, that will be discussed below, which adversely affect the accuracy of estimation, and, in some cases, lead to the fact that the resulting model will be inadequate to the investigated process. If the point of the original sample in the field of process located patchy, there are low-pressure range and lack of observations, in the areas of reconstruction accuracy is low. Due to the properties of nonparametric estimation, which belongs to the class of local approximations, projections can not be given at the lack of observations subdomain. To resolve all these shortcomings we propose an algorithm to obtain a working sample by generating new points in regions where the density is low in comparison with other areas. After generating new working sample, the quality of estimation is significantly improved, as evidenced by the results of numerical experiments. This kind of tasks are relevant and can be used in solving the problem of recognition in various fields, where the classification accuracy is important, for example, in the diagnosis of space propulsion, electrical, etc.

Ссылки на полный текст

Издание

Журнал: Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева

Выпуск журнала: Т. 16, № 2

Номера страниц: 368-375

ISSN журнала: 18169724

Место издания: Красноярск

Издатель: Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева

Персоны

Чжан Е.А. (Сибирский федеральный университет)

Вхождение в базы данных

РИНЦ (eLIBRARY.RU)

Информация о публикациях загружается с сайта службы поддержки публикационной активности СФУ. Сообщите, если заметили неточности.