Łączenie danych z rożnych źródeł w celu monitorowania stanu urządzeń
przemysłowych
Procesy przemysłowe i maszyny generują ogromną ilość danych z wielu różnych źródeł,
które potencjalnie mogą być wartościowe dla celów monitoringu i diagnostyki. Celem
tej pracy jest zbadanie, w jaki sposób różne dane dostępne w warunkach
przemysłowych mogą umożliwić bardziej wiarygodną i solidną ocenę stanu systemu.
Badania obejmują dobór i selekcję cech sygnałów, ponieważ jest to jeden z pierwszych
kroków w kierunku dokładnego wykrywania błędów i diagnozy. Metody selekcji cech
są badane z perspektywy ich przydatności do monitorowania stanu i problemów z fuzją
danych. Metoda ReliefF została przeanalizowana i rozszerzona o mechanizmy
kompensacji redundancji cech. W celu wyboru cech utworzono metodę hybrydową
wykorzystującą ReliefF. W pracy zbadano również nowe algorytmy łączenia danych
z różnych źródeł zarejestrowanych online i offline. Opracowano ogólną dwustopniową
strukturę Bayesowską, która składa się z fuzji na poziomie cech i fuzji wyników fuzji na
poziomie decyzji. Fuzja na poziomie cech jest implementowana naiwnymi
klasyfikatorami Bayesowskimi. W przypadku fuzji bayesowskiej na poziomie cech
można użyć funkcji wiarygodności opartych na progach, funkcji wiarygodności Gaussa,
estymatorów jądrowych lub nowo opracowanej techniki interpolowanych
estymatorów jądrowych w zależności od danych monitorowania stanu i systemu. Fuzja
na poziomie decyzyjnym jest przeprowadzana z użyciem formuły naiwnego
klasyfikatora Bayesowskiego przy użyciu macierzy kontuzji. Ponadto proponuje się
dwie metody, uwzględnienia zależności cech od warunków pracy przy użyciu
dwustopniowej struktury Bayesowskiej, która jest ważnym zadaniem monitorowania
stanu. Nowe metody zwalidowano różnych zastosowaniach dla dwóch studiów
przypadku zawierających heterogeniczne dane na temat silników indukcyjnych
i wielofazowych instalacji przepływowej. Wyniki potwierdziły, że metody poprawiły
wydajność diagnostyki, tworząc solidne, modułowe i skalowalne struktury
monitorowania.
Combining data from disparate sources for condition monitoring purposes
Industrial processes and machinery generate a vast amount of data from a variety of
disparate sources which may potentially be valuable for monitoring purposes. The goal
of this thesis is to investigate how disparate data available in an industrial setting may
enable more reliable and robust condition assessment. Feature design and selection is
investigated as it is one of the first steps towards accurate fault detection and
diagnosis. Feature selection methods are reviewed from the perspective of their
applicability for condition monitoring and data fusion problems. The ReliefF method,
which has been found to be a suitable fit for condition monitoring applications, is
further studied and extended to cope with feature redundancy. A ReliefF-based hybrid
method is created for feature selection. The thesis also investigates new algorithms to
fuse data from disparate sources recorded online, offline, and periodically for
equipment condition monitoring. A generic two-stage Bayesian framework is
developed, which is composed of a feature- level fusion and a decision-level fusion of
the feature- level fusion results. Feature-level fusion is implemented with Naive Bayes
classifiers. Thresholds-based likelihood functions, Gaussian likelihood functions, Kernel
Density Estimation or a newly developed Interpolated Kernel Density Estimation
technique may be used for the feature-level Bayesian fusion depending on the
condition monitoring data and system. Decision-level fusion is conducted with a Naive
Bayes formulation using confusion matrices. Furthermore, two methods are proposed
to account for the operating condition dependency of features when using the
two-stage Bayesian framework, which is a typical condition monitoring challenge. The new
methods are validated through multiple applications on two case studies containing
heterogeneous data obtained from induction motors and a multiphase flow facility.
The results confirm that the methods improve the diagnostics performance, while
creating a robust, modular and scalable monitoring framework.