Uczenie maszynowe z GreyconMill

29/09/2018
greycon mill

Wikipedia definiuje uczenie maszynowe jako naukę interdyscyplinarna ze szczególnym uwzględnieniem takich dziedzin jak informatyka, robotyka i statystyka. Głównym celem jest praktyczne zastosowanie dokonań w dziedzinie sztucznej inteligencji do stworzenia automatycznego systemu potrafiącego doskonalić się przy pomocy zgromadzonego doświadczenia (czyli danych) i nabywania na tej podstawie nowej wiedzy.

Uczenie maszynowe z GreyconMill

GreyconMill, branżowy system realizacji produkcji (MES - manufacturing execution system) firmy Greycon, jest odpowiedzialny za rejestrację produkcji. Jego zadaniem jest:

  • gromadzenie informacji o zdarzeniach takich jak: rozpoczęcie produkcji czy owinięcie palety. Same zdarzenia i związane z nimi pomiary (np. waga palety) są przechowywane w bazie danych produkcji GreyconMill.
  • przeprowadzanie pomiarów procesowych takich jak: zacisk, ciśnienie, zużycie energii itp. Począwszy od wersji 3.4 wydanej w lipcu 2018 roku, GreyconMill rozpoczął oferowanie narzędzia do analizy danych, które rejestruje i przechowuje takie informacje.

Gromadzenie i przechowywanie wszystkich tych informacji stanowi oczywistą okazję do wykorzystania uczenia maszynowego do poprawy wydajności papierni.

Zdecydowaliśmy się rozpocząć od trudnego problemu, a mianowicie przewidzieć, czy dany zwój zostanie odrzucony z powodów jakościowych. Problem ten jest trudny, ponieważ może być bardzo wiele czynników wpływających na tę decyzję. Jednocześnie maszyna podstawowa jest bardzo rozbudowana, co oznacza, że istnieje ogromna ilość pomiarów, często z opóźnieniem czasowym.

W tej pilotażowej realizacji algorytm uczenia maszynowego GreyconMill może przewidzieć prawdopodobieństwo złej jakości zwoju, w oparciu o nadchodzące sygnały. Gdy prawdopodobieństwo to wykracza poza konfigurowalny próg, GreyconMill powiadomi operatorów o zdarzeniu alarmowym.

uczenie maszyne

Punktem wyjścia każdego ćwiczenia ML jest wyszkolenie algorytmu ML, do czego potrzebne są dwa rodzaje danych:

  • Historyczne zapisy różnych znaczników / sygnałów procesowych. Nazywamy je charakterystyką ML. Obejmują one prędkości, temperatury, zużycie energii, itp. Im więcej, tym lepiej. Jeśli masz już narzędzie do analizy danych, to powinno ono zawierać wiele takich danych - które można następnie wyeksportować do bazy danych GreyconMill's Historian.
  • Historyczne odrzucenia zwojów. Standardowo GreyconMill zawiera te dane.

Gdy dane są już dostępne, szkolenie jest proste. Ty lub profesjonalne usługi Greycon będą korzystać z podzbioru danych (zazwyczaj 70%) do szkolenia algorytmu. Jest to niezwykle szybki proces, trwa około 20 minut, aby wyszkolić algorytm dla jednego roku danych zawierających 200 cech mierzonych z prędkością 1 wartości na sekundę.

Proces szkolenia obejmuje następujące kroki:

1. Uzupełnienie bazy danych Greycon Historian

2. Identyfikacja danych dotyczących jakości zwoju i zapewnienie ML dostępu do nich

3. Eksperymentowanie z różnymi opcjami profili ML w celu szkolenia modeli i oceny ich dokładności

  • Szkolenie obejmuje algorytm wykorzystujący część danych i tworzący model, który będzie przewidywał wyniki, a następnie walidację tego modelu z pozostałymi danymi w celu oceny jego dokładności.
  • Średni trening dla danych z 1 roku, 200 cech z 1 wartością na sekundę trwa ok. 20 minut.
  • Twoje dane wejściowe zostaną wykorzystane do określenia najistotniejszych charakterystyk, w połączeniu z metryką relewancji, jaką zapewniają wyszkolone algorytmy.
  • Różne algorytmy i opcje (np. ramy czasowe) definiują kombinację, profil ML, z najlepszą dokładnością.
  • Po przeszkoleniu algorytmu ML tworzony jest profil GreyconMill. Reszta jest trywialna. Przychodzące sygnały są rejestrowane w czasie rzeczywistym w GreyconMill Historian i algorytm ML, który je monitoruje, wyda alarm, gdy prawdopodobieństwo odrzucenia przekroczy próg. W szczegółach kroki są następujące:

4. Ustawienie Greycon Historian w celu uzyskania wartości charakterystycznych (sygnałów) z integracji procesu. Jest to zawarte w integracji procesu Greycona i może być skonfigurowane z innymi dostawcami.

5. Konfiguracja analizatora danych tak, aby:

a. Zaplanowane zadania okresowo wykorzystywały nowe sygnały do przewidywania wyników

b. Jeśli przewidywania przekroczą próg, uruchomił alarm do GreyconMill

c. Operator GreyconMill mógł reagować na alarm i jednym kliknięciem sprawdził odpowiednie sygnały.

Moduł uczenia maszynowego Greycon wymaga oprogramowania SQL Server 2017 lub nowszego, w tym modułów R i ML. Greycon Historian SQL Server powinien być oddzielony od produkcyjnego serwera bazy danych GreyconMill.

Greycon Historian

Greycon Historian jest lekkim, prostym w użyciu, nowoczesnym analizatorem danych historycznych, który wykorzystuje moc SQL Server. Przechowuje swoje dane, ze względu na wydajność, w oddzielnej bazie danych od reszty aplikacji Greycon. Greycon udostępnia panele oparte na języku HTML, aby zaprezentować dane historyczne - są one widoczne w programie GreyconMill.

Greycon Historian przechwytuje sygnały z automatyzacji procesów w bazie danych SQL Server. Może wykorzystywać moduł integracji procesu Greycon, a.k.a. Middle Tier, aby odbierać sygnały z serwera OPC lub bezpośrednio łączyć się ze sterownikami PLC. Może również uzyskiwać sygnały wyeksponowane w internecie rzeczy, za pośrednictwem żądań interfejsu Web API.

greycon historian

Interfejs użytkownika Greycon Historian jest oparty na Internecie i można uzyskać do niego dostęp za pośrednictwem dowolnej przeglądarki, a także wbudowany w GreyconMill. Użytkownik może skonfigurować widżety wykresów pod kątem określonych charakterystyk (tj. Sygnałów) i grupować je w pulpitach nawigacyjnych. Kiedy moduł uczenia maszynowego przewiduje problem i wywołuje alarm w GreyconMill, operator może uzyskać bezpośredni dostęp do odpowiedniego osadzonego pulpitu nawigacyjnego jednym kliknięciem, aby uzyskać więcej informacji na temat źródła alarmu:

 greycon mill

 

Profil ML to nazwany zestaw opcji definiujących model uczenia się maszyny:

(Profile ML są więc podobne do profili optymalizacyjnych w opt-Studio i X-Trim)
profil ML

Możesz tworzyć i przechowywać dowolną liczbę profili i klonować je w celu oceny różnych wariantów, przechowywania i porównywania wyników szkolenia, aby wybrać jeden z najlepszą dokładnością.

Kluczowymi opcjami w profilu są

- Nazwa: identyfikuje profil i jest stosowany podczas szkolenia i przewidywania.

- Model: Jest algorytmem do wykorzystania.

- Maszyna: Jest to nazwa centrum roboczego GeryconMill.

- Typ: Prognoza jakości przewiduje jakość zwoju.

- Data startu danych treningu: jeśli chcesz użyć tylko najnowszego bitu danych do wyszkolenia algorytmu.

- Stosunek trening / sprawdzanie danych: Oznacza, która część istniejących danych zostanie wykorzystana do szkolenia algorytmu (zazwyczaj 70%), wykorzystując resztę do sprawdzenia poprawności.

- Charakterystyka: Po pierwszym szkoleniu, wszystkie cechy w bazie danych Greycon Historian zostaną wymienione według relewancji. Możesz chcieć wybrać, które z nich będą brane pod uwagę.

- Czas ankietowania i częstotliwość treningu pozwalają na skonfigurowanie automatycznego przekwalifikowania i przewidywania z nowymi przychodzącymi danymi.

- Dokładność i wyniki szkolenia w celu porównania profili, aby wybrać najlepsze opcje.

Struktura bazy danych jest zoptymalizowana pod kątem najwyższej wydajności (nie używamy kompresji danych). Test warunków skrajnych na nowoczesnym sprzęcie wykazał maksymalną szybkość przechwytywania sygnału wynoszącą prawie 2.000 pomiarów na sekundę.

Projekt

Pierwszy projekt maszyny samouczącej się firmy Greycon otrzymał dane od jednego z naszych klientów.

Najpierw otrzymaliśmy kopię z 7-lat zawierającą ponad 300 różnych sygnałów, tj. wartości charakterystycznych, śledzonych przez naszego klienta, w jego własnej bazie. Musieliśmy zidentyfikować definicje cech charakterystycznych, wartości wraz z odpowiadającym im znacznikiem czasu i zaimportować wszystko to do naszej bazy danych Greycon Historian.

Następnie musieliśmy określić, jaki będzie wynik zwoju na podstawie ich danych. Eksperymentowaliśmy z różnymi sposobami definiowania tego wyniku, a ponieważ dane klienta zawierały wartości jakościowe mierzone w laboratorium, z pewnymi definicjami zakresów błędów użyliśmy tych informacji do skonstruowania prostych profili jakości i zdefiniowania złego zwoju, jako każdy zwój o dowolnej wartości jakości poza zakresem błędu.

Kolejną częścią informacji o zwoju jest ustalenie, które wartości charakterystyczne są istotne. Dla uproszczenia, przyjęliśmy tylko istotne wartości mierzone w czasie, gdy rozpoczynano produkcję zwoju. Wiemy, że nie zawsze jest to właściwe, np. w przypadku niektórych cech mierzone wartości mają wpływ tylko na materiał wytworzony w późniejszym procesie. W związku z tym do naszych kolejnych etapów włączymy koncepcję przesunięcia czasowego dla każdej z cech charakterystycznych. Dalszym wyzwaniem było znalezienie daty rozpoczęcia i zakończenia produkowanego zwoju. Krótko mówiąc, w końcu okazało się, że najlepsze wyniki uzyskaliśmy zakładając, że datą początkową w zapisie zwoju była data rozpoczęcia, a zatem datą końcową była data rozpoczęcia następnego zwoju.

Następnie rozpoczęło się eksperymentowanie z różnymi algorytmami ML w celu obserwacji wyników. Wszystkie algorytmy wymagają podzielenia całości danych na dwie części, część na szkolenie, tj. wygenerowanie modelu predykcyjnego, oraz inną część na walidację tego modelu obliczającego jego dokładność. Niektóre algorytmy dokonują podziału automatycznie, inne wymagają od nas dokonania tego podziału. Po kilku eksperymentach, w końcu użyliśmy jednego z typowych podziałów polegających na losowym pobraniu 70% danych do treningu, a pozostałe 30% do walidacji. Dlatego domyślnie nasza konfiguracja profilu zaleca ten wskaźnik.

Próbowaliśmy również spróbować z danymi z całych 7 lat, szkolenie zajęło około 2 godzin, a następnie zastosowaliśmy mniejsze zakresy dat, uzyskując najlepszą dokładność przy użyciu danych z jednego rok i szkolenia w 20 do 30 minut. Następnie, korzystając z charakterystyki istotności obliczonej algorytmami ML, staraliśmy się wykryć cechy, które zapewniłyby lepsze przewidywania szybciej.

W uczeniu maszynowym złe prognozowanie zwoju jest problemem klasyfikacji binarnej. Wypróbowaliśmy trzy algorytmy z wynikami binarnymi (dobrymi lub złymi), ale złapałyby one tylko 0,5% złych zwojów, które stanowiły około 1% z całkowitej liczby 100 000 zwojów, których dane zostały użyte.

Dlatego też przeszliśmy na inne klasyfikatory binarne, tj. takie, które dają prawdopodobieństwo złego zwoju, z prawdopodobieństwem, że prognozy te będą błędne.

Wspólną miarą dokładności dla tych algorytmów jest AUROC lub obszar pod krzywą ROC (Area Under the ROC curve). ROC oznacza charakterystykę działania odbiornika używaną przez inżynierów radarowych w II wojnie światowej. Podczas gdy nazwa krzywej ROC została zachowana, w uczeniu maszynowym i nie ma nic wspólnego z sygnałami radarowymi lub jakimkolwiek odbiornikiem sygnału.

 auroc

 

Krzywa ROC, wykresy Czułość (Sensitivity) - lub prawdopodobieństwo wykrycia - na osi Y i False Positive Rate - lub prawdopodobieństwo fałszywego alarmu - na osi X.

Im bardziej krzywa ROC jest uniesiona i znajduje się dalej od przekątnej, tym większa jest AUROC, a tym samym tym lepszy jest model. W powyższym przykładzie zielona krzywa jest lepsza niż czerwona.

Najlepszy wynik uzyskano dzięki implementacji algorytmu RevoScaler z losowym algorytmem drzew. Algorytm konstruuje rodzinę drzew decyzyjnych w czasie treningu i wyprowadza model oparty na trybie poszczególnych drzew. Losowe lasy decyzyjne korygują nawyki decyzyjne drzew decyzyjnych do ich zestawu treningowego.

W tym modelu uzyskano AUROC na poziomie 0,73; oznacza to 70% wykrywania zwojów o złej jakości przy fałszywym wskaźniku alarmu poniżej 35%. Wypróbowaliśmy również dziesięć innych algorytmów i wariantów (regresja liniowa i logarytmiczna, drzewo decyzyjne, knn, naivne Bayes). Najbliżsi mieli AUROC na poziomie 0,65.

Dalsze eksperymenty obejmowały zróżnicowanie zakresu dat danych szkoleniowych, stwierdzając, że najlepsze wyniki (AUROC=0,73) uzyskano, korzystając z danych począwszy od 2017 r.; w przeciwieństwie do wykorzystania wszystkich dostępnych danych z 2011 r. (AUROC=0,67).

Więcej informacji na temat rozwiązań Greycon dla papierni na stronie https://www.greycon.com/greyconmill/

 

Kategoria: