Wikipedia definiuje uczenie maszynowe jako naukę interdyscyplinarna ze szczególnym uwzględnieniem takich dziedzin jak informatyka, robotyka i statystyka. Głównym celem jest praktyczne zastosowanie dokonań w dziedzinie sztucznej inteligencji do stworzenia automatycznego systemu potrafiącego doskonalić się przy pomocy zgromadzonego doświadczenia (czyli danych) i nabywania na tej podstawie nowej wiedzy.
GreyconMill, branżowy system realizacji produkcji (MES - manufacturing execution system) firmy Greycon, jest odpowiedzialny za rejestrację produkcji. Jego zadaniem jest:
Gromadzenie i przechowywanie wszystkich tych informacji stanowi oczywistą okazję do wykorzystania uczenia maszynowego do poprawy wydajności papierni.
Zdecydowaliśmy się rozpocząć od trudnego problemu, a mianowicie przewidzieć, czy dany zwój zostanie odrzucony z powodów jakościowych. Problem ten jest trudny, ponieważ może być bardzo wiele czynników wpływających na tę decyzję. Jednocześnie maszyna podstawowa jest bardzo rozbudowana, co oznacza, że istnieje ogromna ilość pomiarów, często z opóźnieniem czasowym.
W tej pilotażowej realizacji algorytm uczenia maszynowego GreyconMill może przewidzieć prawdopodobieństwo złej jakości zwoju, w oparciu o nadchodzące sygnały. Gdy prawdopodobieństwo to wykracza poza konfigurowalny próg, GreyconMill powiadomi operatorów o zdarzeniu alarmowym.
Gdy dane są już dostępne, szkolenie jest proste. Ty lub profesjonalne usługi Greycon będą korzystać z podzbioru danych (zazwyczaj 70%) do szkolenia algorytmu. Jest to niezwykle szybki proces, trwa około 20 minut, aby wyszkolić algorytm dla jednego roku danych zawierających 200 cech mierzonych z prędkością 1 wartości na sekundę.
Proces szkolenia obejmuje następujące kroki:
1. Uzupełnienie bazy danych Greycon Historian
2. Identyfikacja danych dotyczących jakości zwoju i zapewnienie ML dostępu do nich
3. Eksperymentowanie z różnymi opcjami profili ML w celu szkolenia modeli i oceny ich dokładności
4. Ustawienie Greycon Historian w celu uzyskania wartości charakterystycznych (sygnałów) z integracji procesu. Jest to zawarte w integracji procesu Greycona i może być skonfigurowane z innymi dostawcami.
5. Konfiguracja analizatora danych tak, aby:
a. Zaplanowane zadania okresowo wykorzystywały nowe sygnały do przewidywania wyników
b. Jeśli przewidywania przekroczą próg, uruchomił alarm do GreyconMill
c. Operator GreyconMill mógł reagować na alarm i jednym kliknięciem sprawdził odpowiednie sygnały.
Moduł uczenia maszynowego Greycon wymaga oprogramowania SQL Server 2017 lub nowszego, w tym modułów R i ML. Greycon Historian SQL Server powinien być oddzielony od produkcyjnego serwera bazy danych GreyconMill.
Greycon Historian jest lekkim, prostym w użyciu, nowoczesnym analizatorem danych historycznych, który wykorzystuje moc SQL Server. Przechowuje swoje dane, ze względu na wydajność, w oddzielnej bazie danych od reszty aplikacji Greycon. Greycon udostępnia panele oparte na języku HTML, aby zaprezentować dane historyczne - są one widoczne w programie GreyconMill.
Interfejs użytkownika Greycon Historian jest oparty na Internecie i można uzyskać do niego dostęp za pośrednictwem dowolnej przeglądarki, a także wbudowany w GreyconMill. Użytkownik może skonfigurować widżety wykresów pod kątem określonych charakterystyk (tj. Sygnałów) i grupować je w pulpitach nawigacyjnych. Kiedy moduł uczenia maszynowego przewiduje problem i wywołuje alarm w GreyconMill, operator może uzyskać bezpośredni dostęp do odpowiedniego osadzonego pulpitu nawigacyjnego jednym kliknięciem, aby uzyskać więcej informacji na temat źródła alarmu:
Profil ML to nazwany zestaw opcji definiujących model uczenia się maszyny:
(Profile ML są więc podobne do profili optymalizacyjnych w opt-Studio i X-Trim)
Możesz tworzyć i przechowywać dowolną liczbę profili i klonować je w celu oceny różnych wariantów, przechowywania i porównywania wyników szkolenia, aby wybrać jeden z najlepszą dokładnością.
Kluczowymi opcjami w profilu są
- Nazwa: identyfikuje profil i jest stosowany podczas szkolenia i przewidywania.
- Model: Jest algorytmem do wykorzystania.
- Maszyna: Jest to nazwa centrum roboczego GeryconMill.
- Typ: Prognoza jakości przewiduje jakość zwoju.
- Data startu danych treningu: jeśli chcesz użyć tylko najnowszego bitu danych do wyszkolenia algorytmu.
- Stosunek trening / sprawdzanie danych: Oznacza, która część istniejących danych zostanie wykorzystana do szkolenia algorytmu (zazwyczaj 70%), wykorzystując resztę do sprawdzenia poprawności.
- Charakterystyka: Po pierwszym szkoleniu, wszystkie cechy w bazie danych Greycon Historian zostaną wymienione według relewancji. Możesz chcieć wybrać, które z nich będą brane pod uwagę.
- Czas ankietowania i częstotliwość treningu pozwalają na skonfigurowanie automatycznego przekwalifikowania i przewidywania z nowymi przychodzącymi danymi.
- Dokładność i wyniki szkolenia w celu porównania profili, aby wybrać najlepsze opcje.
Struktura bazy danych jest zoptymalizowana pod kątem najwyższej wydajności (nie używamy kompresji danych). Test warunków skrajnych na nowoczesnym sprzęcie wykazał maksymalną szybkość przechwytywania sygnału wynoszącą prawie 2.000 pomiarów na sekundę.
Pierwszy projekt maszyny samouczącej się firmy Greycon otrzymał dane od jednego z naszych klientów.
Najpierw otrzymaliśmy kopię z 7-lat zawierającą ponad 300 różnych sygnałów, tj. wartości charakterystycznych, śledzonych przez naszego klienta, w jego własnej bazie. Musieliśmy zidentyfikować definicje cech charakterystycznych, wartości wraz z odpowiadającym im znacznikiem czasu i zaimportować wszystko to do naszej bazy danych Greycon Historian.
Następnie musieliśmy określić, jaki będzie wynik zwoju na podstawie ich danych. Eksperymentowaliśmy z różnymi sposobami definiowania tego wyniku, a ponieważ dane klienta zawierały wartości jakościowe mierzone w laboratorium, z pewnymi definicjami zakresów błędów użyliśmy tych informacji do skonstruowania prostych profili jakości i zdefiniowania złego zwoju, jako każdy zwój o dowolnej wartości jakości poza zakresem błędu.
Kolejną częścią informacji o zwoju jest ustalenie, które wartości charakterystyczne są istotne. Dla uproszczenia, przyjęliśmy tylko istotne wartości mierzone w czasie, gdy rozpoczynano produkcję zwoju. Wiemy, że nie zawsze jest to właściwe, np. w przypadku niektórych cech mierzone wartości mają wpływ tylko na materiał wytworzony w późniejszym procesie. W związku z tym do naszych kolejnych etapów włączymy koncepcję przesunięcia czasowego dla każdej z cech charakterystycznych. Dalszym wyzwaniem było znalezienie daty rozpoczęcia i zakończenia produkowanego zwoju. Krótko mówiąc, w końcu okazało się, że najlepsze wyniki uzyskaliśmy zakładając, że datą początkową w zapisie zwoju była data rozpoczęcia, a zatem datą końcową była data rozpoczęcia następnego zwoju.
Następnie rozpoczęło się eksperymentowanie z różnymi algorytmami ML w celu obserwacji wyników. Wszystkie algorytmy wymagają podzielenia całości danych na dwie części, część na szkolenie, tj. wygenerowanie modelu predykcyjnego, oraz inną część na walidację tego modelu obliczającego jego dokładność. Niektóre algorytmy dokonują podziału automatycznie, inne wymagają od nas dokonania tego podziału. Po kilku eksperymentach, w końcu użyliśmy jednego z typowych podziałów polegających na losowym pobraniu 70% danych do treningu, a pozostałe 30% do walidacji. Dlatego domyślnie nasza konfiguracja profilu zaleca ten wskaźnik.
Próbowaliśmy również spróbować z danymi z całych 7 lat, szkolenie zajęło około 2 godzin, a następnie zastosowaliśmy mniejsze zakresy dat, uzyskując najlepszą dokładność przy użyciu danych z jednego rok i szkolenia w 20 do 30 minut. Następnie, korzystając z charakterystyki istotności obliczonej algorytmami ML, staraliśmy się wykryć cechy, które zapewniłyby lepsze przewidywania szybciej.
W uczeniu maszynowym złe prognozowanie zwoju jest problemem klasyfikacji binarnej. Wypróbowaliśmy trzy algorytmy z wynikami binarnymi (dobrymi lub złymi), ale złapałyby one tylko 0,5% złych zwojów, które stanowiły około 1% z całkowitej liczby 100 000 zwojów, których dane zostały użyte.
Dlatego też przeszliśmy na inne klasyfikatory binarne, tj. takie, które dają prawdopodobieństwo złego zwoju, z prawdopodobieństwem, że prognozy te będą błędne.
Wspólną miarą dokładności dla tych algorytmów jest AUROC lub obszar pod krzywą ROC (Area Under the ROC curve). ROC oznacza charakterystykę działania odbiornika używaną przez inżynierów radarowych w II wojnie światowej. Podczas gdy nazwa krzywej ROC została zachowana, w uczeniu maszynowym i nie ma nic wspólnego z sygnałami radarowymi lub jakimkolwiek odbiornikiem sygnału.
Krzywa ROC, wykresy Czułość (Sensitivity) - lub prawdopodobieństwo wykrycia - na osi Y i False Positive Rate - lub prawdopodobieństwo fałszywego alarmu - na osi X.
Im bardziej krzywa ROC jest uniesiona i znajduje się dalej od przekątnej, tym większa jest AUROC, a tym samym tym lepszy jest model. W powyższym przykładzie zielona krzywa jest lepsza niż czerwona.
Najlepszy wynik uzyskano dzięki implementacji algorytmu RevoScaler z losowym algorytmem drzew. Algorytm konstruuje rodzinę drzew decyzyjnych w czasie treningu i wyprowadza model oparty na trybie poszczególnych drzew. Losowe lasy decyzyjne korygują nawyki decyzyjne drzew decyzyjnych do ich zestawu treningowego.
W tym modelu uzyskano AUROC na poziomie 0,73; oznacza to 70% wykrywania zwojów o złej jakości przy fałszywym wskaźniku alarmu poniżej 35%. Wypróbowaliśmy również dziesięć innych algorytmów i wariantów (regresja liniowa i logarytmiczna, drzewo decyzyjne, knn, naivne Bayes). Najbliżsi mieli AUROC na poziomie 0,65.
Dalsze eksperymenty obejmowały zróżnicowanie zakresu dat danych szkoleniowych, stwierdzając, że najlepsze wyniki (AUROC=0,73) uzyskano, korzystając z danych począwszy od 2017 r.; w przeciwieństwie do wykorzystania wszystkich dostępnych danych z 2011 r. (AUROC=0,67).
Więcej informacji na temat rozwiązań Greycon dla papierni na stronie https://www.greycon.com/greyconmill/