Automatisierte Merkmalsextraktion am Beispiel von Friction-Stir-Spot-Welding (FSSW)

In unserem Blogpost zum Friction-Stir-Spot-Welding sind wir bereits auf den Prozess sowie die technologischen Herausforderungen eingegangen. In diesem Blogpost möchten wir die automatisierte Datenanalyse und Merkmalsextraktion näher betrachten.

Herausforderungen der Datenanalyse

Machine Learning ist dafür prädestiniert, Daten automatisiert zu analysieren und wichtige Merkmale zu extrahieren. Um die relevantesten Merkmale zu erkennen, ist jedoch eine Vielfalt von Daten notwendig. Insbesondere tiefe neuronale Netzwerke profitieren von einer vielfältigen Datenbasis und erzielen beeindruckende Resultate. Bei zu wenig Daten schneiden sie jedoch unterdurchschnittlich ab.
Hierbei kann es hilfreich sein, eine Vorauswahl relevanter Merkmale vorzunehmen, um bessere Ergebnisse zu erzielen. Oftmals ist jedoch nicht bekannt, welche Merkmale relevant sind und welche keinen Einfluss auf die Klassifikationsgüte des Netzwerkes haben. Insbesondere Zeitreihen beinhalten eine Vielzahl von Merkmalen, deren Analyse zeitaufwändig ist und schnell unübersichtlich werden kann.

Automatisierte Merkmalsextraktion

Für die automatische Extraktion von Merkmalen gibt es eine Vielzahl von Toolboxen. Eine, die sich als vielversprechend für die Analyse von Zeitreihen herauskristallisiert hat, ist die Python Toolbox tsFresh[1]. Durch die Anwendung etablierter Algorithmen aus verschiedenen Bereichen kann so ein breites Spektrum an Merkmalen erfasst werden.

Relevanzanalyse von Merkmalen

Eine Vielzahl von Merkmalen ist nicht immer hilfreich, um eine gute Künstliche Intelligenz (KI) zu trainieren. Eine Vorauswahl der besten Merkmale kann daher zu einer Leistungssteigerung der KI führen.
Am Beispiel des FSSW wird das Drehmoment verwendet, um Schweißungen in i.O. und n.i.O. zu klassifizieren. Als Algorithmus bietet sich hierfür ein Random Forest an [2]. Ein Random Forest ist ein effektiver maschineller Lernalgorithmus, der viele Entscheidungsbäume umfasst. Jeder Baum wird auf einer zufälligen Stichprobe der Daten trainiert und lernt anhand der Merkmale, die Daten in i.O. und n.i.O. zu unterteilen.
Nach dem Training kann automatisiert analysiert werden, welche Merkmale für die Entscheidungsfindung relevant sind. In Abbildung 1 sind die Top-5 Merkmale für die Entscheidungsfindung aufgezeigt. Insbesondere die Prozessdauer als auch das maximale Drehmoment haben den größten Einfluss auf die Klassifikation.

Abbildung 1: Relative Wichtigkeit der Merkmale

Durch den zunehmenden Verschleiß des Werkzeuges mit zunehmender Anzahl der Schweißungen, lässt sich diese anhand der Daten bestätigen. In Abbildung 2 werden stichprobenartig Aufzeichnungen dargestellt. Hierbei ist deutlich zu erkennen, dass sowohl die Prozessdauer als auch das maximale Drehmoment kontinuierlich abnehmen.

Abbildung 2: Analyse der Prozessdauer und des Drehmoments

Klassifikation der Scherzugfestigkeit

Durch die zuvor durchgeführte Analyse können die Schweißungen anhand von zwei Merkmalen sowohl in i.O. als auch n.i.O. unterteilt werden. Anhand der vorhandenen Daten konnte so ein Klassifikator trainiert werden, der eine Trennung des 2D-Merkmalsraums vornimmt. Dies ist in Abbildung 3 dargestellt.

Abbildung 3: Untergliederung in i.O und n.l.O. Schweißungen

Zukünftige Schweißungen können dadurch automatisiert analysiert werden.

Beitrag von: M. Sc. Dominik Walther

Quellen

[1]Christ, M., Braun, N., Neuffer, J., and Kempa-Liehr A.W. (2018). Time Series FeatuRe Extraction on basis of Scalable Hypothesis tests (tsfresh — A Python package). Neurocomputing 307, p. 72-77

[2] Breiman, Leo. „Random forests.“ Machine learning 45 (2001): 5-32.

Empfehlungen

KI-basierte Augmentierung hyperspektraler Daten zur Unterstützung der Bauschuttklassifizierung

Verwendung von Hochleistungsrechnen (High-Performance Computing) zur Ausführung großer Vision-Language-Modelle (VLM) für die allgemeine Abfallerkennung

Management Take-Aways und Handlungsempfehlungen des Studienberichtes über das Nutzungs- und Annahmeverhalten von KI- basierten Systemen in der Produktion

KI-basierte Augmentierung hyperspektraler Daten zur Unterstützung der Bauschuttklassifizierung

Verwendung von Hochleistungsrechnen (High-Performance Computing) zur Ausführung großer Vision-Language-Modelle (VLM) für die allgemeine Abfallerkennung

Management Take-Aways und Handlungsempfehlungen des Studienberichtes über das Nutzungs- und Annahmeverhalten von KI- basierten Systemen in der Produktion