KI im industriellen Einsatz

Chancen und Mythen

Begriffe wie „KI“, „Artificial Intelligence“, „Deep Learning“ beflügeln dieser Tage die Marketingabteilungen. Jedes aktuelle Bügeleisen muss nicht nur smart, sondern auch mit KI ausgestattet sein, damit die glatten Hemden gelingen.

Auch wenn es Thema des aktuellen Zeitgeistes zu sein scheint, stammt das Konzept der „Artificial Intelligence“ bereits aus den 40er Jahren des letzten Jahrhunderts und ist nicht mehr als der Versuch, ein bestimmtes Maschinenverhalten mit Analogien aus der Biologie zu modellieren.

Da ist zum einen die harte KI, bei der die Vision verfolgt wird, das Verhalten von Menschen in Gänze nachzubilden. Dies muss schon deshalb stets eine Vision bleiben, da der Begriff Intelligenz gar nicht klar definierbar ist und dies fällt in den Wissenschaftsbereich der Philosophie.
Anders verhält es sich mit der weichen KI, dem Ansatz nämlich, konkrete Problemräume mit maschineller Entscheidungsfindung zu bearbeiten.
Klassische Algorithmen werden so entworfen, dass Sie dem Rechner unmittelbar Anweisungen geben, wie ein konkreter Lösungsweg gefunden werden kann.

Die KI bedient sich fester Algorithmen, die in der Lage sind, während einer Lernphase durch Anpassung von mathematischen Gewichtungen Entscheidungsbäume zu optimieren.

Neuronale Netze

Im Bereich neuronaler Netze werden hierzu Strukturen definiert, die in abstrahierter Analogie zu dem definiert werden, was in einem biologischen Neuron geschieht. Im Wesentlichen wird in einem Neuron eine Eingabe gesichtet und es wird bei Überschreiten eines definierten Schwellwertes eine Aktivierungsfunktion ausgeführt; das Neuron wird aktiviert.
Neuronen können auf sehr verschiedene Weise miteinander verbunden werden, in einfachen Schichten, oder in einem Stapel von Schichten, was dann als die Art von Netzwerk erscheint, die im aktuellen (deep) Machine Learning verwendet wird.
Schichten können hierbei ausschließlich hintereinander geschaltet sein (feed forward network) oder sie können Rückkopplungen (Gedächtnis) enthalten, was als recurring network definiert ist.
Innerhalb der Netze finden mathematische Operationen (Matrizenrechnung) statt, nicht mehr und nicht weniger.
Die Leistungsfähigkeit dieser Netze besteht darin, dass sie nach einer entsprechend geschickten Modellierung in der Lage sind, Probleme zu lösen, die aufgrund extrem hoher Datenmengen und einer quasi unendlichen Zahl nicht linearer Funktionen algorithmisch nicht oder nur schwer abbildbar wären.
Nachdem ein neuronales Netz trainiert wurde. liefert es an seiner letzten Schicht (output layer) Wahrscheinlichkeiten dafür, dass z.B. ein gegebenes Bild ein bestimmtes Objekt enthält.

Ein Netzwerk, welches zur Unterscheidung von Hunderassen trainiert wurde, wird beispielsweise bei Lassie für die Rasse Langhaarcollie eine Wahrscheinlichkeit von 0,94, für eine französische Bulldogge einen Wert von 0,15 liefern.
In diesem Fall wird man die Rasse mit der höchsten Wahrscheinlichkeit wählen und das Ergebnis Langhaarcollie ausgeben.
Solche Wahrscheinlichkeiten wird das Netz auch dann ausgeben, wenn man ein Bild mit einer Katze einspeist, nur wird diese dann (hoffentlich) wesentlich kleiner. Ein solches Netz ist natürlich nicht in der Lage explizit festzustellen, dass es sich gar nicht um einen Hund sondern um eine Katze handelt, da es hierauf ja nicht trainiert wurde.
Dies gilt auch für Hunde, die aus einer Perspektive abgebildet sind, die nicht in den Trainingsdaten vorkamen. Hunde in anderen Umgebungen werden auch nicht erkannt, wenn in den Trainingsdaten stets der gleiche Bildhintergrund verwendet wurde (overfeeding).

Intelligenz

Intelligenz bezieht sich somit auf den Umstand, dass diese Systeme lernen können, was durch Anwenden von Trainingsdaten und nicht durch explizites Programmieren von Algorithmen geschieht.
Hieraus wird deutlich, dass es für leistungsfähige Netze großer Mengen an Trainingsdaten bedarf, was sich in der Forderung nach einer hohen Rechnerleistung widerspiegelt.
Genau diese Anforderungen sind es, die erst mit dem Aufkommen extrem leistungsstarker Hardware (GPUs, KI-Prozessoren) zu günstigen Preisen auf breiter Front erfüllt werden können und die der KI den Auftrieb bescheren.

Echtzeitverarbeitung von Bilddaten

Dies trifft besonders auch auf die Echtzeitverarbeitung von Bilddaten zu. Für diesen speziellen Fall wurden in den letzten Jahren die sogenannten Convolutional Neural Networks (CNN) entwickelt. Diese Spezielle Netzarchitektur nutzt die Tatsache aus, dass bei einer Erkennung eines Objektes in einem Bild die Nachbarschaft von Bildpunkten eine entscheidende Rolle spielt. Ein Auge wird beispielsweise nur dann erkannt, wenn charakteristische Bildmuster in einer bestimmten Nachbarschaft vorhanden sind.
Zwar sind Gesichtserkennung und Objektklassifizierung die Klassiker unter den Anwendungen; neuronale Netze können jedoch aufgrund des recht generischen Konzeptes überall dort eingesetzt werden, wo Lösungen nicht deterministisch gefunden werden können oder wo dies einen enormen Aufwand bedeuten würde. Ausreichend Menge an Trainingsdaten sind allerdings notwendig.

Deep Bach

Als Beispiel sei hier das Projekt Deep Bach genannt, welches zum Ziel hat, Choräle im Stil von J.S.Bach zu „komponieren“, indem das Netz die Frage beantwortet, welcher Ton am besten (wahrscheinlichsten) in eines der vier Stimmen bei vorgegebener Melodie passt. Bemerkenswert ist hierbei, dass dieser Ansatz ohne eine Codierung der Harmonielehre auskommt. Das Verbot von parallelen Quinten ergibt sich hier daraus, dass in den Trainingsdaten solche Konstrukte schlicht nicht vorkommen und sie deshalb vom Netz auch nicht als wahrscheinlich passend angeboten werden.

Chancen im industriellen Einsatz

Gerade im Kontext der Sensorik ergeben sich durch den Einsatz neuronaler Netze weitreichende Möglichkeiten zur Datenanalyse. Häufig besteht die Aufgabe darin, eingehende teils komplexe Signale auf bestimmte Eigenschaften hin zu untersuchen. Exemplarisch seien hier die Geräusche von Maschinenteilen genannt, die auf Defekte hinweisen können (ratternde Lager).
Solche Signale zu erfassen und evtl. vorzuverarbeiten stellt sich in aller Regel als vergleichsweise einfach dar. Weitaus problematischer ist deren Bewertung. Was ist „normal“ und was ist „rattern“? Ein einfaches Frequenzspektrum würde hier kaum weiterhelfen, denn Lager rappeln ja nicht kontinuierlich sondern eher in einem bestimmten Rhythmus.
Ein erfolgversprechender Ansatz wäre hier, zunächst signifikanten Mengen an Testdaten von „guten“ und „schlechten“ Lagern zu erfassen. Dies können Audiodaten sein, die bezüglich ihrer Dynamik homogenisiert werden, was mittels entsprechender Filter realisierbar ist.
Mit diesen Daten ließe sich dann ein geeignet modelliertes Netzwerk (z.B. Recurrent neuronal network – RNN) trainieren.

Unter der Annahme, dass die Trainingsdaten das Gesamtspektrum aller zu betrachtenden Lager und ihre Schäden beinhalten, wird ein solches Netzwerk brauchbare Wahrscheinlichkeiten für Lagerdefekte liefern. Dank immer mächtig werdender Hardware ist diese Auswertung sogar in Echtzeitanwendung denkbar.

Aktuelle Entwicklungen

Ki-Operationen lassen sich besonders effizient auf spezieller Hardware ausführen, die parallele Berechnungen gleichartiger Operationen erlaubt.
Zunehmend werden deshalb spezielle Prozessoren entwickelt, die für dedizierte Einsatzzwecke optimiert sind. Neben Prozessoren für Steckkarten für den Einsatz in Servern sind auch solche erhältlich, die sich an mobile Anwendungen richten und sowohl vom Energiebedarf, als auch von ihrer Größe und Komplexität her in den Anwendungskontext klassischer Microcontroller hineinragen.

Im Bereich der Bildverarbeitung und der Signalanalyse haben derartige Prozessoren durchaus das Potenzial, klassische DSPs in Teilbereichen zu ersetzen oder zumindest zu ergänzen, wobei dies natürlich völlig andere Konzepte erfordert.

Als Beispiel sei hier das SOC Kendryte K210 genannt, der bereits für wenige Euro erhältlich ist und neben einem Dual-Core RISCV Prozessor eine separate KI-Einheit beherbergt. Gerade für lokale Einsatzorte wie Maschinen oder Systeme ohne Internet bzw. Cloudanbindung eröffnen solche Komponenten die Möglichkeit, kostengünstig KI-Strategien einzusetzen.

Basierend auf diesem SOC sind diverse Module am Markt verfügbar. Der M5StickV integriert neben dem K210 SOC

Akku nebst Ladevorrichtung
VGA-Kamera
Lautsprecher
LCD-Farbdisplay
Beschleunigungs- und Lagesensor
USB-Interface zur Programmierung
Drei Taster

telos beschäftigt sich seit geraumer Zeit mit KI-Anwendungen und den aktuellen Entwicklungen. In mehreren Projekten haben wir bereits erfolgreich KI-Ansätze realisiert. Häufig besteht die Schwierigkeit in der Beurteilung, ob sich ein konkretes Problem mittels KI oder klassischer Algorithmen am effizientesten und kostengünstigsten lösen lässt und gemeinsam mit Ihnen beantworten wir gern diese Frage.
Nehmen Sie bitte Kontakt mit uns auf.