Deep Learning für maschinelles Sehen mit MATLAB

Hund oder Katz – das ist die Frage?

Bild: istock.com
Markus Back / Chefredaktor Smart Tech /

Die Identifizierung und Klassifizierung dynamischer Objekte ist eine Herausforderung bei der Bildverarbeitung. Damit sich diese nämlich eindeutig bestimmen und zuordnen lassen, müssen Entwickler zunächst Wesensmerkmale extrahieren und anschliessend in Modelle einlernen. Die Deep-Learning-Algorithmen von MATLAB vermeiden diesen Aufwand.

Zum Fachbeitrag

Sie lesen in einer Zeitschrift und vernehmen plötzlich ein sachtes Geräusch. Bereits ein kurzer Augenaufschlag genügt Ihnen, um zu erkennen, ob da nun Ihr Stubentiger oder aber Bello ins Wohnzimmer tappt. Was für Sie kein Problem darstellt, nämlich Zusammenhänge zu erkennen und daraus die richtigen Erkenntnisse abzuleiten, ist für Maschinen beziehungsweise für die in ihnen verbauten Bildverarbeitungssysteme alles andere als einfach. Damit diese die Gegenstände einwandfrei erkennen und eindeutig klassifizieren können, bedarf es äusserst komplexer Verarbeitungsmechanismen bei der Bildanalyse.

Entwicklungsingenieure im Bereich «Maschinelles Sehen» wissen um den Aufwand, den es braucht, um bestimmte Objekte in Bildern zu erkennen und diese in Kategorien zu identifizieren und zu klassifizieren. Dafür müssen sie zunächst bestimmte Merkmale eines Objekts, wie Punkte oder Bereiche, extrahieren, um anhand dieser ein Modell für das Klassifizieren oder Erlernen von Mustern in Bilddaten zu trainieren. Mit dieser zeitintensiven, manuellen Merkmalauswahl, lassen sich später einzelne Motive in einer oder mehreren Bildverarbeitungsoperationen beurteilen.

Mathworks reduziert nun genau diesen Aufwand mit Deep Learning für maschinelles Sehen. Die Deep-Learning-Algorithmen von MATLAB extrahieren direkt aus Bildern, Texten und Tönen verschiedene Merkmale, Darstellungen und Aufgaben und ersparen damit den Zeitaufwand für die manuelle Merkmalsauswahl. Wie das geht, erklären Avinash Nehemiah und Valerie Leung von Mathworks anhand eines simplen Beispiels, bei dem es darum geht, ohne besondere Vorkenntnisse in Bezug auf Computer-Vision-Algorithmen oder neuronale Netze, in einem Video ein Haustier zu erkennen und dieses korrekt als Katze oder Hund zu benennen.

Zum Beispiel-Code