Nachtrag: Modelling and Simulation using MATLAB(R) – MOOC

Mittlerweile läuft der MOOC „Modelling and Simulationusing MATLAB®“ seit ein paar Wochen. Ein erstes Zwischenfazit: Große Klasse!

Diese Woche ist das erste „freiwillige“ (der ganze Kurs ist ja freiwillig;)  Kapitel freigeschaltet worden, dass sich besonders stark mit authentischen Anwendungen auseinandersetzt. Es heißt „Machine Learning in a Nutshell“ und befasst sich mit maschinellem Lernen. Dabei geht es darum, dass Menschen Algorithmen entwickeln, sodass das Informatiksystem „intelligent“ wird und in einem gewissen Sinne eigenständig „lernen“ kann. Es müssen dann nicht mehr umgebungsabhängige Konstanten und Schwellwerte definiert werden, weil das System in der Lage ist, diese selbstständig zu bestimmen. Typische Anwendungen sind sehr breit gefächert und finden sich bei Googles PageRank-Algorithmus, der Objekterkennung (->Computer Vision) oder der Wettervorhersage.

Vier Anwendungsszenarien, Quelle: [1]
Vier Anwendungsszenarien, Quelle: [1]

Anwendungen und Methoden

Im MOOC werden vier verschiedene Anwendungsszenarien aktiv bearbeitet:

Das Unternehmen „RackWheelie“ hat in den letzten Jahren enorme Absätze zu verzeichnen und plant die Erweiterung zusätzlicher Produktionsstätten, um Transportkosten einzusparen. Hier ist Mathematik und Informatik gefragt, denn es geht darum, möglichst optimale Orte für diese Stätten zu finden. TeilnehmerInnen des MOOCs lernen, wie diese Aufgabe mit Hilfe der k-means-Cluster-Analyse zu lösen ist. Dieser Algorithmus berechnet eine Folge von Standorten, die „immer besser“ werden. Dies geschieht so lange, bis man mit dem Ergebnis zufrieden ist (oder ein Restfehler tolerierbar ist). Dennoch können hier Fehler auftreten, da die gefundenen Extrempunkte nur lokal sind – die Konvergenz kann abhängig von den Startwerten sein.

animation
Animation des Algorithmus k-means-Clustering
animation
Lösung für k=2, Algorithmus findet das Optimum nach wenigen Iterationen

Ein weiteres schönes Beispiel ist die Klassifikation anhand des Unternehmens „WoodenBoards“, das Hölzer herstellt. Da es sich um ein Naturprodukt handelt, weisen die Bretter Unterschiedlichkeiten in Farbintensität und Regularität auf. Es gibt einige Testwerte von korrekten Hölzern (Klasse 1) und Ausschussware (Klasse -1).

Das Problem der Klassifikation ist nun, anhand dieser Testwerte zukünftig für jedes mögliche Brett mit möglichen Ausprägungen aus dem Raum  [-4;6]x[-4;6] eine solche Klassifikation vornehmen zu können. Fällt ein solches Brett in den blauen Bereich, ist es in Ordnung. Liegt es im gelben Bereich, wird es aussortiert.

Währen der Lösung dieser Aufgabe lernen Teilnehmer, dass man häufig Freiheitsgerade bei der Wahl verschiedener Parameter hat. Im Bild unten erkennt man verschiedene Fenstergrößen (h) der Nadaraya-Watson-Klassfikation, einer Abwandlung eines Kerndichteschätzers. Die Idee ist, verschiedene Werte systematisch zu testen (Stichwort: Cross Validation), dabei die Zahl der korrekt und falsch klassifizierten Stichproben zu zählen. Das Optimum für h ist dann schnell gefunden, dieses wird hier aber nicht verraten, da die Bestimmung Teil der Hausaufgabe ist. P.S.: Die Korrektur dieser erledigen die Teilnehmer des MOOCs selbst:

Peer-Evaluierung

Einreichung: Vervollständige die Prüfung, indem du deine Antworten einreichst. Peer-Evaluierung: Du wirst eine E-Mail erhalten, die dich benachrichtigt, sobald die Peer-Evaluierung offen ist und du die Antworten der anderen Kursteilnehmer bewerten kannst. Um deine Ergebnisse zu erhalten, musst du selbst an der Peer-Evaluierung teilnehmen.
Ergebnisse: Sobald diese verfügbar sind, wirst du eine E-Mail erhalten. Wenn du mit deinen Ergebnissen unzufrieden bist, kannst du eine Beschwerde einreichen. Wenn der Dozent den Eindruck hat, dass deine Beschwerde fundiert ist, werden deine Antworten erneut bewertet.

Fühlen Sie sich eingeladen, dem MOOC beizutreten und die Aufgabe zu lösen 🙂

animation_h
Cross Validation über die Nadaraya-Watson-Klassifikation

[1]: MOOC Modelling and Simulation using MATLAB (R) – at Iversity 

[2]: Introduction to Machine Learning (Smola/Vishwanathan)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.