Rechner lernt anhand des Verhaltens menschlicher Fahrer, aber wohl auch durch Versuch und Irrtum
Wenn Computer mittels Künstlicher Intelligenz (KI) selbst gute Spieler in Schach und Go sowie in Video-Strategiespielen schlagen, dann kann es doch nicht so schwer sein, ihnen das Autofahren beizubringen, oder? Ein Artikel der englischsprachigen Technologie-Website Medium erklärt nun, wie die Tesla-Fahrzeuge das autonome Fahren lernen.
Zwei Methoden kämen zum Einsatz. Bei supervised imitation learning (beaufsichtigtes Imitationslernen) untersucht die KI eine Vielzahl von richtig gelösten Aufgaben und lernt daraus, wie sie selbst diese Aufgaben lösen kann. Präsentiert man einer KI eine Million Fotos von Katzen, dann kann sie lernen, woran man eine Katze erkennt. Die zweite Technik, reinforcement learning (bestärkendes Lernen), ist ein Versuch-und-Irrtum-Verfahren: Die KI führt eine zufällige Aktion aus, beobachtet die Wirkung und lernt, zu welchen Folgen das führt. Im Straßenverkehr könnte zufälliges Agieren schnell zu Unfällen führen. Werden jedoch beide Verfahren kombiniert -- zuerst das Imitationslernen und dann das bestärkende Lernen -- ergibt sich jedoch angeblich eine erfolgversprechende Methode.
Alle Tesla-Fahrzeuge, die nach dem Oktober 2016 produziert wurden, besitzen bereits die Autopilot-Hardware, die ab 2020 das vollständig autonome Fahren ermöglichen soll. Bevor es so weit ist, sammeln diese Tesla-Fahrzeuge Daten über ihre Kameras und andere Sensoren. Die Entscheidungen des menschlichen Fahrers werden dabei als richtige Problemlösungen angesehen, anhand derer der Rechner das Fahren erlernen kann (Imitationslernen). Derzeit sind rund 400.000 Autos mit dieser Autopilot-Hardware unterwegs, täglich spulen sie rund 20 Millionen Kilometer ab. Laut Medium hat auch die Google-Schwesterfirma Waymo das überwachte Imitationslernen mit Daten von rund 120.000 Kilometern erfolgreich getestet.
Aber auch das bestärkende Lernen wurde schon erfolgreich eingesetzt. So ließ das israelische Unternehmen Mobileye ein per bestärkendem Lernen geschultes autonomes Fahrzeug durch den chaotischen Verkehr Jerusalems kurven. Und OpenAI, das KI-Unternehmen von Elon Musk, konnte dank bestärkendem Lernen in einem Videospiel namens Dota 2 ein Team menschlicher Spieler schlagen.
Offiziell bestätigt hat Tesla bisher nur den Einsatz des Imitationslernens, nicht die Verwendung des bestärkenden Lernens. Angesichts der großen Datenmengen, die Tesla zur Verfügung stehen, und wegen der Erfolge, die mit bestärkenden Lernen erzielt wurden, ist es jedoch wahrscheinlich, dass Tesla beide Techniken kombiniert. Und in einem kürzlich ausgeschriebenen Praktikumsplatz suchte Tesla nach Kandidaten mit Fachkenntnissen im Bereich bestärkendes Lernen ...