KI News #14

Hallo und herzlich willkommen zur vierzehnten Ausgabe von KI News. In dieser Ausgabe zeige ich wie Google Maps die Fahrtzeit berechnet, wie KIs laufen lernen können und wie Bilder im Internet durch maschinelles Lernen besser laden. Viel Spaß beim Lesen!

Wie Google Maps deine Fahrtzeit berechnet

Wir alle haben wahrscheinlich schon die Navi-Funktion von Google Maps benutzt, um herauszufinden, wie lange eine Fahrt dauert. Aber wie berechnet eigentlich Google, wie lange man für eine bestimmte Strecke braucht?

Forscher:innen, unter anderem von Google, haben dafür ein verbessertes System entwickelt und jetzt veröffentlicht wie es funktioniert.

Die Schwierigkeit dabei ist, dass sich während der Fahrt die Verkehrsbedingungen ändern können. Zum Beispiel, wenn man während einer längeren Fahrt in den Berufsverkehr kommt.

Daher muss die Fahrtzeitberechnung nicht nur die aktuelle Situation betrachten, sondern auch, wie der Verkehr sich während der Fahrt ändert. Es müssen quasi die Verkehrsbedingungen in der Zukunft vorausgesagt werden.

Dazu kommt, dass die Fahrtzeit auch durch Verkehr auf Straßen, die nicht direkt auf der Route liegen, beeinflusst werden kann, weil z.B. Ampeln anders geschalten werden.

Google Maps hat dazu die meistbefahrenen Straßen weltweit in Segmente von 50-100 Meter Länge eingeteilt, und diese wiederum zu „Supersegmenten“ von 1-2 Kilometern Länge zusammengefasst.

So entstanden insgesamt ca. 1 Million Supersegmente, die das Straßennetz darstellen.

Für die Berechnung der Fahrtzeit werden die Supersegmente als Graph betrachtet. Jedes Segment ist dabei ein Knoten auf dem Graph, aufeinanderfolgende Segmente sind im Graph durch Kanten verbunden.

Die Fahrtzeit kann dann in dieser Graph-Darstellung von einem Graph Neural Network (ein spezielles neuronales Netz für Graphen) berechnet werden.

Als Eingabe für das neuronale Netz werden, außer dem Straßen-Graph, Echtzeitdaten des Verkehrs der letzten halben Stunde und historische Daten der letzten 4 Monate benutzt. Das sind zum Beispiel die aktuelle Uhrzeit, der Wochentag, Fahrzeit pro Segment, Größe der Segmente und die Straßenarten.

Dieses System wird aktuell in Google Maps eingesetzt und konnte die Anzahl der Fahrtzeitvorhersagen, die deutlich von der tatsächlichen Zeit abweichen, z.B. in Berlin um 21% reduzieren.

Link zum Paper: https://arxiv.org/abs/2108.11482 (englisch)

Wie eine KI laufen lernt

Eine Methode des maschinellen Lernens, bei der KIs selbstständig herausfinden, was sie in einer bestimmten Situation am besten tun sollten, ist Reinforcement Learning (auf Deutsch: Bestärkendes Lernen). Dabei probiert die KI am Anfang zufällige Aktionen aus und erhält eine Belohnung, wenn eine Aktion erfolgreich war. So lernt sie, welche Aktionen erfolgversprechend sind, und kann ihr Verhalten daran anpassen.

Ein sehr bekanntes Beispiel für die Anwendung von Reinforcement Learning ist AlphaGo, die KI, die 2016 gegen den Go-Profispieler Lee Sedol gewonnen hat.

Reinforcement Learning eignet sich vor allem für Bereiche, in denen man eine Situation simulieren kann (zum Beispiel eine Anordnung von Steinen auf einem Go-Brett), aber die optimale Strategie nicht einfach beschrieben werden kann, z.B. weil das Spiel bzw. die Umgebung zu komplex ist.

Außerdem ist es wichtig, dass die zufälligen Aktionen am Anfang zu einer Belohnung für die KI führen können. Sonst würde sie nie über diesem zufälligen Zustand hinaus kommen.

Das ist zum Beispiel ein Problem beim Laufen lernen. Die verschiedenen Bewegungen, die von unterschiedlichen Körperteilen gleichzeitig gemacht werden müssen, um bei einem Schritt nicht umzufallen, sind relativ komplex.

Daher passiert es nur sehr selten, dass eine untrainierte KI es zufällig schafft einen Schritt zu machen. Deshalb ist es sehr schwierig für eine KI, laufen zu lernen.

Ein Team von Intel hat sich einen neuen Ansatz überlegt und die Aufgabe aufgeteilt: ein Modell sollte lernen das Gleichgewicht zu halten, eins sollte den Fuß heben und so weiter. Dadurch, dass es kleinere Aufgaben sind, führen sie schneller zum Erfolg und sind für eine KI deutlich leichter zu lernen.

Die Forscher:innen haben sich außerdem überlegt, dass alle KIs bei ihren jeweiligen kleinen Bewegungen zuerst die selben physikalischen Gesetze lernen müssen. Um das zu beschleunigen, haben sie die Modelle über einen gemeinsamen Speicher verbunden, in dem sie ihre „Erfahrungen“ austauschen können.

Um die einzelnen Bewegungen zu einem sinnvollen Ganzen zusammenzusetzen, haben sie dann ein Optimierungsverfahren namens „Evolutionärer Algorithmus“ benutzt. Dabei werden verschiedene Zusammensetzungen getestet, bewertet und aus den am besten abschneidenden wieder neue Kombinationen gebildet.

Damit haben sie es dann schließlich geschafft, einer KI das Laufen beizubringen.

Artikel, der den Ansatz beschreibt: https://spectrum.ieee.org/reinforcement-learning (englisch)
Link zum Paper: https://arxiv.org/abs/1905.00976 (englisch)

KI optimiert Bilder fürs Internet

Wahrscheinlich hat jede:r von uns schon einmal erlebt, wie nervig es bei einer schlechten Internetverbindung sein kann, zu warten, bis die Bilder auf einer Webseite endlich geladen sind.

Dabei haben wir, meistens unbewusst, die verschiedenen Möglichkeiten gesehen, wie Bilder im Internet geladen werden:

Es gibt die, die plötzlich auftauchen, wenn sie fertig geladen sind, und die ganze Webseite verschieben.

Die zweite Art baut sich langsam von oben nach unten auf, so dass man den Daten beim Ankommen zuschauen kann.

Und die dritte Art zeigt fast von Anfang an ein Bild, das aber zuerst unscharf ist und erst mit den nach und nach übertragenen Daten schärfer wird.

Das neue Bildformat JPEG XL, das gerade entwickelt wird, bietet viele Verbesserungen gegenüber dem heute üblicherweise benutzten JPEG. Dazu gehört, neben geringerem Speicherbedarf und Unterstützung für Transparenz, auch die Möglichkeit, einen interessanten neuen Ansatz beim Laden zu benutzen.

Beim Erstellen oder Konvertieren eines Fotos kann man ein ML-Modell benutzen, das vorhersagt, wohin Menschen als erstes schauen, wenn sie das Bild sehen.

Die Daten des Bilds werden dann so zusammengesetzt, dass diese Bereiche zuerst geladen und scharf dargestellt werden.

Dadurch wirken Bilder auch bei langsamer Verbindung schon früher viel schärfer als bei normalen JPEG Fotos. Wie groß dieser Unterschied wirklich ist, zeigt ein Blogpost, den zwei Forscher von Google verfasst haben.

Blogpost von Google: https://opensource.googleblog.com/2021/09/using-saliency-in-progressive-jpeg-xl-images.html (englisch)
Link zur JPEG XL Webseite: https://jpeg.org/jpegxl/ (englisch)
JPEG XL Referenzimplentierung: https://github.com/libjxl/libjxl (C++)

Außerdem

ZDF Magazin Royale Ausgabe zu KI: Youtube Video
Ein neues Modell der Roomba Saugroboter kann jetzt Hundehaufen erkennen und ihnen ausweichen:
- Artikel bei The Verge
- Artikel bei t3n
Nachdem er seine Stimme durch Krebs verloren hat, hat eine KI-Firma dem Schauspieler Val Kilmer seine alte Stimme zurückgegeben
- Artikel bei der Washington Post
- Youtube Video
Tipps, falls man bei einer Bewerbung auf eine KI trifft: Artikel bei der Wirtschaftswoche
Eine Facebook-KI hat ein Video mit schwarzen Männern als „Video über Primaten“ beschriftet: Artikel bei der New York Times
Kurz nach der Veröffentlichung von Github Copilot wurde ein Beispiel bekannt, in dem das Programm eine Funktion aus dem Quellcode eines Spiels 1:1 kopiert ausgab. Das war ein perfektes Beispiel für die Probleme des Tools, deswegen hat Github Änderungen gemacht, damit das nicht mehr vorkommt: Sie haben den Namen einer Funktion auf die „Schimpfwortliste“ gesetzt:
- Tweet des Entdeckers
- Artikel bei The Register

« Vorherige Nächste »