Diesmal geht es um Videos zu Geschichten, einen Vorschlag für neue KI-Regeln vom Weißen Haus, schnellere Matrixmultiplikationen und zu Texten passende Geräusche.
Viel Spaß beim Lesen!
Aktuelle Text-zu-Video-Modelle, wie Make-a-Video, können nur sehr kurze Videos aus einzelnen Sätzen als Beschreibung generieren.
Das Phenaki genannte Modell geht hier einen Schritt weiter: Es kann Videos zu ganzen Geschichten erzeugen, in denen mehrere Sätze eine kurze Handlung beschreiben.
Ein Beispiel, das die Forscher:innen dafür geben, ist diese Geschichte:
"Ein fotorealistischer Teddybär schwimmt im Ozean bei San Francisco. Der Teddybär geht unter Wasser. Der Teddybär schwimmt unter Wasser weiter, mit bunten Fischen. Ein Pandabär schwimmt unter Wasser."
Das daraus entstandene Video zeigt genau das: Ein Teddybär schwimmt im Wasser, taucht dann unter und Fische schwimmen um ihn herum. Am Ende verwandelt er sich in einen Pandabären.
Um das zu erreichen, verwenden die Forscher:innen bei Phenaki mehrere Transformer-Modelle, die zusammen arbeiten. Damit schaffen sie es auch, verschieden lange Videos generieren zu lassen.
Außerdem kann Phenaki neben reinem Text auch ein vorgegebenes Bild als Ausgangspunkt für das zu erzeugende Video nehmen.
Seit Anfang Oktober werden neue Tesla Model 3 und Y nicht mehr mit Ultraschall-Sensoren ausgestattet. Tesla will sie durch Daten aus Kameras ersetzen, die von einem neuronalen Netz verarbeitet werden.
Das scheint aber noch nicht bereit zu sein, denn in den Modellen ohne die Sensoren wurden einige Funktionen vorübergehend deaktiviert: 📖 https://www.tesla.com/support/transitioning-tesla-vision
Forscher:innen der Universitäten von Tokio und Kyoto haben untersucht, ob große Augen an autonomen Autos dabei helfen können, Unfälle zu reduzieren. Der Gedanke dabei ist, dass Fußgänger Blickkontakt mit dem Auto aufnehmen können und so wissen, ob sie erkannt wurden oder nicht: 📖 https://t3n.de/news/autonomes-fahren-riesenaugen-schutz-fuer-fussgaenger-1506518/, 📖 https://dl.acm.org/doi/10.1145/3543174.3546841
Hamburg wird erste Test-Stadt für autonome Lkw in Europa. Die Laster sollen dabei in einem vierjährigen Pilotprojekt von der Autobahn bis zum Terminalgelände des Hafens fahren: 📖 https://www.hafen-hamburg.de/de/presse/news/hamburg-wird-erste-test-stadt-fuer-autonome-lkws-in-europa/
Das Insurance Institute for Highway Safety hat Nutzer:innen von Fahrassistenzsystemen befragt, ob sie ihr Auto als vollständig selbstfahrend ansehen, wenn das Assistenzsystem aktiviert ist. 53% (Cadillac Super Cruise), 42% (Tesla Autopilot) und 12% (Nissan ProPilot) haben das mit "Ja" beantwortet: 📖 https://www.iihs.org/news/detail/despite-warnings-many-people-treat-partially-automated-vehicles-as-self-driving
Das Startup ArgoAI muss schließen, nachdem die beiden größten Investoren, Ford und VW, angekündigt haben sich in Zukunft auf andere Projekte konzentrieren zu wollen: 📖 https://www.tagesschau.de/wirtschaft/volkswagen-elektroautos-neue-modelle-101.html, 📖 https://techcrunch.com/2022/10/26/ford-vw-backed-argo-ai-is-shutting-down/