KI News #39

Hallo und herzlich willkommen zur neununddreißigsten Ausgabe von KI News.

Diesmal geht es um Videos zu Geschichten, einen Vorschlag für neue KI-Regeln vom Weißen Haus, schnellere Matrixmultiplikationen und zu Texten passende Geräusche.

Viel Spaß beim Lesen!

Phenaki erzeugt Videos aus Geschichten

Aktuelle Text-zu-Video-Modelle, wie Make-a-Video, können nur sehr kurze Videos aus einzelnen Sätzen als Beschreibung generieren.

Das Phenaki genannte Modell geht hier einen Schritt weiter: Es kann Videos zu ganzen Geschichten erzeugen, in denen mehrere Sätze eine kurze Handlung beschreiben.

Ein Beispiel, das die Forscher:innen dafür geben, ist diese Geschichte:

"Ein fotorealistischer Teddybär schwimmt im Ozean bei San Francisco. Der Teddybär geht unter Wasser. Der Teddybär schwimmt unter Wasser weiter, mit bunten Fischen. Ein Pandabär schwimmt unter Wasser."

Das daraus entstandene Video zeigt genau das: Ein Teddybär schwimmt im Wasser, taucht dann unter und Fische schwimmen um ihn herum. Am Ende verwandelt er sich in einen Pandabären.

Um das zu erreichen, verwenden die Forscher:innen bei Phenaki mehrere Transformer-Modelle, die zusammen arbeiten. Damit schaffen sie es auch, verschieden lange Videos generieren zu lassen.

Außerdem kann Phenaki neben reinem Text auch ein vorgegebenes Bild als Ausgangspunkt für das zu erzeugende Video nehmen.

Autonomes Fahren, Oktober Update

Seit Anfang Oktober werden neue Tesla Model 3 und Y nicht mehr mit Ultraschall-Sensoren ausgestattet. Tesla will sie durch Daten aus Kameras ersetzen, die von einem neuronalen Netz verarbeitet werden.

Das scheint aber noch nicht bereit zu sein, denn in den Modellen ohne die Sensoren wurden einige Funktionen vorübergehend deaktiviert: 📖 https://www.tesla.com/support/transitioning-tesla-vision

Forscher:innen der Universitäten von Tokio und Kyoto haben untersucht, ob große Augen an autonomen Autos dabei helfen können, Unfälle zu reduzieren. Der Gedanke dabei ist, dass Fußgänger Blickkontakt mit dem Auto aufnehmen können und so wissen, ob sie erkannt wurden oder nicht: 📖 https://t3n.de/news/autonomes-fahren-riesenaugen-schutz-fuer-fussgaenger-1506518/, 📖 https://dl.acm.org/doi/10.1145/3543174.3546841

Hamburg wird erste Test-Stadt für autonome Lkw in Europa. Die Laster sollen dabei in einem vierjährigen Pilotprojekt von der Autobahn bis zum Terminalgelände des Hafens fahren: 📖 https://www.hafen-hamburg.de/de/presse/news/hamburg-wird-erste-test-stadt-fuer-autonome-lkws-in-europa/

Das Insurance Institute for Highway Safety hat Nutzer:innen von Fahrassistenzsystemen befragt, ob sie ihr Auto als vollständig selbstfahrend ansehen, wenn das Assistenzsystem aktiviert ist. 53% (Cadillac Super Cruise), 42% (Tesla Autopilot) und 12% (Nissan ProPilot) haben das mit "Ja" beantwortet: 📖 https://www.iihs.org/news/detail/despite-warnings-many-people-treat-partially-automated-vehicles-as-self-driving

Das Startup ArgoAI muss schließen, nachdem die beiden größten Investoren, Ford und VW, angekündigt haben sich in Zukunft auf andere Projekte konzentrieren zu wollen: 📖 https://www.tagesschau.de/wirtschaft/volkswagen-elektroautos-neue-modelle-101.html, 📖 https://techcrunch.com/2022/10/26/ford-vw-backed-argo-ai-is-shutting-down/

Zusammengefasst

 
Weißes Haus schlägt KI-Regeln vor
In dem Entwurf, der vom Weißen Haus auch "AI Bill of Rights" genannt wird, werden fünf Prinzipien für Entwicklung, Einsatz und Benutzung von KI-Modellen vorgeschlagen:
  1. Man sollte vor unsicheren oder ineffektiven Systemen geschützt werden
  2. KI-Systeme sollten niemanden diskriminieren und auf gerechte Weise gestaltet und benutzt werden
  3. Man sollte vor Datenmissbrauch geschützt werden und mitbestimmen können, wie Daten über einen benutzt werden
  4. Man sollte erfahren, wenn ein automatisiertes System genutzt wird, und wie und warum es zu Ergebnissen, die einen betreffen, beträgt
  5. Man sollte sich, wenn möglich, dagegen entscheiden können, dass ein KI-System benutzt wird, und bei Problemen Hilfe von einer Person bekommen können
 
KI-Modell von Deepmind findet schnellere Algorithmen für Matrixmultiplikationen
Matrixmultiplikationen sind eine der wichtigsten Operationen, die für neuronale Netze benötigt werden. Deshalb ist es entscheidend, dass sie möglichst schnell durchgeführt werden können.
Forscher:innen von Deepmind haben mit AlphaTensor ein Modell entwickelt, das, mithilfe von Reinforcement Learning, eine schnellere Möglichkeit gefunden hat, bestimmte Matrizen zu multiplizieren.
 
Transformer-Modell kann zu einer Text-Beschreibung passende Geräusche erzeugen
Das Modell, das die Forscher:innen AudioGen nennen, kann zum Beispiel zur Beschreibung "Ein Hund bellt, während jemand Trompete spielt, auf einer belebten Straße" eine passende Audio-Ausgabe generieren.
Die Schwierigkeit dabei ist vor allem, die verschiedenen Arten von Geräuschen, die der Text beschreibt, so zu kombinieren, dass das Ergebnis realistisch klingt, auch wenn die Kombination nicht in den Trainingsdaten vorkam.

Außerdem

« VorherigeNächste »

Hier abonnieren und keine Ausgabe mehr verpassen: