KI News #36

Hallo und herzlich willkommen zur sechsunddreißigsten Ausgabe von KI News. In dieser Ausgabe mit einer KI für Minecraft, wie man Deepfakes in Videoanrufen erkennt, wofür die FIFA bei der WM 2022 KI einsetzen will und mehr.

Viel Spaß beim Lesen!

Minecraft-KI von OpenAI

OpenAI hat eine KI für das Spiel Minecraft entwickelt. Dazu haben sie zwei neuronale Netze trainiert, wobei das erste nur dazu dient, die Trainingsdaten für das zweite vorzubereiten.

im ersten Schritt haben die Forscher:innen Leute 2.000 Stunden lang Minecraft spielen lassen und dabei sowohl ihren Bildschirm als auch die Maus- und Tastatur-Eingaben aufgezeichnet.

Mit den so gesammelten Daten haben sie ein neuronales Netz darauf trainiert, aus mehreren aufgezeichneten Bildern die Eingaben der Spieler:innen vorherzusagen.

Das so entstandene Modell haben sie dann benutzt, um weitere 70.000 Stunden Minecraft-Videos aus dem Internet mit den passenden Maus- und Tastatur-Daten zu versehen.

Auf diesem großen Datensatz haben sie dann ein weiteres Modell trainiert, das die Eingaben der Spieler:innen nur aus den vorhergehenden Bildern vorhersagen soll.

Dieses Modell kann also aus dem, was auf dem Bildschirm zu sehen ist, ableiten, was es als nächstes tun muss - und somit Minecraft spielen.

Die Forscher:innen nennen diese Version das "Foundation Modell". Es kann im Spiel relativ einfache Dinge tun, wie zum Beispiel Bäume zu fällen um Stämme zu gewinnen, aus diesen Stämmen Bretter machen und die Bretter wiederum zu einem Tisch zusammen bauen.

Um die Fähigkeiten des Foundation Modells zu verbessern, haben sie nochmal Trainingsdaten in Form von Video-Material und den dazu gehörigen Eingaben gesammelt. Nachdem sie das Modell auch noch damit trainiert hatten, wurde es nochmal besser und konnte zum Beispiel auch Werkzeuge aus Stein herstellen.

DeepMind KI lernt wie ein Baby

Neuronale Netze können erstaunliche Dinge, aber versagen auch immer wieder auf erstaunliche Weise, weil sie kein Verständnis dafür haben, wie die Welt funktioniert. Ihnen fehlt das "Allgemeinwissen" und das, was man als "gesunden Menschenverstand" bezeichnet.

Als einen ersten Schritt in Richtung "Verständnis wie die Welt funktioniert" haben Forscher:innen von Deepmind ein Modell entwickelt, das einfache physikalische Grundlagen gelernt hat.

Dabei haben sie sich als Vorbild genommen, wie Babys physikalische Interaktionen zwischen Objekten verstehen.

Ihr Ansatz beruht auf Erkenntnissen aus der Entwicklungspsychologie. Erstens, dass das intuitive Physikverständnis auf einer Reihe von unabhängigen Konzepten basiert, z.B. Objektpermanenz und Kontinuität; und zweitens, dass Menschen aus diesen Konzepten eine Vorstellung davon bilden, was als nächstes passieren wird.

Die Forscher:innen haben mithilfe von Videos von einfachen Objekten, wie Bällen und Würfeln, ein Modell trainiert. Das Modell kann ebenfalls vorhersagen was mit diesen Objekten als nächstes passieren wird, zum Beispiel, wenn sie zusammenstoßen.

Zusätzlich kann man auch herausfinden, ob das Modell "überrascht" ist, wenn im Video etwas unerwartetes oder unmögliches passiert, indem man den Unterschied zwischen Vorhersage und Video misst.

Zusammengefasst

KI bei der Fußball WM 2022

Die FIFA will ein KI-System bei der umstrittenen Weltmeisterschaft in Katar einsetzen. Dieses basiert auf zwölf Tracking-Kameras im Stadion. Aus den Daten dieser Kameras werden für jeden Spieler auf dem Feld fünzig mal pro Sekunde die Position und 29 weitere Datenpunkte berechnet, zum Beispiel die Positionen der Körperteile, die für Abseitsentscheidungen relevant sind.

Außerdem enthält der Ball einen Trägheitssensor, der 500 mal pro Sekunde Daten übermittelt, mit denen sich seine Position präzise berechnen lässt.

Das System kann so erkennen, wo der Ball gespielt wurde und wo die Spieler zu diesem Zeitpunkt waren und so Abseitssituationen automatisch erkennen.

Aus den Daten wird dann eine 3D-Animation erstellt, so dass die Zuschauer die Entscheidung nachvollziehen können.


So erkennt man Deepfakes in Videoanrufen
Forscher:innen der Universität von Kalifornien, Berkeley und der NSA haben ein System entwickelt, mit dem sich Deepfakes in Videoanrufen erkennen lassen.
Dazu nutzen sie die Tatsache aus, dass vom Gesicht des/der Gesprächspartner:in das Licht des Bildschirms reflektiert wird. Dadurch erscheint es heller oder dunkler, je nachdem was der Bildschirm anzeigt.
Wenn man den/die andere:n bittet, eine bestimmte Animation abzuspielen, kann man die erwartete Helligkeitsänderung mit der tatsächlichen vergleichen. Da die Beleuchtung durch den Bildschirm bei Deepfakes üblicherweise nicht berücksichtigt wird, kann man die Fakes so erkennen.

Ein Blogeintrag von Metaphysic.ai beschreibt sogar noch eine einfachere Methode: um aktuelle Deepfake-Software zu verwirren, reicht es scheinbar, den/die Anrufer:in zu bitten, den Kopf um 90° zur Seite zu drehen.

AlphaFold veröffentlicht alle Proteinstrukturen
AlphaFold ist ein Modell von Deepmind, das aus einer Aminosäurensequenz die Struktur eines Proteins vorhersagen kann. Es wurde letztes Jahr von Deepmind als open-source Software veröffentlicht, zusammen mit Daten zu 350.000 Proteinstrukturen, die in der AlphaFold Datenbank gespeichert sind. Seitdem haben die Forscher:innen weitere Einträge zur Datenbank hinzugefügt, so dass es zuletzt rund eine Million waren.
Jetzt haben sie die Datenbank auf über 200 Millionen Proteinstrukturen erweitert, was fast alle bekannten Proteine umfasst.
 
BLOOM: Das größte mehrsprachige open-source Sprachmodell
Über tausend Forscher:innen aus siebzig Ländern haben zusammen das bisher größte open-source Sprachmodell veröffentlicht, das mehrere Sprachen unterstützt. Sie nennen es BLOOM, was für "BigScience Large Open-science Open-access Multilingual Language Model" steht.
BLOOM hat 176 Milliarden Parameter und kann damit 46 menschliche sowie 13 Programmiersprachen verarbeiten.
Der finale Trainingslauf für das Modell dauerte auf dem französischen Jean Zay Supercomputer ganze 117 Tage, was durch eine Förderung im geschätzten Wert von drei Millionen Euro ermöglicht wurde.

Außerdem

« VorherigeNächste »

Hier abonnieren und keine Ausgabe mehr verpassen: