KI News #48

Hallo und herzlich willkommen zur achtundvierzigsten Ausgabe von KI News. In dieser Ausgabe geht es um Metas LLaMA Sprachmodell, OpenAIs Sicht auf die KI-Entwicklung der Zukunft, ein Update zum autonomen Fahren und ich habe versucht die vielen KI-Ankündigungen der letzten Wochen zusammenzufassen.

Viel Spaß beim Lesen!

Inhalt

Metas Sprachmodell LLaMA und was andere damit gemacht haben
Andere KI-Ankündigungen
Autonomes Fahren, Mai Update
Zusammengefasst
- Neues zu Bildgenerierung und Deepfakes
- Die Sicht von OpenAI auf die zukünftige KI-Entwicklung
Außerdem

Metas Sprachmodell LLaMA und was andere damit gemacht haben

LLaMA ist eine Familie von Sprachmodellen, die von Meta AI entwickelt wurde. Die LLaMA-Modelle haben zwischen 7 und 65 Milliarden Parameter.

Beim Training der LLaMA-Modelle haben die Forscher:innen noch mehr Daten verwendet als üblich und konnten dadurch die Leistung der Modelle verbessern.

So soll zum Beispiel das LLaMA-Modell mit 13 Milliarden Parametern in den meisten Tests besser sein als GPT-3, das 175 Milliarden Parameter hat, und das LLaMA-Modell mit 65 Milliarden Parametern soll ähnlich gut sein wie das PaLM-Modell von Google mit 540 Milliarden Parametern.

Als Trainingsdaten haben die Forscher:innen 4,7 TB an öffentlich verfügbaren Texten aus dem Internet und Büchern verwendet.

Das Training für das größte Modell hat auf 2048 Grafikkarten (Nvidia A100 80GB) 21 Tage gedauert, die gesamte Entwicklung ungefähr 5 Monate. Den CO₂ Ausstoß dafür schätzen die Forscher:innen auf ca. 1.000t. Das entspricht laut Umweltbundesamt dem Treibhausgasausstoß von knapp 100 Deutschen in einem Jahr.

Meta stellt die LLaMA Modelle interessierten Forscher:innen auf Antrag zur Verfügung. Dadurch haben sich einige Projekte entwickelt, die auf LLaMA basieren.

Dazu gehört zum Beispiel Alpaca von der Stanford Universität. Alpaca basiert auf LLaMA-7B, dem kleinsten der LLaMA Modelle, und wurde von den Stanford-Forscher:innen weitertrainiert, um Anweisungen folgen zu können, ähnlich wie ChatGPT.

Auf HuggingFace gibt es jetzt HuggingChat, ein ChatGPT-ähnlicher Chatbot, der auf dem LLaMA-30B Modell basiert.

LLaMA Ankündigung: https://ai.facebook.com/research/publications/llama-open-and-efficient-foundation-language-models/
LLaMA auf Github (mit Link zum Antragsformular): https://github.com/facebookresearch/llama
Ankündigung von Alpaca: https://crfm.stanford.edu/2023/03/13/alpaca.html
HuggingChat Webseite: https://huggingface.co/chat/

Andere KI-Ankündigungen

HuggingFace ist Partnerschaften mit AWS und IBM eingegangen, wodurch die auf HuggingFace veröffentlichten Modelle auf diesen Cloudplattformen einfacher zu benutzen sein sollen:
- AWS Ankündigung: 📖 huggingface.co
- IBM Ankündigung: 📖 ibm.com
Microsoft setzt seine KI-Offensive fort und hat gleich mehrere Ankündigungen gemacht:
- Microsoft 365 Copilot: ein KI-Assistent für die Microsoft 365 Anwendungen (Word, Excel, Powerpoint, Outlook, Teams): 📖 microsoft.com
- Bing Chat ist jetzt für alle verfügbar: 📖 theverge.com
- ChatGPT um Roboter zu steuern: 📖 microsoft.com
- Generative KI für Cyber Security: 📖 techcrunch.com
- Der LinkedIn AI Assistant bekommt mehr Fähigkeiten: 📖 techcrunch.com
Google hat bei der Hausmesse I/O auch einige Neuigkeiten präsentiert:
- Zusammenschnitt des Google CEOs, wie er "AI" sagt: 📖 twitter.com
- Wie KI in die Google Suche integriert wird: 📖 theverge.com
- Duet AI: KI-Tools für Google Docs und GMail: 📖 theverge.com
- Studio Bot: ein Chatbot für die Android Studio Entwicklungsumgebung, der App-Entwickler:innen helfen soll: 📖 theverge.com
- KI-Integration in Android: 📖 theverge.com
  - Magic Compose: ein Feature in der Android Nachrichten-App (Nachrichten im Sinne von SMS, nicht Journalismus), das automatische Antworten vorschlagen soll, die sich an den bisherigen Antworten orientieren.
  - KI-generierte Hintergrundbilder für Pixel-Smartphones
- PaLM 2, ein neues Sprachmodell, auf das ich in der nächsten Ausgabe noch genauer eingehen will: 📖 ai.google
- Google Bard ist jetzt für alle verfügbar: 📖 techcrunch.com, 📖 bard.google.com
Auch auf der IBM Hausmesse Think gab es Neues:
- watsonx, eine Plattform für die Entwicklung und Verwaltung von KI-Modellen und Daten: 📖 ibm.com
- Watson Code Assistant, ein Programmierassistent ähnlich wie Github Copilot, den Kunden an die eigenen Anforderungen anpassen können sollen: 📖 ibm.com
Daneben hat IBM auch mit der Ankündigung für Schlagzeilen gesorgt, über 7.000 Stellen in der Verwaltung nicht mehr neu zu besetzen, sondern die Aufgaben in Zukunft von KI erledigen zu lassen: 📖 tagesschau.de
Meta will eine neue Organisation im Unternehmen einführen, die auf generative KI fokussiert sein soll: 📖 facebook.com
Otto will KI-gesteuerte Roboter in Logistikzentren einsetzen und ist dafür eine Partnerschaft mit dem 2017 gegründeten kalifornischen Unternehmen Covariant eingegangen: 📖 ottogroup.com
Snapchat hat eine angepasste Version von ChatGPT mit dem Namen My AI in die App integriert (für zahlende Abonennten): 📖 theverge.com
Blender, eine Software für 3D Modellierung, hat jetzt ein Addon von StabilityAI bekommen, mit dem man das Stable Diffusion Modell direkt in Blender benutzen kann: 📖 stability.ai
und schließlich hat auch Elon Musk mal wieder was gemacht:
- eine neues KI-Unternehmen namens X.AI gegründet (📖 theverge.com) und dafür unter anderem Ingenieure von Deepmind eingestellt (📖 techcrunch.com), nur zwei Wochen bevor er einen offenen Brief unterzeichnet hat, der zum Stopp von KI-Experimenten aufruft
- angekündigt an etwas zu arbeiten, das er "TruthGPT" nennt, das "eine maximal wahrheitssuchende KI" sein soll, "die versucht, die Natur des Universums zu verstehen", was auch immer das bedeuten soll: 📖 theverge.com

Autonomes Fahren, Mai Update

Ford hat eine neue Tochterfirma namens Latitude AI gegründet, die an einem fortschrittlichen Assistenzsystem arbeiten soll.
(Fast?) alle der Mitarbeiter von Latitude AI kommen von Argo AI. Argo wurde hauptsächlich von Ford und VW finanziert und hat an Technologie für autonomes Fahren gearbeitet, bevor es vor einigen Monaten geschlossen wurde: 📖 ford.com
Wired hat einen Artikel veröffentlicht, der verschiedene Vorfälle und Probleme beschreibt, die selbstfahrende Autos bei Bussen und Straßenbahnen in San Francisco verursacht haben: 📖 wired.com. Eines davon war möglicherweise dieser Auffahrunfall eines Autos von Cruise auf einen Bus, wegen dem Cruise 300 Autos für Softwareupdates zurückruft: 📖 cbsnews.com
Waymo beschreibt in einer Veröffentlichung ihren Ansatz was Sicherheit bei selbstfahrenden Autos angeht: 📖 waymo.com und verdoppelt das Einsatzgebiet der autonomen Taxis in Phoenix: 📖 waymo.com
Tesla-Aktionäre verklagen unterdessen Elon Musk und zwei Finanzchefs von Tesla (den ehemaligen und den aktuellen), wegen angeblich beschönigender Aussagen zu Fähigkeiten und Sicherheit des Tesla "Autopilot" Assistenzsystems: 📖 tagesschau.de
Die Washington Post beschreibt in einem Artikel die Probleme bei der Entwicklung von Teslas sogenanntem "Full Self Driving" System: 📖 washingtonpost.com

Zusammengefasst

Neues zu Bildgenerierung und Deepfakes

Das US Special Operations Command will Deepfakes für Desinformationskampagnen benutzen: 📖 Dokument auf documentcloud.org, S.16
Ein Künstler, der Portraitfotos auf Instagram veröffentlicht hat, hat zugegeben, dass es sich nicht um Fotos handelt, sondern die Bilder KI-generiert sind: 📖 artnet.com
Ein KI-generiertes Bild hat einen Preis bei den Sony World Photography Awards gewonnen: 📖 artnet.com
Jemand hat Bilder von allen amerikanischen Präsidenten mit Vokuhila-Frisuren generieren lassen und auf Twitter gepostet: 📖 twitter.com
Ein anderer Twitter-Nutzer hat dem Papst eine coole Jacke verpasst: 📖 twitter.com

Die Sicht von OpenAI auf die zukünftige KI-Entwicklung
OpenAI hat zwei Blogposts veröffentlicht, die den Standpunkt des Unternehmens zur zukünftigen (Weiter-) Entwicklung von KI darstellen sollen.

Der erste hat den Titel "Wie sollten sich KI Systeme verhalten und wer sollte entscheiden?".
Darin beschreiben sie, dass ChatGPT in der "normalen" Variante möglichst neutral sein sollte, aber Nutzer:innen sollen es so anpassen können, dass es auch extreme Standpunkte vertreten kann.

Außerdem wollen sie sicherstellen, dass der Zugang zu und der Einfluss auf KI möglichst weit verbreitet sind und es keine unangemessene Machtkonzentration gibt. Deshalb wollen sie in Zukunft anfangen, auch andere Leute nach ihrer Meinung zu fragen.
Wie das helfen soll, Zugang und Einfluss zu sichern, oder die aktuelle Machtkonzentration verringern soll, bleibt dabei leider genauso ihr Geheimnis wie die Funktionsweise ihrer KI-Modelle.

Der zweite Blogpost steht unter der Überschrift "Planung für starke KI und darüber hinaus". "Starke KI" (im Englischen "Artificial General Intelligence", AGI) wird dabei definiert als "KI Systeme, die im Allgemeinen intelligenter sind als Menschen".

Die, meiner Meinung nach, wichtigsten Punkte des Blogeintrags sind:

mehr KI ist besser für die Menschen (zugegeben, das ist eine wenig überraschende Aussage von einer KI Firma)
wenn sich die Fähigkeiten von KI weiterentwickeln, müssen sich gleichzeitig auch die Sicherheitsmechanismen weiterentwickeln
externe Gremien oder Behörden sollten in Zukunft mitentscheiden dürfen, ob ein Modell trainiert oder veröffentlicht werden kann
die Chancen, aber auch die Risiken, von starker KI sind potentiell unbegrenzt

Wie sollten sich KI Systeme verhalten? openai.com
Planung für Starke KI: openai.com

Außerdem

Betrug mit KI-generierten Stimmen nimmt zu: 📖 9to5mac.com
Interview mit dem CEO von HuggingFace: 📖 eladgil.com
Ein Überblick über die meisten Transformer-Modelle: 📖 arxiv.org
Ein Leitfaden, wie man als Nutzer:in Anweisungen für Sprachmodelle schreibt: 📖 promptingguide.ai
Eine Liste der 200 meistzitierten KI Paper aus dem Jahr 2022: 📖 zeta-alpha.com
Die Vanderbilt University entschuldigt sich, nachdem sie ChatGPT benutzt hat, um, nach einem Amoklauf an einer anderen Universität, eine Rundmail an die Studierenden zu schreiben: 📖 cnn.com
OpenAI hat ein Online-Tool veröffentlicht, das zeigt, was ein Tokenizer macht: 📖 openai.com

« Vorherige Nächste »