Meta veröffentlicht LLaMA 2 als Open-Source und konkurriert mit OpenAI’s GPT-4
Meta hat die Open-Source-Veröffentlichung seines großen Sprachmodells LLaMA 2 angekündigt, das nun kostenlos für kommerzielle und Forschungszwecke zur Verfügung steht. Mit diesem Schritt tritt Meta in direkte Konkurrenz zu OpenAI’s GPT-4, das Tools wie ChatGPT und Microsoft Bing antreibt. Die Ankündigung wurde im Rahmen von Microsofts Inspire-Event gemacht und unterstreicht die wachsende Partnerschaft zwischen den beiden Technologiegiganten.
Open-Source-Veröffentlichung von LLaMA 2
Im Gegensatz zu GPT-4 und Googles PaLM 2, die geschlossene Modelle sind, ist LLaMA 2 Open-Source. Meta hat sich für die Open-Source-Veröffentlichung von LLaMA 2 entschieden, um Unternehmen, Startups und Forschern Zugang zu mehr KI-Tools zu ermöglichen und eine gemeinschaftsbasierte Experimentierkultur zu fördern. LLaMA 2 wurde mit 40 Prozent mehr Daten im Vergleich zu seinem Vorgänger LLaMA 1 trainiert, und Meta behauptet, dass es andere große Sprachmodelle wie Falcon und MPT in Tests zu logischem Denken, Programmieren, Sprachkompetenz und Wissen übertrifft.
Partnerschaft zwischen Meta und Microsoft
Die Partnerschaft zwischen Meta und Microsoft hat zur Integration von LLaMA 2 in die Azure-Plattform von Microsoft geführt. Das Unternehmen kündigte auch eine Zusammenarbeit mit Qualcomm an, um LLaMA ab 2024 auf Laptops, Handys und Headsets zu bringen, für KI-gesteuerte Apps, die ohne Cloud-Dienste auskommen.
Leistungsvergleich von LLaMA 2 und ChatGPT
In Bezug auf die Leistung hat LLaMA 2 vielversprechende Ergebnisse gezeigt. Obwohl es in Datensätzen, die Allgemeinwissen, Grundschulmathematik oder Programmierfähigkeiten messen, nicht so hoch abschnitt wie GPT-4, übertraf es ChatGPT in einer Studie, die menschliche Bewertungen verwendete. In dieser Studie bewerteten Menschen 4.000 Aufforderungen auf „Hilfreichkeit“ im Vergleich zu verschiedenen Modellen, und LLaMA 2 schlug ChatGPT, indem es 35,9 Prozent „Siege“ gegenüber ChatGPT’s 32,5 Prozent erzielte.
Sicherheit und Transparenz
Metas Entscheidung, LLaMA 2 als Open-Source zu veröffentlichen, ist auch ein Schritt zur Verbesserung von Sicherheit und Transparenz. Das LLaMA 2-Modell wurde „red-teamed“, also auf Sicherheit getestet, indem „adversarielle Aufforderungen zur Feinabstimmung des Modells erzeugt wurden“, sowohl intern als auch extern. Meta legt auch offen, wie die Modelle bewertet und angepasst werden.
Zugänglichkeit von LLaMA 2
Das Open-Source-Modell LLaMA 2 ist frei zugänglich über Hugging Face, Amazon Web Services und Microsoft Azure, was bedeutet, dass Entwickler Zugang zu seinem Code und seinen Daten haben, was ihnen ermöglicht, das Modell zu verbessern und darauf aufzubauen. LLaMA 2 hat drei verschiedene vortrainierte Modellgrößen: 7 Milliarden, 13 Milliarden und 70 Milliarden Parameter, auf die alle zugegriffen werden kann.
Ausblick
Mit der Open-Source-Veröffentlichung von LLaMA 2 werden wir sicherlich neue KI-gesteuerte Tools sehen, die auf dem Modell aufbauen. Meta sagt, dass es über 100.000 Anfragen von Forschern erhalten hat, um sein erstes Modell zu nutzen, aber das Open-Source-Modell LLaMA 2 wird wahrscheinlich eine viel größere Reichweite haben.