Chinesische KI-Start-up Deepseek hat einen neuen Weg eingeführt, um die Argumentationsfunktionen von Großsprachmodellen (LLMs) zu verbessern, um allgemeine Abfragen bessere und schnellere Ergebnisse zu liefern als seine Konkurrenten.

Deepseek löste im Januar einen Wahnsinn aus, als es mit R1, einem KI -Modell für künstliche Intelligenz (KI) und Chatbot, von dem das Unternehmen behauptete, billiger und genauso gut wie Openais Rivale Chatgpt -Modell auftrat.

Zusammenarbeit mit Forschern der Chinas Tsinghua University, Deepseek In seiner neuesten Arbeit, die am Freitag veröffentlicht wurde, habe es eine Technik für selbstverbesserte KI-Modelle entwickelt.

Die zugrunde liegende Technologie wird als selbstgeprägte Kritikstimmung (SPCT) bezeichnet, die KI zur Entwicklung eigener Regeln für die Beurteilung von Inhalten ausbildet und diese Regeln anschließt, um detaillierte Kritik zu liefern.

Es wird bessere Ergebnisse erzielt, indem mehrere Bewertungen gleichzeitig ausgeführt werden, anstatt größere Modelle zu verwenden.

Dieser Ansatz wird als generative Belohnungsmodellierung (GRM) bezeichnet, ein maschinelles Lernsystem, das überprüft und bewertet, was KI -Modelle produzieren, und sicherzustellen, dass sie mit den Menschen mit SPCT übereinstimmen.

Wie funktioniert es?

Normalerweise erfordert die Verbesserung der KI die Modelle während des Trainings größer, was viel menschliche Anstrengung und Rechenleistung erfordert. Stattdessen, Deepseek hat ein System mit einem integrierten „Richter“ erstellt, das die Antworten der KI in Echtzeit bewertet.

Wenn Sie eine Frage stellen, vergleicht dieser Richter die geplante Antwort der KI mit beiden Regeln der KI und wie eine gute Antwort aussehen sollte.

Wenn es ein enger Spiel gibt, erhält die KI ein positives Feedback, was dazu beiträgt, sich zu verbessern.

Deepseek nennt dieses selbstverbesserte System „Deepseek-Grm“. Die Forscher sagten, dies würde Modellen helfen, besser abzuschneiden als Konkurrenten wie Googles Gemini, das Lama von Meta und das GPT-4O von Openai.

Deepseek plant, diese fortschrittlichen KI-Modelle als Open-Source-Software verfügbar zu machen, es wurde jedoch keine Zeitleiste gegeben.

Die Veröffentlichung der Zeitung erfolgt, als Gerüchte wirken, dass Deepseek seinen neuesten R2 -Chatbot vorstellen wird. Das Unternehmen hat jedoch keine solche neue Veröffentlichung öffentlich kommentiert.

Share.
Exit mobile version