Luo Fuli ist ein 29-jähriger Forscher, den Internetnutzer und Kollegen in China als „Wunderkind der künstlichen Intelligenz“ bezeichnet haben. Sie ist für ihre zentrale Rolle bei der Entwicklung von DeepSeek-V2 bekannt. Dies ist Chinas erstes Sprachmodell für künstliche Intelligenz (KI), das mit ChatGPT von OpenAI konkurrieren könnte.
Laut der South China Morning Post wurde das Large Language Model (LLM) am 26. Dezember 2024 von DeepSeek gestartet und mit weitaus weniger Ressourcen trainiert als Metas Llama.
In einem Interview mit dem chinesischen Medienunternehmen 36Kr im Mai 2023 sagte DeepSeek-Gründer Liang Wenfeng, dass das Unternehmen bei der Rekrutierung von Talenten Fähigkeiten wichtiger sei als Erfahrung. Lokale Nachrichtenquellen deuten darauf hin, dass das Entwicklerteam des Startups hauptsächlich aus Absolventen und Studenten besteht.
„Unsere technischen Kernfunktionen werden größtenteils von Hochschulabsolventen oder solchen mit ein bis zwei Jahren Berufserfahrung besetzt“, erklärte er.
Diese Strategie hat DeepSeek dabei geholfen, ein Team ehrgeiziger junger Forscher aufzubauen, darunter Gao Huazuo und Zeng Wangding. Den beiden werden wichtige Innovationen in der MLA-Architektur zugeschrieben.
Luo Fuli: Herausfordernde IT hat sich ausgezahlt
Zu den gefragtesten Entwicklern des Unternehmens gehört Luo Fuli. Sie gilt als „intelligente“ und aufrichtige Technologieexpertin mit fundierten Kenntnissen in der Verarbeitung natürlicher Sprache (NLP). Berichten zufolge wuchs Fuli in bescheidenen Verhältnissen auf. Es wird gesagt, dass sein Interesse an Technik möglicherweise von seinem Vater, einem Elektroingenieur, herrührte.
Luos Aufstieg auf dem Gebiet der künstlichen Intelligenz begann am Institut für Computerlinguistik der Universität Peking. Unbestätigten Berichten von Deep Reports und sozialen Medien zufolge war sie zunächst unsicher, was das Studium der Informatik angeht. Fuli scheiterte dabei sogar einige Male.
Doch irgendwann entdeckte sie ihre Leidenschaft für künstliche Intelligenz und machte sich durch bahnbrechende Forschung einen Namen. Darüber hinaus soll Luo bereits während seiner Schulzeit Einladungen und Jobangebote erhalten haben, die er jedoch alle abgelehnt hat.
Im Jahr 2019 erregte er die Aufmerksamkeit des chinesischen Technologiesektors, indem er auf der Konferenz der Association for Computational Linguistics (ACL) acht Artikel zum Thema NLP veröffentlichte.
Ihr Wissen und ihre Beiträge zum NLP haben dazu geführt, dass sie zahlreiche Angebote von großen Technologieunternehmen, insbesondere Alibaba, erhalten hat.
An der DAMO Academy von Alibaba trug Luo zu VECO bei, einem mehrsprachigen Modell für künstliche Intelligenz. Er arbeitete am Open-Source-Projekt AliceMind des Unternehmens und half dem Online-Marktplatz dabei, seine Initiativen zur künstlichen Intelligenz voranzutreiben. Seine Ambitionen gingen jedoch über die Unternehmensforschung hinaus. Zu diesem Zweck übernahm sie 2022 die Rolle der Hauptforscherin bei DeepSeek AI unter der Leitung von Wengfeng.
Luo Fuli und das junge Entwicklerteam von DeepSeek AI
Schon früh war Luo Teil des Teams, das DeepSeek-V2 entwickelte. Es handelt sich um ein großes, kostengünstiges Sprachmodell, das die Einheimischen „AI Pinduoduo“ nennen, in Anlehnung an den chinesischen Online-E-Commerce-Riesen, der für seine erschwinglichen Preise bekannt ist.
Feminismus mit chinesischen Merkmalen.
Das ist Luo Fuli, ein DeepSeek-Wunderkind und Autor von 8 Artikeln über KI!
Er erhielt seinen Master-Abschluss 2020 von der Peking-Universität.
Er arbeitete bei Alibaba, kam 2022 zu DeepSeek, vollbrachte erstaunliche Dinge und wurde nun von Xiaomis KI-Labor „gestohlen“! pic.twitter.com/MCz3ahXKVJ
– SL Kanthan (@Kanthan2030) 29. Januar 2025
In seiner Rede auf einer Technologiekonferenz im Jahr 2023 betonte Luo, dass das Modell erstklassige chinesische Sprachfunktionen bietet. Dies konkurrierte sogar mit den besten globalen KI-Systemen wie ChatGPT und Qwei.
Luo Fuli führte den Erfolg von DeepSeek-V2 auf eine Kombination aus innovativer Architektur, robuster Infrastruktur und dem Engagement des Unternehmens für Transparenz zurück. Während seiner Zeit im Unternehmen teilte DeepSeek seine technischen Berichte, Modellgewichte und Inferenzcodes offen auf GitHub. Ziel war es, seinen Open-Source-Ansatz für die KI-Entwicklung zu aktualisieren.
DeepSeek AI – Open-Source-Technologie auf dem Höhepunkt
Eines der herausragenden Merkmale von DeepSeek-V2 ist die Verwendung der Architektur Multi-Level Attention (MLA) und Mixture of Experts (MoE). MLA ermöglicht es dem Modell, sich auf verschiedene Ebenen von Textinformationen zu konzentrieren, ähnlich wie ein menschlicher Leser ein Buch verarbeitet. Je nach Kontext verlagerte er den Fokus zwischen Sätzen, Absätzen und Kapiteln.
Unterdessen optimiert das MoE die Recheneffizienz, indem es Aufgaben an ausgewählte virtuelle „Experten“ innerhalb des Modells weiterleitet. Durch die Akkumulation wurde der Ressourcenverbrauch reduziert und gleichzeitig die Leistung gesteigert.
Luo Fuli glaubt, dass China mehr KI-Labore braucht. Er besteht darauf, dass sein Land sich auf praktische, groß angelegte Ingenieurprojekte konzentrieren sollte.
Luo Fuli war auch ein starker Befürworter einer Verlagerung hin zu einer Forschung, bei der reale Anwendungen im Vordergrund stehen. Die neue Ausrichtung soll sicherstellen, dass Fortschritte in der künstlichen Intelligenz zu greifbaren Vorteilen für Unternehmen und Verbraucher führen.
Der wachsende Einfluss des 29-jährigen Technologen im Bereich der künstlichen Intelligenz ist nicht unbemerkt geblieben. Nach Angaben des SCMP bot Xiaomis Gründer ihr persönlich ein jährliches Vergütungspaket von 10 Millionen Yuan an, es ist jedoch unklar, ob sie das Angebot angenommen hat.
Cryptopolitan Academy: So schreiben Sie einen Web3-Lebenslauf, der zu Vorstellungsgesprächen führt – KOSTENLOSER Spickzettel