Ant, das von Jack Ma gegründete chinesische Finanzdienstleistungsunternehmen, sagte, es habe kostengünstige Modelle für künstliche Intelligenz unter Verwendung chinesischer Mikrochips entwickelt. Alle Details
Ant Group, das von Jack Ma gegründete chinesische Finanzdienstleistungsunternehmen, das mit dem Technologieunternehmen Alibaba verbunden ist, sagte, es habe in China hergestellte Mikrochips verwendet, um Methoden zum Trainieren kostengünstiger Modelle für künstliche Intelligenz zu entwickeln.
WAS IST DIE EXPERTENMISCHUNG?
Nach Informationen von Bloomberg verwendete Ant Chips von Alibaba, Huawei und anderen chinesischen Unternehmen, um Modelle mithilfe einer maschinellen Lernmethode namens „Mixture of Experts“ zu trainieren. Einfach erklärt: Diese Art von Architektur unterteilt ein KI-Modell in mehrere separate, spezialisierte Teilnetzwerke (sogenannte „Experten“), um gemeinsam eine Aufgabe auszuführen.
Der Vorteil des „Mixture of Experts“-Ansatzes besteht darin, dass große Modelle die Datenverarbeitungskosten senken können. Der Nachteil besteht darin, dass leistungsstarke Mikrochips erforderlich sind.
ARM SETZT AUF AMD UND CHINESISCHE MIKROCHIPS
Es scheint, dass chinesische Mikrochips es Ant ermöglicht haben, Ergebnisse zu erzielen, die mit denen der H800-Prozessoren von Nvidia , dem dominierenden (amerikanischen) Unternehmen in der Branche, vergleichbar sind. Der H800 ist die „abgeschwächte“ Version des H100, eines der Flaggschiffprodukte von Nvidia, der speziell für den chinesischen Markt entwickelt wurde, da es dort aufgrund der von der US-Regierung verhängten kommerziellen Kontrollen nicht möglich ist, die leistungsstärksten Chips zu verkaufen.
Allerdings setzt Ant weiterhin auf Nvidia-Chips, setzt aber zunehmend auf heimische und solche des US-Herstellers Advanced Micro Devices (AMD). Nach Angaben des Unternehmens – eine unabhängige Überprüfung dieser Aussage gibt es jedoch nicht – schneiden seine Modelle in einigen Bereichen besser ab als Metas Llama.
WAS CHINA ZUR KÜNSTLICHEN INTELLIGENZ TUT
Die Nachrichten verraten zwei Dinge: dass sich chinesische Unternehmen für künstliche Intelligenz insbesondere nach DeepSeek auf betriebliche Effizienz konzentrieren, um die Kosten (Milliarden) für die Modellschulung zu senken und sich (teilweise) von ausländischer Technologie zu emanzipieren; und dass China weiterhin daran arbeitet, importierte Mikrochips durch inländische Alternativen zu ersetzen.
Sollte sich dieser effizienzorientierte Ansatz international durchsetzen und damit die Nachfrage nach immer leistungsfähigeren Prozessoren sinken, könnte das Geschäftsmodell von Nvidia Schaden nehmen. Aus diesem Grund wollte CEO Jensen Huang betonen, dass das Aufkommen effizienterer Modelle der künstlichen Intelligenz auch die Nachfrage nach Rechenleistung erhöhen wird: Folglich werden Unternehmen bessere Mikrochips benötigen, um höhere Gewinne zu erzielen, und nicht billige Mikrochips, um die Kosten niedrig zu halten.
WAS WIRD ANT MIT SEINEN MODELLEN MACHEN?
Ant sagt, dass es etwa 6,3 Millionen Yuan (880.000 US-Dollar) braucht, um eine Billion Token mit fortschrittlichen Prozessoren zu trainieren; Wenn man seiner Methode folgt und leistungsschwächere Hardware verwendet, ist es jedoch möglich, die Kosten auf 5,1 Millionen Yuan zu senken. Mit Token meinen wir die Informationseinheiten, die dem Modell der künstlichen Intelligenz zur Verfügung gestellt werden, damit es „lernt“ und Benutzerfragen beantworten kann.
Das Unternehmen plant, seine Sprachmodelle Ling-Plus und Ling-Lite in Finanzdienstleistungen und Gesundheitsanwendungen einzusetzen. Beispielsweise hat Arm kürzlich die chinesische Plattform Haodf gekauft und einen virtuellen Assistenten entwickelt, der Ärzte bei der Verwaltung von Patientenakten unterstützt. Es verfügt außerdem über eine KI-basierte Lebensassistenten -App namens Zhixiaobao und einen Finanzberatungsdienst namens Maxiaocai.
Die beiden Ling-Modelle sind Open Source . Ling-Lite enthält 16,8 Milliarden Parameter und Ling-Plus 290 Milliarden: Zum Vergleich: DeepSeeks R1 hat 671 Milliarden Parameter und OpenAis Gpt-4.5 hat 1800 Milliarden Parameter. Abgesehen von den unterschiedlichen „Volumen“ scheint es, dass die Modelle von Ant Stabilitätsprobleme haben und dass bereits kleine Änderungen in der Hardware oder Struktur zu Fehlern führen können.
Dies ist eine Übersetzung eines Artikels, der am Mon, 24 Mar 2025 14:18:38 +0000 im italienischen Blog Start Magazine unter der URL https://www.startmag.it/innovazione/ant-microchip-intelligenza-artificiale-cina/ veröffentlicht wurde.