Callista AI Weekly (16.-21. März 2026)

Das war NVIDIAs Woche. Die GTC 2026 dominierte den Nachrichtenzyklus mit neuen Chips, einer neuen Rack-Architektur und einer offenen Plattform für KI-Agenten, die am ersten Tag 17 grosse Enterprise-Partner an Bord holte. Doch die eigentliche Geschichte der Woche geht über ein einzelnes Unternehmen hinaus. Vom ersten nationalen KI-Gesetzgebungsrahmen des Weissen Hauses bis hin zu Xiaomis heimlicher Platzierung eines Billionen-Parameter-Modells auf öffentlichen Leaderboards unter falschem Namen - das Tempo des Wandels in der KI beschleunigte sich an allen Fronten.

Neue KI-Anwendungsfälle

Die wichtigste Enterprise-Deployment-Meldung der Woche kam von NVIDIA selbst. Auf der GTC 2026 in San Jose (16.-19. März) stellte Jensen Huang NemoClaw vor, eine unternehmenstaugliche Sicherheits- und Datenschutzschicht, die auf dem viralen Open-Source-Agenten-Framework OpenClaw aufbaut. Siebzehn grosse Softwareunternehmen schlossen sich als Launchpartner an, darunter Adobe, Atlassian, Box, Cisco, CrowdStrike, Dassault Systèmes, Red Hat, SAP, Salesforce, Siemens, ServiceNow und Synopsys. NemoClaws OpenShell-Runtime erzwingt Sandboxing, Least-Privilege-Zugriffskontrollen und richtlinienbasierte Datenschutz-Guardrails - und verwandelt damit ein äusserst populäres, aber sicherheitstechnisch problematisches Open-Source-Projekt in etwas, das Unternehmen tatsächlich einsetzen können.

Alibaba trat am 17. März mit dem Launch von Wukong in das Rennen um agentenbasierte KI ein. Wukong ist eine Enterprise-KI-Agentenplattform, die es Unternehmen ermöglicht, mehrere Agenten über eine einzige Oberfläche zu verwalten. Die Plattform übernimmt Aufgaben wie Dokumentenbearbeitung, Genehmigungen, Meeting-Transkription und Recherche. Sie ist als eigenständige Desktop-App und als eingebetteter Agent in DingTalk verfügbar, Alibabas Kollaborationsplattform mit über 20 Millionen Unternehmensnutzern. Integrationen mit Slack, Microsoft Teams und WeChat sind geplant. Alibaba will Wukong mit Taobao, Tmall, 1688, Alipay und Alibaba Cloud als modulare Agenten-Skills verbinden und positioniert es damit als Drehscheibe für alles von E-Commerce-Storefront-Design bis hin zur Cloud-Infrastruktur-Orchestrierung.

Microsoft nutzte die Sicherheitskonferenz RSAC 2026 (ab 19. März), um Zero Trust for AI anzukündigen - eine Erweiterung der Zero-Trust-Sicherheitsarchitektur auf den gesamten KI-Lebenszyklus. Das umfasst eine neue Referenzarchitektur, aktualisierte Bewertungstools und praktische Muster zur Absicherung von KI im grossen Massstab. Ausserdem bestätigte das Unternehmen, dass Agent 365, seine zentrale Steuerungsebene zur Überwachung, Governance und Sicherung von Agenten in Organisationen, am 1. Mai allgemein verfügbar wird.

In einem separaten Schritt lancierte Microsoft am 19. März MAI-Image-2, sein neues Text-zu-Bild-Modell. Das Modell debütierte auf Platz drei der Arena.ai-Rangliste, hinter Googles Gemini 3.1 Flash und OpenAIs GPT Image 1.5. MAI-Image-2 wird über Copilot und Bing Image Creator ausgerollt, API-Zugang steht ausgewählten Kunden wie WPP zur Verfügung. Das Modell setzt auf fotorealistische Ergebnisse mit natürlicher Beleuchtung und präzisen Hauttönen, unterstützt derzeit aber nur quadratische Ausgaben und setzt eine 30-Sekunden-Pause zwischen den Generierungen durch.

Marvell Technology und Lumentum Holdings demonstrierten auf der OFC 2026 diese Woche eine Technologie für optisches Circuit-Switching, die autonome KI-Agenten im grossen Massstab durch verbesserte Netzwerkperformance in Rechenzentren unterstützen soll.

Grosse Vendor-Updates

NVIDIAs GTC-Offensive

Die GTC 2026 war das Hauptereignis der Woche. Huangs zweistündige Keynote am 16. März deckte mehr ab als die meisten Tech-Konferenzen in drei Tagen schaffen.

Die Schlagzeilen-Hardwareankündigung war die Vera Rubin-Plattform, NVIDIAs KI-Infrastruktur der nächsten Generation. Sie vereint sieben Chips: die Vera CPU, Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 Ethernet Switch und die neu integrierte Groq 3 LPU. NVIDIA beansprucht für die Plattform bis zu 10-fach mehr Inferenz-Durchsatz pro Watt und ein Zehntel der Kosten pro Token im Vergleich zur Blackwell-Generation.

Die Groq 3 Language Processing Unit ist NVIDIAs erster Chip aus der Groq-Übernahme, einem 20-Milliarden-Dollar-Deal vom Heiligabend 2025. Der LP30-Chip wird von Samsung im 4nm-Verfahren gefertigt und soll im dritten Quartal 2026 ausgeliefert werden. Er trägt 512 MB On-Chip-SRAM pro Die mit 150 TB/s Speicherbandbreite. Ein vollständiges LPX-Rack beherbergt 256 LPUs. In der Vera-Rubin-Architektur übernehmen die Rubin-GPUs die rechenintensive Prefill-Phase von Anfragen, während die Groq-LPUs die Decode-Phase für die latenzarme Token-Generierung übernehmen.

Huang zeigte auch einen Prototyp von Kyber, der nächsten Generation von NVIDIAs Server-Rack-Design. Es integriert 144 GPUs, die vertikal statt horizontal angeordnet sind, was die Dichte erhöht und die Latenz reduziert. Das kabelfreie Design soll die Installationszeit erheblich verkürzen. Kyber kommt mit Vera Rubin Ultra, geplant für 2027.

Auf der Consumer-Seite kündigte NVIDIA DLSS 5 an, das diesen Herbst für die RTX-50-Serie erscheint. Anders als frühere DLSS-Versionen, die auf Upscaling und Frame-Generierung fokussierten, ist DLSS 5 eine KI-gestützte Beleuchtungsschicht, die fotorealistisches Licht, Schatten und Materialverhalten in Spielszenen einfügt.

Huang prognostizierte, dass die Bestellungen zwischen Blackwell und Vera Rubin bis 2027 ein Volumen von 1 Billion Dollar erreichen werden - mehr als frühere Schätzungen.

OpenAIs Super-App-Pläne

OpenAI baut eine Desktop-Anwendung, die ChatGPT, Codex und ChatGPT Atlas (seinen KI-gestützten Webbrowser) in einem einzigen Produkt vereint. Bloomberg berichtete am 20. März, dass Fidji Simo, CEO für Anwendungen, das Projekt gemeinsam mit Präsident Greg Brockman leiten wird. Die bestehende eigenständige ChatGPT-App soll neben dem neuen Produkt weiterbestehen. Ein Starttermin wurde noch nicht genannt.

Separat machte OpenAI GPT-5.4 mini über die "Thinking"-Funktion für kostenlose Nutzer und Go-Nutzer verfügbar und entfernte damit die Bezahlschranke für sein neuestes kleineres Modell.

Googles Gemini-Vorstoss auf dem Mac

Google begann diese Woche mit dem privaten Testen einer dedizierten Gemini-App für Mac, wie Bloomberg am 19. März berichtete. Die App, intern unter dem Codenamen Janus geführt, kann das Web durchsuchen, hochgeladene Dokumente analysieren und den Gesprächsverlauf beibehalten. Tester generieren Bilder, Videos, Musik, Tabellen und Diagramme. Eine Funktion namens Desktop Intelligence ermöglicht es Gemini, Kontext aus anderen aktiven Mac-Apps wie dem Kalender zu ziehen, um personalisiertere Antworten zu geben. Ein Veröffentlichungsdatum wurde nicht bekanntgegeben.

Xiaomis Stealth-Launch

Xiaomi gelang einer der ungewöhnlichsten Modell-Launches der jüngeren Vergangenheit. Am 18. März erschien ein Modell namens Hunter Alpha auf OpenRouter ohne Entwicklerzuordnung. Die Spezifikationen waren aussergewöhnlich: über 1 Billion Parameter insgesamt, 42 Milliarden davon bei der Inferenz aktiv, ein Kontextfenster von 1 Million Token und eine auf Agenten ausgerichtete Architektur. Es führte die Tages-Charts an und verarbeitete über 1 Billion Token, bevor jemand herausfand, dass es sich um MiMo-V2-Pro handelte - entwickelt von Xiaomis KI-Abteilung unter dem ehemaligen DeepSeek-Forscher Luo Fuli. Xiaomi bot Entwicklern eine Woche kostenlosen Zugang über Agenten-Frameworks wie OpenClaw, Cline und Blackbox.

Anthropic Institute

Anthropic lancierte Anfang März formell das Anthropic Institute, einen Forschungszweig unter der Leitung von Mitgründer Jack Clark, der sich mit den wirtschaftlichen, gesellschaftlichen und sicherheitsrelevanten Auswirkungen von KI befasst. Das Institut vereint drei bestehende Forschungsteams - das Frontier Red Team, Societal Impacts und Economic Research - und hat Experten wie Matt Botvinick von Google DeepMind, Zoe Hitzig von OpenAI und den Wirtschaftsprofessor Anton Korinek eingestellt. Anthropic baut ausserdem sein Public-Policy-Team aus und eröffnet ein Büro in Washington, D.C.

KI-Governance

Das KI-Framework des Weissen Hauses

Die grösste Governance-Meldung der Woche kam am 20. März. Die Trump-Administration veröffentlichte ihr National Policy Framework for Artificial Intelligence, einen sechsteiligen Gesetzgebungsentwurf für den Kongress. Das Framework umfasst den Schutz von Kindern und die Stärkung von Eltern, den Schutz amerikanischer Gemeinschaften, die Wahrung von Rechten des geistigen Eigentums, die Verhinderung von Zensur und den Schutz der Meinungsfreiheit, die Förderung von Innovation und Sicherung der amerikanischen KI-Dominanz sowie die Ausbildung von Amerikanern für eine KI-bereite Arbeitswelt.

Der folgenreichste Vorschlag des Frameworks ist die bundesstaatliche Vorrangigkeit (Federal Preemption) gegenüber einzelstaatlichen KI-Gesetzen. Die Administration will, dass der Kongress einen einheitlichen Bundesansatz etabliert, statt das zuzulassen, was sie einen "Flickenteppich" einzelstaatlicher Regulierungen nennt. Dies folgt auf Trumps Executive Order vom Dezember 2025, die die Durchsetzbarkeit einzelstaatlicher KI-Gesetze in Frage stellt. Die Administration drängte den Kongress, "dieses Jahr" zu handeln, obwohl Bloomberg darauf hinwies, dass der Weg durch den Kongress selbst mit republikanischer Kontrolle schwierig wird.

Aktivitäten auf Ebene der Bundesstaaten

Während das Weisse Haus auf Federal Preemption drängte, legten die Bundesstaaten weiter nach. Washington State verabschiedete fünf KI-Gesetze vor der Vertagung am 12. März: HB 1170 (Offenlegungspflichten für KI), HB 2225 (Chatbot-Sicherheit für Minderjährige), SB 5395 (KI bei Krankenversicherungsentscheidungen), SB 5105 (KI-Deepfakes mit Minderjährigen) und SB 5886 (gefälschte digitale Abbilder). Oregon verabschiedete in der Vorwoche ein ähnliches Gesetz zur Chatbot-Sicherheit. Colorados AI Act, der am 1. Januar in Kraft trat, setzt weiterhin den Standard für die Regulierung von Hochrisiko-KI-Systemen mit seinen Anforderungen an Dokumentation, Transparenz und Risikominderung.

EU-Regulierungsanpassung

Der Europäische Rat einigte sich auf eine Position zur Vereinfachung der KI-Regeln und schlug vor, die Frist für die Anwendung der Regeln für Hochrisiko-KI-Systeme um bis zu 16 Monate zu verlängern. Die Verzögerung gibt der Kommission Zeit, um sicherzustellen, dass die benötigten Standards und Werkzeuge vorhanden sind, bevor die Durchsetzung beginnt.

Durchsetzung von Exportkontrollen

Das US-Justizministerium erhob am 19. März Anklage gegen drei Männer wegen Verschwörung zum Schmuggel von Supermicro-Servern im Wert von 2,5 Milliarden Dollar mit fortschrittlichen NVIDIA-Chips nach China, unter Verstoss gegen die US-Exportkontrollen. Wally Liaw, Mitgründer von Supermicro, und Willy Sun wurden verhaftet. Steven Chang ist weiterhin flüchtig. Das Schema nutzte angeblich einen südostasiatischen Vermittler, um gefälschte Papiere zu erstellen und Server umzuverpacken, bevor sie nach China verschifft wurden. Supermicro stellte die Mitarbeiter frei und kooperiert mit den Behörden. Die Aktien des Unternehmens fielen um 33%.

Schweiz-Fokus

Exa eröffnet erstes europäisches Büro in Zürich

Das in San Francisco ansässige KI-Such-Startup Exa eröffnete diesen Monat sein erstes europäisches Büro in Zürich. Das Unternehmen, das 85 Millionen Dollar eingesammelt hat, entwickelt KI-optimierte Suchinfrastruktur. Das Büro wird von den ehemaligen Google-Mitarbeitern Max Buckley und Felix Kroner geleitet. Exa nannte Zürichs wachsenden Status als KI-Hub und die Präsenz von Anthropic, OpenAI, NVIDIA und Google DeepMind in der Region als entscheidende Faktoren für die Standortwahl.

Swiss AI Initiative nähert sich der Deadline

Die Swiss AI Initiative, das weltweit grösste Open-Science- und Open-Source-Projekt für KI-Grundlagenmodelle, hat ihre vollständige Antragsdeadline auf den 31. März festgelegt. Die Initiative ist das erste Projekt des Swiss National AI Institute, einer Partnerschaft zwischen dem KI-Zentrum der ETH Zürich und dem KI-Zentrum der EPFL. Das Schweizer multilinguale Modell Apertus, entwickelt von EPFL, ETH Zürich und dem Nationalen Hochleistungsrechenzentrum der Schweiz (CSCS), deckt über 1'000 Sprachen ab, darunter Schweizerdeutsch und Rätoromanisch. Die Initiative wird den Fokus 2026 auf spezialisierte Modelle verlagern, insbesondere in der Medizin. Das Universitätsspital Lausanne (CHUV) beginnt ab Mai mit dem Test von Meditron, einem Schweizer medizinischen Sprachmodell, in der Notaufnahme.

ETH-Zürich-Stanford-Partnerschaft

Die ETH Zürich und die EPFL bestätigten eine strategische Zusammenarbeit mit dem Stanford Institute for Human-Centered Artificial Intelligence (HAI), formalisiert über das Swiss National AI Institute. Die Partnerschaft signalisiert die Schweizer Absicht, ein global vernetzter KI-Forschungsstandort zu bleiben.

Bahnbrechende Forschung

OpenClaws explosives Wachstum weckt Bedenken zur Kommodifizierung

OpenClaw, das Open-Source-Framework für autonome KI-Agenten von Peter Steinberger, erreichte diese Woche einen kritischen Wendepunkt. CNBC berichtete am 21. März, dass die rasante Verbreitung - über 250'000 GitHub Stars und damit das am schnellsten wachsende Open-Source-Projekt der Geschichte - Bedenken weckt, dass KI-Modelle zu Massenware werden. Die Fähigkeit des Projekts, Aufgaben autonom über Messaging-Plattformen auszuführen, kombiniert mit NVIDIAs Enterprise-Schicht NemoClaw, hat einen vollständigen Stack für agentenbasierte KI geschaffen, der für alle zugänglich ist.

Chinesische Behörden untersagten staatlichen Unternehmen und Regierungsbehörden die Nutzung von OpenClaw auf Dienstcomputern wegen Sicherheitsrisiken. Gleichzeitig bot die Stadt Wuxi bis zu 5 Millionen Yuan (730'000 Dollar) für OpenClaw-basierte Durchbrüche in Robotik und industriellen Anwendungen. Die Spannung zwischen enthusiastischer Adoption und Sicherheitsbedenken definiert, wo agentenbasierte KI gerade steht.

NVIDIAs AI-Q-Blueprint

NVIDIA veröffentlichte auf der GTC seinen AI-Q Blueprint für agentenbasierte Suche, ein Open-Source-System auf Basis von LangChain, das die DeepResearch-Bench-Genauigkeitsrangliste anführt und gleichzeitig die Abfragekosten halbiert. Der Blueprint liefert eine Referenzarchitektur für den Bau von Forschungsagenten, die grosse Dokumentensammlungen durchsuchen, synthetisieren und auswerten können.

GPT-5.4-Leistungsmeilenstein

OpenAIs GPT-5.4 "Thinking"-Modell erzielte 83,0% auf dem GDPVal-Benchmark und liegt damit auf oder über dem Niveau menschlicher Experten bei ökonomisch wertvollen Aufgaben. Auf dem Artificial Analysis Intelligence Index liegt GPT-5.4 Pro gleichauf mit Googles Gemini 3.1 Pro bei 57 Punkten - den höchsten je gemessenen Werten. Diese Zahlen deuten darauf hin, dass Frontier-Modelle bei einem breiten Spektrum realer Aufgaben Expertenniveau erreichen.

Fazit

NVIDIAs GTC hat die Hardware-Richtung für die nächsten zwei Jahre vorgegeben. Die Vera-Rubin-Plattform mit ihrer integrierten Groq-LPU und dem Versprechen einer 10-fachen Inferenz-Effizienzsteigerung gibt Unternehmen ein konkretes Ziel, an dem sie ihre Planung ausrichten können. Aber der unmittelbarere Wandel findet in der Software statt. Der Launch von NemoClaw mit 17 Enterprise-Partnern zeigt, dass agentenbasierte KI schneller von Demos zu Deployments übergeht, als viele erwartet haben.

Das Governance-Bild spaltet sich auf. Washington State verabschiedete fünf KI-Gesetze in einer einzigen Sitzung, während das Weisse Haus den Kongress dazu drängte, einzelstaatliche Gesetze vollständig zu verdrängen. Die EU kauft sich mehr Zeit. Diese drei Ansätze - aggressive einzelstaatliche Regulierung, Federal Preemption und verzögerte Durchsetzung - können nicht auf Dauer nebeneinander bestehen. Irgendwann muss eine Entscheidung fallen.

Und dann gibt es das leise Signal unter all dem Lärm. Xiaomi lancierte ein Billionen-Parameter-Modell anonym und es führte öffentliche Ranglisten an, bevor jemand wusste, wer es gebaut hat. OpenAI machte GPT-5.4 mini kostenlos. OpenClaw überschritt 250'000 Stars. Die Kosten für den Bau und Betrieb leistungsfähiger KI-Systeme sinken rapide. Der Wettbewerbsvorteil verlagert sich von der Frage, wer das beste Modell bauen kann, zu der Frage, wer es am effektivsten in der realen Welt einsetzen kann.

Ready to explore how Agentic AI can transform your organization? Visit us at to discover how we can guide your journey into this exciting new era of AI-powered productivity.

Quellen

- NVIDIA Newsroom - "NVIDIA Ignites the Next Industrial Revolution in Knowledge Work With Open Agent Development Platform" - 16. März 2026

- NVIDIA Newsroom - "NVIDIA Vera Rubin Opens Agentic AI Frontier" - 16. März 2026

- NVIDIA Newsroom - "NVIDIA Announces NemoClaw for the OpenClaw Community" - 16. März 2026

- CNBC - "Nvidia GTC 2026: CEO Jensen Huang sees $1 trillion in orders for Blackwell and Vera Rubin through '27" - 16. März 2026

- CNBC - "Nvidia GTC 2026: Agentic AI takes center stage" - 20. März 2026

- CNN Business - "Nvidia, the world's most valuable company, just sent another signal that AI agents are going to be everywhere" - 16. März 2026

- Tom's Hardware - "How Nvidia's $20 billion Groq 3 LPU deal reshapes the Nvidia Vera Rubin Platform" - 16. März 2026

- Tom's Hardware - "Nvidia GTC 2026 keynote live blog" - 16. März 2026

- IEEE Spectrum - "Nvidia Groq 3 LPU: Speeding AI Inference Tasks" - März 2026

- StorageReview - "NVIDIA GTC 2026: Rubin GPUs, Groq LPUs, Vera CPUs" - März 2026

- Newegg Insider - "NVIDIA GTC 2026: DLSS 5 Revealed and the $1 Trillion Bet" - März 2026

- CNBC - "Alibaba launches agentic AI tool for businesses with Slack, Teams integration plans" - 17. März 2026

- Alibaba Group - "Alibaba Launches Wukong: An AI-Native Agentic Platform for Enterprises" - 17. März 2026

- Computer Weekly - "Alibaba joins AI agent race with Wukong launch" - 17. März 2026

- Bloomberg - "OpenAI Plans Desktop App Combining Chat, Coding and Web Browsing" - 20. März 2026

- CNBC - "OpenAI to create desktop super app, combining ChatGPT app, browser and Codex app" - 19. März 2026

- Bloomberg - "Google Tests Gemini AI App for Mac to Rival ChatGPT and Claude" - 19. März 2026

- 9to5Mac - "Bloomberg: Google begins testing dedicated Gemini app for Mac" - 19. März 2026

- VentureBeat - "Xiaomi stuns with new MiMo-V2-Pro LLM nearing GPT-5.2, Opus 4.6 performance at a fraction of the cost" - März 2026

- BusinessToday - "Mystery behind 'Hunter Alpha' AI model revealed" - 19. März 2026

- labla.org - "AI Releases March 19-21: Xiaomi 1T Model, GPT-5.4 Free" - 21. März 2026

- Microsoft AI - "Introducing MAI-Image-2: for limitless creativity" - 19. März 2026

- Microsoft Security Blog - "Secure agentic AI end-to-end" - 20. März 2026

- Microsoft Security Blog - "New tools and guidance: Announcing Zero Trust for AI" - 19. März 2026

- Anthropic - "Introducing The Anthropic Institute" - 11. März 2026

- eWeek - "Anthropic Launches Institute to Examine AI's Impact on Jobs, Security, and Society" - März 2026

- The White House - "President Donald J. Trump Unveils National AI Legislative Framework" - 20. März 2026

- CNBC - "Trump administration unveils national AI policy framework to limit state power" - 20. März 2026

- Fortune - "The White House has a plan for AI regulation, and it starts with keeping states out of it" - 20. März 2026

- NBC News - "White House releases AI legislation framework" - 20. März 2026

- Transparency Coalition - "AI Legislative Update: March 20, 2026" - 20. März 2026

- CNBC - "Super Micro shares tank 33% after employees charged with smuggling Nvidia chips to China" - 19. März 2026

- CNN - "Co-founder of tech company charged with diverting $2.5 billion in Nvidia AI chips to China" - 19. März 2026

- Fortune - "Supermicro's cofounder was just arrested for allegedly smuggling $2.5 billion in GPUs to China" - 19. März 2026

- CNBC - "OpenClaw's ChatGPT moment sparks concern that AI models are becoming commodities" - 21. März 2026

- TechCrunch - "Nvidia's version of OpenClaw could solve its biggest problem: security" - 16. März 2026

- S-GE - "Exa arrives in Zurich" - März 2026

- SWI swissinfo.ch - "Artificial intelligence in Switzerland: what's new in 2026" - 2026

- EU Council - "Council agrees position to streamline rules on Artificial Intelligence" - 13. März 2026

Callista AI Weekly(16.-21. März 2026)