
Callista AI Weekly (23.-29. März 2026)
Die Geschichte der Woche war ein Datenleck. Anthropic veröffentlichte versehentlich interne Dokumente, die ein Modell der nächsten Generation namens Claude Mythos beschreiben - intern als "Quantensprung" in der Leistungsfähigkeit bezeichnet. Doch das Leck war nur ein Strang in einer Woche, die auch eine gerichtliche Blockade des Anthropic-Verbots der Trump-Regierung brachte, die Abschaltung von Sora durch OpenAI, Arms erstes eigenes Siliziumprodukt und einen neuen KI-Benchmark, an dem alle Frontier-Modelle scheiterten.
Neue KI-Anwendungsfälle
Harvey erreicht 11 Milliarden Dollar Bewertung
Harvey, das Legal-AI-Startup, schloss am 25. März eine Finanzierungsrunde über 200 Millionen Dollar ab und erreichte damit eine Bewertung von 11 Milliarden Dollar. Sequoia und Singapurs GIC führten die Runde gemeinsam an. Das vier Jahre alte Unternehmen bedient inzwischen mehr als 100'000 Anwälte in 1'300 Organisationen, mit einem jährlich wiederkehrenden Umsatz von 190 Millionen Dollar im Januar - fast doppelt so viel wie die 100 Millionen, die es im vergangenen August meldete. Harveys Tools übernehmen Vertragsanalyse, Compliance-Prüfungen, Due Diligence und Unterstützung bei Rechtsstreitigkeiten. Die Bewertung hat sich in einem einzigen Jahr mehr als 3,5-fach erhöht.
domo.health präsentiert sprachgesteuerten Pflege-Agenten in Zürich
Das Schweizer Healthtech-Unternehmen domo.health stellte am 26. März beim Google Healthcare & Life Sciences Community 2026 Event in Zürich einen sprachgesteuerten KI-Agenten für Pflegefachkräfte in der Spitex vor. Der Agent basiert auf Googles Gemini Live API und Vertex AI und ist in die PRO-Plattform von domo.health integriert. Er hilft Pflegepersonal bei der Dokumentation, beim Zugriff auf Patientenakten und bei der Koordination von Arbeitsabläufen durch natürliche Konversation - und reduziert so den administrativen Aufwand, der Zeit von der Patientenversorgung abzieht.
Cisco lanciert Sicherheitstools für die Agenten-Ära
Auf der RSA Conference 2026 stellte Cisco eine Reihe von Sicherheitstools vor, die für Unternehmen konzipiert sind, die KI-Agenten einsetzen. Das Herzstück ist DefenseClaw, ein Open-Source-Framework für sichere Agenten, das Sicherheitsinventarisierung automatisiert und sich in NVIDIA OpenShell integriert. Cisco führte ausserdem neue Splunk-AI-Funktionen ein, die Response-Workflows für Security-Operations-Teams automatisieren. Das Timing ist kein Zufall: In einer aktuellen Cisco-Umfrage gaben 85% der Enterprise-Kunden an, mit KI-Agenten zu experimentieren, aber nur 5% hatten sie in Produktion gebracht. Die Lücke zwischen Experiment und Einsatz ist ein Sicherheitsproblem, und Cisco setzt darauf, diesen Bereich zu besetzen.
Arm liefert seinen ersten Chip - Meta als Erstkunde
In einer historischen Premiere gab Arm am 24. März bekannt, nach 35 Jahren als Chip-Design-Unternehmen erstmals ein eigenes Siliziumprodukt zu verkaufen. Die AGI CPU packt bis zu 136 Neoverse-V3-Kerne auf TSMCs 3nm-Prozess, verspricht mehr als die doppelte Leistung pro Rack im Vergleich zu x86-Prozessoren und zielt auf die wachsende Nachfrage durch agentische KI-Workloads. Meta ist Lead-Kunde und Co-Entwicklungspartner und plant, den Chip zusammen mit seinen eigenen MTIA-Beschleunigern in Gigawatt-grosser Rechenzentrumsinfrastruktur einzusetzen. Weitere Launch-Partner sind Cerebras, Cloudflare, OpenAI und SAP. Die Arm-Aktie stieg um 16%.
Wichtige Anbieter-Updates
OpenAI beendet Sora und gründet Stiftung
OpenAI machte am 24. und 25. März zwei sehr unterschiedliche Schritte. Zuerst die Abschaltung: OpenAI bestätigte die Einstellung von Sora, seiner KI-Videogenerierungsplattform, einschliesslich der iOS-App, der API und Sora.com. Die App wird am 26. April geschlossen, die API am 24. September. Die Zahlen sprechen für sich. Sora verbrannte auf dem Höhepunkt rund 15 Millionen Dollar pro Tag an Inferenzkosten, während der gesamte Lebenszeiterlös aus In-App-Käufen gerade einmal 2,1 Millionen Dollar erreichte. Die Downloads fielen von 3,3 Millionen im November 2025 auf 1,1 Millionen im Februar 2026. Ein Dreijahresvertrag mit Walt Disney Co., angekündigt im Dezember 2025 mit Plänen für 1 Milliarde Dollar KI-Video-Investitionen, wird abgewickelt.
Das Videogenerierungsmodell selbst überlebt innerhalb von ChatGPT für zahlende Abonnenten. Aber das eigenständige Produktökosystem ist Geschichte. Für Entwickler, die auf die Sora 2 API gebaut haben, ist es eine harte Frist.
Einen Tag später kündigte Sam Altman die OpenAI Foundation an, mit der Zusage, im nächsten Jahr 1 Milliarde Dollar als Zuschüsse zu vergeben. Die Mittel fliessen in die Biowissenschaftsforschung - darunter Alzheimer und Krankheiten mit hoher Krankheitslast - sowie in Programme zur Abmilderung der Auswirkungen von KI auf Arbeitsplätze, Wirtschaft und die psychische Gesundheit von Kindern. "KI wird auch neue Bedrohungen für die Gesellschaft mit sich bringen, die wir angehen müssen", schrieb Altman. "Kein Unternehmen kann diese allein ausreichend abmildern."
Anthropics Mythos-Leak und juristischer Sieg
Es war eine turbulente Woche für Anthropic. Am 26. März entdeckten Sicherheitsforscher knapp 3'000 unveröffentlichte Dokumente in einem öffentlich zugänglichen Datenspeicher, darunter Entwürfe von Blogbeiträgen für ein unveröffentlichtes Modell namens Claude Mythos (intern auch Capybara genannt). Ein fehlkonfiguriertes Content-Management-System hatte hochgeladene Dateien automatisch öffentlich gemacht.
Die geleakten Entwürfe beschreiben ein Modell, das "dramatisch höhere Ergebnisse in Tests für Softwareentwicklung, akademisches Schlussfolgern und Cybersicherheit" erzielt als Claude Opus 4.6. Sie warnen auch, dass das Modell Cybersicherheitsrisiken erheblich verschärfen könnte, indem es Software-Schwachstellen schnell findet und ausnutzt. Anthropic bestätigte, dass das Modell real ist, nannte es einen "Quantensprung" in den Fähigkeiten und sagte, es werde derzeit mit einer kleinen Gruppe von Early-Access-Kunden getestet. Das Unternehmen räumte ein, das Modell sei "sehr teuer für uns bereitzustellen und wird sehr teuer für unsere Kunden sein."
Separat erliess U.S. District Judge Rita F. Lin am 26. März eine einstweilige Verfügung, die das Verbot der Trump-Regierung für die staatliche Nutzung von Anthropics Technologie blockiert. In einem 43-seitigen Urteil hob sie die Einstufung des Pentagon von Anthropic als "Lieferkettenrisiko für die nationale Sicherheit" auf und nannte dies "klassische Vergeltung im Sinne des First Amendment." Der Streit geht auf zwei Einschränkungen in Anthropics Nutzungsrichtlinien zurück: Claude darf nicht für vollautonome Waffensysteme oder für Massenüberwachung im Inland eingesetzt werden. Richterin Lin schrieb: "Die Aktenlage stützt die Schlussfolgerung, dass Anthropic dafür bestraft wird, die Vertragsposition der Regierung öffentlich kritisiert zu haben."
ARC-AGI-3 lässt alle Frontier-Modelle scheitern
ARC Prize startete ARC-AGI-3 am 25. März im Y Combinator HQ in San Francisco, mit einem Gespräch zwischen Schöpfer François Chollet und OpenAI-CEO Sam Altman. Der neue Benchmark ist der erste vollständig interaktive Test in der ARC-AGI-Reihe. Er umfasst Hunderte von rundenbasierten Umgebungen, die von menschlichen Spieledesignern entworfen wurden. Es gibt keine Anweisungen, keine Regeln und keine vorgegebenen Ziele. Um erfolgreich zu sein, muss ein KI-Agent explorieren, lernen und Wissen über zunehmend schwierigere Level hinweg mitnehmen.
Die bisherigen Ergebnisse sind deutlich. Menschen erreichen 100%. Das beste Frontier-Modell, Gemini 3.1 Pro, kam auf 0,37%. GPT-5, Claude und Gemini lagen alle unter 1%. Der Wettbewerb ist mit mehr als 2 Millionen Dollar Preisgeld dotiert, und alle Gewinnerlösungen müssen als Open Source veröffentlicht werden.
MCP überschreitet 97 Millionen Downloads
Das Model Context Protocol (MCP), ursprünglich von Anthropic im November 2024 eingeführt, erreichte im März 2026 97 Millionen monatliche SDK-Downloads. Das ist vergleichbar mit React, das rund drei Jahre brauchte, um 100 Millionen monatliche Downloads zu erreichen. MCP schaffte es in 16 Monaten. Das Ökosystem umfasst inzwischen mehr als 5'800 Community- und Enterprise-Server. Die Adoption beschleunigte sich, nachdem OpenAI sich zur MCP-Unterstützung bekannt hatte und damit die anbieterspezifische Fragmentierung bei Tool-Formaten durchbrach, die die Entwicklung agentischer KI gebremst hatte. Auch Google DeepMind und Microsoft haben das Protokoll übernommen.
Cursor-Kimi-Attributionskontroverse
Cursor löste diese Woche eine Glaubwürdigkeitskrise aus, als Entwickler entdeckten, dass Composer 2, das neueste Coding-Modell des Unternehmens, auf Moonshot AIs Open-Weight-Modell Kimi K2.5 aufgebaut war. Cursor hatte Composer 2 als proprietäre Eigenentwicklung vermarktet und "Continued Pretraining" und "Scaled Reinforcement Learning" hervorgehoben, ohne Kimi K2.5 in irgendeinem öffentlichen Material zu erwähnen. Ein Entwickler fand den Kimi-Modell-Identifier in Cursors API-Antworten.
Cursors VP of Developer Education Lee Robinson räumte ein, dass "Composer 2 auf einer Open-Source-Basis aufbaut", und schätzte, dass etwa 25% der Rechenleistung vom Basismodell stammten. Die Kimi-K2.5-Lizenz verlangt jedoch eine prominente Namensnennung für jedes kommerzielle Produkt mit mehr als 20 Millionen Dollar Monatsumsatz - eine Schwelle, die Cursor um etwa das 8-Fache überschreitet. Moonshot AI bestätigte, dass Cursor das Modell "im Rahmen einer autorisierten kommerziellen Partnerschaft" nutzte, doch der Vorfall hat Fragen zur Transparenz bei der zunehmend verbreiteten Praxis aufgeworfen, offene Modelle für kommerzielle Produkte feinzutunen.
KI-Governance
Weisses Haus veröffentlicht nationale KI-Politikrahmen
Am 20. März veröffentlichte das Weisse Haus ein National Policy Framework for Artificial Intelligence mit Gesetzgebungsempfehlungen an den Kongress. Das Dokument selbst schafft keine neuen rechtlichen Verpflichtungen, aber die politische Stossrichtung ist klar: breite Bundesvorrangigkeit gegenüber bundesstaatlichen KI-Gesetzen, Vertrauen auf bestehende sektorspezifische Regulierer statt einer neuen föderalen KI-Behörde, und regulatorische "Sandboxes" zur Beschleunigung des KI-Einsatzes.
Das Rahmenwerk würde es den Bundesstaaten verbieten, die KI-Modellentwicklung zu regulieren oder KI-Entwickler für den Missbrauch durch Dritte haftbar zu machen. Ausnahmen gelten für bundesstaatliche Zuständigkeiten beim Kinderschutz, bei der Betrugsbekämpfung und beim Verbraucherschutz. Die Bundesvorrangigkeit ist in diesem Kongress bereits zweimal gescheitert - sie wurde aus dem GOP-Haushaltsgesetz gestrichen und schaffte es nie in das Verteidigungspolitikgesetz. Die Empfehlungen bleiben daher ohne Gesetzgebung rein programmatisch.
Sanders und AOC fordern Rechenzentrum-Moratorium
Am 25. März brachten Senator Bernie Sanders und Kongressabgeordnete Alexandria Ocasio-Cortez den Artificial Intelligence Data Center Moratorium Act ein. Das Gesetz würde landesweit den Bau aller neuen KI-Rechenzentren stoppen, bis der Kongress Bundesgesetze zum Schutz von Arbeitnehmern, Verbrauchern, Privatsphäre und Umwelt verabschiedet. Es würde auch den Export von KI-Chips verbieten, bis diese Schutzmassnahmen greifen.
Das Gesetz hat praktisch keine Chance, im aktuellen Kongress verabschiedet zu werden. Aber es signalisiert wachsenden politischen Widerstand gegen den Infrastrukturbedarf der KI-Industrie. Der Bau von Rechenzentren ist in Gemeinden, die mit der Belastung von Stromnetzen und Wasservorräten kämpfen, zum Streitpunkt geworden.
Baltimore klagt gegen xAI wegen Grok-Deepfakes
Die Stadt Baltimore reichte am 24. März Klage gegen xAI und X ein und ist damit die erste grosse US-Stadt, die rechtliche Schritte wegen KI-generierter Deepfakes unternimmt. Die Klage wirft xAIs Grok-Chatbot vor, nicht-einvernehmliche sexualisierte Bilder produziert und verbreitet zu haben - einschliesslich Inhalte mit Minderjährigen -, was gegen Baltimores Verbraucherschutzverordnung verstosse. Die Stadt verwies auf geschätzte 3 Millionen sexualisierte Bilder, die über einen Zeitraum von 11 Tagen generiert wurden, darunter mehr als 23'000 mit Darstellungen von Kindern. Baltimore fordert eine einstweilige Verfügung zur Änderung von Groks Bildgenerierungsfunktionen sowie die maximalen gesetzlichen Strafen.
EU AI Act: Verzögerungen und Divergenz
Der regulatorische Zeitplan der EU verschiebt sich weiter. Am 13. März einigte sich der Rat der EU auf sein Verhandlungsmandat zum Digital Omnibus AI Act - mit anderen Fristen als sowohl die Kommission als auch das Parlament vorgeschlagen hatten. Die Regeln für Hochrisiko-KI-Systeme, ursprünglich für August 2026 vorgesehen, könnten nun auf Dezember 2027 für eigenständige Systeme und August 2028 für eingebettete Systeme verschoben werden. Gleichzeitig haben erst 8 von 27 Mitgliedstaaten ihre zuständigen Behörden benannt. Der zweite Entwurf des Verhaltenskodex zur Transparenz von KI-generierten Inhalten war bis zum 30. März zur Stellungnahme durch Stakeholder offen.
Schweiz-Fokus
domo.health am Google Cloud Event in Zürich
Wie oben erwähnt, präsentierte das in Lausanne ansässige Unternehmen domo.health seinen sprachgesteuerten KI-Agenten am 26. März beim Google Healthcare & Life Sciences Community Event in Zürich. Der Agent adressiert eines der hartnäckigsten Probleme im Gesundheitswesen: den administrativen Aufwand für Spitex-Fachkräfte. Aufgebaut mit Google Clouds Gemini Live API und unterstützt von Datwave, einem Premier Google Cloud Partner, wurde die Lösung live von Mitgründer Charles-Edouard Bardyn demonstriert.
ETH Zürich lanciert KI-Innovationsprogramm für Genf
Die ETH Zürich hat ihr International Geneva AI Innovation Programme (IGAIP) eröffnet. Das Programm finanziert angewandte, souveräne KI-Projekte, die UNO-Organisationen und internationalen Institutionen in Genf helfen sollen, ihre Mandate effektiver umzusetzen. Die Eingabefrist für Anträge ist der 17. Mai 2026. Das Programm ist Teil eines breiteren ETH-Engagements im Bereich KI. Der 2026 European Deep Tech Report bestätigte, dass die ETH Zürich seit 2020 192 von Alumni gegründete, VC-finanzierte Deep-Tech-Startups hervorgebracht hat - mehr als jede andere Institution weltweit, einschliesslich MIT und Stanford. Die EPFL rangiert mit 94 Startups auf Platz zwei in Europa.
Swiss AI Initiative vor dem Fristende
Die Eingabefrist für Vollanträge bei der Swiss AI Initiative ist der 31. März 2026. Die Initiative gilt als das weltweit grösste Open-Science-, Open-Source-Projekt für KI-Basismodelle und ist eine Partnerschaft zwischen dem ETH AI Center und dem EPFL AI Center. Ihr Flaggschiffmodell Apertus wurde mit 15 Billionen Tokens in über 1'000 Sprachen auf dem Alps-Supercomputer in Lugano trainiert. Apertus hat die Marke von einer Million Downloads überschritten, und der Kanton Tessin setzt es bereits für die KI-Übersetzung amtlicher Dokumente ein.
Durchbrüche in der Forschung
ARC-AGI-3: Messen, was Modelle nicht können
Der Start von ARC-AGI-3 ist zugleich ein Forschungsbeitrag. Durch die Gestaltung interaktiver, spielartiger Umgebungen ohne Anweisungen und ohne vorgegebene Ziele testet der Benchmark etwas, das heutigen KI-Systemen grundlegend fehlt: die Fähigkeit, aus neuartigen Situationen zu lernen, statt Muster aus Trainingsdaten abzurufen. Die Ergebnisse unter 1% bei allen Frontier-Modellen legen eine harte Obergrenze der aktuellen Ansätze offen. François Chollets These - dass Skalierung allein keine allgemeine Intelligenz hervorbringt - hat nun frische empirische Unterstützung. Das Preisgeld von 2 Millionen Dollar und die Open-Source-Pflicht könnten eine neue Welle der Forschung zu adaptiven Lernarchitekturen anstossen.
Qwen 3.5 Small Models verschieben Grenzen auf dem Gerät
Alibabas Qwen-Team veröffentlichte die Qwen 3.5 Small Model Series Anfang März, doch ihre Auswirkungen beschäftigten die Forschungsgemeinschaft die ganze Woche. Die Serie umfasst vier Grössen von 0,8B bis 9B Parametern, von Grund auf für den Einsatz auf Endgeräten entwickelt statt aus grösseren Modellen destilliert. Die 9B-Variante erzielte 81,7 auf GPQA Diamond und übertraf damit OpenAIs gpt-oss-120B, sowie 70,1 auf MMMU-Pro Visual Reasoning und schlug Gemini 2.5 Flash-Lite (59,7) und GPT-5-Nano (57,4). Die Hybridarchitektur kombiniert Gated Delta Networks mit sparse Mixture-of-Experts. Die praktische Erkenntnis: Frontier-Qualität beim Schlussfolgern bewegt sich auf Geräte, die in eine Hosentasche passen.
ArXiv-Einreichungen erreichen 28'000 pro Monat
Die KI-Forschungsproduktion beschleunigt sich weiter. Einreichungen in den KI-Kategorien von arXiv erreichten im März 2026 fast 28'000 Papers pro Monat. Das Volumen macht es für Forschende und Praktiker zunehmend schwierig, den Überblick zu behalten, und treibt die Nachfrage nach KI-gestützten Werkzeugen zur Forschungssynthese. Das Tempo selbst ist zum Forschungsproblem geworden.
Fazit
Dies war eine Woche der Korrekturen und Abrechnungen. OpenAI stellte ein Produkt ein, das 15 Millionen Dollar pro Tag verbrannte. Cursor wurde dabei erwischt, ein Open-Source-Modell als proprietäre Innovation zu vermarkten. Anthropics leistungsfähigstes Modell wurde durch eine fehlkonfigurierte Datenbank geleakt. Jede Geschichte trägt die gleiche Lektion: Die Kluft zwischen dem, was KI-Unternehmen behaupten, und dem, was sie liefern, lässt sich immer schwerer aufrechterhalten.
Das beständigere Signal kam aus der Infrastruktur. Arms erster Chip, MCPs 97 Millionen Downloads, NVIDIAs Agenten-Toolkit, Ciscos Security-Stack - das sind die Bausteine für die nächste Phase. Die Agenten-Ära kommt nicht durch einen einzelnen Durchbruch, sondern durch die Anhäufung von Protokollen, Silizium und Sicherheitsframeworks, die den Produktiveinsatz ermöglichen.
Und dann ist da ARC-AGI-3, still die wichtigste Geschichte der Woche. Jedes Frontier-Modell erzielte unter 1%. Menschen erzielten 100%. Der Benchmark misst nicht, was KI kann. Er misst, was KI nicht kann. Diese Lücke - zwischen Musterabruf und echtem Lernen - bleibt das zentrale ungelöste Problem des Fachgebiets.
Möchten Sie erfahren, wie Agentic AI Ihre Organisation transformieren kann? Besuchen Sie uns auf https://www.callista.ch/agentic-ai und entdecken Sie, wie wir Sie auf Ihrer Reise in die neue Ära KI-gestützter Produktivität begleiten können.
Quellen
- Bloomberg - "OpenAI Plans to Discontinue Support for Sora AI Video Generator" - 24. März 2026
- TechCrunch - "OpenAI's Sora was the creepiest app on your phone - now it's shutting down" - 24. März 2026
- Fortune - "OpenAI Foundation pledges $1 billion to mitigate some of the jobs that it thinks AI will destroy" - 25. März 2026
- Fortune - "Exclusive: Anthropic 'Mythos' AI model representing 'step change' in power revealed in data leak" - 26. März 2026
- Fortune - "Anthropic accidentally leaked details of a new AI model that poses unprecedented cybersecurity risks" - 27. März 2026
- Fortune - "U.S. judge blocks Anthropic ban, supply chain risk 'Orwellian notion'" - 26. März 2026
- NPR - "Judge temporarily blocks Trump administration's Anthropic ban" - 26. März 2026
- CNBC - "Legal AI startup Harvey raises $200 million at $11 billion valuation" - 25. März 2026
- TechCrunch - "Harvey confirms $11B valuation: Sequoia triples down" - 25. März 2026
- CNBC - "Baltimore is first U.S. city to sue over Grok deepfake porn as legal pressure mounts on Musk's xAI" - 24. März 2026
- CNBC - "Arm releases first in-house chip, with Meta as debut customer" - 24. März 2026
- Bloomberg - "Arm to Sell Its Own Chips, Eyeing Sales Goal of $15 Billion" - 24. März 2026
- Arm Newsroom - "Introducing Arm AGI CPU" - 24. März 2026
- ARC Prize - "Announcing ARC-AGI-3" - 25. März 2026
- TechCrunch - "Bernie Sanders and AOC propose a ban on data center construction" - 25. März 2026
- Axios - "Sanders and AOC unveil data center moratorium bill" - 25. März 2026
- domo.health - "domo.health AI agent to be unveiled at Google Cloud event in Zurich on March 26" - 26. März 2026
- Cisco Newsroom - "Cisco Reimagines Security for the Agentic Workforce" - 24. März 2026
- The New Stack - "Why the Model Context Protocol Won" - März 2026
- Digital Applied - "MCP Hits 97M Downloads: Model Context Protocol Guide" - März 2026
- TechCrunch - "Cursor admits its new coding model was built on top of Moonshot AI's Kimi" - 22. März 2026
- Wilmerhale - "White House Releases National Policy Framework for Artificial Intelligence" - 23. März 2026
- Roll Call - "White House AI framework calls for preemption of state laws" - 20. März 2026
- EU Council - "Council agrees position to streamline rules on Artificial Intelligence" - 13. März 2026
- ETH Zurich - "A new funding programme boosts AI in international organisations" - März 2026
- SWI swissinfo.ch - "Artificial intelligence in Switzerland: what's new in 2026" - März 2026
