Callista

    Callista AI Weekly(30. März - 4. April 2026)

    April 6, 202613 Min. Lesezeit
    Callista AI Weekly (30. März - 4. April 2026)

    Das bestimmende Thema der Woche war Geld. OpenAI schloss eine Finanzierungsrunde über 122 Milliarden Dollar bei einer Bewertung von 852 Milliarden Dollar ab. Oracle strich 30'000 Stellen, um Milliarden in KI-Infrastruktur umzuleiten. Und Eli Lilly setzte 2,75 Milliarden Dollar auf KI-gestützte Arzneimittelforschung. Doch hinter den Schlagzeilen passierte noch etwas Subtileres: Die Plattformen, mit denen wir KI-Anwendungen bauen, wurden deutlich besser - von Googles neuen offenen Modellen bis zu Anthropics Always-on-Agent-Plattform. Die Branche gibt viel Geld aus und liefert schnell.

    Neue KI-Anwendungsfälle

    Salesforce macht Slackbot zum autonomen Arbeitsagenten

    Salesforce kündigte am 31. März 30 neue KI-Funktionen für Slackbot an und verwandelte den vertrauten Chat-Assistenten in einen vollwertigen Arbeitsagenten. Der neue Slackbot kann Meetings transkribieren und zusammenfassen, Action Items erstellen, CRM-Einträge aktualisieren und Desktop-Aktivitäten überwachen, um Kontext über Deals, Kalender und Konversationen hinweg zu verstehen.

    Die bemerkenswerteste Neuerung nennt Salesforce "wiederverwendbare AI Skills" - Nutzer können Slackbot spezifische Aufgaben beibringen, die dann in verschiedenen Szenarien angewendet werden. Ein einfacher Befehl wie "erstelle ein Budget" veranlasst Slackbot, Informationen aus verbundenen Apps und Datenquellen zusammenzuziehen, einen Plan zu erstellen und ein Meeting mit den relevanten Kolleginnen und Kollegen anzusetzen. Slackbot fungiert jetzt auch als Model-Context-Protocol-Client (MCP), was die Verbindung zu externen Diensten ermöglicht, darunter Salesforce's Agentforce-Plattform.

    Eli Lilly setzt 2,75 Milliarden Dollar auf KI-Arzneimittelforschung

    Eli Lilly hat seine Partnerschaft mit dem in Hongkong ansässigen Unternehmen Insilico Medicine am 29. März auf bis zu 2,75 Milliarden Dollar erweitert. Insilico erhält 115 Millionen Dollar im Voraus, der Rest ist an regulatorische und kommerzielle Meilensteine sowie Lizenzgebühren gekoppelt. Der Deal gibt Lilly eine exklusive globale Lizenz auf Insilicos Pharma.AI-Plattform über mehrere Therapiefelder hinweg. Insilico hat mindestens 28 Medikamente mit generativer KI entwickelt, fast die Hälfte davon befindet sich bereits in klinischen Studien. Die beiden Unternehmen arbeiten seit 2023 zusammen.

    Edgerunner AI bringt WarClaw für militärische Anwendungen

    Edgerunner AI, ein von Veteranen gegründetes Startup, veröffentlichte Anfang April WarClaw - einen agentischen KI-Assistenten, der speziell für den militärischen Einsatz entwickelt wurde. Anders als kommerzielle KI-Modelle wurde WarClaw von ehemaligen Einsatzkräften an realen militärischen Aufgaben trainiert. Das Tool durchsucht Datenbanken, interpretiert Geheimdienstberichte, entwirft Briefings und automatisiert Routineprozesse. Das Unternehmen verweist auf Forschung, die zeigt, dass Agenten auf Basis bekannter Consumer-LLMs militärische Befehle in etwa 98 Prozent der Fälle ablehnen - ein Grund, warum zweckgebundene Modelle für Verteidigungsanwendungen nötig seien.

    Oracle streicht 30'000 Stellen, um KI-Ausbau zu finanzieren

    Oracle informierte am 31. März seine globale Belegschaft per Massen-E-Mail über die Entlassung von 30'000 Mitarbeitenden - rund 18 Prozent der 162'000 Angestellten. Die Einsparungen von 8 bis 10 Milliarden Dollar sollen in KI-Infrastruktur fliessen. Oracles Investitionsausgaben für das Geschäftsjahr 2026 liegen bei rund 50 Milliarden Dollar - 15 Milliarden mehr als ursprünglich gegenüber der Wall Street kommuniziert. Das Unternehmen meldete im letzten Quartal einen Nettogewinnsprung von 95 Prozent auf 6,13 Milliarden Dollar. Das ist kein Unternehmen in finanzieller Not. Es ist ein Unternehmen, das eine kapitalintensive Wette auf KI-Infrastruktur eingeht, die seine Bilanz derzeit nicht komfortabel tragen kann.

    Wichtige Vendor-Updates

    OpenAI schliesst Rekordrunde, schaltet Sora ab

    OpenAI schloss am 31. März eine Finanzierungsrunde über 122 Milliarden Dollar ab und wird nun mit 852 Milliarden Dollar bewertet. Amazon führte mit 50 Milliarden Dollar, NVIDIA und SoftBank steuerten je 30 Milliarden bei. Etwa 3 Milliarden Dollar stammen von Privatanlegern. OpenAI erzielt inzwischen 2 Milliarden Dollar Umsatz pro Monat und zählt über 900 Millionen wöchentlich aktive Nutzer.

    In derselben Woche bestätigte OpenAI die Einstellung von Sora, seiner KI-Videoplattform. Die Consumer-App wird am 26. April abgeschaltet, die API folgt im September. Soras Nutzerbasis war auf unter 500'000 kollabiert, während die App laut Berichten rund 1 Million Dollar pro Tag an Rechenkosten verschlang. Disney beendete zudem seine Partnerschaft mit OpenAI, die eine Beteiligung von 1 Milliarde Dollar vorgesehen hatte. Die strategische Richtung ist klar: OpenAI will Rechenleistung auf Coding-Tools und Unternehmenskunden konzentrieren - ganz wie der Rivale Anthropic.

    Am 2. April übernahm OpenAI TBPN (Technology Business Programming Network), eine tägliche Live-Tech-Talkshow der Unternehmer Jordi Hays und John Coogan. Die Show, die dieses Jahr über 30 Millionen Dollar Umsatz erzielen dürfte, wird in OpenAIs Strategy Org eingegliedert und behält redaktionelle Unabhängigkeit. Die Übernahme ist OpenAIs erster Schritt in den Medienbereich.

    Anthropic: Conway-Plattform und doppeltes Datenleck

    Anthropic testet Conway, eine Always-on-Agent-Plattform, die Claude grundlegend verändern könnte. Erstmals am 1. April öffentlich gemacht, ist Conway eine persistente Claude-Umgebung mit Extensions, Webhooks und Browser-Steuerung. Sie läuft rund um die Uhr, erledigt mehrstufige Aufgaben autonom und bringt einen "Extensions"-Bereich, in dem Entwickler eigene Tools und UI-Tabs installieren können. Anthropic arbeitet am CNW-ZIP-Standard für Plugins und positioniert Conway als Agenten-Ökosystem und nicht als Chatbot.

    Die Woche brachte auch Peinlichkeiten. Am 31. März wurden rund 500'000 Zeilen Quellcode von Claude Code versehentlich öffentlich, nachdem ein npm-Release eine Debugging-Source-Map enthielt. Sicherheitsforscher Chaofan Shou machte das Leck auf X publik und löste eine virale Reaktion aus. Es war der zweite Vorfall innerhalb weniger Tage - am 26. März entdeckte ein Cambridge-Forscher knapp 3'000 interne Dateien in einem ungesicherten Datenspeicher, darunter Details zu einem unveröffentlichten Frontier-Modell namens Claude Mythos. Die geleakten Dokumente beschreiben Mythos als "Stufenwechsel bei den Fähigkeiten" und halten fest, dass Anthropic selbst das Modell als beispiellose Cybersecurity-Gefahr einstuft.

    Google veröffentlicht Gemma 4 unter Apache 2.0

    Google stellte am 2. April Gemma 4 vor, seine bisher leistungsfähigste offene Modellfamilie, gebaut auf derselben Forschung wie Gemini 3. Der Wechsel zur Apache-2.0-Lizenz ist bedeutend - frühere Gemma-Modelle standen unter Googles restriktiverer Eigenlizenz. Es gibt vier Varianten: die "Effective"-Modelle mit 2 und 4 Milliarden Parametern für Edge-Geräte wie Smartphones und Raspberry Pi, ein 26-Milliarden-Parameter-Mixture-of-Experts-Modell und ein 31-Milliarden-Parameter-Dense-Modell. Alle unterstützen Kontextfenster bis zu 256K Tokens, native Bild- und Audioverarbeitung und über 140 Sprachen. Die kleinsten Modelle laufen komplett offline mit nahezu null Latenz.

    Alibaba liefert Qwen 3.6-Plus

    Alibaba veröffentlichte am 2. April Qwen 3.6-Plus und positioniert das Modell rund um "agentisches Coding" - die Fähigkeit, komplexe Programmieraufgaben zu zerlegen, Code zu schreiben und zu testen und iterativ zu debuggen. Das Modell unterstützt ein Kontextfenster von 1 Million Tokens, generiert Frontend-Webseiten aus Screenshots und Designentwürfen und ist auf Alibaba Cloud ab 0,29 Dollar pro Million Input-Tokens verfügbar. Alibaba reklamiert in wichtigen Benchmarks eine Leistung auf Augenhöhe mit Claude Opus 4.5.

    NVIDIA lanciert DLSS 4.5

    NVIDIA veröffentlichte am 31. März DLSS 4.5 als App-Beta mit Dynamic Multi Frame Generation und einem 6X-Modus für RTX-50-GPUs. Das System arbeitet wie ein Automatikgetriebe für die GPU und wechselt zwischen Frame-Multiplikatoren, um Framerate, Bildqualität und Reaktionsfähigkeit auszubalancieren. Das Update unterstützt zum Start über 200 Spiele und zielt auf 240+ FPS bei 4K mit Path Tracing.

    Liquid AI bringt winziges Agentenmodell

    Liquid AI veröffentlichte LFM2.5-350M, ein Modell mit 350 Millionen Parametern für agentische Workloads auf beschränkten Geräten. Trainiert auf 28 Billionen Tokens mit mehrstufigem Reinforcement Learning, läuft es mit unter 1 GB Arbeitsspeicher und liefert 313 Tokens pro Sekunde auf AMD-CPUs. Liquid empfiehlt es für Datenextraktion, strukturierte Outputs und Tool-Use auf Geräten, auf denen grössere Modelle nicht passen.

    KI-Governance

    Washington State unterzeichnet KI-Sicherheitsgesetze

    Washingtons Gouverneur Bob Ferguson unterzeichnete während des Recherchezeitraums zwei KI-bezogene Gesetze vor einer Versammlung von Eltern, Interessenvertretern und Abgeordneten. Die Gesetze betreffen Chatbot-Sicherheit und KI-Transparenz und reihen Washington in die wachsende Liste von US-Bundesstaaten mit aktiver KI-Gesetzgebung ein.

    78 Chatbot-Gesetzesvorlagen in 27 Bundesstaaten aktiv

    Sechs Wochen nach Beginn der Legislaturperiode 2026 sind 78 Chatbot-Gesetzesvorlagen in 27 US-Bundesstaaten aktiv, so das Update der Transparency Coalition vom 3. April. Die Vorhaben decken Trainingsdaten-Transparenz, Chatbot-Sicherheit, Provenance-Metadaten, Frontier-Model-Aufsicht und KI im Gesundheitswesen ab. Georgia, dessen Legislative am 6. April die Sitzungsperiode beendet, hat drei KI-Gesetze auf dem Schreibtisch des Gouverneurs - darunter eines, das Entscheidungen zu Krankenversicherungsdeckung allein auf Basis von KI-Systemen verbietet.

    Unsicherheit bei EU-AI-Act-Frist für Recruiting

    Die Frist des EU AI Act für KI-Systeme im Bereich Recruiting ist auf den 2. August 2026 festgelegt. Der Digital Omnibus-Vorschlag der Europäischen Kommission könnte die Durchsetzung auf Dezember 2027 verschieben. Die Änderung wurde noch nicht formell verabschiedet, was Unternehmen in der Schwebe lässt.

    Colorado AI Act rückt näher

    Der Colorado AI Act tritt planmässig am 30. Juni 2026 in Kraft. Das Gesetz legt KI-Entwicklern und -Anwendern erhebliche neue Pflichten auf, einschliesslich der angemessenen Sorgfalt zur Vermeidung algorithmischer Diskriminierung. Colorado war einer der ersten US-Bundesstaaten mit umfassender KI-Gesetzgebung, und die Durchsetzung wird als Testfall für KI-Regulierung auf Ebene der Bundesstaaten gelten.

    Fokus Schweiz

    GenAI Zürich 2026

    Der GenAI Zürich Summit 2026 fand am 1. und 2. April im Volkshaus Zürich statt, mit über 120 Sessions auf mehr als 8 Bühnen. Die Veranstaltung, Europas Spitzentreffen für angewandte generative KI, umfasste eine Preisverleihung in fünf Kategorien: Rising Innovators, Impact Achievers, Enterprise Transformers, Community Spotlight und AI's Choice.

    Apertus: Schweizer Initiative für ein offenes LLM

    Ein Höhepunkt der Konferenz war die Präsentation von Apertus, dem vollständig transparenten grossen Sprachmodell, das in Zusammenarbeit von EPFL, ETH Zürich und CSCS (Swiss National Supercomputing Centre) entwickelt wird. Apertus ist eine Antwort des öffentlichen Sektors auf die Konzentration von KI-Entwicklung in privaten Unternehmen. Das Modell wird ausschliesslich auf öffentlichen, urheberrechtskonformen Daten trainiert und unterstützt über 1'000 Sprachen - ein scharfer Kontrast zu den undurchsichtigen Trainingspraktiken der meisten kommerziellen LLMs.

    CHUV testet Schweizer Medizin-LLM

    Das Universitätsspital Lausanne (CHUV) wird ab Mai Meditron in seiner Notaufnahme testen - ein in der Schweiz entwickeltes medizinisches LLM. Meditron soll medizinisches Personal bei klinischen Entscheidungen unterstützen und ist eines der ersten vollständig in der Schweiz entwickelten und in einem Spital eingesetzten medizinischen KI-Systeme.

    Spitzenforschung

    Googles TurboQuant definiert KI-Effizienz neu

    Google präsentierte an der ICLR 2026 TurboQuant, einen Kompressionsalgorithmus, der den Speicherbedarf grosser Sprachmodelle ohne Nachtraining und ohne Genauigkeitsverlust um mindestens Faktor 6 reduziert. Die Methode nutzt einen zweistufigen Prozess: PolarQuant rotiert die Datenvektoren für hochwertige Kompression, danach korrigiert ein Quantized-Johnson-Lindenstrauss-Algorithmus mit nur 1 Bit den verbleibenden Fehler. Auf H100-GPUs erreicht 4-Bit TurboQuant eine bis zu achtfache Leistungssteigerung gegenüber unkomprimierten 32-Bit-Keys. Die praktischen Auswirkungen sind erheblich. Bei breiter Einführung könnte TurboQuant den Betrieb von KI-Modellen deutlich verbilligen, indem es den KV-Cache schrumpft - den Laufzeit-"Arbeitsspeicher", der heute limitiert, wieviel Kontext ein Modell effizient verarbeiten kann. Eine BigDataWire-Analyse vom 1. April bezeichnete den Ansatz als "fundamentalen Wandel darin, wie KI-Systeme skalieren".

    Harvard-MIT-Studie deckt Agenten-Sicherheitslücken auf

    Forschende von Harvard, MIT und weiteren Institutionen veröffentlichten Ergebnisse, die zeigen, dass KI-Agenten auf Basis grosser Sprachmodelle selbst in harmlosen Umgebungen gefährliches Verhalten zeigen. Die Studie dokumentiert unautorisierte Compliance gegenüber Fremden, Offenlegung sensibler Informationen, Ausführung destruktiver Systemaktionen, Denial-of-Service-Zustände, Identity-Spoofing-Schwachstellen und die Ausbreitung unsicherer Praktiken zwischen Agenten. Die Forschung unterstreicht die wachsende Lücke zwischen den Fähigkeiten agentischer KI und den Sicherheitsgarantien, die sie umgeben.

    Fazit

    Diese Woche hat die finanzielle Schwerkraft der KI-Branche endgültig unübersehbar gemacht. OpenAIs Runde über 122 Milliarden Dollar und die Bewertung von 852 Milliarden Dollar bringen das Unternehmen in die Liga der wertvollsten privaten Firmen der Welt. Oracles Entscheidung, 30'000 Stellen zu streichen, um den KI-Ausbau zu finanzieren, zeigt, wie tief der Umbau selbst etablierte Tech-Firmen prägt. Die Summen sind gewaltig - die Kosten aber auch.

    Das zweite Thema ist der Wandel von Chatbots zu Agenten. Salesforces 30 neue Slackbot-Funktionen, Anthropics Conway-Plattform und Liquid AIs winziges Agentenmodell zeigen in dieselbe Richtung: KI-Systeme, die autonom handeln, dauerhaft aktiv bleiben und über Tools und APIs mit der realen Welt verbunden sind. Die Infrastruktur für agentische KI wird gerade jetzt gebaut.

    Und dann ist da die Frage des Vertrauens. Anthropic hat innerhalb von fünf Tagen den eigenen Quellcode und Details zu einem unveröffentlichten Frontier-Modell geleakt. Die Harvard-MIT-Studie zeigt, dass KI-Agenten unvorhersehbar handeln können. Washington State unterzeichnet Sicherheitsgesetze, während 78 Chatbot-Gesetzesvorlagen durch 27 weitere Legislativen laufen. Die Branche baut schnell. Ob sie sorgfältig genug baut, bleibt offen.

    Ready to explore how Agentic AI can transform your organization? Visit us at https://www.callista.ch/agentic-ai to discover how we can guide your journey into this exciting new era of AI-powered productivity.

    Quellen

    - TechCrunch - "Salesforce announces an AI-heavy makeover for Slack, with 30 new features" - 31. März 2026

    - CNBC - "Eli Lilly reaches $2.75 billion deal with Insilico to bring AI-developed drugs to the global market" - 29. März 2026

    - Defense One - "Startup debuts agentic AI assistant for war" - April 2026

    - CNBC - "Oracle cutting thousands in latest layoff round as company continues to ramp AI spending" - 31. März 2026

    - TechCrunch - "OpenAI, not yet public, raises $3B from retail investors in monster $122B fund raise" - 31. März 2026

    - Bloomberg - "OpenAI Valued at $852 Billion After Completing $122 Billion Round" - 31. März 2026

    - OpenAI Help Center - "What to know about the Sora discontinuation" - 2026

    - TechCrunch - "Why OpenAI really shut down Sora" - 29. März 2026

    - Variety - "OpenAI Will Shut Down Sora Video App; Disney Drops Plans for $1 Billion Investment" - 2026

    - TechCrunch - "OpenAI acquires TBPN, the buzzy founder-led business talk show" - 2. April 2026

    - Dataconomy - "Anthropic Tests Conway As A Persistent Agent Platform For Claude" - 3. April 2026

    - TestingCatalog - "Exclusive: Anthropic tests its own always-on 'Conway' agent" - 1. April 2026

    - Fortune - "Anthropic leaks its own AI coding tool's source code in second major security breach" - 31. März 2026

    - Fortune - "Exclusive: Anthropic left details of an unreleased model in a public database" - 26. März 2026

    - TechRadar - "Anthropic confirms it leaked 512,000 lines of Claude Code source code" - 31. März 2026

    - Google Open Source Blog - "Gemma 4: Expanding the Gemmaverse with Apache 2.0" - März 2026

    - Engadget - "Google releases Gemma 4, a family of open models built off of Gemini 3" - 2. April 2026

    - Caixin Global - "Alibaba Releases Qwen 3.6-Plus AI Model With Enhanced Coding Capabilities" - 2. April 2026

    - NVIDIA - "DLSS 4.5 Dynamic Multi Frame Generation & Multi Frame Generation 6X Available Now" - 31. März 2026

    - MarkTechPost - "Liquid AI Releases LFM2.5: A Compact AI Model Family For Real On-Device Agents" - 2026

    - Transparency Coalition - "AI Legislative Update: April 3, 2026" - 3. April 2026

    - GenAI Zurich - "GenAI Zurich 2026 - Main Stage Day 1" - 1. April 2026

    - EPFL - "EPFL and ETH Zurich enhance collaboration to boost AI in Switzerland" - 2026

    - Google Research Blog - "TurboQuant: Redefining AI efficiency with extreme compression" - 2026

    - BigDataWire - "Google's TurboQuant Marks a Fundamental Shift in How AI Systems Scale" - 1. April 2026

    - VentureBeat - "Google's new TurboQuant algorithm speeds up AI memory 8x, cutting costs by 50% or more" - 2026

    - Boston Institute of Analytics - "Agentic AI Weekly Roundup Mar 29-Apr 3 2026" - 3. April 2026