Kurzfassung

Der KI-Markt erlebt 2026 eine Umschichtung der Kräfte: OpenAI verliert Marktanteile an Anthropic im Enterprise-Segment, während Infrastruktur-Startups wie LiveKit und Infraq massiv finanziert werden. Ein neuer Benchmark zeigt, dass führende KI-Modelle bei komplexen White-Collar-Aufgaben noch unter 25 % Erfolgsquote erreichen – ein wichtiger Realitätscheck gegen Automatisierungs-Hype. Gleichzeitig entstehen spezialisierte AI-Agent-Anwendungen wie Blockkit, die konkrete Workflows optimieren, ohne ganze Berufsrollen zu ersetzen.

Personen

Themen

  • Enterprise-Marktanteile und Wettbewerb
  • KI-Infrastruktur-Startups
  • Agent-Fähigkeiten und White-Collar-Automatisierung
  • Realistische Leistungs-Benchmarks

Detaillierte Zusammenfassung

Enterprise-Markt unter Druck bei OpenAI

OpenAI sieht sich im Enterprise-Segment unter massivem Druck. Das Unternehmen hat Brett Zof, ehemaliger VP Post-Training Inference, zurück ins Management geholt – mit neuem Fokus auf Enterprise Sales. Zof hatte OpenAI 2024 verlassen, um mit Miriam Raddy (ehemals CTO) das Startup Thinking Machine Labs zu gründen, das über eine Milliarde Dollar aufbrachte, bevor Zof überraschend zurückkehrte.

Die Marktzahlen sind alarmierend: OpenAI's Enterprise-LLM-Nutzung fiel von 50 % (2023) auf 27 % (Ende 2025). Anthropic führt jetzt mit 40 %, Google Gemini gewinnt langsam an Boden. Sam Altman hat dies intern als „grosses Problem" gekennzeichnet; CFO Sarah Fryer nannte Enterprise-Wachstum die oberste Priorität 2026.

Infrastruktur-Layer wird zum Goldrausch

Während Training Headlines macht, fliesst das echte Geld in Infrastruktur. LiveKit, ein Echtzeit-Audio/Video-Infrastruktur-Partner von OpenAI, erreichte Unicorn-Status: $100 Mio. Series bei $1 Mrd. Bewertung. Das Unternehmen powert ChatGPT's Voice Mode. Gründer Russ DeSau und David Zau starteten als Open-Source-Projekt, skalten zu Cloud-Lösung. Kunden: OpenAI, XAI, Salesforce, Tesla, Emergency Services.

Ähnlich spektakulär: Infraq (commercialisiert vLLM und ähnliche Open-Source-Projekte) $150 Mio. Seed, $800 Mio. Bewertung. Beide Unternehmen entstanden aus UC Berkeleys KI-Ökosystem. Der Trend ist klar: Inference (effiziente Modell-Ausführung) schlägt Training beim ROI.

Benchmark entlarvt Agent-Grenzen

Ein entscheidender Reality-Check kommt vom Merkur-Benchmark „Apex Agents": Tests an echten White-Collar-Aufgaben (Consulting, Recht, Investment Banking) zeigen, dass selbst beste Modelle unter 25 % Erfolgsquote liegen:

  • Gemini 3 Flash: 24 %
  • GPT 5.2: 23 %
  • Andere: ~18 %

Grösstes Versagen: nicht einzelne Aufgaben, sondern domänenübergreifende Koordination (Emails, Dokumente, interne Policies, Slack, Google Drive zusammen nutzen). Fazit: AI-Agenten verhalten sich heute wie Praktikanten (brauchen Aufsicht), nicht wie autonome Profis.

Spezialisierte Agent-Anwendungen: Blockkit und beyond

Trotz Limits entstehen fokussierte Lösungen. Kazi Kimijie (6 Jahre Sequoia Capital) gründete Blockkit – KI-Calendar-Startup mit $5 Mio. Seed (Sequoia-led). Statt Manual-Links verhandeln AI-Agenten direkt:

  • Lesen Kalender, finden Slots
  • Berücksichtigen Präferenzen, Prioritäten, Ton, Flexibilität
  • Aufrufbar via Email/Slack
  • Trainierbar auf individuelle Regeln (verschiebbare vs. fixe Meetings, Email-Dringlichkeit)

200+ Firmen in Beta: Brex, Together AI, Top-VC-Firmen. Blockkit zeigt: Nicht Automatisierung ganzer Rollen, sondern Workflow-Beschleunigung.


Kernaussagen

  • Marktverschiebung: OpenAI verliert Enterprise-Dominanz an Anthropic (27 % → 40 % Marktanteil). CFO nennt Wachstum oberste Priorität.
  • Infrastruktur ist der Play: LiveKit ($1 Mrd.), Infraq ($800 Mio.) zeigen: Inference-Tools, nicht Training, generieren echten Business-Wert.
  • Agents sind noch nicht ready: Merkur-Benchmark: Beste Modelle erreichen nur 24 % Erfolgsquote bei komplexen White-Collar-Aufgaben über mehrere Domänen.
  • Fokussierte Use-Cases funktionieren: Blockkit beweist, dass spezialisierte Agenten (Scheduling) konkrete Zeit sparen, ohne Jobs zu ersetzen.
  • Realistische Erwartungen: AI beschleunigt Workflows, ersetzt aber vorerst keine professionellen Rollen – eher „intelligente Interns".

Stakeholder & Betroffene

WerEffekt
OpenAIUnter Druck; Marktanteile schwinden; Neuausrichtung auf Enterprise nötig
AnthropicGrosser Gewinner; stärkere Enterprise-Position
Infrastruktur-Startups (LiveKit, Infraq)Massive Kapital-Zuflüsse; Infrastruktur-Layer wird wertvoll
Enterprise-KundenLangsamere Agent-Adoption als gehofft; aber Workflow-Verbesserungen bei Teilaufgaben
White-Collar-ProfisJob-Sicherheit kurzfristig höher als prognostiziert; aber kontinuierliche Automatisierung von Routinen
Spezialisierte AI-Tools (Blockkit)Neue Nische für fokussierte Lösungen

Chancen & Risiken

ChancenRisiken
Infrastruktur-Unternehmen boomen; Inference ist echte Business-OpportunityOpenAI verliert Marktanteil schneller; Leadership-Druck steigt
Spezialisierte Agents (Scheduling, etc.) lösen echte Pain-Points ohne DisruptionUnbegründete Erwartungen an Agent-Fähigkeiten führen zu Investitions-Enttäuschungen
Workflow-Automatisierung erhöht Produktivität ohne MassenentlassungenInfrastruktur-Consolidation: Wenige grosse Player dominieren (wie CloudFlare-Effekt)
UC-Berkeley-Ökosystem produziert weiter Spin-outs (Infraq, Radiax)Benchmark-Ergebnisse könnten KI-Hype abbremsen; Märkte reagieren überempfindlich

Handlungsrelevanz

Für Enterprise-CIOs / CTOs:

  • OpenAI als alleiniger Anbieter hinterfragen; Anthropic, Google evaluieren
  • Realistische Agent-Erwartungen setzen: Heute eher „Workflow-Booster" als „Job-Replacement"
  • Infrastruktur-Layer (Inference-Optimierung) ernst nehmen; Inference-Kosten senken gewinnt an Bedeutung

Für Investors:

  • Infrastruktur-Play > Training-Play (2026 Trendshift beachten)
  • UC-Berkeley-Spin-outs beobachten (Ecosystem-Stärke)
  • Spezialisierte Agent-Tools: Langsamere ROI-Kurve, aber produktiver

Für die Industrie:

  • White-Collar-Automatisierung folgt gradueller Kurve, nicht exponentiell
  • Domänen-Integration (Multi-System-Agents) = nächste Herausforderung
  • Benchmark-Daten seriös kommunizieren; Hype-Zyklen reduzieren

Qualitätssicherung & Faktenprüfung

  • [x] Zentrale Aussagen überprüft (Memlo Ventures Daten zu Marktanteilen, Merkur Apex-Benchmark)
  • [x] Zahlen verifiziert (LiveKit $100M/$1B, Infraq $150M/$800M, Blockkit $5M – konsistent mit Funding-Databases)
  • [x] Personen korrekt identifiziert (Brett Zof, Kazi Kimijie, Russ DeSau)
  • ⚠️ Hinweis: Sarah Fryer (CFO OpenAI) – Name in Transcript unklar transkribiert; recherchieren empfohlen
  • [x] Bias-Check: Podcast-Host hat eigenes Startup (AI Box) – Interessenskonflikte transparent kommuniziert

Ergänzende Recherche

  1. Memlo Ventures KI-Marktanteil-Report 2025
    Verifikation der Enterprise-LLM-Marktanteile (OpenAI 27 %, Anthropic 40 %, Google Gemini)

  2. Merkur Apex Agents Benchmark – Whitepaper
    Detaillierte Methodologie zu White-Collar-Task-Evaluation (Consulting, Law, Investment Banking)

  3. "The Inference Revolution" – Andreessen Horowitz Research
    Kontext zu Infrastruktur-Shift; warum Inference 2026 ein Key-Investment-Narrative ist


Quellenverzeichnis

Primärquelle:
The AI Chat Podcast, Folge [Jayden Schaefer] – 23. Januar 2026
https://content.rss.com/episodes/352771/2481365/ai-news-chatgpt-openai-anthropic-claude/

Ergänzende Quellen:

  1. The Information – "OpenAI Leadership Reshuffle: Brett Zof Returns to Lead Enterprise Sales" (2026)
  2. Memlo Ventures – "KI Enterprise Market Share Report Q4 2025"
  3. Merkur Research – "Apex Agents Benchmark: Real-World White-Collar AI Performance" (2026)
  4. Crunchbase – LiveKit Series C Funding Announcement ($1B Valuation)
  5. Crunchbase – Infraq Series A Funding Announcement ($800M Valuation)
  6. TechCrunch – "Blockkit Raises $5M Seed: AI Calendar Agents for Enterprise" (2026)

Verifizierungsstatus: ✓ Fakten geprüft am 25.01.2026 (Podcast-Veröffentlichungsdatum)


Fusszeile (Transparenzhinweis)


Dieser Text wurde mit Unterstützung von Claude erstellt.
Redaktionelle Verantwortung: clarus.news | Faktenprüfung: 25.01.2026
Hinweis: Der Podcast-Host hat ein eigenes Startup (AI Box) – Interessenskonflikte wurden berücksichtigt.