Anthropic-Messages wird zur Inter-Vendor-Schicht: Qwen 3.7 Max landet in OpenCode Go
28. Mai 2026. OpenCode, ein Open-Source-Harness für agentisches Coding, hat am 27. Mai Alibabas Qwen 3.7 Max-Preview in den eigenen Go-Subscription-Tarif aufgenommen. Das Modell akzeptiert das Anthropic-Messages-Format nativ am Endpunkt — kein Übersetzungs-Shim, sondern der Wire-Stack selbst. Damit ist die Anthropic-Protokoll-Schicht zwischen Harness und Modell zur Inter-Vendor-Sprache geworden, ohne dass ein Standardisierungs-Gremium etwas dazu erklärt hätte.

Was ist passiert
OpenCode hat am 27. Mai 2026 das Modell Qwen 3.7 Max-Preview in seinen Go-Subscription-Tarif aufgenommen. Qwen 3.7 Max selbst wurde am 19. Mai von Alibaba bereitgestellt: 1-Million-Token-Kontextfenster, $2,50 / $7,50 pro Million Input/Output-Token und 90 Prozent Cached-Input-Rabatt. Architektonisch zählt nicht das Preisniveau, sondern die Endpunkt-Spezifikation: Qwen 3.7 Max akzeptiert das Anthropic-Messages-Format direkt am Wire, einschliesslich Tool-Use-Schemas, Streaming-Chunk-Grenzen und Reasoning-Content-Feldern. Wer Claude Code oder OpenClaw bisher gegen Claude Opus 4.7 betrieben hat, ändert ANTHROPIC_BASE_URL, ANTHROPIC_API_KEY und Modell-ID — der gleiche Harness läuft gegen Qwen, ohne dass eine Zeile Tool-Definition-Code angefasst werden muss.
Einordnung
Methodisch ist das eine Protokoll-Verschiebung, kein Produkt-Update. Eine vendor-spezifische API-Spezifikation wird zur de-facto-Inter-Vendor-Schicht, ohne dass die Linux Foundation oder eine IETF-Working-Group das deklariert hätte. Anthropic hat das Messages-Format für die eigenen Modelle entworfen; Alibaba implementiert es nativ, weil der Claude-Code-Workflow von einigen Hunderttausend Entwicklern den Format-Stack als Distributionsvehikel etabliert hat. Die gleiche Bewegung wie beim OpenAI-Chat-Completions-Format, eine Schicht höher: Messages umfasst die agentische Semantik (Werkzeug-Aufrufe, Reasoning-Spuren), nicht die blosse Konversations-Form. Die Anthropic Messages stehen damit neben MCP und A2A als dritte Inter-Vendor-Konvergenz-Spur — diesmal zwischen Harness und Modell.
Bedeutung für den Mittelstand
Für unsere Kundschaft ist das eine doppelte Botschaft. Die gute Seite zuerst: Modell-Risiko wird vom Harness-Risiko entkoppelt. Wer Claude Code oder OpenCode im Workflow hat und Bedenken gegen die Hosting-Topologie entwickelt, wechselt das Modell, ohne den Stack neu zu bauen. Routing-Entscheidung statt Re-Implementierung.
Compliance-seitig ist die Botschaft härter. Qwen 3.7 Max läuft auf Alibaba-Modelstudio in der VR China, on-premises gibt es nicht, das Modell ist proprietär und API-only. Wer den Drop-in nur wegen der Kosten macht, hat eine DSFA-Pflicht ausgelöst: Drittland-Transfer nach China braucht eine Rechtsgrundlage nach Art. 49 DSGVO oder Standardvertragsklauseln, das BSI hat zur Einstufung chinesischer Cloud-Anbieter mehrfach Position bezogen, und unter NIS-2, DORA oder MaRisk gehört die Modell-Quelle in das Drittparteien-Risiko-Inventar. Die saubere Variante für Personendaten- oder Geschäftsgeheimnis-Workloads bleibt Claude oder GPT auf EU-Region oder ein selbst gehostetes Open-Weight-Modell.
Bedeutung für die technische Entwicklung
Architektonisch lässt sich die Konsequenz in drei sauberen Schichten zeichnen. Erste Schicht Harness: Claude Code, OpenCode, OpenClaw, Codex CLI, Cursor. Zweite Schicht Protokoll: Anthropic Messages zwischen Harness und Modell, MCP für Werkzeug-Anbindung, A2A für Agent-zu-Agent. Dritte Schicht Modell: Claude, GPT, Qwen, Gemini, ein selbst-gehostetes Llama oder Mistral. Solange die Protokoll-Schicht stabil bleibt, sind Modell-Wechsel reine Routing-Entscheidungen — die richtige Trennung für Compliance-getriebene Modell-Pluralität, weil dieselbe Pipeline für verschiedene Daten-Klassen gegen verschiedene Backends fahren kann.
Operativ heisst das, den Routing-Layer als eigenes Element zu behandeln: eine Policy, die je nach Workload-Klassifikation zwischen den verfügbaren Backends entscheidet, mit auditierbarer Log-Spur. Das Anthropic-Format ist dann Schnittstelle, nicht Vendor-Bindung.
Konkrete Handlungsempfehlung
In dieser Reihenfolge. Erstens, inventarisieren Sie binnen vierzehn Tagen, welche Agenten-Workloads aktuell gegen Anthropic-Messages-Endpunkte fahren und welche Daten-Klassen jeweils durchlaufen. Zweitens, prüfen Sie pro Workload-Klasse den Drittland-Transfer-Status (TOMs, AVV, ggf. DSFA für Personenbezug oder Geschäftsgeheimnis). Drittens, bewerten Sie die Qwen-Option nicht primär nach Token-Preis, sondern nach Drittland-Profil: für Workloads ohne Personenbezug und ohne Geschäftsgeheimnis ein legitimer Hebel, für regulierte Workloads nicht. Wenn diese Schritte aus eigener Kraft nicht laufen, sprechen Sie mit uns. Moselwal baut Agenten-Stacks, in denen die Modell-Schicht austauschbar ist und die Protokoll-Schicht stabil bleibt.
Dieser Beitrag spiegelt unsere technische und strategische Einschätzung. Er ersetzt keine Rechtsberatung und keine Datenschutz-Folgenabschätzung.
Quellen
- OpenCode — Qwen 3.7 Max in Go-Subscription (X-Post, 27.05.2026)
- Qwen Team — Qwen3.7: The Agent Frontier (22.05.2026)
- ofox.ai — Qwen 3.7 Max Developer Guide: 1M Context, $2.50/MTok, and the Anthropic-Protocol Drop-In (24.05.2026)
- Radical Data Science — AI News Briefs Bulletin Board, Eintrag zu OpenCode Go (27.05.2026)
Über die Autorin
Kim Hartwig
Kim verantwortet das operative Geschäft und begleitet unsere Kunden strategisch im Alltag. Ihre Expertise in der Computerlinguistik vereint kommunikatives Verständnis mit technologischem Know-how.