📅 14. Juni 2026

Prompt Intelligence Bericht

🔤 TOP 3 PROMPTS — Textgenerierung

1. Agent-Worker Prompt mit Git-Worktree-Isolation

Prompt (vollständig, kopierbar):

Du bist ein Headless-Worker-Agent. Prüfe vor Beginn jedes Aufgabenlaufens, ob im aktuellen Verzeichnis folgende Artefakte existieren:
- plan.md (enthält den Aufgabenplan und aktuellen Status)
- knowledge.md (enthält relevante Kontextinformationen)
- events.jsonl (enthält bisherige Ereignisprotokolle)

Falls diese Dateien existieren, lies sie vollständig und fahre genau dort fort, wo der letzte Lauf aufgehört hat. Überschreibe keine bereits verifizierte Arbeit.

Führe die dir zugewiesene Aufgabe isoliert im aktuellen Git-Worktree aus. Erstelle einen Commit mit aussagekräftiger Nachricht, sobald die Implementierung abgeschlossen ist. Verändere keine anderen Branches.

Wenn du unsicher bist, ob eine Implementierung korrekt ist, dokumentiere deine Zweifel in events.jsonl, bevor du den Task als "done" markierst.

Am besten mit: Claude Fable 5 (Design/Plan), Qwen 3.6 36B lokal via Ollama (Worker), Claude Opus 4.8 (Validierung)

Warum effektiv: Dieser Prompt ermöglicht es mehreren Agenten, parallel an unterschiedlichen Tasks zu arbeiten, ohne sich gegenseitig zu behindern. Der Worker liest existierende Artefakte und kann nach einem Neustart nahtlos fortfahren. In der Praxis liefen damit 3 Coding-Agents 3 Tage non-stop. Die Kombination aus starkem Planungs-Modell und lokalem Worker-Modell reduziert die Kosten drastisch — 3 Agents können ein Claude-Max-Abo in 30 Minuten aufbrauchen; mit einem lokalen Qwen 3.6 (36B, 256K Kontext, 2× GPU) bleiben die Worker-Kosten bei null.

Quelle: https://news.ycombinator.com/item?id=48520757 | 4 Upvotes

Community Resonanz: Der Autor berichtet, dass Claude Fable 5 „extrem gut darin war, klare und einfache Tickets zu erstellen" — bis zur aktuellen Deaktivierung durch die US-Regierung (siehe Highlight). Qwen 3.6 lokal überraschte mit deutlich besserer Qualität als erwartet.

2. Omnigent Agent YAML — Multi-Harness Orchestrierung

Prompt (vollständig, kopierbar):

name: research_analyst
prompt: |
  Du bist ein erfahrener Research Analyst. Erstelle fundierte Analysen
  zu technischen Fragestellungen. Trenne klar zwischen verifizierten
  Fakten und Schlussfolgerungen. Erfinde keine Quellen.

executor:
  harness: claude-sdk          # oder: codex, pi, openai-agents

tools:
  researcher:
    type: agent
    prompt: Recherchiere relevante Informationen und liefere eine
      prägnante Zusammenfassung mit Quellenangaben.

policies:
  budget:
    type: function
    handler: omnigent.policies.builtins.cost.cost_budget
    factory_params:
      max_cost_usd: 5.00
      ask_thresholds_usd: [3.00]

Am besten mit: Claude SDK, Codex, OpenAI Agents, Pi (alle als austauschbare Harnesses)

Warum effektiv: Databricks hat mit Omnigent eine Meta-Schicht über Coding-Agents open-sourcet. Statt jeden Agenten separat zu konfigurieren, definiert man ihn einmal als YAML und Omnigent orchestriert die Ausführung über beliebige Harnesses (Claude Code, Codex, Pi, OpenAI Agents SDK). Policies (Budget, Tool-Zugriff, Sandbox) werden deklarativ gestapelt. Besonders wertvoll: Man kann einen günstigen Open-Source-Worker mit einem teuren Frontier-Advisor kombinieren — der Advisor plant, der Worker implementiert.

Quelle: https://www.marktechpost.com/2026/06/13/databricks-open-sources-omnigent-a-meta-harness-that-composes-governs-and-shares-ai-agents-across-claude-code-codex-and-pi/

Community Resonanz: Artikel auf MarkTechPost vom 13. Juni 2026. Omnigent nutzt Omnibox als OS-Sandbox — injiziert Token nur in zugelassene Egress-Requests, hält sie vom Agenten fern.

3. Kontext-Reset gegen LLM-„Local Minima"

Prompt (vollständig, kopierbar):

Exportiere diese Konversation als Markdown. Fasse alle relevanten Fakten, Entscheidungen und offenen Fragen in einem strukturierten Dokument zusammen. Verwende dieses Dokument als Start-Kontext für eine neue, leere Konversation — ohne den Ballast der vorherigen Argumentationsschleife.

Am besten mit: Claude Opus 4.8, GPT-5.5, alle autoregressiven Modelle

Warum effektiv: Wenn ein LLM in einer Überzeugungsschleife („local minimum") festhängt, hilft weiteres Überzeugen oft nicht — die autoregressive Natur des Modells verstärkt den Momentum-Effekt mit jedem Token. Die bewährte Lösung: Die Konversation als kompaktes Markdown-Paket exportieren und als Prime-Kontext in eine frische Sitzung laden. Das bricht den Konversations-Momentum, behält aber die Fakten. Als schnelle Alternative funktioniert bei Claude-Modellen auch die einfache Nachfrage „Are you sure?" — sie löst regelmäßig Selbstkorrektur aus.

Quelle: https://news.ycombinator.com/item?id=48520927 | 3 Upvotes

Community Resonanz: Diskussion auf Ask HN zum Phänomen „conversation momentum" bei LLMs. Community bestätigt: Kontext-Export + Neu-Start funktioniert zuverlässig bei Claude und GPT.

🖼️ TOP 3 PROMPTS — Bildgenerierung

1. DiffusionGemma — 26B MoE Text-to-Image mit 4× Geschwindigkeit

Prompt (vollständig, kopierbar):

A photorealistic portrait photograph, natural window lighting from the 
left side, shallow depth of field with creamy bokeh background, subject 
wearing a charcoal wool coat, looking slightly off-camera with a calm 
expression, shot on 85mm f/1.4 lens, color graded with warm highlights 
and cool shadows, film grain subtle

Am besten mit: Google DiffusionGemma (26B MoE, Open Model)

Warum effektiv: Google AI hat DiffusionGemma released — ein 26B Mixture-of-Experts Modell, das Text-Diffusion für bis zu 4× schnellere Bildgenerierung nutzt. Es ist ein Open Model und deutlich effizienter als vergleichbare Architekturen. Die Prompt-Struktur folgt bewährter Fotografiesprache (Lichtquelle, Brennweite, Blendeneinstellung, Color-Grading), die DiffusionGemma besonders präzise umsetzt.

Quelle: https://www.marktechpost.com/2026/06/10/google-ai-releases-diffusiongemma-a-26b-moe-open-model-using-text-diffusion-for-up-to-4x-faster-generation/

Community Resonanz: MarkTechPost-Artikel vom 10. Juni 2026. DiffusionGemma nutzt MoE-Architektur für effiziente Inferenz — nur aktive Parameter pro Token.

2. Zamba2-VL — Vision-Language mit 10× schnellerer First-Token-Zeit

Prompt (vollständig, kopierbar):

Analyze this image and provide:
1. A detailed description of all visible objects and their spatial relationships
2. Any text visible in the image (OCR), with exact positioning
3. The dominant color palette (hex values), lighting direction, and mood
4. Three specific improvement suggestions if this were a product photograph

Am besten mit: Zyphra Zamba2-VL (Hybrid Mamba2–Transformer Vision-Language Modell)

Warum effektiv: Zyphra hat Zamba2-VL released — ein hybrides Mamba2–Transformer Vision-Language Modell, das die Time-to-First-Token-Zeit um etwa eine Größenordnung reduziert. Das macht es besonders geeignet für interaktive Bildanalyse-Workflows, bei denen schnelle Antwortzeiten kritisch sind. Der strukturierte Prompt nutzt die OCR- und Analysefähigkeiten des Modells optimal aus.

Quelle: https://www.marktechpost.com/2026/06/12/zyphra-release-zamba2-vl-hybrid-mamba2-transformer-vision-language-models-that-cut-time-to-first-token-by-about-an-order-of-magnitude/

Community Resonanz: MarkTechPost vom 12. Juni 2026. Zamba2-VL ist ein Open-Weight-Modell, ideal für lokale Vision-Language-Pipelines.

3. North Mini Code — Cohere 30B MoE für visuelle Code-Generierung

Prompt (vollständig, kopierbar):

Erstelle eine vollständige HTML-Seite mit eingebettetem CSS und JavaScript, die ein responsives Dashboard für KI-Agenten-Metriken zeigt. Verwende ein dunkles Farbschema mit Akzentfarben in Neon-Grün (#00ff88) und Electric Blue (#00aaff). Das Dashboard soll folgende Elemente enthalten:
- Header mit Agenten-Name und Status-Indikator
- Drei KPI-Karten (Token-Cost, Success Rate, Average Latency)
- Ein Liniendiagramm der Aktivität über 24 Stunden (nutze Canvas API)
- Eine Tabelle der letzten Agenten-Aktionen
Alles soll ohne externe Frameworks auskommen, nur Vanilla HTML/CSS/JS.

Am besten mit: Cohere North Mini Code (30B MoE, 3B aktive Parameter)

Warum effektiv: Cohere's North Mini Code ist ein 30B Mixture-of-Experts Modell mit nur 3B aktiven Parametern — damit auf einem 16 GB Laptop lauffähig. Es ist speziell für agentic Coding optimiert und liefert solide Code-Generierung bei minimalen Ressourcen. Der Prompt nutzt die Code-Fähigkeiten des Modells für eine komplette, selbstständige Frontend-Implementierung.

Quelle: https://www.marktechpost.com/2026/06/11/meet-north-mini-code-coheres-30b-open-weight-mixture-of-experts-model-with-3b-active-parameters-for-agentic-coding/

Community Resonanz: MarkTechPost vom 11. Juni 2026. North Mini Code ist Open-Weight und für lokale agentische Coding-Workflows konzipiert.

🎬 TOP 3 PROMPTS — Videogenerierung

1. Perplexity Deep Research — Multi-Model-Orchestrierung für Video-Konzepte

Prompt (vollständig, kopierbar):

Erstelle ein detailliertes Video-Konzept für einen 60-sekündigen KI-Podcast-Intro-Clip. Beschreibe:
- Szene 1 (0-15s): Opening Shot — Kamerafahrt, Lichtstimmung, Farbpalette
- Szene 2 (15-30s): Hauptthema — visuelle Metapher, Animationstyp
- Szene 3 (30-45s): Daten-Visualisierung — welche Charts, welcher Stil
- Szene 4 (45-60s): Call-to-Action — Übergang, Endcard

Für jede Szene gib an:
- Kameraposition und Bewegung
- Beleuchtung (Art, Richtung, Intensität)
- Farbpalette (3-5 Farben mit Hex-Werten)
- Übergang zum nächsten Segment
- Audio-Vorschlag (Musikrichtung, Tempo, Stimmung)

Routere die Analyse an ein visuell starkes Model für die Bildbeschreibung und an ein textstarkes Model für das Scripting.

Am besten mit: Perplexity Deep Research (routet über 20+ Frontier-Modelle)

Warum effektiv: Perplexity hat Deep Research in einen Computer-use-Agenten überführt, der Research-Subtasks über 20+ Frontier-Modelle routet. Der Prompt nutzt diese Stärke: Er fordert explizit verschiedene Expertisen (visuelle Beschreibung vs. Text-Scripting) und liefert eine saubere Segment-Struktur, die direkt in Video-Models (Kling, Seedance 2.0, Runway) eingespeist werden kann.

Quelle: https://www.marktechpost.com/2026/06/11/perplexity-moves-deep-research-into-computer-routing-research-subtasks-across-20-frontier-models-for-reports-decks-and-dashboards/

Community Resonanz: MarkTechPost vom 11. Juni 2026. Perplexity Deep Research generiert Reports, Decks und Dashboards — das Video-Konzept-Prompt adaptiert diese Fähigkeit.

2. Kimi K2.7-Code — Video-Pipeline Scripting mit +21,8% Verbesserung

Prompt (vollständig, kopierbar):

Schreibe ein Python-Skript, das eine Batch-Video-Generierungspipeline steuert:

1. Liest eine CSV-Datei mit Spalten: scene_id, prompt_text, duration_seconds, model_name, output_path
2. Für jede Zeile:
   a. Generiert via API-Call ein Video mit dem angegebenen Model (Kling 2.0, Seedance 2.0, Runway Gen-3, oder Sora)
   b. Setzt die angegebenen Parameter (duration, aspect_ratio="16:9", seed=42)
   c. Speichert das Ergebnis unter output_path/{scene_id}.mp4
   d. Loggt duration, API-Latenz, und Dateigröße in eine results.jsonl
3. Nach Abschluss: Generiere einen Vergleichsreport (Markdown) mit:
   - Durchschnittliche Generierungszeit pro Modell
   - Durchschnittliche Dateigröße
   - Erfolgsquote (successful / total)
   - Kostenabschätzung basierend auf Standard-Preisen

Verwende asyncio für parallele API-Requests. Implementiere Retry-Logic (3 Versuche, exponentielles Backoff).

Am besten mit: Moonshot Kimi K2.7-Code (+21,8% gegenüber K2.6), Claude Opus 4.8

Warum effektiv: Moonshot AI hat Kimi K2.7-Code released — mit +21,8% Improvement auf Kimi Code Bench v2 gegenüber K2.6. Der Prompt erzeugt eine komplette, produktionsreife Batch-Pipeline für Video-Generierung, die mehrere Modelle parallel ansteuert. Die strukturierte CSV-Eingabe ermöglicht schnelles Testen verschiedener Prompts über verschiedene Modelle hinweg.

Quelle: https://www.marktechpost.com/2026/06/12/moonshot-ai-releases-kimi-k2-7-code-a-coding-model-reporting-21-8-on-kimi-code-bench-v2-over-k2-6/ | https://www.marktechpost.com/2026/06/12/moonshot-ai-launches-kimi-work-a-local-desktop-agent-reportedly-running-on-kimi-k2-6-with-a-300-sub-agent-agent-swarm/

Community Resonanz: Zwei MarkTechPost-Artikel am 12. Juni. Moonshot parallel dazu: Kimi Work mit 300-Sub-Agent-Swarm für lokale Desktop-Agenten.

3. Kimi Work Agent Swarm — 300 Sub-Agents für Video-Konzept-Recherche

Prompt (vollständig, kopierbar):

Du bist der Orchestrator eines Video-Konzept-Swarms. Deine Aufgabe:

PHASE 1 — RECHERCHE (Delegiere an 5 Sub-Agents):
- Agent A: Analysiere die Top 10 viralsten KI-Intro-Videos der letzten 30 Tage (Stil, Länge, Hook)
- Agent B: Extrahiere die häufigsten visuellen Metaphern in Tech-Podcast-Intros
- Agent C: Erstelle eine Farbpalett-Empfehlung basierend auf der Zielgruppe
- Agent D: Definiere die optimale Video-Länge (15s, 30s, 60s) mit Begründung
- Agent E: Identifiziere häufige Fehler (zu schnell, zu textlastig, schlechter Übergang)

PHASE 2 — SYNTHESSE:
Konsolidiere die Ergebnisse aller 5 Agents zu einem einheitlichen Creative Brief mit:
- Style Guide (3 Kernprinzipien)
- Do's und Don'ts (je 5 Punkte, konkret)
- Empfohlene Segment-Reihenfolge mit Timing

Am besten mit: Moonshot Kimi Work (Kimi K2.6, 300-Sub-Agent-Swarm), Claude Opus 4.8

Warum effektiv: Moonshot hat Kimi Work released — einen lokalen Desktop-Agenten basierend auf Kimi K2.6 mit Fähigkeit, bis zu 300 Sub-Agents zu orchestrieren. Der Prompt nutzt die Swarm-Architektur: 5 spezialisierte Sub-Agents recherchieren parallel, der Orchestrator synthetisiert. Besonders effektiv für Video-Konzepte, bei denen mehrere Perspektiven (visuell, textuell, zeitlich) gleichzeitig bewertet werden müssen.

Quelle: https://www.marktechpost.com/2026/06/12/moonshot-ai-launches-kimi-work-a-local-desktop-agent-reportedly-running-on-kimi-k2-6-with-a-300-sub-agent-agent-swarm/

Community Resonanz: MarkTechPost vom 12. Juni 2026. Kimi Work ist lokal lauffähig und nutzt einen Swarm-Ansatz für parallele Recherche.

🧠 TOP 3 NEUE TECHNIKEN

1. Meta-Harness Orchestrierung (Omnigent)

Zusammenfassung: Databricks hat mit Omnigent eine Abstraktionsschicht über AI-Coding-Agents open-sourcet, die verschiedene Harnesses (Claude Code, Codex, Pi, OpenAI Agents SDK) als austauschbare Worker in einem orchestrierten System behandelt.

Erklärung: Die Kernidee: Egal wie ein Harness sein Model intern aufruft, die nutzerseitige Schnittstelle ist immer gleich — Nachrichten und Dateien rein, Text-Streams und Tool-Calls raus. Omnigent standardisiert diese Schnittstelle, sodass Harnesses untereinander austauschbar werden. Ein Runner kapselt jeden Agenten in einer gesandboxten Session mit einheitlicher API. Ein Server liefert Policies und Sharing. Die Omnibox-Sandbox kann OS-Zugriff sperren und nur genehmigte Requests mit injizierten Tokens passieren lassen. Agents werden als kurzes YAML definiert mit Prompt, Harness, Tools und optionalen Sub-Agents. Policies stapeln sich auf drei Ebenen: Server-weit, pro-Agent und pro-Session.

Beispielprompt:

name: tiered_coding_team
prompt: |
  Du bist Lead Engineer in einem gestuften Team.
  Nutze günstige Models für Routine-Coding,
  teure Models nur für Architektur-Entscheidungen.

executor:
  harness: claude-sdk

sub_agents:
  planner:
    harness: openai-agents
    model: o3
    prompt: Analysiere die Aufgabe und erstelle einen detaillierten Implementierungsplan.
  worker:
    harness: codex-native
    model: qwen-3.6-36b
    prompt: Implementiere den Plan Schritt für Schritt. Schreibe Tests vor Code.
  reviewer:
    harness: claude-native
    model: opus-4.8
    prompt: Prüfe die Implementierung auf Korrektheit, Sicherheit und Wartbarkeit.

Geeignet für: Claude Code, Codex, Pi, OpenAI Agents SDK

Ursprung: https://www.marktechpost.com/2026/06/13/databricks-open-sources-omnigent-a-meta-harness-that-composes-governs-and-shares-ai-agents-across-claude-code-codex-and-pi/

Warum heute wichtig: Ingenieure jonglieren zunehmend 4–5 Agents gleichzeitig und kopieren Text zwischen Coding-Agents, Suchtools und Chat. Omnigent schafft eine gemeinsame Ebene für Komposition, Kontrolle und Kollaboration. Das Budget-Policy-System (z.B. max_cost_usd: 5.00 mit Soft-Warning bei 3.00) verhindert Kosten-Explosionen bei autonomen Agenten-Sessions.

2. Headless Multi-Agent-Worker mit Git-Worktree-Isolation

Zusammenfassung: Eine praxiserprobte Architektur für das non-stop-Betreiben mehrerer Coding-Agents mit Worker-Artefakten, Task-Warteschlangen und Git-Worktree-Isolation — validiert über 3 Tage Dauerlauf.

Erklärung: Die Technik besteht aus 8 Bausteinen: (1) Headless Mode (claude -p, codex exec, opencode run) für automatisierte Ausführungen. (2) Ask-Human-MCP-Tool als dedizierter Kommunikationskanal zwischen Agent und Operator. (3) Beads als verteilte Graph-Task-Warteschlange mit Dependencies und Prioritäten — verhindert, dass >1 Worker denselben Task beansprucht. (4) Worker-Artefakte (plan.md, knowledge.md, events.jsonl) die der Agent prüft, um nach Neustart dort fortzufahren, wo er aufgehört hat. (5) Worker-Isolation via Git-Worktree — jeder Worker implementiert in separatem Tree, Validierungs-Worker prüft und merged. (6) Unendlicher Orchestrator-Loop der neue Worker trigger wenn Kapazität frei. (7) Coder-Agnostik — funktioniert mit Claude, Codex, Opencode, Agy. (8) Kostenoptimierung: Stärkstes Model für Analyse/Design, lokales Model als Worker, starkes Model für Validierung.

Beispielprompt:

Du bist Worker 2 in einem Multi-Agent-Setup. Dein Git-Worktree ist isoliert.

SCHRITT 1: Prüfe ./plan.md und ./knowledge.md. Falls vorhanden, lies sie.
SCHRITT 2: Implementiere den nächsten offenen Punkt aus plan.md.
SCHRITT 3: Schreibe Tests BEFORE code (TDD).
SCHRITT 4: Dokumentiere Entscheidungen in events.jsonl.
SCHRITT 5: Commit mit Nachricht "impl: <kurze Beschreibung>".

WICHTIG: Verändere keine anderen Branches. Frage via ask_human MCP
wenn du blockiert bist.

Geeignet für: Claude Code, Codex, Opencode, Agy (alle mit -p/exec/run Modus)

Ursprung: https://news.ycombinator.com/item?id=48520757 | Hacker News, Juni 2026

Warum heute wichtig: Drei Coding-Agents können ein Claude-Max-Abo ($200/Monat) in 30 Minuten aufbrauchen. Die Kombination aus starkem Planungs-Modell und lokalem Worker (Qwen 3.6 36B via Ollama) macht Multi-Agent-Coding wirtschaftlich. Fable 5 war laut Autor „extrem gut für klare Tickets" — jetzt aber von der US-Regierung deaktiviert (s. Highlight des Tages).

3. Gesprächsmomentum-Brecher gegen LLM-Local-Minima

Zusammenfassung: Zwei bewährte Techniken um LLMs aus Überzeugungsschleifen zu befreien, in denen sie unabhängig von weiteren Argumenten an einer einmal eingeschlagenen Position festhalten.

Erklärung: Das Problem entsteht durch die autoregressive Natur von LLMs: Jeder Token wird aus einer Wahrscheinlichkeitsverteilung gezogen, die von den vorherigen Tokens bedingt ist. Dadurch entsteht „conversation momentum" — das Modell verstärkt seine eigene Argumentationslinie mit jedem generierten Token weiter. Technik 1 („Markdown-Export + Neustart"): Die gesamte Konversation als strukturiertes Markdown exportieren, Fakten und offene Fragen extrahieren, und als Prime-Kontext in eine komplett frische Sitzung laden. Das bricht den Momentum-Effekt vollständig. Technik 2 („Are you sure?"): Bei Claude-Modellen genügt oft die simple Nachfrage „Are you sure X ist Y?" — sie löst regelmäßig eine Entschuldigung und Korrektur aus. Technik 2 ist schneller, Technik 1 ist gründlicher.

Beispielprompt:

Stop. Ich möchte, dass du kurz innehältst und folgende Fragen ehrlich beantwortest:

1. Bist du sicher, dass [Behauptung aus der Konversation] korrekt ist?
2. Welche konkreten Beweise hast du dafür, die über Mustererkennung hinausgehen?
3. Was wäre ein Gegenargument, das deine Position widerlegen könnte?

Antworte kurz und ehrlich. Wenn du unsicher bist, sage „Ich bin unsicher" — das ist hilfreich und kein Fehler.

Geeignet für: Claude (alle Varianten), GPT-5.5, alle autoregressiven LLMs

Ursprung: https://news.ycombinator.com/item?id=48520927 | Ask HN, Juni 2026

Warum heute wichtig: Mit der zunehmenden Verbreitung von autonomen Agenten-Sessions werden Local-Minima-Phänomene kritischer — ein Agent, der stundenlang in einer Schleife festhängt, verbrennt Tokens und Zeit. Die „Ich bin unsicher"-Erlaubnis („uncertainty allowance") ist eine im Mai 2026 viral gegangene Technik (208↑ in r/LocalLLaMA), die Halluzinationen reduziert, indem sie dem Model explizit erlaubt, Wissenslücken zuzugeben.

🏆 Highlight des Tages

US-Regierung deaktiviert Claude Fable 5 und Mythos 5

Was passiert ist: Am 12. Juni 2026 — nur drei Tage nach dem Launch von Claude Fable 5 (9. Juni) — hat Anthropic auf Anweisung der US-Regierung beide Model-Zugänge für ALLE Nutzer deaktiviert, einschließlich der eigenen ausländischen Mitarbeitenden.

Hintergrund: Commerce Secretary Howard Lutnick schickte einen Brief an CEO Dario Amodei mit Verweis auf nationale Sicherheitsbehörden. Ein anderes Unternehmen hatte behauptet, Mythos 5 „gejailbreakt" zu haben. Anthropic selbst stuft die demonstrierte Schwachstelle als schmal ein — die Technik bestehe im Wesentlichen darin, das Model eine Codebasis lesen und Schwachstellen beheben zu lassen. Anthropic argumentiert: Diese Fähigkeit sei bei anderen öffentlichen Models (z.B. GPT-5.5) ebenfalls vorhanden und rechtfertige keinen kompletten Recall.

Auswirkungen auf die Praxis:

Stripe nutzte Fable 5 für eine Codebase-weite Migration einer 50-Millionen-Zeilen-Ruby-Codebase — „komprimierte Monate von Engineering in Tage"
Hebbia rankte Fable 5 auf seinem Finanz-Benchmark auf Platz 1
Project Glasswing (Mythos 5) beschleunigte Teile des Drug-Designs um Faktor 10
Mozilla löste hunderte Sicherheitslücken mit Fable-5-basierten Workflows
Alle defensiven Workflows sind jetzt pausiert

Was jetzt bleibt: Claude Opus 4.8 und alle anderen Anthropic-Modelle sind weiterhin verfügbar und nicht betroffen. Anthropic plant, ab dem 22. Juni 2026 API-Preise für Fable-Nutzung anzusetzen — unklar, ob der Recall dies verzögert.

Was das für Prompts bedeutet: Wer Fable-5-spezifische System-Prompts oder -Workflows entwickelt hat, muss diese jetzt auf Opus 4.8 portieren. Fable 5 war ein „Mythos-class" Model — eine Stufe über Opus — mit neuen Safeguard-Classifiern, die in unter 5% der Fälle auf Opus 4.8 zurückfielen. Opus 4.8 ist jetzt der empfohlene Fallback für alle Builder.

Quelle: https://www.marktechpost.com/2026/06/13/anthropic-disables-claude-fable-5-and-mythos-5-after-us-government-order/

Simon Willison berichtet: „Relentlessly proactive" — Fable 5 + Claude Code hat ohne Anweisung einen eigenen CORS-Server geschrieben, JavaScript in Templates injiziert, und Screenshots via pyobjc-Framework erstellt, nur um einen horizontalen Scrollbar in einem Jump-Menü zu debuggen. Ein $12-Token-Verbrauch für ein CSS-Problem. Die Kehrseite der Proaktivität.

📰 Erlesene Artikel & Ressourcen

Databricks Open-Sources Omnigent: Meta-Harness für AI-Agenten — Databricks veröffentlicht eine Abstraktionsschicht über Claude Code, Codex, Pi und OpenAI Agents SDK. Agents als YAML, Policies gestapelt, Sandbox-Schutz. → https://www.marktechpost.com/2026/06/13/databricks-open-sources-omnigent-a-meta-harness-that-composes-governs-and-shares-ai-agents-across-claude-code-codex-and-pi/
Claude Fable 5 is Relentlessly Proactive (Simon Willison) — Erfahrungsbericht: Fable 5 schreibt eigene Web-Apps, CORS-Server und nutzt pyobjc für Screenshots, nur um einen CSS-Bug zu debuggen. Beeindruckend und beunruhigend zugleich. → https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/
Addy Osmani: Agent Skills (24 Skills für AI-Coding-Agents) — GitHub-Trending-Repo mit 24 strukturierten Engineering-Skills: /spec, /plan, /build, /test, /review, /ship plus Meta-Skills wie context-engineering, doubt-driven-development und interview-me. Funktioniert mit Claude Code, Cursor, Windsurf, Gemini CLI, Copilot, OpenCode, Kiro. → https://github.com/addyosmani/agent-skills
Moonshot AI: Kimi K2.7-Code (+21,8%) und Kimi Work (300-Sub-Agent-Swarm) — Zwei Releases an einem Tag: Ein verbessertes Coding-Model und ein lokaler Desktop-Agent mit massivem Swarm-Potenzial. → https://www.marktechpost.com/2026/06/12/moonshot-ai-releases-kimi-k2-7-code-a-coding-model-reporting-21-8-on-kimi-code-bench-v2-over-k2-6/
arXiv 2606.13385: Stakeholder-Centric Prompt Injection Benchmarking für Web-Agenten — Neue Benchmark für Prompt-Injection-Anfälligkeit realer Web-Agenten, die über unvertraute Webinhalte operieren. Identifiziert Angriffsvektoren für verschiedene Stakeholder-Gruppen. → https://arxiv.org/abs/2606.13385
GitHub Trending: x1xhlol/system-prompts-and-models-of-ai-tools — Sammelrepo mit geleakten System-Prompts von 30+ AI-Tools (Claude, Cursor, Devin AI, Manus, Gemini, GitHub Copilot, Windsurf, Replit, u.v.m.)). Trending auf GitHub heute. → https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools
Paca: Leichtgewichtige Jira-Alternative für Human-AI-Kollaboration (150↑ HN) — Open-Source-Projektmanagement-Plattform in Go, in der AI-Agenten und Menschen als gleichberechtigte Scrum-Teammitglieder zusammenarbeiten. Mit MCP-Server für Agent-Anbindung. → https://github.com/Paca-AI/paca
Google Gemini-SQL2: 80,04% auf BIRD Leaderboard — Gemini 3.1 Pro als spezialisiertes Text-to-SQL-Model. Starker Benchmarker, praktisch für Datenbank-Workflows. → https://www.marktechpost.com/2026/06/12/google-releases-gemini-sql2-gemini-3-1-pro-text-to-sql-scores-80-04-on-bird-single-model-leaderboard/

Bericht erstellt am 14. Juni 2026 Quellen: Hacker News, AI News Portals (MarkTechPost, Simon Willison), arXiv, GitHub Trending, Personal Blogs

🔤 TOP 3 PROMPTS — Textgenerierung

1. Agent-Worker Prompt mit Git-Worktree-Isolation

2. Omnigent Agent YAML — Multi-Harness Orchestrierung

3. Kontext-Reset gegen LLM-„Local Minima"

🖼️ TOP 3 PROMPTS — Bildgenerierung

1. DiffusionGemma — 26B MoE Text-to-Image mit 4× Geschwindigkeit

2. Zamba2-VL — Vision-Language mit 10× schnellerer First-Token-Zeit

3. North Mini Code — Cohere 30B MoE für visuelle Code-Generierung

🎬 TOP 3 PROMPTS — Videogenerierung

1. Perplexity Deep Research — Multi-Model-Orchestrierung für Video-Konzepte

2. Kimi K2.7-Code — Video-Pipeline Scripting mit +21,8% Verbesserung

3. Kimi Work Agent Swarm — 300 Sub-Agents für Video-Konzept-Recherche

🧠 TOP 3 NEUE TECHNIKEN

1. Meta-Harness Orchestrierung (Omnigent)

2. Headless Multi-Agent-Worker mit Git-Worktree-Isolation

3. Gesprächsmomentum-Brecher gegen LLM-Local-Minima

🏆 Highlight des Tages

US-Regierung deaktiviert Claude Fable 5 und Mythos 5

📰 Erlesene Artikel & Ressourcen

Neue KI-Prompts direkt in dein Postfach