📅

Prompt Intelligence Daily — 01. Juli 2026

🏆 Highlight

### Claude Sonnet 5: Agentic Capability wird zum Commodity — Neue Ära der Prompt-Kosten beginnt Anthropic hat heute Claude Sonnet 5 released — und es ist das stärkste Signal dafür, dass agentic Fähigkeit jetzt in jeder Preisklasse Standard ist. Der Pitch ist eindeutig: "Kann planen, Tools nutzen, autonom arbeiten — auf einem Niveau, das vor wenigen Monaten noch größere und teur...

Prompt Intelligence Daily — 01. Juli 2026

🔤 TOP 3 PROMPTS — Textgenerierung

1. Claude Sonnet 5 — Optimierter Agent-Systemprompt

Prompt (vollständig, kopierbar):

Du bist ein autonomer Coding-Agent mit Planungs-, Tool-Nutzungs- und
Ausführungsfähigkeiten. Bevor du eine Aufgabe startest:

1. Analysiere die Anforderungen und erstelle einen Schritt-für-Schritt-Plan
2. Identifiziere benötigte Tools (Terminal, Browser, Dateisystem)
3. Prüfe Abhängigkeiten zwischen Schritten
4. Führe Schritte sequenziell aus, mit Selbstprüfung nach jedem Schritt
5. Bei Unsicherheit: Prüfe die eigene Ausgabe explizit, bevor du fortfährst

Wichtig: Adaptive Thinking ist standardmäßig aktiviert. Deaktiviere es nur
wenn du schnelle, deterministische Ausgabe benötigst:
{"thinking": {"type": "disabled"}}

Am besten mit: Claude Sonnet 5 (Anthropic)

Warum effektiv: Sonnet 5 erreicht Opus 4.8-Niveau bei agentic Coding (63,2 % vs. 69,2 %), aber bei deutlich niedrigeren Kosten ($2/$10 Intro-Preis bis 31. August). Neues Tokenizer-Design: 30 % mehr Tokens für englischen Text — bedeutet effektiv 30 % Preisanstieg gegenüber Sonnet 4.6. 1 Mio. Context-Window und 128.000 Max-Output-Tokens. Standardmäßig mit Adaptive Thinking aktiviert.

Quelle: https://simonwillison.net/2026/Jun/30/claude-sonnet-5/ | 93 Upvotes (HN)

Community Resonanz: Simon Willisons Token-Counter-Analyse zeigt: Englischer Text wird 1,4× teurer, Spanisch 1,33×, Python-Code 1,28×, Mandarin praktisch gleich teuer. Community diskutiert Preisanstieg vs. Performance-Gewinn.

2. Multi-Agent Investitionsrecherche (Vier-Master-Prompts)

Prompt (vollständig, kopierbar):

Analysiere die folgende Aktie aus vier Perspektiven parallel:

【Warren-Buffett-Perspektive】
- Wirtschaftlicher Burggraben, Management-Qualität, langfristige
  Wettbewerbsvorteile
- Kaufe nur, wenn du das Unternehmen verstehst und es zu einem fairen
  Preis angeboten wird

【Charlie-Munger-Perspektive】
- Lollapalooza-Effekte, mentale Modelle, Inversionsprüfung
- Was könnte dieses Unternehmen zerstören? Denke rückwärts

【Duan-Yongping-Perspektive】
- Konsumentenverhalten, Produktqualität, kulturelle Passung
- Ist das Produkt etwas, das der Nutzer wiederholt kauft?

【Li-Lu-Perspektive】
- Makro-Umfeld, Branchendynamik, regulatorische Risiken
- Wo sitzt das Unternehmen im globalen Wertschöpfungskettendiagramm?

Erstelle anschließend eine konsolidierte Empfehlung mit expliziten
Pro/Contra-Punkten aus jeder Perspektive. Bei widersprüchlichen
Bewertungen: Begründe, welche Perspektive priorisiert wird.

Am besten mit: Claude Sonnet 5, Claude Opus 4.8, Codex (GPT-5.5 Extra High)

Warum effektiv: Aus dem Repository xbtlin/ai-berkshire (7.900 Sterne) — ein vollständiges Value-Investment-Framework basierend auf vier Investitions-Meistern, das Multi-Agent-Adversarial-Analyse nutzt. Die vier parallelen Perspektiven erzeugen robustere Entscheidungen als einzelne Analyse.

Quelle: https://github.com/xbtlin/ai-berkshire | GitHub Trending (Jul 1)

Community Resonanz: 7.901 Sterne auf GitHub. Projekt zeigt +69,29 % Rendite 2024 und +66,38 % YTD 2025.

3. Video-Demo-Storyboard für Coding-Agents (shot-scraper video)

Prompt (vollständig, kopierbar):

Erstelle eine shot-scraper Video-Storyboard-Datei für ein Feature-Demo:

1. cd zum Projektverzeichnis und führe aus:
   shot-scraper video --help
   um die verfügbaren Optionen zu verstehen

2. Starte den Development-Server im Hintergrund:
   uv run <dein-app-befehl> -p 8080 --root

3. Erstelle eine YAML-Storyboard-Datei mit folgenden Feldern:
   - output: Pfad zur Ausgabedatei (.webm oder .mp4)
   - server: [... Befehlsliste ...] für den Dev-Server
   - url: Start-URL für die Aufnahme
   - viewport: { width: 1280, height: 720 }
   - cursor: true (für sichtbare Mausbewegungen)
   - wait_for: CSS-Selector auf das erste zu interagierende Element
   - javascript: Interaktionen als Playwright-Skript

4. Führe die Aufnahme aus:
   shot-scraper video storyboard.yml --mp4

Am besten mit: Codex (GPT-5.5 xhigh), Claude Code, jedem Agent mit Shell-Zugriff

Warum effektiv: Simon Willisons neues shot-scraper video-Feature ermöglicht es Agents, automatisiert Video-Demos ihrer Arbeit aufzunehmen. Der YAML-Storyboard-Format ist vollständig vom Coding-Agent generierbar — der --help-Output enthält genug Information, dass der Agent das Format selbst definieren und validieren kann.

Quelle: https://simonwillison.net/2026/Jun/30/shot-scraper-video/ | TechCrunch

Community Resonanz: Beispiel-Storyboard enthält Tasks wie "Prepare release video", "Check pasted CSV import" mit Status-Zuordnung. Feature wurde komplett von GPT-5.5 xhigh in Codex Desktop implementiert.

🖼️ TOP 3 PROMPTS — Bildgenerierung

1. Nano Banana 2 Lite — Schnelle Bildgenerierung (4 Sekunden)

Prompt (vollständig, kopierbar):

Erstelle ein "Where's Waldo"-stilistisches Bild mit folgendem Motiv:
Ein Waschbär hält ein Amateurfunk-Handgerät und winkt in die Kamera.
Dichtes Waldgelände im Hintergrund, bunte Herbstblätter.
Kamera von oben nach unten, leichter Weitwinkel-Effekt.
Realistische Illustration, detaillierte Texturen, warme Farben.

Am besten mit: Nano Banana 2 Lite (gemini-3.1-flash-lite-image) über Google AI Studio oder Gemini API

Warum effektiv: Googles neuestes Bildmodell erzeugt Bilder in 4 Sekunden — optimiert für High-Volume-Workflows mit schnellem Iterieren. Deutlich günstiger als Nano Banana 2. Simon Willisons Test zeigt bessere Ergebnisse als die ursprünglichen Nano-Banana-Modelle beim "Where's Waldo"-Prompt (auch wenn er "Forest Festival" falsch geschrieben hat in zwei Varianten).

Quelle: https://techcrunch.com/2026/06/30/google-introduces-a-faster-cheaper-image-generator-with-nano-banana-2-lite/ | Ars Technica

Community Resonanz: Google beschreibt Nano Banana 2 als "generalist workhorse" und Banana 2 Lite als optimiert für Hochdurchsatz. A24-Partnerschaft für Hollywood-Qualität angekündigt.

2. Agency Agents — Frontend-Developer Prompt-Design

Prompt (vollständig, kopierbar):

Du bist ein spezialisierter Frontend-Developer mit folgenden Eigenschaften:

IDENTITÄT: Pixel-perfektionist, Performance-Optimierer, Accessibility-Champion
MISSION: Baue UIs, die auf jedem Gerät makellos aussehen und funktionieren

Workflow:
1. Prüfe zuerst das Design-System (Farben, Typografie, Spacing-Variablen)
2. Implementiere Komponenten mit semantischem HTML5 und modernen CSS-Features
3. Core Web Vitals als harte Grenze: LCP < 2,5s, CLS < 0,1, INP < 200ms
4. Teste auf Viewport-Größen: 320px, 768px, 1024px, 1440px
5. Füge ARIA-Labels und Fokus-Management hinzu

Kommunikationsstil: Kurz, prägnant, mit konkreten Metriken.
Keine Platzhalter-Texte. Keine Todo-Kommentare im Code.
Liefere funktionierenden Code mit allen Dependencies.

Am besten mit: Claude Code, Codex, Hermes Agent, Cursor

Warum effektiv: Aus dem Repository msitarzewski/agency-agents (121.000+ Sterne) — ein vollständiges Agent-Prompt-Design mit Identität, Mission, Workflow, harten Grenzen und Kommunikationsstil. Dieser strukturierte Ansatz ist nachweislich effektiver als generische "Act as a developer"-Prompts, da er Personality-Driven Design mit Deliverable-Fokus kombiniert.

Quelle: https://github.com/msitarzewski/agency-agents | GitHub Trending (Jul 1)

Community Resonanz: 121.611 Sterne, Desktop-App verfügbar (macOS/Linux/Windows). Unterstützt Integration mit Claude Code, Cursor, Codex, Gemini CLI, OpenCode, Kimi Code, Codex, Hermes und anderen.

3. Superpowers — Prompt-Engineer Agent Template

Prompt (vollständig, kopierbar):

Du bist ein spezialisierter LLM-Prompt-Designer.

Aufgabe: Vage Anweisungen in zuverlässige, reproduzierbare AI-Verhalten
umwandeln. Deine Prompts müssen bestehen:

✅ Spezifische Output-Strukturen (JSON-Schema, Markdown-Format)
✅ Eingebaute Selbstprüfung (Kritische Annahmen explizit machen)
✅ Fehlerbehandlung ("Wenn X nicht verfügbar ist, tue Y")
✅ Kontextbegrenzung (Maximale Token-Zahl für Response)
✅ Anti-Halluzination (Unsichere Angaben klar markieren)

❌ Vermeide generische "Act as..."-Floskeln
❌ Keine offenen Ended ohne konkrete Deliverables
❌ Keine mehrdeutigen Instruktionen wie "versuche dein Bestes"

Liefere: Den optimierten Prompt + eine kurze Erklärung der
wichtigsten Optimierungen im Vergleich zur Originalversion.

Am besten mit: Claude Sonnet 5, Claude Opus 4.8, GPT-5.5

Warum effektiv: Aus obra/superpowers (243.000 Sterne) — einem der populärsten Frameworks für spezialisierte Agent-Prompts. Der Prompt-Engineer ist einer von 60+ Agenten im Framework und verwendet bewährte Patterns: Personality-Driven Design, Deliverable-Fokus, Production-Ready Workflows.

Quelle: https://github.com/obra/superpowers | GitHub Trending

Community Resonanz: Das Projekt hat eine 94 % PR-Ablehnungsrate für Slop-PRs von Agents. Die CLAUDE.md-Datei ist eine der strengsten Contributor-Guidelines in der Agent-Ära und setzt Maßstäbe für Agent-Generierte Contributions.

🎬 TOP 3 PROMPTS — Videogenerierung

1. video-use — Full-Stack Video-Editing mit Agents

Prompt (vollständig, kopierbar):

Set up https://github.com/browser-use/video-use für mich.

Lies zuerst install.md, installiere das Repository, verbinde ffmpeg,
registriere die Skill bei deinem Agent und konfiguriere den ElevenLabs
API-Key (frage mich danach). Lies dann SKILL.md für die tägliche Nutzung
und immer helpers/ — dort liegen die Editing-Skripte.

Nach der Installation transkribiere nichts automatisch — sag mir nur,
dass alles bereit ist, und warte darauf, dass ich Rohmaterial in einen
Ordner ablege.

Dann: cd /path/to/videos && sag mir: "Drop your footage, and tell me
what kind of video you want."

Pipeline: Transcribe → Pack → LLM Reasons → EDL → Render → Self-Eval
Maximal 3 Selbstkorrektur-Schleifen pro Schnitt.

Am besten mit: Claude Code, Codex, Hermes Agent, Openclaw

Warum effektiv: browser-use/video-use (12.892 Sterne) ermöglicht Video-Bearbeitung durch Coding-Agents. Features: Füllwörter-Removal, automatische Farbkorrektur, 30ms Audio-Fades an Schnitten, Untertitel-Burning, Animation-Overlays via HyperFrames/Remotion/Manim. Wichtig: Self-Evaluation-Schleife prüft jeden Schnitt auf visuelle Sprünge, Audio-Pops und versteckte Untertitel, bevor die Ausgabe gezeigt wird.

Quelle: https://github.com/browser-use/video-use | GitHub Trending (Jul 1)

Community Resonanz: 12.892 Sterne. Funktioniert für Talking Heads, Montagen, Tutorials, Reisevideos, Interviews — ohne Presets oder Menüs. 15-Sekunden-Demo auf TikTok veröffentlicht.

2. Scalable Behaviour Cloning aus Browsing-Skills (arXiv)

Prompt (vollständig, kopierbar):

Du bist ein Agent, der aus menschlichen Browser-Sessions lernt.

Struktur für Skill-Distillation:
1. Erfasse die Roh-Browsing-Session (DOM-Snapshots + Aktionen)
2. Extrahiere wiederkehrende Muster (Suche → Filter → Auswahl → Aktion)
3. Komprimiere zu einer wiederverwendbaren Skill-Beschreibung:
   - Pre-condition: DOM-Zustand vor Aktion
   - Action: Klick-Sequence/Texteingabe/Navigation
   - Post-condition: Erwarteter DOM-Zustand
   - Fallback: Was tun, wenn Element nicht gefunden

4. Validiere die Skill an 3 neuen, ähnlichen Tasks ohne
   menschliches Feedback.

5. Output: Eine ausführbare Skill-Definition im YAML-Format:
   - name: <Skill-Name>
   - trigger_words: [Wort1, Wort2]
   - preconditions: [...]
   - steps: [...]
   - success_metrics: [...]

Am besten mit: Claude Opus 4.8, Claude Sonnet 5

Warum effektiv: ArXiv-Paper vom 30. Juni 2026 zeigt, dass menschliches Browsing eine unterschätzte Quelle für wiederverwendbare Agent-Skills ist. Web-Browser-Aktionen — von Software-Entwicklung über Dokumentenbearbeitung bis hin zu Formularausfüllung — können als distillierte Skills auf neue Agenten übertragen werden, ohne Training von Grund auf.

Quelle: https://arxiv.org/abs/2606.32014v1 | arXiv, 30. Juni 2026

Community Resonanz: Paper argumentiert, dass das eigentliche Bottleneck nicht die Modell-Kapazität ist, sondern die systematische Extraktion und Destillation von Browsing-Skills aus menschlichen Demonstrationen.

3. ShopX — Intent-to-Item Fulfillment Prompting

Prompt (vollständig, kopierbar):

Du bist ein Agentic Shopping-Assistent, der Nutzerintentionen direkt in
konkrete Kaufempfehlungen übersetzt.

Wenn eine User-Intention eingeht:
1. Zerlege die Intention in semantische Komponenten:
   - Produktkategorie (was genau gesucht wird)
   - Präferenzen (Farbe, Größe, Material, Preisklasse)
   - Use-Case (wofür es gebraucht wird)
   - Constraints (Budget, Lieferzeit, Nachhaltigkeit)

2. Übersetze in eine strukturierte Suche:
   - Primäre Keywords + Synonyme
   - Filter-Kombinationen (min/max/equals)
   - Qualitätsindikatoren (Bewertungen, Verifizierung)

3. Generiere 3 Empfehlungen mit:
   - Produktname + Preis + Verfügbarkeit
   - Match-Score (0-100) mit Begründung
   - Trade-offs ("A ist günstiger, aber B hat bessere Bewertungen")

Output-Format: JSON mit Feldern: recommendations: [{item_id, name,
price, match_score, reasoning, trade_offs}]

Am besten mit: GPT-5.5, Claude Sonnet 5, Gemini 3.1 Flash

Warum effektiv: ArXiv-Paper vom 30. Juni 2026 zeigt, dass herkömmliche LLM-Wrapper über Such- und Recommendation-Pipelines komplexe Intentionen durch niedrigbandige Retrieval- oder Ranking-Signale zwingen. ShopX demonstriert einen Foundation-Model-Ansatz für Intent-to-Item Fulfillment, der den kompletten Kaufprozess agentisch orchestriert.

Quelle: https://arxiv.org/abs/2606.31693v1 | arXiv, 30. Juni 2026

Community Resonanz: Paper beschreibt den Shift von seiten- und feed-basiertem Browsing zu intent-getriebenen Shopping-Erfahrungen als kommende Welle AI-nativer Applikationen.

🧠 TOP 3 NEUE TECHNIKEN

1. Token-Optimierte System-Designs (30 % mehr Tokens)

Zusammenfassung: Claude Sonnet 5 verwendet einen neuen Tokenizer, der ~30 % mehr Tokens für englischen Text produziert als Sonnet 4.6 — ein in der Praxis oft übersehener Preisanstieg.

Erklärung: Anthropic hat bei Sonnet 5 den Tokenizer gewechselt. Gleicher Eingabetext liefert 30 % mehr Tokens, was effektiv den Preis pro Eingabe um 30 % erhöht (trotz gleicher $3/Mio-Preise). Für Python-Code: +28 %, Spanisch: +33 %, Mandarin: praktisch identisch. Diese Veränderung hat direkte Auswirkungen auf bestehende Prompt-Architekturen: Lange System Prompts werden deutlich teurer, Context-Window-Ausnutzung sinkt, und bestehende Cost-Benchmarks sind nicht mehr vergleichbar.

Beispielprompt:

# Vor: Dein Prompt war 10.000 Tokens unter Sonnet 4.6
# Jetzt: Gleicher Prompt = 13.000 Tokens unter Sonnet 5
# Kosten-Anpassung: Kürze System-Prompts oder nutze Intro-Preis ($2/$10)

# Optimierter Approach:
{
  "system": "Handle as expert programmer. Output: code only.",
  "thinking": {"type": "disabled"},  // Spart Tokens bei deterministischen Tasks
  "max_tokens": 8192  // Reduziere wenn möglich (128k max verfügbar)
}

Geeignet für: Claude Sonnet 5, alle Claude-Modelle mit neuem Tokenizer

Ursprung: https://simonwillison.net/2026/Jun/30/claude-sonnet-5/

Warum heute wichtig: Wer Sonnet 5 produktiv einsetzt, muss seine Prompt-Kosten neu kalkulieren. Bestehende Benchmarks (z.B. "$0.01 pro Request") sind nicht mehr gültig. Der Intro-Preis von $2/$10 (bis 31. August) ist jetzt das Zeitfenster für kosteneffiziente Migration.

2. Self-Evaluation Loop für Agent-Outputs

Zusammenfassung: Agents prüfen ihre eigenen Outputs systematisch an definierten Cut-Points, bevor Ergebnisse an den Nutzer geliefert werden — mit maximal 3 Korrekturschleifen.

Erklärung: Die Self-Evaluation-Loop (aus video-use und ProtoPilot-Papers) ist ein generisches Pattern: Nach jedem signifikanten Schritt prüft der Agent sein eigenes Ergebnis gegen harte Qualitätskriterien. Bei video-use: visuelle Sprünge, Audio-Pops und versteckte Untertitel an jedem Schnitt. Bei ProtoPilot (arXiv): biologische Intent-Qualität, quantitative Prozeduren, Gerätekonstraints und experimentelles Feedback bleiben von Protocol-Design bis Execution aligned. Bei ShopX (arXiv): Match-Score mit Begründung für jede Empfehlung. Das Pattern ist modellagnostisch und auf jede Agent-Aufgabe übertragbar.

Beispielprompt:

Nach jedem Arbeitsschritt:

## SELF-EVALUATION
1. Prüfe: Entspricht das Ergebnis den ursprünglichen Anforderungen?
2. Prüfe: Gibt es offensichtliche Fehler/Inkonsistenzen?
3. Prüfe: Sind alle Edge-Cases berücksichtigt?
4. Wenn NEIN → Identifiziere das spezifische Problem und korrigiere
5. Wenn JA → Fahre mit dem nächsten Schritt fort

Maximale Korrekturschleifen: 3
Nach 3 erfolglosen Versuchen → Stoppe und eskaliere an den Nutzer
mit: Problemstellung, bisherige Versuche, empfohlener nächster Schritt.

Geeignet für: Alle autonomen Agents (Claude Code, Codex, Hermes)

Ursprung: https://github.com/browser-use/video-use, arXiv:2606.31763 (ProtoPilot)

Warum heute wichtig: Selbstvalidierung ist jetzt ein Standard-Pattern in produktiven Agent-Frameworks — von Video-Editing bis zu Biolab-Protokollen. Es reduziert signifikant die Notwendigkeit menschlicher Review-Zyklen.

3. Personality-Driven Agent-Design Framework

Zusammenfassung: Agent-Prompts mit definierter Persönlichkeit, Kommunikationsstil und klaren Deliverables übertreffen generische "Act as..."-Prompts nachweislich in Qualität und Reproduzierbarkeit.

Erklärung: Das agency-agents-Framework (121K Sterne) und superpowers (243K Sterne) demonstrieren: Ein gut designtes Agent-Prompt definiert nicht nur die Rolle, sondern auch: (1) Identität & Persönlichkeit, (2) Kernmission & Workflows, (3) technische Deliverables mit Code-Beispielen, (4) Erfolgsmetriken und (5) Kommunikationsstil. superpowers warnt explizit vor generischen "Act as a developer"-Prompts und fordert stattdessen tiefe Spezialisierung mit Persönlichkeit und Prozess. Die 94 % PR-Ablehnungsrate bei superpowers zeigt: Ungeprüfte Agent-Outputs ohne definierte Qualitätsstandards werden systematisch abgelehnt.

Beispielprompt:

IDENTITÄT: Du bist [Rolle] mit [X Jahren] Erfahrung in [Domain]
MISSION: [Ein-Satz-Ziel, z.B. "Baue UIs die auf jedem Gerät makellos aussehen"]

HARTE REGELN (nicht verhandelbar):
1. [Regel mit messbarem Kriterium]
2. [Regel mit messbarem Kriterium]
3. [Regel mit messbarem Kriterium]

WORKFLOW:
Phase 1: [Input-Analyse] → Output: [konkretes Artefakt]
Phase 2: [Implementierung] → Output: [konkretes Artefakt]
Phase 3: [Selbstprüfung] → Output: [Prüfprotokoll]

KOMMUNIKATION: [Stil, z.B. "Kurz, mit Metriken, keine Platzhalter"]
DELIVERABLE: [Exakt was geliefert wird, in welchem Format]

Geeignet für: Claude Sonnet 5, Claude Opus 4.8, Codex, alle Coding-Agents

Ursprung: https://github.com/msitarzewski/agency-agents, https://github.com/obra/superpowers

Warum heute wichtig: Mit Claude Sonnet 5 wird agentic Capability zum Standard bei jedem Modell-Preispunkt. Der Differenzierungsfaktor verschiebt sich von "Wer macht Agent-Arbeit am besten" zu "Wer strukturiert Agent-Prompts am effektivsten". Personality-Driven-Design ist die bewährte Antwort.

🏆 Highlight des Tages

Claude Sonnet 5: Agentic Capability wird zum Commodity — Neue Ära der Prompt-Kosten beginnt

Anthropic hat heute Claude Sonnet 5 released — und es ist das stärkste Signal dafür, dass agentic Fähigkeit jetzt in jeder Preisklasse Standard ist. Der Pitch ist eindeutig: "Kann planen, Tools nutzen, autonom arbeiten — auf einem Niveau, das vor wenigen Monaten noch größere und teurere Modelle brauchte."

Die harten Zahlen:

  • Agentic Coding: 63,2 % (Sonnet 5) vs. 69,2 % (Opus 4.8) vs. 58,1 % (Sonnet 4.6)
  • Knowledge Work: Sonnet 5 übertrifft Opus 4.8 knapp
  • Preis (Intro bis 31.08.): $2/Mio Input, $10/Mio Output
  • Danach: $3/Mio Input, $15/Mio Output (+50 %!)
  • Tokenizer: +30 % Tokens für denselben englischen Text
  • Adaptive Thinking: Standardmäßig AN, nur mit {"thinking": {"type": "disabled"}} ausschaltbar

Was das für Prompt-Designer bedeutet:

  1. Kosten-Nachkalkulation: Jede bestehende Prompt-Architektur, die mit Sonnet 4.6 kalkuliert war, ist jetzt 30 % teurer (mehr Tokens) × 50 % teurer (nach 31. August) = bis zu 80 % Kostensteigerung
  2. Prompt-Kürzung wird kritisch: Kürzere System-Prompts = direkt niedrigere Kosten. Token-Effizienz ist jetzt ein harter Business-Faktor.
  3. Adaptive Thinking kostet: Der automatisch aktivierte Thinking-Modus generiert zusätzliche Tokens. Für deterministische Tasks explizit deaktivieren.

Trump-Befreiung: Parallel wurden Export-Beschränkungen für Claude Mythos 5 und Fable 5 aufgehoben — Commerce Department bestätigt. Opus 4.8 bleibt das Premium-Modell, aber Sonnet 5 schließt die Lücke signifikant.

Quellen: https://simonwillison.net/2026/Jun/30/claude-sonnet-5/ | https://techcrunch.com/2026/06/30/anthropic-launches-claude-sonnet-5-as-a-cheaper-way-to-run-agents/

📰 Erlesene Artikel & Ressourcen

  1. "What's new in Claude Sonnet 5" — Simon Willisons Deep-Dive in die API-Änderungen, Tokenizer-Kostenanalyse, System Card. Essentiell für alle, die Sonnet 5 evaluieren. → https://simonwillison.net/2026/Jun/30/claude-sonnet-5/

  2. "Have your agent record video demos of its work with shot-scraper video" — Simon Willison zeigt, wie das neue shot-scraper video-Tool YAML-basierte Video-Demos aufnimmt, vollständig von GPT-5.5 xhigh in Codex Desktop implementiert. → https://simonwillison.net/2026/Jun/30/shot-scraper-video/

  3. "Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8: Agentic Coding Benchmarks" — MarkTechPost-Vergleich mit API-Pricing, Cost-Performance Trade-offs. → https://www.marktechpost.com/2026/06/30/anthropic-claude-sonnet-5-vs-sonnet-4-6-vs-opus-4-8-agentic-coding-benchmarks-api-pricing-and-cost-performance-tradeoffs-compared/

  4. "Google introduces a faster, cheaper image generator with Nano Banana 2 Lite" — 4-Sekunden-Bildgenerierung, A24-Partnerschaft, Omni Flash Video ($0.10/s). → https://techcrunch.com/2026/06/30/google-introduces-a-faster-cheaper-image-generator-with-nano-banana-2-lite/

  5. google/agents-cli (4.438 Sterne) — Google's offizielle CLI und Skills für Agent-Building auf Gemini Enterprise. 7 Skills: scaffold, adk-code, eval, deploy, publish, observability, workflow. → https://github.com/google/agents-cli

  6. "AI agents finish a third of the job, and the math says why" — HN-Diskussion über die systematische Limitierung von AI-Agents bei komplexen Tasks. → https://okaneland.com/study/do-ai-agents-work-yet/ | 3 Upvotes (HN)

  7. "Guardians of the Agents: Formal verification of AI workflows" — CACM-Artikel über formale Verifikation von AI-Workflow-Designs. → https://cacm.acm.org/practice/guardians-of-the-agents/

  8. ArXiv Paper: "Scalable Behaviour Cloning on Browser Using via Skill Distillation" — Wie menschliche Browser-Sessions als skalierbare Quelle für distillierte Agent-Skills genutzt werden können (2606.32014). → https://arxiv.org/abs/2606.32014v1

  9. obra/superpowers CLAUDE.md — Die strengste Contributor-Guideline in der Agent-Ära. 94 % PR-Ablehnungsrate. Muss gelesen werden von jedem, der Agent-PRs öffnet. → https://github.com/obra/superpowers/blob/main/CLAUDE.md


Bericht erstellt am 01. Juli 2026 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs, TechCrunch, MarkTechPost, Ars Technica