Prompt Intelligence Daily — 01. Juli 2026
🔤 TOP 3 PROMPTS — Textgenerierung
1. Claude Sonnet 5 — Optimierter Agent-Systemprompt
Prompt (vollständig, kopierbar):
Du bist ein autonomer Coding-Agent mit Planungs-, Tool-Nutzungs- und
Ausführungsfähigkeiten. Bevor du eine Aufgabe startest:
1. Analysiere die Anforderungen und erstelle einen Schritt-für-Schritt-Plan
2. Identifiziere benötigte Tools (Terminal, Browser, Dateisystem)
3. Prüfe Abhängigkeiten zwischen Schritten
4. Führe Schritte sequenziell aus, mit Selbstprüfung nach jedem Schritt
5. Bei Unsicherheit: Prüfe die eigene Ausgabe explizit, bevor du fortfährst
Wichtig: Adaptive Thinking ist standardmäßig aktiviert. Deaktiviere es nur
wenn du schnelle, deterministische Ausgabe benötigst:
{"thinking": {"type": "disabled"}}
Am besten mit: Claude Sonnet 5 (Anthropic)
Warum effektiv: Sonnet 5 erreicht Opus 4.8-Niveau bei agentic Coding (63,2 % vs. 69,2 %), aber bei deutlich niedrigeren Kosten ($2/$10 Intro-Preis bis 31. August). Neues Tokenizer-Design: 30 % mehr Tokens für englischen Text — bedeutet effektiv 30 % Preisanstieg gegenüber Sonnet 4.6. 1 Mio. Context-Window und 128.000 Max-Output-Tokens. Standardmäßig mit Adaptive Thinking aktiviert.
Quelle: https://simonwillison.net/2026/Jun/30/claude-sonnet-5/ | 93 Upvotes (HN)
Community Resonanz: Simon Willisons Token-Counter-Analyse zeigt: Englischer Text wird 1,4× teurer, Spanisch 1,33×, Python-Code 1,28×, Mandarin praktisch gleich teuer. Community diskutiert Preisanstieg vs. Performance-Gewinn.
2. Multi-Agent Investitionsrecherche (Vier-Master-Prompts)
Prompt (vollständig, kopierbar):
Analysiere die folgende Aktie aus vier Perspektiven parallel:
【Warren-Buffett-Perspektive】
- Wirtschaftlicher Burggraben, Management-Qualität, langfristige
Wettbewerbsvorteile
- Kaufe nur, wenn du das Unternehmen verstehst und es zu einem fairen
Preis angeboten wird
【Charlie-Munger-Perspektive】
- Lollapalooza-Effekte, mentale Modelle, Inversionsprüfung
- Was könnte dieses Unternehmen zerstören? Denke rückwärts
【Duan-Yongping-Perspektive】
- Konsumentenverhalten, Produktqualität, kulturelle Passung
- Ist das Produkt etwas, das der Nutzer wiederholt kauft?
【Li-Lu-Perspektive】
- Makro-Umfeld, Branchendynamik, regulatorische Risiken
- Wo sitzt das Unternehmen im globalen Wertschöpfungskettendiagramm?
Erstelle anschließend eine konsolidierte Empfehlung mit expliziten
Pro/Contra-Punkten aus jeder Perspektive. Bei widersprüchlichen
Bewertungen: Begründe, welche Perspektive priorisiert wird.
Am besten mit: Claude Sonnet 5, Claude Opus 4.8, Codex (GPT-5.5 Extra High)
Warum effektiv: Aus dem Repository xbtlin/ai-berkshire (7.900 Sterne) — ein vollständiges Value-Investment-Framework basierend auf vier Investitions-Meistern, das Multi-Agent-Adversarial-Analyse nutzt. Die vier parallelen Perspektiven erzeugen robustere Entscheidungen als einzelne Analyse.
Quelle: https://github.com/xbtlin/ai-berkshire | GitHub Trending (Jul 1)
Community Resonanz: 7.901 Sterne auf GitHub. Projekt zeigt +69,29 % Rendite 2024 und +66,38 % YTD 2025.
3. Video-Demo-Storyboard für Coding-Agents (shot-scraper video)
Prompt (vollständig, kopierbar):
Erstelle eine shot-scraper Video-Storyboard-Datei für ein Feature-Demo:
1. cd zum Projektverzeichnis und führe aus:
shot-scraper video --help
um die verfügbaren Optionen zu verstehen
2. Starte den Development-Server im Hintergrund:
uv run <dein-app-befehl> -p 8080 --root
3. Erstelle eine YAML-Storyboard-Datei mit folgenden Feldern:
- output: Pfad zur Ausgabedatei (.webm oder .mp4)
- server: [... Befehlsliste ...] für den Dev-Server
- url: Start-URL für die Aufnahme
- viewport: { width: 1280, height: 720 }
- cursor: true (für sichtbare Mausbewegungen)
- wait_for: CSS-Selector auf das erste zu interagierende Element
- javascript: Interaktionen als Playwright-Skript
4. Führe die Aufnahme aus:
shot-scraper video storyboard.yml --mp4
Am besten mit: Codex (GPT-5.5 xhigh), Claude Code, jedem Agent mit Shell-Zugriff
Warum effektiv: Simon Willisons neues shot-scraper video-Feature ermöglicht es Agents, automatisiert Video-Demos ihrer Arbeit aufzunehmen. Der YAML-Storyboard-Format ist vollständig vom Coding-Agent generierbar — der --help-Output enthält genug Information, dass der Agent das Format selbst definieren und validieren kann.
Quelle: https://simonwillison.net/2026/Jun/30/shot-scraper-video/ | TechCrunch
Community Resonanz: Beispiel-Storyboard enthält Tasks wie "Prepare release video", "Check pasted CSV import" mit Status-Zuordnung. Feature wurde komplett von GPT-5.5 xhigh in Codex Desktop implementiert.
🖼️ TOP 3 PROMPTS — Bildgenerierung
1. Nano Banana 2 Lite — Schnelle Bildgenerierung (4 Sekunden)
Prompt (vollständig, kopierbar):
Erstelle ein "Where's Waldo"-stilistisches Bild mit folgendem Motiv:
Ein Waschbär hält ein Amateurfunk-Handgerät und winkt in die Kamera.
Dichtes Waldgelände im Hintergrund, bunte Herbstblätter.
Kamera von oben nach unten, leichter Weitwinkel-Effekt.
Realistische Illustration, detaillierte Texturen, warme Farben.
Am besten mit: Nano Banana 2 Lite (gemini-3.1-flash-lite-image) über Google AI Studio oder Gemini API
Warum effektiv: Googles neuestes Bildmodell erzeugt Bilder in 4 Sekunden — optimiert für High-Volume-Workflows mit schnellem Iterieren. Deutlich günstiger als Nano Banana 2. Simon Willisons Test zeigt bessere Ergebnisse als die ursprünglichen Nano-Banana-Modelle beim "Where's Waldo"-Prompt (auch wenn er "Forest Festival" falsch geschrieben hat in zwei Varianten).
Quelle: https://techcrunch.com/2026/06/30/google-introduces-a-faster-cheaper-image-generator-with-nano-banana-2-lite/ | Ars Technica
Community Resonanz: Google beschreibt Nano Banana 2 als "generalist workhorse" und Banana 2 Lite als optimiert für Hochdurchsatz. A24-Partnerschaft für Hollywood-Qualität angekündigt.
2. Agency Agents — Frontend-Developer Prompt-Design
Prompt (vollständig, kopierbar):
Du bist ein spezialisierter Frontend-Developer mit folgenden Eigenschaften:
IDENTITÄT: Pixel-perfektionist, Performance-Optimierer, Accessibility-Champion
MISSION: Baue UIs, die auf jedem Gerät makellos aussehen und funktionieren
Workflow:
1. Prüfe zuerst das Design-System (Farben, Typografie, Spacing-Variablen)
2. Implementiere Komponenten mit semantischem HTML5 und modernen CSS-Features
3. Core Web Vitals als harte Grenze: LCP < 2,5s, CLS < 0,1, INP < 200ms
4. Teste auf Viewport-Größen: 320px, 768px, 1024px, 1440px
5. Füge ARIA-Labels und Fokus-Management hinzu
Kommunikationsstil: Kurz, prägnant, mit konkreten Metriken.
Keine Platzhalter-Texte. Keine Todo-Kommentare im Code.
Liefere funktionierenden Code mit allen Dependencies.
Am besten mit: Claude Code, Codex, Hermes Agent, Cursor
Warum effektiv: Aus dem Repository msitarzewski/agency-agents (121.000+ Sterne) — ein vollständiges Agent-Prompt-Design mit Identität, Mission, Workflow, harten Grenzen und Kommunikationsstil. Dieser strukturierte Ansatz ist nachweislich effektiver als generische "Act as a developer"-Prompts, da er Personality-Driven Design mit Deliverable-Fokus kombiniert.
Quelle: https://github.com/msitarzewski/agency-agents | GitHub Trending (Jul 1)
Community Resonanz: 121.611 Sterne, Desktop-App verfügbar (macOS/Linux/Windows). Unterstützt Integration mit Claude Code, Cursor, Codex, Gemini CLI, OpenCode, Kimi Code, Codex, Hermes und anderen.
3. Superpowers — Prompt-Engineer Agent Template
Prompt (vollständig, kopierbar):
Du bist ein spezialisierter LLM-Prompt-Designer.
Aufgabe: Vage Anweisungen in zuverlässige, reproduzierbare AI-Verhalten
umwandeln. Deine Prompts müssen bestehen:
✅ Spezifische Output-Strukturen (JSON-Schema, Markdown-Format)
✅ Eingebaute Selbstprüfung (Kritische Annahmen explizit machen)
✅ Fehlerbehandlung ("Wenn X nicht verfügbar ist, tue Y")
✅ Kontextbegrenzung (Maximale Token-Zahl für Response)
✅ Anti-Halluzination (Unsichere Angaben klar markieren)
❌ Vermeide generische "Act as..."-Floskeln
❌ Keine offenen Ended ohne konkrete Deliverables
❌ Keine mehrdeutigen Instruktionen wie "versuche dein Bestes"
Liefere: Den optimierten Prompt + eine kurze Erklärung der
wichtigsten Optimierungen im Vergleich zur Originalversion.
Am besten mit: Claude Sonnet 5, Claude Opus 4.8, GPT-5.5
Warum effektiv: Aus obra/superpowers (243.000 Sterne) — einem der populärsten Frameworks für spezialisierte Agent-Prompts. Der Prompt-Engineer ist einer von 60+ Agenten im Framework und verwendet bewährte Patterns: Personality-Driven Design, Deliverable-Fokus, Production-Ready Workflows.
Quelle: https://github.com/obra/superpowers | GitHub Trending
Community Resonanz: Das Projekt hat eine 94 % PR-Ablehnungsrate für Slop-PRs von Agents. Die CLAUDE.md-Datei ist eine der strengsten Contributor-Guidelines in der Agent-Ära und setzt Maßstäbe für Agent-Generierte Contributions.
🎬 TOP 3 PROMPTS — Videogenerierung
1. video-use — Full-Stack Video-Editing mit Agents
Prompt (vollständig, kopierbar):
Set up https://github.com/browser-use/video-use für mich.
Lies zuerst install.md, installiere das Repository, verbinde ffmpeg,
registriere die Skill bei deinem Agent und konfiguriere den ElevenLabs
API-Key (frage mich danach). Lies dann SKILL.md für die tägliche Nutzung
und immer helpers/ — dort liegen die Editing-Skripte.
Nach der Installation transkribiere nichts automatisch — sag mir nur,
dass alles bereit ist, und warte darauf, dass ich Rohmaterial in einen
Ordner ablege.
Dann: cd /path/to/videos && sag mir: "Drop your footage, and tell me
what kind of video you want."
Pipeline: Transcribe → Pack → LLM Reasons → EDL → Render → Self-Eval
Maximal 3 Selbstkorrektur-Schleifen pro Schnitt.
Am besten mit: Claude Code, Codex, Hermes Agent, Openclaw
Warum effektiv: browser-use/video-use (12.892 Sterne) ermöglicht Video-Bearbeitung durch Coding-Agents. Features: Füllwörter-Removal, automatische Farbkorrektur, 30ms Audio-Fades an Schnitten, Untertitel-Burning, Animation-Overlays via HyperFrames/Remotion/Manim. Wichtig: Self-Evaluation-Schleife prüft jeden Schnitt auf visuelle Sprünge, Audio-Pops und versteckte Untertitel, bevor die Ausgabe gezeigt wird.
Quelle: https://github.com/browser-use/video-use | GitHub Trending (Jul 1)
Community Resonanz: 12.892 Sterne. Funktioniert für Talking Heads, Montagen, Tutorials, Reisevideos, Interviews — ohne Presets oder Menüs. 15-Sekunden-Demo auf TikTok veröffentlicht.
2. Scalable Behaviour Cloning aus Browsing-Skills (arXiv)
Prompt (vollständig, kopierbar):
Du bist ein Agent, der aus menschlichen Browser-Sessions lernt.
Struktur für Skill-Distillation:
1. Erfasse die Roh-Browsing-Session (DOM-Snapshots + Aktionen)
2. Extrahiere wiederkehrende Muster (Suche → Filter → Auswahl → Aktion)
3. Komprimiere zu einer wiederverwendbaren Skill-Beschreibung:
- Pre-condition: DOM-Zustand vor Aktion
- Action: Klick-Sequence/Texteingabe/Navigation
- Post-condition: Erwarteter DOM-Zustand
- Fallback: Was tun, wenn Element nicht gefunden
4. Validiere die Skill an 3 neuen, ähnlichen Tasks ohne
menschliches Feedback.
5. Output: Eine ausführbare Skill-Definition im YAML-Format:
- name: <Skill-Name>
- trigger_words: [Wort1, Wort2]
- preconditions: [...]
- steps: [...]
- success_metrics: [...]
Am besten mit: Claude Opus 4.8, Claude Sonnet 5
Warum effektiv: ArXiv-Paper vom 30. Juni 2026 zeigt, dass menschliches Browsing eine unterschätzte Quelle für wiederverwendbare Agent-Skills ist. Web-Browser-Aktionen — von Software-Entwicklung über Dokumentenbearbeitung bis hin zu Formularausfüllung — können als distillierte Skills auf neue Agenten übertragen werden, ohne Training von Grund auf.
Quelle: https://arxiv.org/abs/2606.32014v1 | arXiv, 30. Juni 2026
Community Resonanz: Paper argumentiert, dass das eigentliche Bottleneck nicht die Modell-Kapazität ist, sondern die systematische Extraktion und Destillation von Browsing-Skills aus menschlichen Demonstrationen.
3. ShopX — Intent-to-Item Fulfillment Prompting
Prompt (vollständig, kopierbar):
Du bist ein Agentic Shopping-Assistent, der Nutzerintentionen direkt in
konkrete Kaufempfehlungen übersetzt.
Wenn eine User-Intention eingeht:
1. Zerlege die Intention in semantische Komponenten:
- Produktkategorie (was genau gesucht wird)
- Präferenzen (Farbe, Größe, Material, Preisklasse)
- Use-Case (wofür es gebraucht wird)
- Constraints (Budget, Lieferzeit, Nachhaltigkeit)
2. Übersetze in eine strukturierte Suche:
- Primäre Keywords + Synonyme
- Filter-Kombinationen (min/max/equals)
- Qualitätsindikatoren (Bewertungen, Verifizierung)
3. Generiere 3 Empfehlungen mit:
- Produktname + Preis + Verfügbarkeit
- Match-Score (0-100) mit Begründung
- Trade-offs ("A ist günstiger, aber B hat bessere Bewertungen")
Output-Format: JSON mit Feldern: recommendations: [{item_id, name,
price, match_score, reasoning, trade_offs}]
Am besten mit: GPT-5.5, Claude Sonnet 5, Gemini 3.1 Flash
Warum effektiv: ArXiv-Paper vom 30. Juni 2026 zeigt, dass herkömmliche LLM-Wrapper über Such- und Recommendation-Pipelines komplexe Intentionen durch niedrigbandige Retrieval- oder Ranking-Signale zwingen. ShopX demonstriert einen Foundation-Model-Ansatz für Intent-to-Item Fulfillment, der den kompletten Kaufprozess agentisch orchestriert.
Quelle: https://arxiv.org/abs/2606.31693v1 | arXiv, 30. Juni 2026
Community Resonanz: Paper beschreibt den Shift von seiten- und feed-basiertem Browsing zu intent-getriebenen Shopping-Erfahrungen als kommende Welle AI-nativer Applikationen.
🧠 TOP 3 NEUE TECHNIKEN
1. Token-Optimierte System-Designs (30 % mehr Tokens)
Zusammenfassung: Claude Sonnet 5 verwendet einen neuen Tokenizer, der ~30 % mehr Tokens für englischen Text produziert als Sonnet 4.6 — ein in der Praxis oft übersehener Preisanstieg.
Erklärung: Anthropic hat bei Sonnet 5 den Tokenizer gewechselt. Gleicher Eingabetext liefert 30 % mehr Tokens, was effektiv den Preis pro Eingabe um 30 % erhöht (trotz gleicher $3/Mio-Preise). Für Python-Code: +28 %, Spanisch: +33 %, Mandarin: praktisch identisch. Diese Veränderung hat direkte Auswirkungen auf bestehende Prompt-Architekturen: Lange System Prompts werden deutlich teurer, Context-Window-Ausnutzung sinkt, und bestehende Cost-Benchmarks sind nicht mehr vergleichbar.
Beispielprompt:
# Vor: Dein Prompt war 10.000 Tokens unter Sonnet 4.6
# Jetzt: Gleicher Prompt = 13.000 Tokens unter Sonnet 5
# Kosten-Anpassung: Kürze System-Prompts oder nutze Intro-Preis ($2/$10)
# Optimierter Approach:
{
"system": "Handle as expert programmer. Output: code only.",
"thinking": {"type": "disabled"}, // Spart Tokens bei deterministischen Tasks
"max_tokens": 8192 // Reduziere wenn möglich (128k max verfügbar)
}
Geeignet für: Claude Sonnet 5, alle Claude-Modelle mit neuem Tokenizer
Ursprung: https://simonwillison.net/2026/Jun/30/claude-sonnet-5/
Warum heute wichtig: Wer Sonnet 5 produktiv einsetzt, muss seine Prompt-Kosten neu kalkulieren. Bestehende Benchmarks (z.B. "$0.01 pro Request") sind nicht mehr gültig. Der Intro-Preis von $2/$10 (bis 31. August) ist jetzt das Zeitfenster für kosteneffiziente Migration.
2. Self-Evaluation Loop für Agent-Outputs
Zusammenfassung: Agents prüfen ihre eigenen Outputs systematisch an definierten Cut-Points, bevor Ergebnisse an den Nutzer geliefert werden — mit maximal 3 Korrekturschleifen.
Erklärung: Die Self-Evaluation-Loop (aus video-use und ProtoPilot-Papers) ist ein generisches Pattern: Nach jedem signifikanten Schritt prüft der Agent sein eigenes Ergebnis gegen harte Qualitätskriterien. Bei video-use: visuelle Sprünge, Audio-Pops und versteckte Untertitel an jedem Schnitt. Bei ProtoPilot (arXiv): biologische Intent-Qualität, quantitative Prozeduren, Gerätekonstraints und experimentelles Feedback bleiben von Protocol-Design bis Execution aligned. Bei ShopX (arXiv): Match-Score mit Begründung für jede Empfehlung. Das Pattern ist modellagnostisch und auf jede Agent-Aufgabe übertragbar.
Beispielprompt:
Nach jedem Arbeitsschritt:
## SELF-EVALUATION
1. Prüfe: Entspricht das Ergebnis den ursprünglichen Anforderungen?
2. Prüfe: Gibt es offensichtliche Fehler/Inkonsistenzen?
3. Prüfe: Sind alle Edge-Cases berücksichtigt?
4. Wenn NEIN → Identifiziere das spezifische Problem und korrigiere
5. Wenn JA → Fahre mit dem nächsten Schritt fort
Maximale Korrekturschleifen: 3
Nach 3 erfolglosen Versuchen → Stoppe und eskaliere an den Nutzer
mit: Problemstellung, bisherige Versuche, empfohlener nächster Schritt.
Geeignet für: Alle autonomen Agents (Claude Code, Codex, Hermes)
Ursprung: https://github.com/browser-use/video-use, arXiv:2606.31763 (ProtoPilot)
Warum heute wichtig: Selbstvalidierung ist jetzt ein Standard-Pattern in produktiven Agent-Frameworks — von Video-Editing bis zu Biolab-Protokollen. Es reduziert signifikant die Notwendigkeit menschlicher Review-Zyklen.
3. Personality-Driven Agent-Design Framework
Zusammenfassung: Agent-Prompts mit definierter Persönlichkeit, Kommunikationsstil und klaren Deliverables übertreffen generische "Act as..."-Prompts nachweislich in Qualität und Reproduzierbarkeit.
Erklärung: Das agency-agents-Framework (121K Sterne) und superpowers (243K Sterne) demonstrieren: Ein gut designtes Agent-Prompt definiert nicht nur die Rolle, sondern auch: (1) Identität & Persönlichkeit, (2) Kernmission & Workflows, (3) technische Deliverables mit Code-Beispielen, (4) Erfolgsmetriken und (5) Kommunikationsstil. superpowers warnt explizit vor generischen "Act as a developer"-Prompts und fordert stattdessen tiefe Spezialisierung mit Persönlichkeit und Prozess. Die 94 % PR-Ablehnungsrate bei superpowers zeigt: Ungeprüfte Agent-Outputs ohne definierte Qualitätsstandards werden systematisch abgelehnt.
Beispielprompt:
IDENTITÄT: Du bist [Rolle] mit [X Jahren] Erfahrung in [Domain]
MISSION: [Ein-Satz-Ziel, z.B. "Baue UIs die auf jedem Gerät makellos aussehen"]
HARTE REGELN (nicht verhandelbar):
1. [Regel mit messbarem Kriterium]
2. [Regel mit messbarem Kriterium]
3. [Regel mit messbarem Kriterium]
WORKFLOW:
Phase 1: [Input-Analyse] → Output: [konkretes Artefakt]
Phase 2: [Implementierung] → Output: [konkretes Artefakt]
Phase 3: [Selbstprüfung] → Output: [Prüfprotokoll]
KOMMUNIKATION: [Stil, z.B. "Kurz, mit Metriken, keine Platzhalter"]
DELIVERABLE: [Exakt was geliefert wird, in welchem Format]
Geeignet für: Claude Sonnet 5, Claude Opus 4.8, Codex, alle Coding-Agents
Ursprung: https://github.com/msitarzewski/agency-agents, https://github.com/obra/superpowers
Warum heute wichtig: Mit Claude Sonnet 5 wird agentic Capability zum Standard bei jedem Modell-Preispunkt. Der Differenzierungsfaktor verschiebt sich von "Wer macht Agent-Arbeit am besten" zu "Wer strukturiert Agent-Prompts am effektivsten". Personality-Driven-Design ist die bewährte Antwort.
🏆 Highlight des Tages
Claude Sonnet 5: Agentic Capability wird zum Commodity — Neue Ära der Prompt-Kosten beginnt
Anthropic hat heute Claude Sonnet 5 released — und es ist das stärkste Signal dafür, dass agentic Fähigkeit jetzt in jeder Preisklasse Standard ist. Der Pitch ist eindeutig: "Kann planen, Tools nutzen, autonom arbeiten — auf einem Niveau, das vor wenigen Monaten noch größere und teurere Modelle brauchte."
Die harten Zahlen:
- Agentic Coding: 63,2 % (Sonnet 5) vs. 69,2 % (Opus 4.8) vs. 58,1 % (Sonnet 4.6)
- Knowledge Work: Sonnet 5 übertrifft Opus 4.8 knapp
- Preis (Intro bis 31.08.): $2/Mio Input, $10/Mio Output
- Danach: $3/Mio Input, $15/Mio Output (+50 %!)
- Tokenizer: +30 % Tokens für denselben englischen Text
- Adaptive Thinking: Standardmäßig AN, nur mit
{"thinking": {"type": "disabled"}}ausschaltbar
Was das für Prompt-Designer bedeutet:
- Kosten-Nachkalkulation: Jede bestehende Prompt-Architektur, die mit Sonnet 4.6 kalkuliert war, ist jetzt 30 % teurer (mehr Tokens) × 50 % teurer (nach 31. August) = bis zu 80 % Kostensteigerung
- Prompt-Kürzung wird kritisch: Kürzere System-Prompts = direkt niedrigere Kosten. Token-Effizienz ist jetzt ein harter Business-Faktor.
- Adaptive Thinking kostet: Der automatisch aktivierte Thinking-Modus generiert zusätzliche Tokens. Für deterministische Tasks explizit deaktivieren.
Trump-Befreiung: Parallel wurden Export-Beschränkungen für Claude Mythos 5 und Fable 5 aufgehoben — Commerce Department bestätigt. Opus 4.8 bleibt das Premium-Modell, aber Sonnet 5 schließt die Lücke signifikant.
Quellen: https://simonwillison.net/2026/Jun/30/claude-sonnet-5/ | https://techcrunch.com/2026/06/30/anthropic-launches-claude-sonnet-5-as-a-cheaper-way-to-run-agents/
📰 Erlesene Artikel & Ressourcen
-
"What's new in Claude Sonnet 5" — Simon Willisons Deep-Dive in die API-Änderungen, Tokenizer-Kostenanalyse, System Card. Essentiell für alle, die Sonnet 5 evaluieren. → https://simonwillison.net/2026/Jun/30/claude-sonnet-5/
-
"Have your agent record video demos of its work with shot-scraper video" — Simon Willison zeigt, wie das neue
shot-scraper video-Tool YAML-basierte Video-Demos aufnimmt, vollständig von GPT-5.5 xhigh in Codex Desktop implementiert. → https://simonwillison.net/2026/Jun/30/shot-scraper-video/ -
"Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8: Agentic Coding Benchmarks" — MarkTechPost-Vergleich mit API-Pricing, Cost-Performance Trade-offs. → https://www.marktechpost.com/2026/06/30/anthropic-claude-sonnet-5-vs-sonnet-4-6-vs-opus-4-8-agentic-coding-benchmarks-api-pricing-and-cost-performance-tradeoffs-compared/
-
"Google introduces a faster, cheaper image generator with Nano Banana 2 Lite" — 4-Sekunden-Bildgenerierung, A24-Partnerschaft, Omni Flash Video ($0.10/s). → https://techcrunch.com/2026/06/30/google-introduces-a-faster-cheaper-image-generator-with-nano-banana-2-lite/
-
google/agents-cli (4.438 Sterne) — Google's offizielle CLI und Skills für Agent-Building auf Gemini Enterprise. 7 Skills: scaffold, adk-code, eval, deploy, publish, observability, workflow. → https://github.com/google/agents-cli
-
"AI agents finish a third of the job, and the math says why" — HN-Diskussion über die systematische Limitierung von AI-Agents bei komplexen Tasks. → https://okaneland.com/study/do-ai-agents-work-yet/ | 3 Upvotes (HN)
-
"Guardians of the Agents: Formal verification of AI workflows" — CACM-Artikel über formale Verifikation von AI-Workflow-Designs. → https://cacm.acm.org/practice/guardians-of-the-agents/
-
ArXiv Paper: "Scalable Behaviour Cloning on Browser Using via Skill Distillation" — Wie menschliche Browser-Sessions als skalierbare Quelle für distillierte Agent-Skills genutzt werden können (2606.32014). → https://arxiv.org/abs/2606.32014v1
-
obra/superpowers CLAUDE.md — Die strengste Contributor-Guideline in der Agent-Ära. 94 % PR-Ablehnungsrate. Muss gelesen werden von jedem, der Agent-PRs öffnet. → https://github.com/obra/superpowers/blob/main/CLAUDE.md
Bericht erstellt am 01. Juli 2026 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs, TechCrunch, MarkTechPost, Ars Technica