Prompt Intelligence Daily — 3. Juli 2026
🔤 TOP 3 PROMPTS — Textgenerierung
1. Claude Code Setup-Prompt für video-use Agent
Prompt (vollständig, kopierbar):
Set up https://github.com/browser-use/video-use for me.
Read install.md first to install this repo, wire up ffmpeg, register the skill with whichever agent you're running under, and set up the ElevenLabs API key — ask me to paste it when you need it. Then read SKILL.md for daily usage, and always read helpers/ because that's where the editing scripts live. After install, don't transcribe anything on your own — just tell me it's ready and wait for me to drop footage into a folder.
Am besten mit: Claude Code, Codex, Cursor oder jedem Coding Agent
Warum effektiv: Der Prompt nutzt das neue Agent-Skills-Standardformat — der Agent liest automatisch Skill-Metadaten progressiv und registriert das Repo mit allen Abhängigkeiten. Der strukturierte Ablauf (install.md → Abhängigkeiten → Skill-Registrierung → API-Key-Abfrage) verhindert den typischen "alles auf einmal"-Fehler bei Agent-Setups.
Quelle: https://github.com/browser-use/video-use | 12.9K ⭐ GitHub Trending
Community Resonanz: Das Repo erschien auf GitHub Trending mit 12.9K Stars und demonstriert, wie Agent Skills als portables Skill-Format plattformübergreifend funktionieren.
2. LLM-Coding-Agent: Zwei-Prompt-Build mit Fable 5
Prompt (vollständig, kopierbar):
Write a spec.md for this project - it will depend on the latest "llm" alpha from PyPI and implement a Claude code style coding agent complete with tools for reading and editing files and executing commands
Danach im zweiten Schritt:
Commit the spec, then build it using red/green TDD in a series of sensible commits (each with passing tests and updated docs) - occasionally manually test it using the OpenAI API key in your environment
Am besten mit: Claude Fable 5, GPT-5.5
Warum effektiv: Simon Willison hat den kompletten zweistufigen Build-Prompt veröffentlicht. Der Trick: Erst Spec schreiben lassen (nicht direkt Code), dann mit TDD aufbauen. Das Ergebnis war llm-coding-agent 0.1a0 auf PyPI — ein voll funktionsfähiger Coding Agent mit Tools wie CodingTools_edit_file, CodingTools_read_file und CodingTools_run_command. Der Prompt bewies, dass Fable 5 in einem Durchlauf Agent-Architekturen inkl. Python-API mit CodingAgent(model="gpt-5.5", root="/path", approve=True).run() implementieren kann.
Quelle: https://simonwillison.net/2026/Jul/2/llm-coding-agent/ | 132↑ HN
Community Resonanz: Der komplette Build-Transcript ist öffentlich einsehbar und zeigt, dass der Agent eigenständig eine Python-API entworfen hat, die niemand im Prompt verlangt hatte — ein Beispiel für emergente Agent-Fähigkeiten.
3. DSPy-getriebene System-Prompt-Optimierung für SQL-Agenten
Prompt (Beispiel für die DSPy-Evaluierung):
Pip install the latest Datasette alpha and datasette-agent and dspy - then figure out how to use dspy to evaluate and improve the main system prompts used by Datasette Agent for the feature where it can execute read only SQL queries to answer user questions about data.
Am besten mit: Claude Fable 5, GPT-4.1 mini
Warum effektiv: Willison hat gezeigt, wie DSPy als evaluierender Harness funktionieren kann: DSPy-Agenten rufen die echten Tool-Implementierungen eines SQL-Agenten gegen eine Live-Datasette-Instanz auf und vergleichen mit Gold-Standard-Traces. Das konkrete Ergebnis: Die ursprüngliche Prompt-Anweisung "don't call describe_table if you already have the information" verursachte Column-Name-Guessing und Error-Retry-Loops. Die Lösung: Column-Namen direkt in die Schema-Listing des Prompts aufnehmen oder diese Anweisung abschwächen. Ein reproduzierbarer, metrischer Ansatz für System-Prompt-Optimierung statt Trial-and-Error.
Quelle: https://simonwillison.net/2026/Jul/2/dspy-datasette-agent-prompts/ | 38↑ HN
Community Resonanz: Fand breite Zustimmung in der AI-Coding-Community als Proof-of-Concept für quantitativen Prompt-Engineering-Ansatz.
🖼️ TOP 3 PROMPTS — Bildgenerierung
1. Ornith-1.0: Self-Scaffolding Coding Model mit visueller Architektur
Prompt (vollständig, kopierbar):
Muse on the feasibility of porting the Moebius 0.2B image inpainting model to WebGPU using @chenglou/pretext. What are the current options for running it? What are the trade-offs?
Am besten mit: Claude Code, Claude Fable 5
Warum effektiv: Der "Muse"-Pattern (von Simon Willison bestätigt) signalisiert exploratives Denken ohne konkretes Ziel — das Modell produziert unvoreingenommene Analysen von Optionen, Trade-offs und unkonventionellen Wegen. Willison nutzte diesen Pattern erfolgreich beim Portieren von Moebius 0.2B (einem 0,2B-Parameter-Inpainting-Modell) in den Browser via WebGPU/Pretext. Die Anfrage produziert Machbarkeitsanalysen, bevor man sich auf Implementierung committe.
Quelle: https://simonwillison.net/2026/Jun/22/porting-moebius/ | 52↑ HN (Ornith-1.0 Referenz)
Community Resonanz: Der "Muse on"-Pattern wurde als kürzester Weg zu Machbarkeitsanalysen vor Implementierungsentscheidungen bestätigt.
2. Agent Skills Standard — portables Skill-Format für Bildprompt-Workflows
Prompt (vollständig, kopierbar):
SKILL.md für Bildgenerierungs-Workflow:
---
name: image-generation-workflow
description: Structured image generation with model selection and parameter optimization
---
When the user asks for image generation:
1. Ask for subject, style, composition, and technical requirements
2. Select appropriate model (Flux, Midjourney, DALL-E) based on task complexity
3. Generate prompt with: subject description → style modifiers → composition rules → technical params (--ar, --v, --sref)
4. Include negative prompts where applicable (e.g., "ugly, blurry, deformed hands")
5. Output ready-to-copy prompt in code block
Always include: aspect ratio (--ar 16:9), version param (--v 6), and quality param (--q 2) for Midjourney.
Am besten mit: Claude Code, Codex, Openclaw
Warum effektiv: Anthropic hat das Agent-Skills-Format als offenen Standard freigegeben. Skills sind portabel über AI-Tools hinweg und bieten progressive Discovery → Activation → Execution. Bildprompt-Workflows lassen sich als Skill verpacken, sodass jeder kompatible Agent den strukturierten Prompt-Generierungsprozess reproduzierbar ausführt.
Quelle: https://github.com/agentskills/agentskills | 439 ⭐ (neu auf Trending)
Community Resonanz: Das Format wurde von Anthropic entwickelt und von einer wachsenden Zahl von Agent-Produkten adoptiert. Client-Showcase unter agentskills.io/clients.
3. Chrome DevTools MCP für Browser-basierte Bildprompt-Vorschau
Prompt (vollständig, kopierbar):
Use the chrome-devtools-mcp server to inspect the rendered output of generated images in the browser. Analyze the network requests, check console for any rendering errors, and take a screenshot of the current page state. Provide performance insights about image loading times and visual rendering quality.
Am meglio mit: Claude Code + Chrome DevTools MCP
Warum effektiv: Das von Google offiziell veröffentlichte Chrome DevTools MCP (chrome-devtools-mcp) gibt Coding-Agenten Zugriff auf vollständige Browser-Inspektion via Puppeteer. Agenten können Screenshots machen, Netzwerk-Requests analysieren, Console-Fehler prüfen und Performance-Traces aufzeichnen — ideal für den visuellen Feedback-Loop bei Bildgenerierung-Workflows.
Quelle: https://github.com/ChromeDevTools/chrome-devtools-mcp | 2.7K ⭐ GitHub Trending
Community Resonanz: Offizielles Google-Tool, unterstützt Claude, Cursor, Copilot, Antigravity. Opt-out für Usage Statistics via --no-usage-statistics Flag möglich.
🎬 TOP 3 PROMPTS — Videogenerierung
1. Video-Editing Agent: "edit these into a launch video"
Prompt (vollständig, kopierbar):
You are a professional video editing agent using the video-use skill.
Analyze the raw footage in the current directory. For each video file:
1. Identify filler words (umm, uh), dead space, and false starts
2. Auto color grade every segment (warm cinematic style)
3. Apply 30ms audio fades at every cut
4. Burn subtitles: 2-word UPPERCASE chunks, centered, high contrast
5. Generate animation overlays where appropriate
Propose your editing strategy before executing. After rendering, self-evaluate the output at every cut boundary and report quality metrics.
Am besten mit: Claude Code + ElevenLabs API Key
Warum effektiv: video-use von browser-use ist ein 100% Open-Source-Video-Editing-Agent. Er entfernt Füllwörter, auto-gradet Segmente, brennt Subtitles und generiert Animation-Overlays via HyperFrames/Remotion/Manim. Der Agent evaluiert den Output selbst an jeder Cut-Boundary, bevor er den Benutzer einbezieht. Persistiert Session-Memory in project.md für Fortsetzung am nächsten Tag.
Quelle: https://github.com/browser-use/video-use | 12.9K ⭐ GitHub Trending
Community Resonanz: Erscheint auf GitHub Trending als eines der meistgesternten Video-Tools. Der Setup-Flow über Agent Skills funktioniert mit Claude Code, Codex und Hermes.
2. Claude-Real-Video: "Jedes LLM Videos ansehen lassen"
Prompt (vollständig, kopierbar):
crv "https://www.youtube.com/watch?v=YOUR_VIDEO_ID"
Anschließend:
Lade die Frames aus crv-out/frames/*.jpg und die MANIFEST.txt. Analysiere die folgende Bildsequenz und beantworte: [deine Frage]
Am besten mit: Claude, GPT-5.5, Gemini 3.1 Pro
Warum effektiv: Statt fixed-interval Sampling (z.B. 1 Frame/Sekunde) extrahiert crv nur frames bei scene changes, entfernt Duplikate via sliding-window dedup und transkribiert Audio mit Whisper. Das Ergebnis: Weniger, aussagekräftigere Frames → günstigerer Context, besseres Verständnis. Funktioniert lokal, nichts wird in die Cloud hochgeladen.
Quelle: https://github.com/HUANGCHIHHUNGLeo/claude-real-video | 132↑ HN
Community Resonenz: Dominierte HN mit 132 Punkten. Der Kernvorteil gegenüber Gemini's fixem 1-fps-Sampling: scene-change detection + density floor statt willkürlicher Intervalle.
3. Video-Prompt-Chaining mit Agent Skills
Prompt (vollständig, kopierbar):
Du bist ein Video-Prompt-Architekt. Für einen 30-sekündigen Produktlaunch-Video:
Phase 1 (0-5s): Hook — Nahaufnahme des Produkts, dramatisches Licht, Kamera slow zoom in
Phase 2 (5-15s): Problem — Zeige den Status Quo mit warmen Farbtönen, Kamera schwenkt
Phase 3 (15-25s): Lösung — Produkt im Einsatz, schnelles Schnittmuster, Energie steigt
Phase 4 (25-30s): Call-to-Action — Text-Overlay mit URL, Fade-out
Für jede Phase generiere:
- Detaillierte visuelle Beschreibung (unter 50 Wörtern)
- Kamera-Parameter (Schwenk, Zoom, Neigung)
- Licht-Setup (warm/kalt, Richtung, Intensität)
- Negativ-Constraints (keine unscharfen Übergänge, kein Text-Cutoff)
Output: 4 separate Prompts, je einem Video-Generierungsmodell zugeordnet.
Am besten mit: Kling 1.6, Seedance 2.0, Runway Gen-3
Warum effektiv: Der phasenbasierte Ansatz teilt komplexe Video-Generierung in handhabbare Segmente auf. Jede Phase hat explizite Kamera-Parameter, Licht-Setup und Negativ-Constraints — das entspricht dem Seedance 2.0 R2V-Pattern ("Keep appearance consistent with first frame") und vermeidet die typische "Video-Drift" bei längeren Generationen.
Quelle: Eigene Synthese aus Seedance 2.0 R2V-Workflow und Runway Act-One Pattern
Community Resonanz: Der phasenbasierte Ansatz wird zunehmend als Best Practice für 10s+ Video-Generierung empfohlen, da Modelle wie Seedance und Kling ihre Konsistenz verlieren, wenn zu viel Action in einen Prompt gezwungen wird.
🧠 TOP 3 NEUE TECHNIKEN
1. DSPy-basierte System-Prompt-Evaluierung
Zusammenfassung: Quantitativer, reproduzierbarer Ansatz zur Bewertung und Verbesserung von System-Prompts durch DSPy-Harness mit Gold-Standard-Traces.
Erklärung: Statt Prompt-Verbesserungen durch Trial-and-Error zu finden, ruft ein DSPy-Agent die echten Tool-Implementierungen eines SQL-Agenten gegen eine Live-Datasette-Instanz auf und vergleicht mit automatisch generierten Gold-Standard-Traces. Spezifische Metriken zeigen, ob Änderungen die Genauigkeit verbessern. Ein konkretes Ergebnis: Die Anweisung "don't call describe_table if you already have the information" verursachte Column-Name-Guessing und Error-Retry-Loops — durch Aufnahme der Column-Namen in das Schema-Listing behoben.
Beispielprompt:
Evaluiere den folgenden System-Prompt für einen SQL-Agenten:
- Führe den Prompt gegen die Live-Datasette-Instanz aus
- Vergleiche mit den 50 Gold-Standard-Traces
- Berichte: Success Rate, avg. token usage, error rate per table
- Teste Variante A: "Include column names in schema listing"
- Teste Variante B: "Remove 'don't call describe_table' constraint"
- Empfehle die bessere Variante mit Begründung
Geeignet für: Claude Fable 5, GPT-5.5, GPT-4.1 mini
Ursprung: https://simonwillison.net/2026/Jul/2/dspy-datasette-agent-prompts/
Warum heute wichtig: Erstmals ein Framework, das System-Prompt-Optimierung von subjektivem "fühlt sich besser an" zu quantitativer Messung bewegt. Besonders relevant für Agent-Entwickler, die prompt-Engineering als Engineering-Disziplin statt als Kunst betreiben wollen.
2. "Muse on the feasibility of X" — Exploratorischer Prompt-Pattern
Zusammenfassung: "Denke über die Machbarkeit von X nach" statt "Baue X" — signalisiert exploratives Denken, produziert unvoreingenommene Analysen ohne Implementierungsdruck.
Erklärung: Wenn ein Modell "Make X" hört, committet es sich auf einen konkreten Build-Plan und übersieht oft Alternativen. "Muse on the feasibility of X" dagegen signalisiert explorierendes Denken — das Modell evaluiert Optionen, Trade-offs und unkonventionelle Wege, bevor es sich festlegt. Simon Willison nutzte dies beim Portieren von Moebius 0.2B nach WebGPU und erhielt eine strukturierte Analyse von Pretext, ONNX, WebAssembly und anderen Optionen.
Beispielprompt:
Muse on the feasibility of porting [Projekt/Modell] to [Plattform/Technologie].
What are the current options for running it? What are the trade-offs?
Consider performance, compatibility, and maintainability.
Don't jump into implementation yet — just analyze the options.
Geeignet für: Claude Fable 5, GPT-5.5, Qwen 3.7 Max, GLM-5.2
Ursprung: https://simonwillison.net/2026/Jun/22/porting-moebius/
Warum heute wichtig: Verhindert den typischen "erstmal losbauen"-Fehler von Agenten. Besonders wertvoll wenn man nicht weiß, ob ein Ansatz überhaupt praktikabel ist. Der kürzeste Weg zu Machbarkeitsanalysen vor Implementierungs-Commitments.
3. "Understand to Participate" — Kognitive Schulden-Prävention bei AI-Collaboration
Zusammenfassung: Entwickler müssen den generierten Code verstehen, um aktiv am kreativen Prozess teilnehmen zu können — sonst entsteht "Cognitive Debt".
Erklärung: Geoffrey Litts Framing beim AI Engineering Summit: Coding Agents erzeugen immer größere Änderungen, aber Entwickler verlieren den Faden, wenn sie nicht aktiv verstehen, was der Agent baut. Die These: Man muss ein rich set of concepts im Kopf haben, um kreativ und fließend über Weiterentwicklung nachdenken zu können. Ohne diese Fluency ist die Fähigkeit zur Mitarbeit im Projekt signifikant eingeschränkt. Praktisch bedeutet das: Vor dem Akzeptieren von Agent-Änderungen sollte man den Code lesen und verstehen, nicht nur diffen.
Beispielprompt:
Before applying your changes, explain to me:
1. What architecture patterns did you choose and why?
2. What are the key interactions between new and existing components?
3. What edge cases should I test manually?
4. Where should I focus my review attention?
After your explanation, I will read the diff with understanding and provide feedback.
Geeignet für: Claude Code, Codex, Cursor
Ursprung: https://simonwillison.net/2026/Jul/2/understand-to-participate/ (Geoffrey Litt, AIE Summit)
Warum heute wichtig: Mit Fable 5 und GLM-5.2 erzeugen Agenten zunehmend massive Änderungen (50M Lines Ruby Codebase Migration in einem Tag). Ohne aktives Verständnis entsteht technische Schuld nicht im Code, sondern im Kopf des Entwicklers.
🏆 Highlight des Tages
"Twilight of the Gods" — 11 LLMs im LangGraph-God-Node-Refactoring-Vergleich (47↑ HN)
Ein einziger Blog-Artikel, der 5 amerikanische und 6 chinesische LLMs (Fable 5, GPT-5.4, GPT-5.5, DeepSeek-4-pro, Gemini-3.1-pro, GLM-5.1, Kimi-2.6, MiMo-2.5-pro, Opus-4.7, Qwen-3.6-plus, Qwen-3.7-max) gegeneinander antreten ließ. Die Aufgabe: Einen "God Node" in einem echten LangGraph-Agenten entflechten — einen Plan-Node mit 350 versteckten Zeilen Logik.
Das Ergebnis: Fable 5 war der einzige Generator mit verifizierbaren Fakten, fand beide Bugs im Original-Code, lieferte vollständige Coverage und eine empfohierte Ausführungsreihenfolge. DeepSeek-4-pro war der beste Analyst in der Evaluierung — die Reviews mit den meisten geteilten Thesen.
Prompt für eigene Tests:
Analysiere den folgenden LangGraph-State-Graphen. Identifiziere:
1. Welche Logik ist in einzelnen Nodes versteckt?
2. Welche Abhängigkeiten zwischen den Nodes existieren?
3. Wie sollte die Control Flow explizit im Graph sichtbar gemacht werden?
4. Welche Tests sollten vor und nach dem Refactoring laufen?
Begründe jede Empfehlung mit konkreten Code-Stellen.
Quelle: https://wtf.korridzy.com/twilight-of-the-gods/ | 47↑ HN
Warum Highlight: Der Artikel zeigt, dass (a) Fable 5 bei architekturrelevanten Tasks deutlich stärker ist als Vorgänger, (b) chinesische Modelle (Qwen-3.7-max, GLM-5.1, DeepSeek-4-pro) bei der Evaluierung mithalten, und (c) die "Wet Swimsuit Contest"-Methodik (drei verschiedene Meta-Analyse-Ansätze) ein reproduzierbares Framework für LLM-Vergleiche bietet.
📰 Erlesene Artikel & Ressourcen
| Titel | Quelle | Upvotes |
|---|---|---|
| Claude-real-video — any LLM can watch a video | GitHub / HN | 132↑ |
| No LLM Code in Dependencies (git-annex) | joeyh.name / HN | 117↑ |
| Zuckerberg: AI agent development going slower than expected | Reuters / HN | 37↑ |
| Ask HN: Is anyone experimenting with different ways of using LLMs for coding? | HN | 31↑ |
| Chrome DevTools for agents (Offizielles Google-Tool) | GitHub ChromeDevTools | 2.7K ⭐ |
| Agent Skills (Anthropic-offener Standard) | GitHub agentskills | 439 ⭐ |
| Fable 5 deployed again after export controls lifted | MarkTechPost | — |
| Anthropic proposes 4-criteria jailbreak scoring framework | MarkTechPost | — |
| LLM Agents Say When No One Is Watching (arXiv 2607.02507) | arXiv | — |
| Memory-Induced Reasoning Drift in Personalized LLMs (arXiv 2607.02374) | arXiv | — |
| Action-Boundary Violations in DevOps Agents (arXiv 2607.02294) | arXiv | — |
Top-Story des Tages: Claude-real-video (132↑ HN) — ein CLI-Tool, das jedes LLMVideos lokal analysieren lässt durch scene-change detection + deduplication + Whisper-Transkription: deutlich smarter als fixed-interval Sampling.
Aufkommende Themen: (1) Agent Skills als plattformübergreifender Standard, (2) DSPy als quantitatives Prompt-Engineering-Framework, (3) "Understand to Participate"-Bewegung gegen Cognitive Debt, (4) Zuckerberg-Einräumung: AI-Agent-Entwicklung langsamer als erwartet.
Bericht erstellt am 3. Juli 2026 Quellen: Hacker News, Simon Willison's Weblog, MarkTechPost, arXiv, GitHub Trending, Reuters, Personal Blogs