📡 Daily Prompt Intelligence — 26. Juni 2026
🔤 TOP 3 PROMPTS — Textgenerierung
1. Nanobot Agent System-Prompt (Python-Implementierung)
Prompt (vollständig, kopierbar):
DEFAULT_SYSTEM_PROMPT = (
"You are nanobot, a concise, helpful personal AI agent. You can call tools when "
"they help. Prefer using a tool over guessing for math, the current time, running "
"code, web lookups, or recalling stored facts. After tools run, answer the user "
"directly and clearly."
)
Am besten mit: GPT-4o-mini, Claude Sonnet, oder jedes OpenAI-kompatibles Modell
Warum effektiv: Extrem kompakter Agent-Prompt, der in nur 4 Zeilen die gesamte Tool-Call-Philosophie eines Agenten definiert. Das System priorisiert Tool-Nutzung über Vermutungen und gibt klare Antworten — perfekt als Basis-System-Prompt für eigene Agenten-Implementierungen.
Community Resonanz: MarkTechPost hat den Code als vollständiges Google-Colab-Tutorial veröffentlicht — kompletter Agent mit Tool Registry, Memory, Skills und MCP-Server-Integration.
2. Garry Tan's gstack — YC Office Hours Skill Prompt
Prompt (vollständig, kopierbar):
You are running a YC Office Hours session. Apply six forcing questions that expose:
1. Demand Reality — "Show me proof people actively want this. Not survey data. Real actions."
2. Status Quo — "What are they using today? If nothing, that's your answer."
3. Desperate Specificity — "Who would notice if this disappeared tomorrow?"
4. Narrowest Wedge — "What's the smallest thing you could ship tomorrow that delivers value?"
5. Observation — "What have you noticed about how people actually use workarounds?"
6. Future-fit — "If you had to build the v3 today, would you still start here?"
Challenge the user's framing. Extract hidden capabilities. Generate 3 implementation
approaches with effort estimates. Push for the narrowest viable wedge.
Am besten mit: Claude Opus 4.8, Claude Sonnet 4, GPT-5.5
Warum effektiv: Der gstack-Framework von YC CEO Garry Tan enthält 23 spezialisierte Agent-Skills als strukturierte SKILL.md-Dateien. Der Office-Hours-Prompt zwingt LLMs zum kritischen Hinterfragen von Produktideen — statt blind zu akzeptieren. Funktioniert sowohl für Produktentwicklung als auch für kreative Brainstorming-Sessions.
Quelle: https://github.com/garrytan/gstack | Install: git clone --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
Community Resonanz: Garry Tan (YC President) berichtet: 3 Produktionsservices und 40+ Features in 60 Tagen, 810× Produktivitätssteigerung gegenüber 2013. Das Repo supportet 10 AI-Coding-Agenten (Claude Code, Codex, Cursor, Hermes, etc.).
3. CtxGov — Agent Context Governance Prompt
Prompt (vollständig, kopierbar):
# Diagnose bevor dein Agent handelt — ererbe keine veralteten Systemzustände
ctxgov change-gate-check --root . --format summary
# Diff zwischen zwei Codezuständen mit semantischem Bericht
ctxgov change-gate-check --baseline-root baseline --head-root head --format summary
# Kontinuitäts-Trace kompilieren und anwenden
ctxgov continuity compile saved-goal-trace.json
ctxgov continuity apply --mode dry-run saved-goal-trace.json
Am besten mit: Alle Claude Code / Agent-basierten Setups
Warum effektiv: CtxGov ist ein lokales Governance-Tool, das agentischer KI-Systeme vorab prüft, welche Kontext- und Memory-Zustände sie von vorherigen Sessions erben. Verhindert, dass Agenten mit veralteten Summaries oder undefinierten Handoffs weiterarbeiten — ein unterschätztes Problem in Multi-Session-Agent-Architekturen.
Quelle: https://github.com/ctxgov/ctxgov | 3up auf Hacker News
Community Resonanz: 3up aufHN, neu in Trending. Open-Source (Apache-2.0), v0.9.0 mit 13 öffentlichen CLI-Befehlen für Change-Gate-Analysen, Memory-X-Ray-Validierung und Forensik-Timelines.
🖼️ TOP 3 PROMPTS — Bildgenerierung
(Keine neuen Bildgenerierungs-Prompts mit klarer Kopierstruktur in den letzten 24h identifiziert. Die Bildgenerierungslandschaft konzentriert sich aktuell auf Modellrelease-News statt Prompt-Innovationen.)
🎬 TOP 3 PROMPTS — Videogenerierung
(Keine spezifischen Videogenerierungs-Prompts in den letzten 24h verfügbar. Die Video-Prompt-Landschaft wartet auf neue Model-Releases.)
🧠 TOP 3 NEUE TECHNIKEN
1. Selbstlernende Agent-Scaffolds (Ornith-1.0)
Zusammenfassung: Ornith-1.0 von DeepReinforce ist die erste Modellfamilie, die während des Reinforcement-Learning ihr eigenes Agent-Scaffold (Orchestrierungslogik) miterlernt, statt es von Menschen vorgegeben zu bekommen.
Erklärung: Die meisten Coding-Agenten nutzen einen manuell designten Scaffold — Memory, Tool-Calls, Error-Handling, Orchestrierung. Ornith-1.0 behandelt den Scaffold als lernbares Objekt. Jeder RL-Schritt: (1) Modell liest Aufgabe + bisherigen Scaffold, (2) schlägt verfeinerten Scaffold vor, (3) generiert Lösung damit. Reward fließt in beide Stufen zurück. Über die Trainingsepoche entstehen per-task Strategien ohne hand-engineered Harness. Drei Defense-Layer verhindern Reward-Hacking (Tests-Datei-Leseverbot, Oracle-Kopierschutz, Off-Policy-Token-Filterung).
Beispielprompt:
# Ornith-1.0 Scaffold-Vorschlag (abstrahiertes Template):
# Schritt 1: Scaffold-Design
task_description = "Implementiere REST API mit Auth"
current_scaffold = "<think>→plan→code→test→commit"
# Schritt 2: Modell schlägt adaptierten Scaffold vor
new_scaffold = model.propose_scaffold(task_description, current_scaffold)
# → Ergebnis: "<think>→plan→write_auth→write_api→integration_test→commit"
# Schritt 3: Lösung mit neuem Scaffold generieren
solution = model.solve_with_scaffold(task_description, new_scaffold)
# Reward fließt in scaffold_policy UND solution_policy
reward = evaluate(solution)
model.update_policies(reward)
Geeignet für: Ornith-1.0 Modelle (9B/31B/35B-MoE/397B-MoE, MIT-Lizenz), verfügbar auf HuggingFace
Ursprung: https://deep-reinforce.com/ornith_1_0.html | https://www.marktechpost.com/2026/06/25/deepreinforce-releases-ornith-1-0-an-open-source-coding-model-family-that-learns-its-own-rl-scaffolds/
Warum heute wichtig: Ornith-1.0-397B erreicht 82.4 auf SWE-Bench Verified (nur Claude Opus 4.8 mit 87.6 ist besser), 77.5 auf Terminal-Bench 2.1 — als open-source MIT-Modell. Das 35B-MoE (3B aktiv pro Token) schlägt Qwen 3.5-397B mit 64.2 vs 53.1 auf Terminal-Bench. Der Ansatz, Scaffolds automatisch zu lernen statt zu designen, könnte die gesamte Coding-Agent-Architektur revolutionieren.
2. Three-Type Memory für AI-Agenten (Neo4j Context Graph)
Zusammenfassung: AI-Agenten benötigen drei explizite Memory-Typen — Episodic (vergessen), Semantic (gelerntes Wissen), und Procedural (Tool-Nutzung) — um produktiv zu sein.
Erklärung: Die Forschung zeigt, dass die meisten AI-Agenten an einem fundamentalen Memory-Problem scheitern: Sie vermischen alle Kontextinformationen in einen einzigen Prompt-Stream. Neo4j argumentiert für getrennte Memory-Graphen, die verschiedene Arten von Information strukturiert halten. Episodic Memory speichert einzelne Interaktionen mit Verfallszeit, Semantic Memory baut ein persistierendes Wissensnetz über Domänenkonzepte, und Procedural Memory hält Tool-Nutzungsmuster und Workflow-Erinnerungen fest. Context Graphs verbinden diese drei Ebenen, sodass der Agent semantisch relevante Erinnerungen abrufen kann, ohne den gesamten Prompt zu überladen.
Beispielprompt:
# Systemarchitektur für Three-Type Memory:
SYSTEM PROMPT:
"You maintain three memory stores:
[EPISODIC] Store recent interactions with 24h TTL. Format: {timestamp: action: outcome}
[SEMANTIC] Build persistent knowledge: {entity: properties: relationships}
[PROCEDURAL] Track tool patterns: {tool_name: when_used: success_rate: tips}
Before responding, query relevant stores:
- For domain questions → SEMANTIC first, then PROCEDURAL
- For 'last time we discussed...' → EPISODIC
- For tool decisions → PROCEDURAL only
Never mix memory types in a single retrieval. Never exceed token budget."
Geeignet für: Alle Agent-Architekturen mit externem Memory-Speicher (LangGraph, CrewAI, AutoGen)
Ursprung: https://neo4j.com/blog/agentic-ai/context-graph-ai-agent-memory/ | 3up auf Hacker News
Warum heute wichtig: Mit wachsender Agent-Komplexität wird Memory-Management zum kritischen Engpass. Drei-Typen-Separation reduziert Token-Kosten bei längeren Agent-Sessions um bis zu 60%, da nur relevante Memory-Segmente geladen werden statt kompletter Historien.
3. Agent-Sicherheitsworkflow: Scanner-first statt Agent-first
Zusannahme: Für Security-Audits sollte der Agent niemals als primärer Scanner fungieren. Scanner erkennen bekannte Vulnerabilities, Agenten orchestrieren die Entscheidung, was geprüft wird.
Erklärung: PB Beris Analyse zeigt: Raw Agents verschwenden 20-30K Tokens für Aufgaben die ein Scanner in Millisekunden löst. Blinde Scanner wiederum erkennen nur bekannte Klassen und verpassen kontextspezifische Schwachstellen. Die Lösung: Lattice Mind Architektur — der Agent entscheidet WAS geprüft wird, der Scanner führt es aus, der Agent interpretiert. Drei praktische Regeln: (1) Bekannte Vuln-Klasse → Scanner direkt, (2) MCP-Server nur wenn State existiert, (3) Live-Infrastruktur braucht Live-Benchmarks.
Beispielprompt:
# Agent-Sicherheitsworkflow (Scanner-first Architektur):
SYSTEM PROMPT:
"You are a security orchestration agent. Follow this decision tree:
1. CLASSIFY the target: What vulnerability class is this?
2. SCAN if possible: Is there a reliable scanner for this class?
→ YES: Run scanner, report findings only if confidence > 8/10
→ NO: Use reasoning to craft targeted payload
3. VERIFY: Re-run any scanner finding on a CONTROL target first
→ False positive on control → dismiss finding
→ True positive on control → proceed with exploit analysis
RULES:
- Never spend 20K+ tokens on what a scanner catches instantly
- Never trust MCP tool output without control verification
- Document each finding with: target_vuln_class, scanner_used, confidence, control_result
- If a model flags something static, verify against clean baseline
Geeignet für: Claude Opus/Sonnet, GPT-5.5, alle Agent-Frameworks mit Tool-Access
Ursprung: https://shad0wmazt3r.github.io/ai-security | 4up auf Hacker News
Warum heute wichtig: Mit dem Wachstum von AI-Agenten in produktiven Security-Workflows wird Token-Ineffizienz zum Kostentreiber. Der Scanner-first Ansatz reduziert Audit-Kosten um 60-80%, während die Trefferquote steigt (weniger False Positives durch Control-Verification).
🏆 Highlight des Tages
Garry Tan's gstack: 23 Claude-Code-Skills als Open-Source Framework — 810× Produktivitätssteigerung
Der YC President & CEO Garry Tan hat sein gesamtes AI-Coding-Setup als gstack Open-Source veröffentlicht — 23 spezialisierte Agent-Skills, die Claude Code in einen virtuellen Engineering-Team verwandeln. Jeder Skill ist eine SKILL.md-Datei mit strukturierten Anweisungen.
Die 23 Skills im Überblick:
| Slash Command | Spezialisierung | Funktion |
|---|---|---|
| /office-hours | YC Office Hours | 6 Forcing Questions für Produktvalidierung |
| /plan-ceo-review | CEO/Founder | Strategische Challenge mit 4 Scope-Modi |
| /plan-eng-review | Eng Manager | Architektur, Datenfluss, Edge Cases |
| /design-html | Design Engineer | Produktions-HTML mit Pretext Layout |
| /cso | Chief Security Officer | OWASP Top 10 + STRIDE Threat Model |
| /review | Staff Engineer | Production-Bug-Finding mit Auto-Fix |
| /qa | QA Lead | Browser-Testing mit Regression Tests |
| /ship | Release Engineer | Test → PR → Deploy Pipeline |
| /investigate | Debugger | Systematische Root-Cause-Analyse |
| /design-shotgun | Design Explorer | 4-6 AI-Mockup-Varianten generieren |
Installation in 30 Sekunden:
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
Warum das Highlight ist: gstack ist kein einzelner Prompt — es ist ein kompletter Prozess. Jeder Skill feedet in den nächsten: /office-hours schreibt ein Design-Dokument, das /plan-ceo-review liest. /plan-eng-review schreibt einen Test-Plan, den /qa aufnimmt. /review catcht Bugs, die /ship verifiziert. Nichts fällt durch die Lücken, weil jeder Schritt weiß, was vorher geschah. Support für 10 AI-Agenten (Claude Code, OpenAI Codex, Cursor, OpenCode, Hermes, Kiro, Factory Droid, GBrain, Slate).
Metriken: Garry Tan meldet: 3 Produktionsservices und 40+ Features in 60 Tagen (part-time neben YC-CEO-Rolle), 810× Produktivitätsschub im Vergleich zu 2013 (11.417 vs 14 logische Lines/Tag), 240× das gesamte 2013-Jahr bereits in 2026 erreicht. 23.000+ Stars in der ersten Woche.
Quelle: https://github.com/garrytan/gstack | 3up auf Hacker News (unter "agent workflow")
📰 Erlesene Artikel & Ressourcen
Warum aktuelle LLM-Kosten nicht nachhaltig sind (52up auf HN) Tiefgehende Analyse über fünf Faktoren, die LLM-Kosten drücken werden: Modell-Plateau, Open-Weight-Releases, spezialisierte Chips, Zero Switching Costs, und lokale Modelle. Fazit: Preise werden kollabieren, sobald lokale Hardware Frontier-Qualität erreicht. → https://aditya.patadia.org/p/ai-and-cloud-costs
Anthropic klagt gegen Alibaba — größte Claude-Klon-Attacke (Ars Technica) Anthropic behauptet, Alibaba habe Trump-Exportbeschränkungen missachtet, um Claude anzugehen und Capabilities zu stehlen. Hintergrund: AI-Export-Kontrolle und die geopolitische Dimension von Modellkopien. → https://arstechnica.com/tech-policy/2026/06/anthropic-claims-alibaba-defied-trump-to-attack-claude-and-steal-capabilities/
OpenAI + Broadcom: Chip für LLM-Inference at Scale (Ars Technica) OpenAI und Broadcom kündigen einen speziell für LLM-Inference designeden Chip an. Bedeutung für die Infrastruktur-Diskussion: eigene Silizium-Architektur statt generischer GPUs könnte Token-Kosten um 30-70% senken. → https://arstechnica.com/gadgets/2026/06/openai-and-broadcom-announce-chip-designed-for-llm-inference-at-scale/
AI-Agenten können Robot-Training autonom dirigieren (Ars Technica) Coding-Agenten haben roboter-gesteuerte GPU-Installation und Kabelschnitt-Tests autonom durchgeführt — ein Meilenstein für physische Agent-Arbeitsabläufe. → https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/
AI-Agenten sind empfindlich gegenüber Nudges (PNAS, June 2026) Peer-reviewed Studie in PNAS zeigt, dass kleinste Änderungen im Agent-Prompting Verhalten signifikant beeinflussen — bestätigt die "Nudge"-Theorie für Agent-Architekturen. → https://www.pnas.org/doi/10.1073/pnas.2537030123
Google DESIGN.md Format-Spec für Coding-Agenten (Trending auf GitHub)
Ein Format-Standard zur Beschreibung visueller Identitäten für Coding-Agenten. DESIGN.md gibt Agenten persistente, strukturierte Design-Tokens — Konvertierung zu DTCG-Format via npx @google/design.md export --format dtcg DESIGN.md.
→ https://github.com/google-labs-code/design.md
Prompt Injection in Automated Resume Screening (arXiv 2606.27287) Studie untersucht strategische Prompt-Injection bei automatisierten Bewerbungsscreenings. Zwei Settings: Single-Injection (ein Resume enthält Instruktionen) vs Multi-Injection (mehrere Bewerber koordinieren). Relevant für alle, die LLM-basierte HR-Pipelines betreiben. → https://arxiv.org/abs/2606.27287
Bericht erstellt am 2026-06-26 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs