🔤 TOP 3 PROMPTS — Textgenerierung
1. Ponytail – Der faule Senior-Entwickler als AGENTS.md Prompt
Prompt (vollständig, kopierbar):
# Ponytail, lazy senior dev mode
You are a lazy senior developer. Lazy means efficient, not careless. The best code is the code never written.
Before writing any code, stop at the first rung that holds:
1. Does this need to be built at all? (YAGNI)
2. Does the standard library already do this? Use it.
3. Does a native platform feature cover it? Use it.
4. Does an already-installed dependency solve it? Use it.
5. Can this be one line? Make it one line.
6. Only then: write the minimum code that works.
Rules:
- No abstractions that weren't explicitly requested.
- No new dependency if it can be avoided.
- No boilerplate nobody asked for.
- Deletion over addition. Boring over clever. Fewest files possible.
- Question complex requests: "Do you actually need X, or does Y cover it?"
- Pick the edge-case-correct option when two stdlib approaches are the same size, lazy means less code, not the flimsier algorithm.
- Mark intentional simplifications with a `ponytail:` comment. If the shortcut has a known ceiling (global lock, O(n²) scan, naive heuristic), the comment names the ceiling and the upgrade path.
Not lazy about: input validation at trust boundaries, error handling that prevents data loss, security, accessibility, the calibration real hardware needs, anything explicitly requested. Lazy code without its check is unfinished: non-trivial logic leaves ONE runnable check behind, the smallest thing that fails if the logic breaks (an assert-based demo/self-check or one small test file; no frameworks, no fixtures). Trivial one-liners need no test.
Am besten mit: Claude Code (Sonnet/Opus), Codex, Copilot CLI, Gemini CLI, OpenCode, Pi
Warum effektiv: Benchmark-Ergebnisse zeigen 80–94 % weniger Code, 3–6× schnellere Ausführung und 47–77 % niedrigere Token-Kosten gegenüber Standard-Agent-Verhalten. Der Prompt zwingt den Agenten in eine 6-stufige Prüfroutine, bevor überhaupt Code geschrieben wird — ein bewährtes Pattern, das Über-Engineering systematisch verhindert. Das ponytail: Kommentar-System dokumentiert dabei bewusste Simplifizierungen samt Upgrade-Path.
Quelle: https://github.com/DietrichGebert/ponytail | 63 Upvotes
Community Resonanz: Auf Hacker News als Show HN gelistet mit 63 Upvotes. Support für 13 verschiedene Coding-Agent-Plattformen (Claude Code, Codex, Copilot CLI, Gemini CLI, OpenCode, Pi, Cursor, Windsurf, Cline, Kiro, Antigravity). AGENTS.md-Datei direkt im Repo — sofort aktivierbar.
2. Databricks Omnigent — YAML-basierte Multi-Agent-Komposition
Prompt (vollständig, kopierbar):
# Custom Agent Definition für Omnigent
name: my_agent
prompt: You are a helpful data analyst.
executor:
harness: claude-sdk # or: codex, codex-native, claude-native, openai-agents, pi
tools:
researcher:
type: agent
prompt: Search for relevant information and summarize it.
# Budget Policy
policies:
budget:
type: function
handler: omnigent.policies.builtins.cost.cost_budget
factory_params:
max_cost_usd: 5.00
ask_thresholds_usd: [3.00]
Am besten mit: Omnigent (Python 3.12+, Node.js 22 LTS), Claude SDK, OpenAI Agents SDK, Pi
Warum effektiv: Omnigent erlaubt es, Multi-Agent-Pipelines in YAML zu definieren — jeder Sub-Agent hat seinen eigenen Prompt, sein eigenes Tool-Set und seinen eigenen Executor. Policies stapeln sich über drei Ebenen (serverweit, pro-Agent, pro-Session). Das /model-Kommando erlaubt Modellwechsel mid-session. Ein Befehl (omni setup) installiert alle Abhängigkeiten. Open-Source von Databricks, unterstützt Claude Code, Codex und Pi parallel.
3. GLM-5.2 mit 1M-Token-Kontext und Thinking-Effort-Stufen
Prompt/Konfiguration (vollständig, kopierbar):
{
"env": {
"CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
}
}
Und als Environment-Variablen:
export ANTHROPIC_AUTH_TOKEN="your-token-here"
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"
Dann im Claude-Code-Terminal: /effort max für volle Denkleistung, /status zur Bestätigung.
Am besten mit: GLM-5.2 über Z.ai API (Anthropic-kompatibler Endpunkt), Claude Code, Cline, OpenCode, OpenClaw
Warum effektiv: GLM-5.2 bietet nutzbaren 1-Million-Token-Kontext mit zwei konfigurierbaren Thinking-Effort-Stufen (/effort Befehl). Kompatibel mit 8 agentic Coding-Tools ab Tag 1. Die Anthropic-kompatible API ermöglicht einen nahtlosen Austausch von Sonnet/Opus durch GLM-5.2 in existierenden Setups — ohne Code-Änderungen. Keine Benchmarks bei Launch veröffentlicht, aber der 1M-Kontext ist praktisch nutzbar für große Codebasen.
🖼️ TOP 3 PROMPTS — Bildgenerierung
(Keine neuen, kopierbaren Bildprompts in den Quellen der letzten 24h gefunden. MarkTechPost und andere Portals berichteten primär über Modell-Releases und Agent-Tools.)
🎬 TOP 3 PROMPTS — Videogenerierung
(Keine neuen Videoprompts in den Quellen der letzten 24h gefunden.)
🧠 TOP 3 NEUE TECHNIKEN
1. YAGNI-First Code-Reduktion (Ponytail-Methode)
Zusammenfassung: Eine 6-stufige Abbruchlogik, die den Agenten zwingt, vor jeder Code-Generierung zu prüfen, ob weniger oder gar kein Code das Problem löst.
Erklärung: Agenten neigen systematisch zu Overengineering — sie erstellen Wrapper, Abstraktionen und Boilerplate, wo StdLib oder eine Zeile genügen würde. Ponytail implementiert eine strikte Hierarchie: (1) Braucht es das überhaupt? (2) StdLib? (3) Platform-Feature? (4) Existierende Dependency? (5) Eine Zeile? (6) Erst dann: Minimum Code. Das ponytail: Kommentar markiert bewusste Abkürzungen mit ihrem bekannten Limit und Upgrade-Pfad. Eingebettet als AGENTS.md funktioniert es in 13+ Agent-Plattformen.
Beispielprompt:
Before writing any code, stop at the first rung that holds:
1. Does this need to be built at all? (YAGNI)
2. Does the standard library already do this? Use it.
3. Does a native platform feature cover it? Use it.
4. Does an already-installed dependency solve it? Use it.
5. Can this be one line? Make it one line.
6. Only then: write the minimum code that works.
Rules:
- Deletion over addition. Boring over clever. Fewest files possible.
- Question complex requests: "Do you actually need X, or does Y cover it?"
- Mark shortcuts with a `ponytail:` comment naming the ceiling and upgrade path.
Geeignet für: Claude Code, Codex, Copilot CLI, Gemini CLI, Cursor, Windsurf, Cline
Ursprung: https://github.com/DietrichGebert/ponytail | 63↑ HN
Warum heute wichtig: Mit der Explosion von AI-Coding-Agenten (Claude Code, Codex, Copilot, Cursor etc.) ist Agent-Bloat ein massiver Kostenfaktor geworden. Ponytail beweist mit Benchmarks: 80–94 % weniger Code, bis zu 77 % geringere Kosten. Die Technik ist agnostisch — sie funktioniert als AGENTS.md-Datei in jedem Agent-Tool ohne Installation.
2. Relentless Proaktivität als Agent-Debugging-Technik (Claude Fable 5)
Zusammenfassung: Claude Fable 5 demonstrierte komplett autonome Debugging-Fähigkeiten: Ohne Browser-Automation zu können, manipulierte es Website-Templates, injizierte JavaScript, startete lokale Server und erstellte ein CORS-basiertes Diagnose-System — alles aus einem Screenshot und einem Einzeiler-Prompt.
Erklärung: Simon Willison zeigte einen Screenshot eines horizontalen Scrollbar-Bugs. Fable 5 erkannte, dass eine Browser-Inspektion nötig war, obwohl kein Browser-Zugriff möglich war. Stattdessen: (1) Editierte Datasette-Templates, um JS-Key-Simulatoren zu injizieren, (2) schrieb einen Python-HTTP-Server mit http.server, der CORS-Diagnose-Daten empfing, (3) erstellte Scratch-HTML-Seiten in /tmp, (4) verwendete screencapture CLI-Befehle für Screenshots. Am Ende traf Fable eine eigene Guardrail und downgraded sich zu Opus, das dann den 2-Zeilen-CSS-Fix bestätigte. Die Session-Kosten bei vollem API-Preis: ~$12.11.
Beispielprompt:
Look at dependencies to help figure out why there is a horizontal scrollbar here
Und zur Nachbearbeitung:
Write a report in /tmp/automation-report.md where you note down all of the tricks
you have used in this session to test against real browsers on my computer,
include runnable code examples
Geeignet für: Claude Fable 5 (Claude Max Plan), Claude Code
Ursprung: https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/ | Simon Willison
Warum heute wichtig: Zeigt die neue Generation von Coding-Agenten: Fable 5 erfindet Workarounds, die niemand dokumentiert hat. Gleichzeitig eine Warnung: Ohne Sandbox kann ein subvertierter Agent diese Techniken auch für Datenexfiltration missbrauchen. Praktisch relevant für jeden, der Claude Code in produktiven Umgebungen einsetzt.
3. Multi-Agent-Swarm mit 300 Sub-Agenten (Moonshot Kimi Work)
Zusammenfassung: Moonshot AI veröffentlichte Kimi Work — einen lokalen Desktop-Agent, der auf Kimi K2.6 läuft und bis zu 300 Sub-Agenten parallel koordiniert für komplexe Recherche- und Reporting-Aufgaben.
Erklärung: Kimi Work repräsentiert einen Paradigmenwechsel von Single-Agent zu Swarm-Architekturen. Statt einem Agenten eine riesige Aufgabe zu geben, werden Subtasks parallel an bis zu 300 spezialisierte Sub-Agenten verteilt, die unabhängig arbeiten und später vom Orchestrator zusammengeführt werden. Lokal auf dem Desktop ausgeführt, bedeutet das: Kein API-Call-Limit durch Cloud-Provider, keine Daten verlassen den Rechner, und die parallele Verarbeitung reduziert Wall-Clock-Zeit drastisch. Besonders relevant für Deep-Research-Workflows mit 20+ Modellen.
Beispiel-Konfiguration:
# Swarm-Orchestrierung Pattern (Kimi Work / ähnliche Architekturen)
orchestrator:
model: kimi-k2.6
max_sub_agents: 300
merge_strategy: deduplicate_rank_by_relevance
output_format: structured_report
sub_task_template:
specialization: "domain × source_type × depth"
constraints:
- max_tokens_per_subtask: 4096
- output_schema: {title, sources, summary, confidence}
- timeout_seconds: 120
Geeignet für: Kimi Work (Kimi K2.6), ähnliche Swarm-Architekturen mit Claude Code/Codex
Warum heute wichtig: Perplexity hat zeitgleich Deep Research in Computer verschoben und routed Subtasks über 20+ Frontier-Modelle. Swarm-Architekturen (300 Sub-Agenten bei Kimi, 20+ Modelle bei Perplexity) werden zum neuen Standard für komplexe Recherche. Single-Agent-Ansätze wirken damit zunehmend limitiert.
🏆 Highlight des Tages
Ponytail: 63↑ auf HN — Der meistbewertete Prompt-Engineering-Beitrag des Tages
Ponytail ist ein AGENTS.md-Prompt, der Coding-Agenten beibringt, wie ein erfahrener Senior-Entwickler zu denken: Zuerst prüfen, ob das Problem überhaupt Code braucht, dann StdLib, dann Platform-Features, dann Dependencies, dann eine Zeile, und erst am Ende komplexen Code schreiben.
Der Clou: Es funktioniert als einfache Markdown-Datei in jedem Agent-Tool — ohne Installation, ohne Konfiguration. In 13+ Plattformen unterstützt. Die Benchmarks sprechen für sich: 80–94 % weniger generierter Code, bis zu 77 % geringere Token-Kosten, 3–6× schnellere Ergebnisse.
Für prompta.ch-Nutzer besonders relevant: Der gesamte AGENTS.md-Prompt (26 Zeilen) ist sofort kopierbar und in Claude Code, Codex, Cursor, Copilot und 9 weiteren Tools nutzbar. Das ponytail: Kommentar-Pattern ist eine elegante Lösung für das Dilemma zwischen Minimalismus und Dokumentation.
URL: https://github.com/DietrichGebert/ponytail
📰 Erlesene Artikel & Ressourcen
Simon Willison — „Claude Fable is relentlessly proactive"
Tiefgehender Bericht über die autonomen Debugging-Fähigkeiten von Claude Fable 5. Fable manipulierte Templates, schrieb lokale Server, nutzte screencapture und baute ein CORS-Diagnose-System — alles aus einem Screenshot. Zugleich Warnung vor den Risiken von ungesandboxten Coding-Agenten.
Quelle: https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/
Simon Willison — „Why AI hasn't replaced software engineers" Essay über das KI-Produktivitätsparadoxon: Wenn Coding nicht der Engpass ist, was dann? Analyse von WARN-Act-Daten (0 von 160+ Firmen haben KI als Layoff-Grund angegeben). Quelle: https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/
Databricks — Omnigent: Meta-Harness für AI-Agenten Open-Source-Tool, das Claude Code, Codex und Pi in YAML-basierten Agent-Workflows orchestriert. Custom Agents, Sub-Agents, Budget-Policies — alles in deklarativem YAML. Quelle: https://www.marktechpost.com/2026/06/13/databricks-open-sources-omnigent-a-meta-harness-that-composes-governs-and-shares-ai-agents-across-claude-code-codex-and-pi/
Z.ai — GLM-5.2 Launch mit 1M-Token-Kontext GLM-5.2 mit 1-Million-Token-Kontext, zwei Thinking-Effort-Stufen, nahtlose Integration in CLAUDE_CODE via Anthropic-kompatiblem Endpunkt. Keine Benchmarks bei Launch. Quelle: https://www.marktechpost.com/2026/06/14/z-ai-launches-glm-5-2-with-a-usable-1m-token-context-two-thinking-effort-levels-and-no-benchmarks-at-launch/
Moonshot AI — Kimi Work mit 300-Sub-Agent-Swarm Lokaler Desktop-Agent auf Kimi K2.6 mit bis zu 300 parallel arbeitenden Sub-Agenten. Swarm-Architektur als Alternative zu Cloud-basierten Single-Agent-Ansätzen. Quelle: https://www.marktechpost.com/2026/06/12/moonshot-ai-launches-kimi-work-a-local-desktop-agent-reportedly-running-on-kimi-k2-6-with-a-300-sub-agent-agent-swarm/
Marktplatz für AI-Agent-Plugins wächst GitHub-Trending zeigt neue Repos wie Velyr (conversion-leak-finder), burpwn (Burp Suite für AI-Agenten), v-cos (Governance-Layer für Coding-Agenten), audit-skills (30 Invarianten für AI-Code-Audits) und tkngate (Cloudflare für AI-Agenten). Agent-Infrastruktur wird zur eigenen Produktkategorie.
arXiv — Forschungsarbeiten der letzten 24 Stunden
Communication Policy Evolution for Proactive LLM Agents (arXiv:2606.14314) Formalisiert, wann und wie LLM-Agenten zwischen Modalitäten kommunizieren sollten. Kommunikation ist teuer; identische Benutzerpräferenzen limitieren den Informationsaustausch. Quelle: https://arxiv.org/abs/2606.14314
Retrospective Progress-Aware Self-Refinement for LLM Agent Training (arXiv:2606.14302) Zeigt, dass Online-Progress-Prompting die Leistung verschlechtert, während retrospektive Demonstrationsdaten beim RL-Training für langfristige Aufgaben helfen. Quelle: https://arxiv.org/abs/2606.14302
From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails (arXiv:2606.14517) Offenbart, dass Guardrails, die LLMs gegen Prompt-Injection schützen, selbst durch DoS-Angriffe auf ihre Reasoning-Fähigkeiten lahmgelegt werden können. Die gleichen Fähigkeiten, die Schutz ermöglichen, werden zur Schwachstelle. Quelle: https://arxiv.org/abs/2606.14517
Bericht erstellt am 2026-06-15 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs