📅

Ponytail, lazy senior dev mode

🏆 Highlight

### Ponytail: 63↑ auf HN — Der meistbewertete Prompt-Engineering-Beitrag des Tages Ponytail ist ein AGENTS.md-Prompt, der Coding-Agenten beibringt, wie ein erfahrener Senior-Entwickler zu denken: Zuerst prüfen, ob das Problem überhaupt Code braucht, dann StdLib, dann Platform-Features, dann Dependencies, dann eine Zeile, und erst am Ende komplexen Code schreiben. Der Clou: Es funkti...

🔤 TOP 3 PROMPTS — Textgenerierung

1. Ponytail – Der faule Senior-Entwickler als AGENTS.md Prompt

Prompt (vollständig, kopierbar):

# Ponytail, lazy senior dev mode

You are a lazy senior developer. Lazy means efficient, not careless. The best code is the code never written.

Before writing any code, stop at the first rung that holds:

1. Does this need to be built at all? (YAGNI)
2. Does the standard library already do this? Use it.
3. Does a native platform feature cover it? Use it.
4. Does an already-installed dependency solve it? Use it.
5. Can this be one line? Make it one line.
6. Only then: write the minimum code that works.

Rules:
- No abstractions that weren't explicitly requested.
- No new dependency if it can be avoided.
- No boilerplate nobody asked for.
- Deletion over addition. Boring over clever. Fewest files possible.
- Question complex requests: "Do you actually need X, or does Y cover it?"
- Pick the edge-case-correct option when two stdlib approaches are the same size, lazy means less code, not the flimsier algorithm.
- Mark intentional simplifications with a `ponytail:` comment. If the shortcut has a known ceiling (global lock, O(n²) scan, naive heuristic), the comment names the ceiling and the upgrade path.

Not lazy about: input validation at trust boundaries, error handling that prevents data loss, security, accessibility, the calibration real hardware needs, anything explicitly requested. Lazy code without its check is unfinished: non-trivial logic leaves ONE runnable check behind, the smallest thing that fails if the logic breaks (an assert-based demo/self-check or one small test file; no frameworks, no fixtures). Trivial one-liners need no test.

Am besten mit: Claude Code (Sonnet/Opus), Codex, Copilot CLI, Gemini CLI, OpenCode, Pi

Warum effektiv: Benchmark-Ergebnisse zeigen 80–94 % weniger Code, 3–6× schnellere Ausführung und 47–77 % niedrigere Token-Kosten gegenüber Standard-Agent-Verhalten. Der Prompt zwingt den Agenten in eine 6-stufige Prüfroutine, bevor überhaupt Code geschrieben wird — ein bewährtes Pattern, das Über-Engineering systematisch verhindert. Das ponytail: Kommentar-System dokumentiert dabei bewusste Simplifizierungen samt Upgrade-Path.

Quelle: https://github.com/DietrichGebert/ponytail | 63 Upvotes

Community Resonanz: Auf Hacker News als Show HN gelistet mit 63 Upvotes. Support für 13 verschiedene Coding-Agent-Plattformen (Claude Code, Codex, Copilot CLI, Gemini CLI, OpenCode, Pi, Cursor, Windsurf, Cline, Kiro, Antigravity). AGENTS.md-Datei direkt im Repo — sofort aktivierbar.

2. Databricks Omnigent — YAML-basierte Multi-Agent-Komposition

Prompt (vollständig, kopierbar):

# Custom Agent Definition für Omnigent
name: my_agent
prompt: You are a helpful data analyst.
executor:
  harness: claude-sdk  # or: codex, codex-native, claude-native, openai-agents, pi
tools:
  researcher:
    type: agent
    prompt: Search for relevant information and summarize it.

# Budget Policy
policies:
  budget:
    type: function
    handler: omnigent.policies.builtins.cost.cost_budget
    factory_params:
      max_cost_usd: 5.00
      ask_thresholds_usd: [3.00]

Am besten mit: Omnigent (Python 3.12+, Node.js 22 LTS), Claude SDK, OpenAI Agents SDK, Pi

Warum effektiv: Omnigent erlaubt es, Multi-Agent-Pipelines in YAML zu definieren — jeder Sub-Agent hat seinen eigenen Prompt, sein eigenes Tool-Set und seinen eigenen Executor. Policies stapeln sich über drei Ebenen (serverweit, pro-Agent, pro-Session). Das /model-Kommando erlaubt Modellwechsel mid-session. Ein Befehl (omni setup) installiert alle Abhängigkeiten. Open-Source von Databricks, unterstützt Claude Code, Codex und Pi parallel.

Quelle: https://www.marktechpost.com/2026/06/13/databricks-open-sources-omnigent-a-meta-harness-that-composes-governs-and-shares-ai-agents-across-claude-code-codex-and-pi/

3. GLM-5.2 mit 1M-Token-Kontext und Thinking-Effort-Stufen

Prompt/Konfiguration (vollständig, kopierbar):

{
  "env": {
    "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
  }
}

Und als Environment-Variablen:

export ANTHROPIC_AUTH_TOKEN="your-token-here"
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"

Dann im Claude-Code-Terminal: /effort max für volle Denkleistung, /status zur Bestätigung.

Am besten mit: GLM-5.2 über Z.ai API (Anthropic-kompatibler Endpunkt), Claude Code, Cline, OpenCode, OpenClaw

Warum effektiv: GLM-5.2 bietet nutzbaren 1-Million-Token-Kontext mit zwei konfigurierbaren Thinking-Effort-Stufen (/effort Befehl). Kompatibel mit 8 agentic Coding-Tools ab Tag 1. Die Anthropic-kompatible API ermöglicht einen nahtlosen Austausch von Sonnet/Opus durch GLM-5.2 in existierenden Setups — ohne Code-Änderungen. Keine Benchmarks bei Launch veröffentlicht, aber der 1M-Kontext ist praktisch nutzbar für große Codebasen.

Quelle: https://www.marktechpost.com/2026/06/14/z-ai-launches-glm-5-2-with-a-usable-1m-token-context-two-thinking-effort-levels-and-no-benchmarks-at-launch/


🖼️ TOP 3 PROMPTS — Bildgenerierung

(Keine neuen, kopierbaren Bildprompts in den Quellen der letzten 24h gefunden. MarkTechPost und andere Portals berichteten primär über Modell-Releases und Agent-Tools.)


🎬 TOP 3 PROMPTS — Videogenerierung

(Keine neuen Videoprompts in den Quellen der letzten 24h gefunden.)


🧠 TOP 3 NEUE TECHNIKEN

1. YAGNI-First Code-Reduktion (Ponytail-Methode)

Zusammenfassung: Eine 6-stufige Abbruchlogik, die den Agenten zwingt, vor jeder Code-Generierung zu prüfen, ob weniger oder gar kein Code das Problem löst.

Erklärung: Agenten neigen systematisch zu Overengineering — sie erstellen Wrapper, Abstraktionen und Boilerplate, wo StdLib oder eine Zeile genügen würde. Ponytail implementiert eine strikte Hierarchie: (1) Braucht es das überhaupt? (2) StdLib? (3) Platform-Feature? (4) Existierende Dependency? (5) Eine Zeile? (6) Erst dann: Minimum Code. Das ponytail: Kommentar markiert bewusste Abkürzungen mit ihrem bekannten Limit und Upgrade-Pfad. Eingebettet als AGENTS.md funktioniert es in 13+ Agent-Plattformen.

Beispielprompt:

Before writing any code, stop at the first rung that holds:
1. Does this need to be built at all? (YAGNI)
2. Does the standard library already do this? Use it.
3. Does a native platform feature cover it? Use it.
4. Does an already-installed dependency solve it? Use it.
5. Can this be one line? Make it one line.
6. Only then: write the minimum code that works.

Rules:
- Deletion over addition. Boring over clever. Fewest files possible.
- Question complex requests: "Do you actually need X, or does Y cover it?"
- Mark shortcuts with a `ponytail:` comment naming the ceiling and upgrade path.

Geeignet für: Claude Code, Codex, Copilot CLI, Gemini CLI, Cursor, Windsurf, Cline

Ursprung: https://github.com/DietrichGebert/ponytail | 63↑ HN

Warum heute wichtig: Mit der Explosion von AI-Coding-Agenten (Claude Code, Codex, Copilot, Cursor etc.) ist Agent-Bloat ein massiver Kostenfaktor geworden. Ponytail beweist mit Benchmarks: 80–94 % weniger Code, bis zu 77 % geringere Kosten. Die Technik ist agnostisch — sie funktioniert als AGENTS.md-Datei in jedem Agent-Tool ohne Installation.

2. Relentless Proaktivität als Agent-Debugging-Technik (Claude Fable 5)

Zusammenfassung: Claude Fable 5 demonstrierte komplett autonome Debugging-Fähigkeiten: Ohne Browser-Automation zu können, manipulierte es Website-Templates, injizierte JavaScript, startete lokale Server und erstellte ein CORS-basiertes Diagnose-System — alles aus einem Screenshot und einem Einzeiler-Prompt.

Erklärung: Simon Willison zeigte einen Screenshot eines horizontalen Scrollbar-Bugs. Fable 5 erkannte, dass eine Browser-Inspektion nötig war, obwohl kein Browser-Zugriff möglich war. Stattdessen: (1) Editierte Datasette-Templates, um JS-Key-Simulatoren zu injizieren, (2) schrieb einen Python-HTTP-Server mit http.server, der CORS-Diagnose-Daten empfing, (3) erstellte Scratch-HTML-Seiten in /tmp, (4) verwendete screencapture CLI-Befehle für Screenshots. Am Ende traf Fable eine eigene Guardrail und downgraded sich zu Opus, das dann den 2-Zeilen-CSS-Fix bestätigte. Die Session-Kosten bei vollem API-Preis: ~$12.11.

Beispielprompt:

Look at dependencies to help figure out why there is a horizontal scrollbar here

Und zur Nachbearbeitung:

Write a report in /tmp/automation-report.md where you note down all of the tricks
you have used in this session to test against real browsers on my computer,
include runnable code examples

Geeignet für: Claude Fable 5 (Claude Max Plan), Claude Code

Ursprung: https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/ | Simon Willison

Warum heute wichtig: Zeigt die neue Generation von Coding-Agenten: Fable 5 erfindet Workarounds, die niemand dokumentiert hat. Gleichzeitig eine Warnung: Ohne Sandbox kann ein subvertierter Agent diese Techniken auch für Datenexfiltration missbrauchen. Praktisch relevant für jeden, der Claude Code in produktiven Umgebungen einsetzt.

3. Multi-Agent-Swarm mit 300 Sub-Agenten (Moonshot Kimi Work)

Zusammenfassung: Moonshot AI veröffentlichte Kimi Work — einen lokalen Desktop-Agent, der auf Kimi K2.6 läuft und bis zu 300 Sub-Agenten parallel koordiniert für komplexe Recherche- und Reporting-Aufgaben.

Erklärung: Kimi Work repräsentiert einen Paradigmenwechsel von Single-Agent zu Swarm-Architekturen. Statt einem Agenten eine riesige Aufgabe zu geben, werden Subtasks parallel an bis zu 300 spezialisierte Sub-Agenten verteilt, die unabhängig arbeiten und später vom Orchestrator zusammengeführt werden. Lokal auf dem Desktop ausgeführt, bedeutet das: Kein API-Call-Limit durch Cloud-Provider, keine Daten verlassen den Rechner, und die parallele Verarbeitung reduziert Wall-Clock-Zeit drastisch. Besonders relevant für Deep-Research-Workflows mit 20+ Modellen.

Beispiel-Konfiguration:

# Swarm-Orchestrierung Pattern (Kimi Work / ähnliche Architekturen)
orchestrator:
  model: kimi-k2.6
  max_sub_agents: 300
  merge_strategy: deduplicate_rank_by_relevance
  output_format: structured_report

sub_task_template:
  specialization: "domain × source_type × depth"
  constraints:
    - max_tokens_per_subtask: 4096
    - output_schema: {title, sources, summary, confidence}
    - timeout_seconds: 120

Geeignet für: Kimi Work (Kimi K2.6), ähnliche Swarm-Architekturen mit Claude Code/Codex

Ursprung: https://www.marktechpost.com/2026/06/12/moonshot-ai-launches-kimi-work-a-local-desktop-agent-reportedly-running-on-kimi-k2-6-with-a-300-sub-agent-agent-swarm/

Warum heute wichtig: Perplexity hat zeitgleich Deep Research in Computer verschoben und routed Subtasks über 20+ Frontier-Modelle. Swarm-Architekturen (300 Sub-Agenten bei Kimi, 20+ Modelle bei Perplexity) werden zum neuen Standard für komplexe Recherche. Single-Agent-Ansätze wirken damit zunehmend limitiert.


🏆 Highlight des Tages

Ponytail: 63↑ auf HN — Der meistbewertete Prompt-Engineering-Beitrag des Tages

Ponytail ist ein AGENTS.md-Prompt, der Coding-Agenten beibringt, wie ein erfahrener Senior-Entwickler zu denken: Zuerst prüfen, ob das Problem überhaupt Code braucht, dann StdLib, dann Platform-Features, dann Dependencies, dann eine Zeile, und erst am Ende komplexen Code schreiben.

Der Clou: Es funktioniert als einfache Markdown-Datei in jedem Agent-Tool — ohne Installation, ohne Konfiguration. In 13+ Plattformen unterstützt. Die Benchmarks sprechen für sich: 80–94 % weniger generierter Code, bis zu 77 % geringere Token-Kosten, 3–6× schnellere Ergebnisse.

Für prompta.ch-Nutzer besonders relevant: Der gesamte AGENTS.md-Prompt (26 Zeilen) ist sofort kopierbar und in Claude Code, Codex, Cursor, Copilot und 9 weiteren Tools nutzbar. Das ponytail: Kommentar-Pattern ist eine elegante Lösung für das Dilemma zwischen Minimalismus und Dokumentation.

URL: https://github.com/DietrichGebert/ponytail


📰 Erlesene Artikel & Ressourcen

Simon Willison — „Claude Fable is relentlessly proactive" Tiefgehender Bericht über die autonomen Debugging-Fähigkeiten von Claude Fable 5. Fable manipulierte Templates, schrieb lokale Server, nutzte screencapture und baute ein CORS-Diagnose-System — alles aus einem Screenshot. Zugleich Warnung vor den Risiken von ungesandboxten Coding-Agenten. Quelle: https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/

Simon Willison — „Why AI hasn't replaced software engineers" Essay über das KI-Produktivitätsparadoxon: Wenn Coding nicht der Engpass ist, was dann? Analyse von WARN-Act-Daten (0 von 160+ Firmen haben KI als Layoff-Grund angegeben). Quelle: https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/

Databricks — Omnigent: Meta-Harness für AI-Agenten Open-Source-Tool, das Claude Code, Codex und Pi in YAML-basierten Agent-Workflows orchestriert. Custom Agents, Sub-Agents, Budget-Policies — alles in deklarativem YAML. Quelle: https://www.marktechpost.com/2026/06/13/databricks-open-sources-omnigent-a-meta-harness-that-composes-governs-and-shares-ai-agents-across-claude-code-codex-and-pi/

Z.ai — GLM-5.2 Launch mit 1M-Token-Kontext GLM-5.2 mit 1-Million-Token-Kontext, zwei Thinking-Effort-Stufen, nahtlose Integration in CLAUDE_CODE via Anthropic-kompatiblem Endpunkt. Keine Benchmarks bei Launch. Quelle: https://www.marktechpost.com/2026/06/14/z-ai-launches-glm-5-2-with-a-usable-1m-token-context-two-thinking-effort-levels-and-no-benchmarks-at-launch/

Moonshot AI — Kimi Work mit 300-Sub-Agent-Swarm Lokaler Desktop-Agent auf Kimi K2.6 mit bis zu 300 parallel arbeitenden Sub-Agenten. Swarm-Architektur als Alternative zu Cloud-basierten Single-Agent-Ansätzen. Quelle: https://www.marktechpost.com/2026/06/12/moonshot-ai-launches-kimi-work-a-local-desktop-agent-reportedly-running-on-kimi-k2-6-with-a-300-sub-agent-agent-swarm/

Marktplatz für AI-Agent-Plugins wächst GitHub-Trending zeigt neue Repos wie Velyr (conversion-leak-finder), burpwn (Burp Suite für AI-Agenten), v-cos (Governance-Layer für Coding-Agenten), audit-skills (30 Invarianten für AI-Code-Audits) und tkngate (Cloudflare für AI-Agenten). Agent-Infrastruktur wird zur eigenen Produktkategorie.


arXiv — Forschungsarbeiten der letzten 24 Stunden

Communication Policy Evolution for Proactive LLM Agents (arXiv:2606.14314) Formalisiert, wann und wie LLM-Agenten zwischen Modalitäten kommunizieren sollten. Kommunikation ist teuer; identische Benutzerpräferenzen limitieren den Informationsaustausch. Quelle: https://arxiv.org/abs/2606.14314

Retrospective Progress-Aware Self-Refinement for LLM Agent Training (arXiv:2606.14302) Zeigt, dass Online-Progress-Prompting die Leistung verschlechtert, während retrospektive Demonstrationsdaten beim RL-Training für langfristige Aufgaben helfen. Quelle: https://arxiv.org/abs/2606.14302

From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails (arXiv:2606.14517) Offenbart, dass Guardrails, die LLMs gegen Prompt-Injection schützen, selbst durch DoS-Angriffe auf ihre Reasoning-Fähigkeiten lahmgelegt werden können. Die gleichen Fähigkeiten, die Schutz ermöglichen, werden zur Schwachstelle. Quelle: https://arxiv.org/abs/2606.14517


Bericht erstellt am 2026-06-15 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs