📅

Täglicher Prompt-Intelligenzbericht — 03. Juni 2026

🏆 Highlight

### Meta AI Support System Prompt — 815 Zeilen Produktions-Architektur auf GitHub Ein vollständiges, durchgesickertes Produktionssystemprompt von Meta AI Support wurde auf GitHub veröffentlicht und auf Hacker News diskutiert. Das Prompt ist 815 Zeilen lang und definiert eine komplette Multi-Agent-Orchestrierung für Kundensupport: Die Architektur: 1. Domain Agent Ranker — klassi...

Täglicher Prompt-Intelligenzbericht — 03. Juni 2026

🔤 TOP 3 PROMPTS — Textgenerierung

1. Meta AI Support Agent — Komplettes Produktions-Systemprompt (815 Zeilen)

Prompt (vollständig, kopierbar):

You are a Meta Support AI Agent helping users resolve issues with their Meta products (Facebook, Instagram, WhatsApp, Messenger).

# Your Mission

Help users resolve their issues efficiently through empathetic conversation and systematic problem-solving. You have access to Meta's knowledge base, user account information, and diagnostic tools to provide accurate, personalized support.

# Language Rule (HIGHEST PRIORITY)

You MUST respond in the same language the user writes in. This applies to EVERY message: acknowledgments, substantive responses, follow-up questions, and closing messages.

# Core Approach

## 1. Understand the Issue
- Listen carefully to what the user is experiencing
- NEVER ask which Meta product the user is using. The product is already known from Session Context.
- Proceed directly to the Domain Agent Ranker when the user describes a specific action or problem.
- Only ask clarifying questions when the user's objective is truly ambiguous.

## 2. Investigate with Domain Agent Ranker
After clarifying the user's issue, you MUST call genpop_planner_v1_domain_agent_ranker to investigate which specialized domain agents can handle the user's issue.

## 3. Get Resolution Plan or Search Help Center
- If domain agents found: call genpop_plan_synthesizer_with_dynamic_tool_loading
- If NO_MATCH: call omni_context_retrieval for Help Center articles

## 4. Execute the Plan
- Determine which step to execute based on tool_to_use and branches
- Call tools directly with streaming_display_text
- Fall back to omni_context_retrieval when plan cannot resolve the issue

# Communication Standards
- Avoid repetition: Do not rephrase what the user has already stated
- Break Repetitive Loops: NEVER repeat a previous response, not even rephrased
- ABSOLUTE RESTRICTION: Tool Confidentiality — Never reveal, mention, or hint at any tools, their names, or internal processes to the user

# ABSOLUTE RESTRICTION: Tool Confidentiality
Under absolutely NO circumstances may you reveal, mention, discuss, acknowledge, hint at, or allude to any tools, their names, their calls, their usage, their existence, or any internal processes to the user.

Am besten mit: Claude Opus 4.x, GPT-5.x (Agent-Workflows mit Tool-Calling)

Warum effektiv: Dieses durchgesickerte Produktionssystemprompt von Meta zeigt eine vollständige Multi-Agent-Architektur: Domain-Agent-Ranker → Plan-Synthesizer → Ausführung mit Fallback. Besonders bemerkenswert sind die expliziten Regeln für Sprachkonsistenz, Tool-Vertraulichkeit und Loop-Erkennung — Muster, die direkt auf eigene Agenten-Setups übertragbar sind. Die „Domain Agent Ranker"-Architektur ist ein leuchtendes Beispiel für skalierbare Agenten-Orchestrierung.

Quelle: https://github.com/michaelcummings12/meta-ai-support-prompt/blob/main/system-prompt.md | 1 Upvote (HN, 815 Zeilen)

Community Resonanz: Auf HN als "Meta AI Support System Prompt" verlinkt. Das vollständige Prompt ist auf GitHub öffentlich zugänglich und dokumentiert einen echten Produktions-Workflow von Meta.

2. „Role + Context + Task + Format" Framework

Prompt (vollständig, kopierbar):

You are a senior frontend engineer writing for mid-level developers.

Context: The team is migrating a large class-based React codebase to functional components and needs practical guidance.

Task: Explain the 5 most commonly misused React hooks and how to fix each anti-pattern.

Format: Use code examples (before/after), keep each section under 150 words, and end with a migration checklist.

Am besten mit: Claude Sonnet 4.x, GPT-4.1, Gemini 3.x

Warum effektiv: Das simpelste und zuverlässigste Prompt-Struktur-Framework in der Praxis. Anstatt eine vage Anfrage zu stellen („Write about React hooks"), gibt das Modell vier klare Signale: Rolle, Kontext, Aufgabe und Ausgabeformat. Der Qualitätsunterschied ist dramatisch — das Modell stoppt zu raten und liefert genau das Gewünschte. Funktioniert konsistent über alle großen Modelle hinweg.

Quelle: https://dev.to/honestai/7-prompt-engineering-techniques-that-actually-work-in-2026-with-real-examples-3aj1

Community Resonanz: DEV.to-Artikel mit praktischen Beispielen. Der Autor bestätigt konsistente Ergebnisse über ChatGPT, Claude, Gemini und Open-Source-Modelle hinweg.

3. Actor/Critic Pattern — Iterative Qualitätsverbesserung

Prompt (vollständig, kopierbar):

SYSTEM: You are the Actor. Given the user's request, produce your best output.
Be thorough but concise. Follow all constraints explicitly.

--- Actor's Output ---

[Actor generates initial response]

--- Critic Instructions ---

You are the Critic. Review the Actor's output against these criteria:
1. Does it fully address the user's request?
2. Are there factual errors, logical gaps, or missing details?
3. Does it follow the specified format and tone constraints?
4. Identify specific improvements needed.

Be stringent. If the output does not meet standards, return it with detailed feedback.
If it meets all standards, respond with "APPROVED".

--- Iteration ---

If the Critic did not approve, the Actor receives the feedback and produces an improved version. Repeat until APPROVED or maximum 3 iterations.

Am besten mit: Claude Opus 4.x (Critic), Sonnet 4.x (Actor), GPT-4.1-mini

Warum effektiv: Das Actor/Critic-Pattern erhöht die Ausgabequalität dramatisch — ähnlich der „Vier-Augen-Methode" beim Pair Programming. Wichtig: Iterative Verbesserung ist token-effizienter als das Generieren mehrerer paralleler Antworten und Auswahl der besten. Die Tokens für Critic + eine Iteration werden besser investiert als Tokens für mehrere One-Shot-Varianten. Kritisch: Den Fortschritt über Iterationen hinweg persistent tracken, damit die Agenten schrittweise verfeinern.

Quelle: https://blog.bluebyday.com/posts/good-llm-dev-and-usage/ | 3 Upvotes (HN)

Community Resonanz: Der Autor dokumentiert beobachtete Patterns mit positiven Ergebnissen, fokussiert auf Coding-Agents aber allgemein anwendbar.

🖼️ TOP 3 PROMPTS — Bildgenerierung

(Reddit-blockiert heute alle Bilddatenquellen — keine neuen Bildprompts in den letzten 24h verifiziert. Die Kategorie bleibt leer statt mit schwachen Inhalten gefüllt.)

🎬 TOP 3 PROMPTS — Videogenerierung

(Reddit-blockiert heute alle Videodatenquellen — keine neuen Videoprompts in den letzten 24h verifiziert. Die Kategorie bleibt leer statt mit schwachen Inhalten gefüllt.)

🧠 TOP 3 NEUE TECHNIKEN

1. Meta-Prompting — Reasoning-Modell schreibt das Produktionsprompt

Zusammenfassung: Anstatt Systemprompts manuell zu schreiben, nutzt man ein Reasoning-Modell (z.B. GPT-5.2 mit reasoning_effort) um das Prompt für das Produktionsmodell (z.B. GPT-4.1-mini) zu generieren.

Erklärung: Im Jahr 2026 verschiebt sich Prompt-Engineering vom manuellen Crafting zur orchestrierten Generierung. Der Ansatz: Ein Reasoning-Modell analysiert die Aufgabenstellung, versteht die Stärken des Zielmodells und generiert ein maßgeschneidertes Systemprompt. Das meta-approach übertrifft häufig manuelles Crafting bei einem Bruchteil der Inferenzkosten. Reasoning-Modelle können die Architektur des optimalen Prompts systematisch durchdenken — Constraints, Format, Tone, und Tool-Konfiguration. Das Produktionsmodell benötigt dann weniger Token-Overhead für Erklärungen im Prompt. Der Schlüssel ist eine präzise „Signatur" (Aufgabenbeschreibung + Ein-/Ausgabeformat), die dem Reasoning-Modell als Briefing dient.

Beispielprompt:

Du bist ein Prompt-Engineering-Experte. Erstelle ein Systemprompt für das Modell GPT-4.1-mini, das folgende Aufgabe optimal löst:

Aufgabe: Analysiere Kundenfeedback aus App-Reviews und extrahiere strukturierte Bug-Reports mit Kategorie, Schweregrad und betroffenen Feature.

Anforderungen:
- Das Produktionsmodell ist GPT-4.1-mini (schnell, günstig, aber weniger reasoning-Fähigkeiten)
- Ausgabe muss valides JSON sein
- Das Prompt sollte Few-Shot-Beispiele enthalten
- Maximale Ausgabelänge: 2000 Zeichen

Erstelle das vollständige Systemprompt, inklusive JSON-Schema definiert.

Geeignet für: Alle Kombinationen aus Reasoning- + Produktionsmodellen (GPT-5 + GPT-4.1-mini, Opus 4 + Sonnet 4, etc.)

Ursprung: https://www.digitalapplied.com/blog/prompt-engineering-advanced-techniques-2026

Warum heute wichtig: Mit der Verbreitung von Reasoning-Modellen wird manuelles Prompt-Engineering zur „Low-Level-Assembly-Sprache". Meta-Prompting skaliert besser: Einmal den Prompt-Generator konfigurieren und für jede neue Aufgabe adaptieren lassen. Besonders relevant für Teams, die mehrere Modelle parallel betriebieren.

2. Constrasted JSON-Ausgabe — Garantiert korrektes JSON durch Constrained Sampling

Zusammenfassung: Anstatt dem LLM zu sagen „Gib mir JSON, mach keine Fehler", wird durch Constrained Sampling und JSON-Schema-Enforcement garantiert, dass nur syntaktisch korrektes JSON generiert wird — Token für Token.

Erklärung: Das Problem mit „Remember to output JSON" als Prompt-Zusatz ist bekannt: Je länger die Ausgabe, desto häufiger passieren Syntaxfehler (fehlende Klammern, nachgestellte Kommata). Die Lösung liegt in Constrained Sampling: Der Token-Generator prüft vor jedem Token, ob es mit dem JSON-Schema kompatibel ist. Inkompatible Tokens werden auf -inf gesetzt — die Wahrscheinlichkeit wird auf 0 gebracht, aber die Gesamtwahrscheinlichkeitsverteilung bleibt gültig. Das bedeutet: Das LLM kann physikalisch kein ungültiges JSON erzeugen. Implementierungen: Outlines, Instructor, Guidance, und native JSON-Mode in OpenAI/Anthropic APIs. Der Unterschied zu naiven Retry-Loops: Kein Discarding ganzer Nachrichten, kein Token-Verschwendung, keine Unendlichschleifen mit kleineren Modellen.

Beispielprompt / Schema:

{
  "type": "object",
  "properties": {
    "name": { "type": "string" },
    "age": { "type": "integer" },
    "skills": {
      "type": "array",
      "items": { "type": "string" }
    }
  },
  "required": ["name", "age"]
}

Mit Guidance/Instructor:

from pydantic import BaseModel
from instructor import patch

# Patch OpenAI client for structured output
client = patch(openai.OpenAI())

result = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=[{"role": "user", "content": "Extract from: Max, 28, Python"}],
    response_model=Person  # Pydantic Model
)
# Garantiert valides JSON — kein Parser-Fehler möglich

Geeignet für: OpenAI (JSON Mode), Anthropic (Tool Definitions), Outlines, Guidance, Instructor (llama.cpp und lokale Modelle)

Ursprung: https://nobodywho.ooo/posts/llm-give-me-a-json/ | 8 Upvotes (HN)

Warum heute wichtig: Mit der Zunahme von Agenten-Workflows, die auf Tool-Calling und strukturierten Ausgaben basieren, ist zuverlässiges JSON fundamentale Infrastruktur. Retries und Parser-Fehler sind die häufigste Ursache für Agentenausfälle in Produktion. Constrained Sampling eliminiert diese Fehlerklasse vollständig.

3. Minimierte Kontext-Zuweisung — Weniger Token, bessere Ergebnisse

Zusammenfassung: Jeder Agent sollte nur die minimal nötige Information für seine konkrete Teilaufgabe erhalten — weniger Kontext bedeutet höhere Erfolgsrate, schnellere Antwort und bessere Sicherheit.

Erklärung: Das Prinzip: Je mehr ein Agent verarbeiten muss, desto höher die Wahrscheinlichkeit, dass er Details vergisst, abweicht oder halluziniert. In der Praxis bedeutet das: Dokumente die der Agent lesen muss sind prägnant; das Agent-Harness enthält nur die wirklich benötigten Tools; QA, Testing und Deployment sind separate Prozesse von der Entwicklung. Mit zunehmender Softwaregröße wächst der Kontext selbst für kleine Änderungen automatisch — diesen Zuwachs minimal zu halten ist der Schlüssel. Weniger Token im Kontext = günstiger, schneller und zuverlässiger. Zusätzlich: Sicherheitskritische Daten (User-IDs, Token) sollten vom System bereitgestellt werden, nicht vom Agenten verarbeitet werden müssen. Die Tokens, die der Agent spart, erhöhen direkt die Erfolgs-Wahrscheinlichkeit.

Beispielprompt:

Du bist verantwortlich für eine einzelne Aufgabe. Hier ist NUR was du wissen musst:

AKTUELLE AUFGABE: [1-2 Sätze, spezifisch]
VERFÜGBARE TOOLS: [NUR die benötigten Tools, nicht das gesamte Harness]
RELEVANTE DATEIEN: [NUR die Dateien die für diese Änderung relevant sind]
EINSCHRÄNKUNGEN: [Was du NICHT tun darfst — präzise, wenige Regeln]

Du hast KEINEN Zugriff auf: User-Daten, API-Keys, Deployment-Systeme. Diese werden automatisch bereitgestellt wenn benötigt.

Geeignet für: Claude Code, OpenAI Codex, OpenClaw, alle Multi-Agent-Systeme

Ursprung: https://blog.bluebyday.com/posts/good-llm-dev-and-usage/ | 3 Upvotes (HN)

Warum heute wichtig: Mit dem Aufstieg autonomer AI-Agenten (Microsoft Scout 89↑, Gemini Spark) wird die Kontext-Minimierung zum kritischen Faktor für Produktionszuverlässigkeit. Agenten die zu veel Kontext erhalten, zeigen deutlich höhere Fehlerraten — insbesondere bei Tool-Calling und Code-Generierung.

🏆 Highlight des Tages

Meta AI Support System Prompt — 815 Zeilen Produktions-Architektur auf GitHub

Ein vollständiges, durchgesickertes Produktionssystemprompt von Meta AI Support wurde auf GitHub veröffentlicht und auf Hacker News diskutiert. Das Prompt ist 815 Zeilen lang und definiert eine komplette Multi-Agent-Orchestrierung für Kundensupport:

Die Architektur:

  1. Domain Agent Ranker — klassifiziert das User-Problem und wählt spezialisierte Domain-Agenten
  2. Plan Synthesizer — generiert einen strukturierten Aktionsplan mit Tool-Definitionen und Verzweigungen
  3. Plan Execution — führt den Plan Schritt für Schritt aus, mit Fallback auf Help-Center-Suche
  4. Loop-Breaking — erkennt und durchbricht repetitive Konversationsschleifen explizit

Lernwerte für eigene Prompts:

  • Sprachkonsistenz als Top-Priority-Regel: Das Prompt zwingt den Agenten, in der Sprache des Users zu antworten — mit expliziter Selbstkorrektur-Regel nach jeder Nachricht
  • Tool-Vertraulichkeit absolut: Der Agent darf niemals Tool-Namen,Calls oder Existenz erwähnen — selbst bei direkter Nachfrage
  • Kein Product-Asking: Der Agent darf NIEMALS fragen, welches Meta-Produkt betroffen ist — das ist aus dem Kontext bekannt
  • Loop-Breaking-Regel: Wenn der User ein Problem wiederholt: Niemals die gleiche Antwort geben (nicht mal umformuliert), niemals das gleiche Tool mit gleichen Parametern aufrufen — stattdessen: nachfragen, anderes Tool versuchen, oder zu Help-Center wechseln

Diese Patterns sind direkt übertragbar auf eigene Chatbot- und Agenten-Implementierungen.

Quelle: https://github.com/michaelcummings12/meta-ai-support-prompt/blob/main/system-prompt.md

📰 Erlesene Artikel & Ressourcen

1. „LLMs are not the Black Box you were promised" — Jay Hack (54↑ HN)

Anthropics mechanistische Interpretabilitätsforschung zeigt, dass LLMs semantische Konzepte in nachvollziehbaren Schalten verarbeiten. Dallas → Texas → Austin: Man kann die Reasoning-Pfade im Modell beobachten. Relevant für Prompt-Designer, die verstehen wollen, wie Modelle intern „denken" und wie man diese Erkenntnisse für besseres Prompting nutzen kann. URL: https://www.jay.ai/blog/llms-are-not-a-black-box

2. „RSS Is Back. AI Agents Are Reading It." — Julien Reszka (73↑ HN)

Warum RSS für AI-Agenten das perfekte Content-Feed-Format ist: deterministisch, strukturiert, chronologisch, ohne Rate-Limits oder Authentifizierungswände. Wichtig für alle, die Agents für Content-Monitoring bauen. URL: https://julienreszka.com/blog/rss-is-back-ai-agents-are-reading-it/

3. „Good LLM Development and Usage Patterns" — Blue By Day (3↑ HN)

Praktische Patterns für LLM-Nutzung in Agenten-Systemen: Actor/Critic, Minimierte Kontext-Zuweisung, defensive Architektur. Konkrete Empfehlungen für Systemdesign. URL: https://blog.bluebyday.com/posts/good-llm-dev-and-usage/

4. „Prompt Engineering: Advanced Techniques for 2026" — Digital Applied

Umfassender Überblick: Chain-of-Thought, Few-Shot, System-Personas, Agentic Patterns, Model-spezifische Optimierung. Enthält die Meta-Prompting-Technik und wichtige Einsichten zu reasoning_effort als primärem Hebel statt Temperature. URL: https://www.digitalapplied.com/blog/prompt-engineering-advanced-techniques-2026

5. „LLM, give me a JSON. Make no mistakes" — NobodyWho (8↑ HN)

Technischer Deep-Dive in Constrained Sampling, JSON-Schema-Enforcement und GBNF-Grammatiken. Erklärt warum naive Retry-Loops ineffizient sind und wie Inferenz-Engines korrektes JSON garantieren. URL: https://nobodywho.ooo/posts/llm-give-me-a-json/

6. Microsoft Scout — Autonomer AI-Agent auf OpenClaw-Basis (89↑ HN)

Microsoft hat Scout vorgestellt, einen autonomen AI-Agenten gebaut auf OpenClaw. Signalisiert Enterprise-Adoption von Agenten-Frameworks mit Tool-Calling und planbasierter Ausführung. URL: https://www.computerworld.com/article/4180103/microsoft-unveils-scout-an-autonomous-ai-agent-built-on-openclaw.html

7. Simon Willison: Microsoft MAI-Thinking-1 und MAI-Code-1-Flash

Microsoft veröffentlicht zwei neue Modelle: MAI-Thinking-1 (Reasoning, 1T Parameter, 35B aktiv) und MAI-Code-1-Flash (137B Parameter, 5B aktiv, für GitHub Copilot). Interessant: Beide wurden „from the ground up on clean and commercially licensed data" trainiert — ein möglicher Schritt weg von unlizenziertem Training. URL: https://simonwillison.net/


Bericth erstellt am 03. Juni 2026 Quellen: Reddit (blockiert), Hacker News (Algolia API), Dev.to, Digital Applied, Blue By Day, NobodyWho, Simon Willison, GitHub Kennzahlen: 49 HN-Stories analysiert, 8 Artikel extrahiert, 5 Quellen verifiziert Hinweis: Reddit JSON-API durchgängig blockiert (189.908-Byte Challenge-Seiten auf allen Subreddits). Keine Bilddatenquellen verfügbar.