📅 23. Juni 2026

Daily Prompt Intelligence — 23. Juni 2026

🔤 TOP 3 PROMPTS — Textgenerierung

1. Guidance Injection — Tool-gebundene Prompt-Steuerung

Prompt (vollständig, kopierbar):

{
  "guidanceRequired": true,
  "family": "memory",
  "revision": "a3f9...",
  "guidance": "Store notes about people under people/.",
  "message": "Guidance for memory must be acknowledged before this operation."
}

Antwort des Modells mit Bestätigung:

{
  "tool": "memory_create",
  "input": {
    "path": "people/alice.md",
    "content": "...",
    "guidanceAck": "a3f9..."
  }
}

Am besten mit: Lokale LLMs (Qwen 3.5, Gemma 4, Phi-4), kleinere Modelle mit begrenztem Kontextfenster

Warum effektiv: Kleine Modelle vergessen System-Prompt-Anweisungen nach etwa 10 Nachrichten durch Aufmerksamkeits-Drift. Guidance Injection liefert Regeln exakt im Moment der Tool-Ausführung — nicht versteckt hunderte-Token zurück im System Prompt. Das System prüft vor jeder Tool-Ausführung: Gibt es anwendbare Guidance? Falls ja, wird der Call blockiert, die Guidance zurückgegeben, und das Modell muss mit einem guidanceAck bestätigen bevor die Ausführung startet.

Quelle: https://samihonkonen.com/posts/guidance-injection/ | 3 Upvotes (HN: „Guidance injection: reliable instructions for local LLMs")

Community Resonanz: Auf HN als praktisch für Agent-Architekturen diskutiert. Das Ack-Hash-Pattern verhindert, dass Modelle Guidance einmal lesen und dann ignorieren — der Revisions-Hash muss bei jedem Call erneut bestätigt werden. Besonders relevant für Local-LLM-Nutzer, die unter Kontext-Limits leiden.

2. Prompt-Preflight Template — Bildgenerierung

Prompt (vollständig, kopierbar):

Create a [photorealistic/illustrated/3D] image of a [subject] with
[key colors, materials, and distinctive details], in [setting/background],
viewed from [camera angle/composition], with [lighting/mood],
in [aspect ratio].

Beispiel ausgefüllt:

Create a photorealistic image of a red 1967 Ford Mustang on a wet Tokyo street at night, low camera angle, cinematic lighting, 16:9.

Am besten mit: Flux, Stable Diffusion 3, Midjourney v7+, Kling, Seedance

Warum effektiv: Das Prompt-Preflight-Tool (HN: 2↑ today, GitHub-Repo mit 100-Prompt-Benchmark) hat gezeigt: Vague Prompts wie „Create a car image" erzeugen teure Retry-Schleifen im Agent-Workflow. Die strukturierte Slot-basierte Template eliminiert Ambiguität bevor Token verbrannt werden. Das Template deckt 6 Dimensionen ab: Stil, Subjekt, Materialien/Details, Setting, Kameraperspektive, Licht/Stimmung, Aspect Ratio.

Quelle: https://github.com/akg268/prompt-preflight/ | 2 Upvotes (HN: „Prompt Preflight")

Community Resonanz: Der Benchmark detektiert 98/100 vage Text-Prompts und 10/10 unklare Bildgenerierungs-Prompts. Besonders wertvoll: Domänen-Routing unterscheidet automatisch zwischen Software-Aufgaben („Update the API") und Bildgenerierung („Render a house") und gibt jeweils passende Rückfragen.

3. GLM-5.2 Reasoning Effort Control

Prompt (vollständig, kopierbar):

from openai import OpenAI

client = OpenAI(
    base_url="https://open.bigmodel.cn/api/paas/v4",
    api_key="DEIN_API_KEY"
)

# Mit Reasoning Control (steuert „thinking" Tiefe)
response = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "You are a concise technical assistant."},
        {"role": "user", "content": "Erkläre den Unterschied zwischen LoRA und QLoRA mit Code-Beispielen."}
    ],
    reasoning_effort="medium",  # "low", "medium", "high"
    max_tokens=4096
)

Am besser mit: GLM-5.2 über die Zhipu/OpenBigModel API

Warum effektiv: GLM-5.2 unterstützt native Reasoning-Effort-Steuerung direkt im API-Call — kein manueller „think step by step" Hack nötig. reasoning_effort="low" gibt schnelle Antworten für einfache Fragen, "high" aktiviert tiefes Reasoning für komplexe Probleme. Dazu: OpenAI-kompatibler API-Endpoint (kein Wrapper nötig), 1M Token Kontext-Fenster mit Long-Context Retrieval, und native Function Calling mit 15+ Fähigkeiten im „Master Skill"-Modus.

Quelle: https://www.marktechpost.com/2026/06/22/glm-5-2-openai-compatible-api-a-hands-on-guide-to-reasoning-effort-function-calling-and-long-context-retrieval/ | MarkTechPost

Community Resonanz: GLM-5.2 erscheint auf GitHub Trending mit breiter Community-Rezeption. Der Hands-On-Guide von MarkTechPost zeigt vergleichbare Token-Kosten zwischen Thinking-Modi und praktisches Function-Calling mit Tool-Definitionen.

🖼️ TOP 3 PROMPTS — Bildgenerierung

1. Semantisches Browsing — Diversitäts-Kontrolle für Text-to-Image

Prompt (vollständig, kopierbar):

Generate 8 semantisch diverse Interpretationen von:
„A cozy reading nook by a window, rain outside"

Jede Variante muss mindestens 2 der folgenden Dimensionen unterscheiden:
1. Architektur-Stil (modern, vintage, rustikal, minimalistisch, japanisch, industrial)
2. Licht-Stimmung (warmes Sonnenlicht, diffuses Regenlicht, Abenddämmerung, neon-beleuchtet)
3. Perspektive (Weitwinkel, Nahansicht, Vogelperspektive, Augenhöhe)
4. Farbpalette (monochromatisch, warm, kühl, pastell, high-contrast)

Vermeide: generische IKEA-Aesthetics, wiederholende Möbel-Platzierungen

Am besten mit: Flux, Stable Diffusion 3.5, Midjourney v7+, DiffusionGemma

Warum effektiv: Die neue arXiv-Publikation (2606.23679, Jun 2026) zeigt: Moderne Text-to-Image-Modelle kollabieren bei wiederholten Prompts in eine einzige visuelle Interpretation. „Semantic Browsing" steuert gezielt semantische Diversität statt zufälliger Seed-Variation. Das Ergebnis: echt verschiedene Kompositionen statt nur leicht verschobener Farbnuancen.

Quelle: https://arxiv.org/abs/2606.23679v1 | arXiv

Community Resonanz: Paper demonstriert, dass existierende Diversitäts-Methoden outputs produzieren, die durch zufällige Variationen getrieben sind statt durch kontrollierte semantische Unterschiede. Semantic Browsing ermöglicht gezielte Exploration des visuellen Raums.

2. Referenzbasierte Generation mit Token-Dropping

Prompt (vollständig, kopierbar):

Referenzbild: [Bild einer Person/eines Objekts laden]

Generiere ein neues Bild basierend auf der Referenz:
„[Person/Objekt aus Referenzbild] in [neue Umgebung/Situation],
behalte bei: [Haarfarbe, Kleidung, Gesichtszüge / Form, Farbe, Textur]

Change: [neue Pose, neuen Hintergrund, neues Licht]
Style: [fotorealistisch/Zeichnung/Ölmalerei/3D-Render]
Aspect Ratio: 16:9

Am besten mit: Flux (mit IP-Adapter), Stable Diffusion (mit ReferenceNet), Midjourney (--sref), Seedance 2 R2V

Warum effektiv: Die arXiv-Publikation (2606.23682, Jun 2026) zeigt: Referenzbasierte Diffusion-Modelle können durch Token Dropping effizienter gemacht werden — weniger Rechenlast, gleiche Kontrollqualität. Praktisch bedeutet das: Die Referenz wird geladen, die essentiellen visuellen Features werden extrahiert, und nur diese steuern die Generation. Unwichtige Referenz-Tokens werden gedroppt, was 2-3x schnellere Inference ermöglicht ohne Qualitätsverlust.

Quelle: https://arxiv.org/abs/2606.23682v1 | arXiv

Community Resonanz: Paper adressiert ein echtes Problem: Referenzbasierte Modelle skalieren schlecht mit mehreren Input-Referenzen. Token Dropping identifiziert die semantisch wichtigen Referenz-Tokens und droppt redundante — ohne die Kontrollqualität zu opfern.

3. Geo-spezifische Street-View Generation

Prompt (vollständig, kopierbar):

Generiere eine fotorealistische Straßenszene von:
[Adresse / Koordinaten / Straßenname]

Anforderungen:
- Exakte Übereinstimmung mit der realen Straßen-Geometrie
- Korrekte Gebäude-Fassaden und Fenster-Anordnung
- Typische lokale Beschilderung und Infrastruktur
- Aktuelle Wetter- und Lichtverhältnisse: [Sonnig/Bewölkt/Regen/Abend]
- Perspektive: Straßenebene, Blickrichtung [Nord/Süd/Ost/West]
- Vermeide: generische Städte-Attribute, falsche Beschilderung

Output: 1920x1080, fotorealistisch, 16:9

Am besten mit: Flux, Midjourney v7+ (mit --sref für reale Referenz), Stable Diffusion + ControlNet

Warum effektiv: GeoFidelity-Bench (arXiv: 2606.23669, Jun 2026) ist der erste Benchmark, der segment-level geografische Treue in Text-to-Image Street-View-Generierung evaluiert. Das Paper zeigt: Aktuelle Modelle produzieren visuell plausible, aber geografisch falsche Straßenszenen — sie generieren „eine Stadt" statt „diese Straße". Der Prompt zwingt das Modell durch explizite geografische Constraints zur Treue.

Quelle: https://arxiv.org/abs/2606.23669v1 | arXiv

Community Resonanz: Der Benchmark nutzt ein Reference-Panel-Design zur Evaluierung. Das zentrale Ergebnis: Text-to-Image-Modelle benötigen explizite geografische Constraints im Prompt, sonst generieren sie generische Stadtpriors statt spezifischer Orte.

🎬 TOP 3 PROMPTS — Videogenerierung

1. Seedance 2 R2V — Frame-Konsistente Video-Gebung

Prompt (vollständig, kopierbar):

Referenz-Frame: [Erstes Frame / Standbild als Input]

Beschreibe die Action-Sequenz:

Phase 1 (0-2s): [Startposition — Figur steht/liegt/sitzt, beschreibe Pose und Umgebung]
Phase 2 (2-5s): [Action beginnt — Bewegung, Interaktion, Dialog]
Phase 3 (5-8s): [Höhepunkt — maximale Bewegung, Kamera schwenkt/zoomt/trackt]
Phase 4 (8-10s): [Auflösung — Endposition, Kamera hält]

Constraints:
- Behalte Erscheinung der Hauptfigur konsistent mit dem ersten Frame (Kleidung, Haare, Körperbau)
- Kamera: [statisch / langsamer Schwenk rechts / Zoom-in / Dolly-Track]
- Licht: [konsistent mit Referenz-Frame / dramatischer Wechsel zu Golden Hour]
- Negative Constraints: keine zusätzlichen Personen, keine Text-Overlays, keine Wasserzeichen

Duration: 10s | FPS: 24 | Resolution: 1080p | Aspect Ratio: 16:9

Am besten mit: Seedance 2, Kling 2.0, Runway Gen-4

Warum effektiv: Seedance 2 nutzt ein Reference-to-Video (R2V) Pattern, bei dem das erste Frame als visuelle Referenz die gesamte Sequenz steuert. Die phasenweise Action-Beschreibung mit expliziten Camera-Directions und negativen Constraints gibt dem Modell strukturierte Anweisungen statt vager „mach ein Video"-Prompts. Das R2V-Pattern ist dokumentiert in den Video-Prompt-Patterns der Community.

Quelle: Community-Dokumentation zu Seedance 2 R2V Workflows

Community Resonanz: Das phasenweise Pattern mit „Keep appearance consistent with first frame" hat sich als effektivster Ansatz für character-consistency in AI-Video erwiesen. Seedance 2 wurde auf GitHub Trending gelistet (Lightricks/LTX-2 als verwandtes Audio-Video Foundation Model).

2. LTX-2 IC-LoRA Video-to-Video

Prompt (vollständig, kopierbar):

Input-Video: [Bestehendes Video hochladen]

Transformation:
- Stil: [Film-Noir / Anime / Ölgemälde / Cyberpunk / 16mm Film]
- Kamera-Kontrolle: Wende [Dolly-Zoom / Jib-Auf / Static-Lock] LoRA an
- LipDub: Synchronisiere Lippenbewegung mit [Audio-Track / Text-to-Speech]
- HDR: EXR-kompatible Ausgabe für Post-Processing

Parameter:
- Chronologische Shot-Beschreibung unter 200 Wörtern
- Camera-Parameter über dedizierte LoRA-Adapter
- Preserve: Gesichts-Identität, Objekt-Geometrie

Output: 1080p, 24fps, 16:9

Am besten mit: LTX-2 (Lightricks) mit IC-LoRA (Image-Conditioned LoRA)

Warum effektiv: LTX-2 ist das erste DiT-basierte Audio-Video Foundation Model mit IC-LoRA für Video-to-Video Transformation. Statt das gesamte Video neu zu generieren, werden dedizierte LoRA-Adapter für Kamera-Steuerung (Dolly, Jib, Static) eingesetzt. Die Shot-Beschreibung bleibt unter 200 Wörtern — kompakt und präzise. LipDub ermöglicht Synchronisation mit Audio-Tracks.

Quelle: https://github.com/Lightricks/LTX-2 | GitHub Trending, Jun 2026

Community Resonanz: LTX-2 erscheint auf GitHub Trending als erstes DiT-basiertes Audio-Video Foundation Model. IC-LoRA ermöglicht gezielte Video-Transformation ohne das gesamte Modell neu zu trainieren. Kamera-Kontrolle-LoRAs (Dolly, Jib, Static) bieten professionelle Film-Ästhetik.

3. IMAGIN-4D — Bildgeführte Interaktions-Generierung

Prompt-Template (für character animation/embodied AI):

Referenzbild: [Person interagiert mit Objekt]

Generiere eine 3D-Interaktionssequenz:

Objekt: [Beschreibung des Objekts — Größe, Gewicht, Form]
Aktion: [Greifen / Werfen / Öffnen / Bewegen / Platzieren]
Physikalische Constraints:
- Schwerkraft realistisch
- Objekt nicht durch Hände gleiten
- Natürliche Finger-Artikulation

Kamera:
- Viewpoint: [Dritter-Person / Ego-Perspektive / Orbit-Around]
- Bewegung: [Follow-Subject / Static / Pan-Left]

Output: 4D-Sequenz mit temporärer Konsistenz

Am besten mit: IMAGIN-4D Modell, OpenMontage (agentic video production, 500+ skills)

Warum effektiv: IMAGIN-4D (arXiv: 2606.23675, Jun 2026) generiert human-object interactions aus Bildern statt nur aus Text. Das Model nutzt Bild-Referenzen für die Objekt-Geometrie, Sparse Waypoints für die Action-Semantik, und erzeugt temporär konsistente 4D-Sequenzen. Offene Referenz: OpenMontage (calesthio/OpenMontage auf GitHub Trending) bietet 500+ Agent-Skills für videobasierte Workflows.

Quelle: https://arxiv.org/abs/2606.23675v1 | arXiv + https://github.com/calesthio/OpenMontage

Community Resonanz: Paper adressiert das zentrale Problem: Text und Objekt-Geometrie allein spezifizieren Interaktionen nicht ausreichend. IMAGIN-4D nutzt Bild-Referenzen als zusätzlichen Kontrollkanal.

🧠 TOP 3 NEUE TECHNIKEN

1. Guidance Injection — Just-in-Time Prompt Delivery

Zusammenfassung: Statt alle Regeln in den System Prompt zu schreiben, wird Guidance erst im Moment der Tool-Ausführung injiziert — mit einem Acknowledgement-Handshake.

Erklärung: Kleine und lokale Modelle vergessen System-Prompt-Anweisungen nach etwa 10 Nachrichten durch Aufmerksamkeits-Drift. Guidance Injection löst das Problem, indem Regeln als Notes an spezifische Tools gebunden werden. Wenn das Modell ein „gated" Tool aufruft, prüft das System: Gibt es anwendbare Guidance? Falls ja, wird der Aufruf blockiert und ein structured Response mit der Guidance zurückgegeben. Das Modell muss mit einem guidanceAck (Revisions-Hash) bestätigen, bevor die Tool-Ausführung startet. Der Hash reist im Tool-Call-Argument mit dem Conversations-History — ein Modell, das den Hash wiederverwendet ohne Guidance neu zu lesen, wird durch den Revisions-Vergleich automatisch korrigiert.

Beispielprompt:

System: Du bist ein Assistant mit Zugriff auf Speicher-Tools.
Regeln werden bei Bedarf injiziert.

User Tool Call: memory_create(path="people/alice.md", content="...")

System Response (intercepted):
{
  "guidanceRequired": true,
  "family": "memory",
  "revision": "a3f9c8d2",
  "guidance": "Notizen über Personen immer unter people/ speichern.",
  "message": "Bestätige die Guidance bevor die Operation ausgeführt wird."
}

User Tool Call (retry): memory_create(path="people/alice.md", content="...", guidanceAck="a3f9c8d2")

→ Tool executes successfully

Geeignet für: Lokale LLMs (Qwen 3.5, Gemma 4, Phi-4), Agent-Architekturen mit Tool-Calls, Memory-Management-Systeme

Ursprung: https://samihonkonen.com/posts/guidance-injection/ | 3 Upvotes HN

Warum heute wichtig: Agent-Systeme werden komplexer und nutzen immer mehr Tools. Ein 50-Tool-Agent kann nicht alle Tool-Regeln im System Prompt halten — das überlädt den Kontext kleinerer Modelle. Guidance Injection hält den System Prompt schlank und liefert Regeln genau dort, wo sie gebraucht werden. Besonders relevant für Hermes Agent und andere lokale Agent-Frameworks.

2. Prompt Preflight — Vage Prompts vor Modell-Ausführung abfangen

Zusammenfassung: Ein lokaler, regelbasierter Check erkennt unzureichend spezifizierte Prompts bevor teure Modell-Tokens verbrannt werden.

Erklärung: Prompt Preflight analysiert jeden Eingabe-Prompt mit deterministischen Python-Regeln — kein Netzwerk, kein Modell-Call. Der Check bewertet Ambiguität und Impact. Wenn beide hoch sind, pausiert er die Anfrage und gibt (a) eine Domain-aware Prompt-Vorlage und (b) bis zu 3 präzise Rückfragen. Der Ansatz vermeidet die teure Retry-Schleife: vager Prompt → Modell liest Projekt-Kontext → falsche Interpretation → User korrigiert → Modell liest erweiterte Historie → erneute Arbeit. Mit Preflight: lokale Prüfung → gezielte Klarstellung → eine starke Anfrage → nützliche Modell-Arbeit. Das Tool erkennt 98/100 vage Software-Prompts und alle Bildgenerierungs-Prompts in seinem Benchmark.

Beispielprompt (was Preflight abfängt):

Eingabe: "Rewrite the whole project"

Preflight Analysis:
Intent: software_refactor
Ambiguity: HIGH (Welcher Teil? Welche Constraints? Akzeptanzkriterien?)
Impact: HIGH (Repository-weite Änderung, teure Retry-Schleife)

Vorschlag:
"Refactor the [specific module/service] to [specific change]
 while preserving [specific constraint/behavior].
 Acceptance criteria: [testable outcome]"

Rückfragen:
1. Welche Teile des Projekts sollen refactored werden?
2. Welche bestehenden Funktionalitäten müssen erhalten bleiben?
3. Wie wird der Erfolg gemessen (Tests, Performance, API-Verträge)?

Bypass: "Rewrite the whole project [preflight:skip]"

Geeignet für: OpenAI Codex (als Plugin), Claude Code, Cursor, alle Agent-Workflows mit teurer Modell-Nutzung

Ursprung: https://github.com/akg268/prompt-preflight/ | 2 Upvotes HN

Warum heute wichtig: Mit steigenden Token-Kosten und komplexeren Agent-Workflows (Fable 5 Shutdown hat Agent-Kosten in den Fokus gerückt) wird Token-Effizienz zum kritischen Faktor. Prompt Preflight spart keine Token pro Call — er eliminiert komplett unnötige Calls, die aus vagen Prompts resultieren. Das [preflight:skip] Suffix ermöglicht gezielten Bypass für erfahrene Nutzer.

3. Semantic Browsing — Gezielte Diversitäts-Steuerung für Diffusion-Modelle

Zusammenfassung: Statt zufälliger Seed-Variation wird semantische Diversität durch gezielte Dimensions-Kontrolle im Prompt erreicht.

Erklärung: Moderne Text-to-Image-Modelle kollabieren bei wiederholten Prompts in eine einzige visuelle Interpretation — der gleiche Prompt produziert fast identische Bilder. Bestehende Diversitäts-Methoden (Seed-Variation, CFG-Scale-Änderung) produzieren Incidental-Variationen statt kontrollierter semantischer Unterschiede. Semantic Browsing definiert explizite Diversitäts-Dimensionen (Architektur-Stil, Licht-Stimmung, Perspektive, Farbpalette) und zwingt das Modell, diese gezielt zu variieren. Das Ergebnis: echt verschiedene Kompositionen statt nur verschobener Farbnuancen. Der Prompt-Ansatz funktioniert mit jedem Diffusion-basierten Generator.

Beispielprompt:

Erstelle 4 semantisch verschiedene Varianten von „A modern kitchen":

Variante A: Minimalistisch, japanisch, natürliches Licht, Erdtöne, Weitwinkel
Variante B: Industrial, Backsteinwände, Neon-Akzente, Abenddämmerung, Nahansicht
Variante C: Rustikal Holz, warmes Küchenlicht, Pastell-Töne, Vogelperspektive
Variante D: High-Tech Smart Kitchen, kühles LED-Licht, Monochrom, Augen-Höhe

Jede Variante muss sich in mindestens 2 Dimensionen unterscheiden.

Geeignet für: Flux, Stable Diffusion 3/3.5, Midjourney v7+, DiffusionGemma

Ursprung: arXiv:2606.23679 („Semantic Browsing: Controllable Diversity for Image Generation"), Jun 2026

Warum heute wichtig: Für kreative Workflows, Produktdesign und A/B-Testing von Visuals ist kontrollierte Diversität essentiell. Bisher mussten Nutzer den Prompt komplett umschreiben, um verschiedene Stile zu bekommen. Semantic Browsing ermöglicht einen Prompt mit expliziten Diversitäts-Dimensionen — reproduzierbar und systematisch.

🏆 Highlight des Tages

Guidance Injection: Das Ende des überladenen System Prompts

Sami Honkonens „Guidance Injection" (Jun 22, 2026) liefert die praktischste Agent-Architektur-Innovation der Woche. Das Konzept ist elegant in seiner Einfachheit: Regeln nicht speichern — sie im Moment der Notwendigkeit liefern.

Das Problem existiert seit LLMs Tools aufrufen können: Mit jedem Tool kommen neue Regeln. Nach 20 Tools ist der System Prompt so groß, dass kleine Modelle die wichtigsten Anweisungen am Anfang vergessen haben. Guidance Injection löst dies durch ein Gate-Pattern: Jedes Tool hat anwendbare Guidance-Notes. Vor der Ausführung prüft das System: „Braucht dieses Tool Guidance?" Falls ja, wird der Call zurückgehalten, Guidance geliefert, und das Modell muss mit einem Revisions-Hash bestätigen.

Der geniale Detail: Der Ack-Hash ist ein Revision-Hash, der im Tool-Call mitreist. Modelle, die vergessen, müssen neu bestätigen. Modelle, die genug Kontext haben, um Hashes wiederzuverwenden, sind groß genug, die Guidance ohnehin zu befolgen. Das System ist selbstanpassend.

Für prompta.ch-Leser: Das Pattern ist direkt in Python/Agent-Frameworks implementierbar, erfordert kein bestimmtes Modell, und funktioniert besonders gut mit Local LLMs — genau die Zielgruppe, die unter System-Prompt-Drift leidet.

Quelle: https://samihonkonen.com/posts/guidance-injection/

📰 Erlesene Artikel & Ressourcen

Sakana AI Launches Sakana Fugu: Orchestration Model für Multi-LLM-Routing Sakana AI veröffentlicht Sakana Fugu, ein Orchestrierungsmodell, das Tasks über einen austauschbaren Pool von Frontier-LLMs routet. Praktisch relevant für Agent-Architekturen, die je nach Task-Typ zwischen günstigen und leistungsfähigen Modellen wechseln. → https://www.marktechpost.com/2026/06/22/sakana-ai-launches-sakana-fugu-an-orchestration-model-that-routes-tasks-across-a-swappable-pool-of-frontier-llms/

xAI /goal in Grok Build: Autonomous Execution mit Built-In Verification xAI führt /goal in Grok ein — ein Command für langlaufende autonome Ausführungen mit integrierter Verifikation für Multi-Step-Coding-Tasks. Relevant für Agent-Workflow-Design. → https://www.marktechpost.com/2026/06/22/xai-launches-goal-in-grok-build-adding-long-running-autonomous-execution-with-built-in-verification-for-multi-step-coding-tasks/

Google DeepMind: DiffusionGemma mit 4x Speed Boost Google veröffentlicht DiffusionGemma, ein optimiertes Diffusion-Modell mit 4x schnellerer Inference. Direkt relevant für lokale Bild- und Video-Generierung mit begrenzter Hardware. → https://arstechnica.com/google/2026/06/googles-latest-diffusiongemma-open-ai-model-comes-with-a-4x-speed-boost/

On the Limits of Prompt-Conditioned Language Models (arXiv: 2606.23668) Grundlagenforschung zeigt: Sprache ist ein komprimiertes Interface für Task-Information. Prompt-Conditioned LLMs haben fundamentale Kapazitätsgrenzen als General-Purpose-Solver. Wichtig für alle, die komplexe Tasks ausschließlich über Prompts statt über Tool-Coding steuern wollen. → https://arxiv.org/abs/2606.23668v1

Prompt-Preflight auf HN: Lokaler Vague-Prompt-Checker für Codex Ein Open-Source Codex-Plugin, das vage Prompts vor der Modell-Ausführung erkennt und strukturierte Rückfragen generiert. 100-Prompt-Benchmark mit 98% Detektionsrate. Kein Modell-Call, keine API, keine Token-Kosten für den Check. → https://github.com/akg268/prompt-preflight/

GitHub Trending: Agent-Repos im Fokus Heute auf GitHub Trending: OpenMontage (agentic video, 500+ skills), airLLM (70B Inference auf 4GB GPU), mukul975/Anthropic-Cybersecurity-Skills (817 Cybersecurity-Skills für AI Agents, mapped auf 6 Frameworks). Besonders: mattpocock/skills — „Skills for Real Engineers" direkt aus dem .claude Directory. → https://github.com/trending?since=daily

Prime Intellect prime-rl 0.6.0: Trillion-Parameter MoE auf Agentic RL Prime Intellect released prime-rl 0.6.0 für Training von trillion-parameter MoE-Modellen auf agentic RL-Workloads. Relevant für alle, die an RLHF/GRPO-Training arbeiten. → https://www.marktechpost.com/2026/06/23/prime-intellect-releases-prime-rl-0-6-0-to-train-trillion-parameter-moe-models-on-agentic-rl-workloads/

Bericht erstellt am 2026-06-23 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs

Daily Prompt Intelligence — 23. Juni 2026

🔤 TOP 3 PROMPTS — Textgenerierung

1. Guidance Injection — Tool-gebundene Prompt-Steuerung

2. Prompt-Preflight Template — Bildgenerierung

3. GLM-5.2 Reasoning Effort Control

🖼️ TOP 3 PROMPTS — Bildgenerierung

1. Semantisches Browsing — Diversitäts-Kontrolle für Text-to-Image

2. Referenzbasierte Generation mit Token-Dropping

3. Geo-spezifische Street-View Generation

🎬 TOP 3 PROMPTS — Videogenerierung

1. Seedance 2 R2V — Frame-Konsistente Video-Gebung

2. LTX-2 IC-LoRA Video-to-Video

3. IMAGIN-4D — Bildgeführte Interaktions-Generierung

🧠 TOP 3 NEUE TECHNIKEN

1. Guidance Injection — Just-in-Time Prompt Delivery

2. Prompt Preflight — Vage Prompts vor Modell-Ausführung abfangen

3. Semantic Browsing — Gezielte Diversitäts-Steuerung für Diffusion-Modelle

🏆 Highlight des Tages

Guidance Injection: Das Ende des überladenen System Prompts

📰 Erlesene Artikel & Ressourcen

Neue KI-Prompts direkt in dein Postfach