📅

You are writing clean Python 3 code.

🏆 Highlight

### GLM-5.2 — Das leistungsstärkste Open-Weights LLM, MIT-Lizenz, $1.40/Mio Token Chinas Z.ai hat GLM-5.2 veröffentlicht — 753B Parameter, 1.51TB Modellgewicht, 40 aktive Parameter (MoE), 1 Million Token Context Window. MIT-Lizenz. Auf OpenRouter ab $1.40/Mio Input- und $4.40/Mio Output-Tokens verfügbar — deutlich günstiger als GPT-5.5 ($5/$30) oder Claude Opus ($5/$25). **Promp...

🔤 TOP 3 PROMPTS — Textgenerierung

1. Animiertes SVG direkt vom LLM generieren — GLM-5.2

Prompt (vollständig, kopierbar):

Generate an SVG of a pelican riding a bicycle. Make it a fully self-contained, animated SVG with CSS animations. The pelican should have expressive eyes, and the bicycle wheels should rotate in sync with forward motion. Keep all elements within a single SVG file — no external dependencies.

Am besten mit: GLM-5.2 (Open-Weights, MIT-Lizenz, 753B Parameter), Claude Fable 5

Warum effektiv: GLM-5.2 erzeugt als Text-only-Model vollständig animierte, eigenständige SVGs mit korrekten CSS-Animationen — ohne dass separate Bild-Inputs nötig sind. Das Model liefert saubere Vector-Grafiken, bei denen alle Elemente synchron animiert sind (Augen bleiben dran, Räder drehen sich im Takt). Verfügbarkeit über OpenRouter ab $1.40/Mio Input-Tokens.

Quelle: https://simonwillison.net/2026/Jun/17/glm-52/ | 26 Upvotes (HN)

Community Resonanz: GLM-5.2 führt den Artificial Analysis Intelligence Index v4.1 mit 51 Punkten an — vor MiniMax-M3 (44), DeepSeek V4 Pro (44) und Kimi K2.6 (43). Auf der Code Arena WebDev-Bestenliste Platz 2 hinter Claude Fable 5.


2. Strukturierte Code-Generierung mit Best-of-N und Unit-Tests

Prompt (vollständig, kopierbar):

# You are writing clean Python 3 code.
# Task: [YOUR_TASK_DESCRIPTION]
# Rules:
# - Do not import packages.
# - Do not print anything.
# - Return the answer from the function.
# - Keep the implementation compact and readable.
# Example: [FUNCTION_NAME](example_args) -> expected_result
[FUNCTION_SIGNATURE]

Am besten mit: Salesforce CodeGen, GLM-5.2, Claude Opus 4.8, GPT-5.5

Warum effektiv: Das strukturierte Prompt-Template kombiniert natürliche Sprachbeschreibung, strikte Regeln, ein konkretes Beispiel und die Funktionssignatur. In Kombination mit Best-of-N-Generierung (3–5 Kandidaten), statischer Sicherheitsprüfung, zyklomatischer Komplexitätsanalyse und automatischer Unit-Test-Validierung ergibt sich eine deutlich höhere Trefferquote als bei One-Shot-Generierung.

Quelle: https://www.marktechpost.com/2026/06/18/salesforce-codegen-tutorial-generate-validate-and-rerank-python-functions-with-unit-tests-and-safety-checks/ | MarkTechPost

Community Resonanz: Das Tutorial demonstriert einen vollständigen Pipeline-Ansatz: Prompt → Kandidatengenerierung → Syntax-Check → Safety-Scan → Complexity-Metrik → Unit-Test → Scoring. Reproduzierbare, messbare Ergebnisse statt vager Code-Ausgaben.


3. LLM-Silence steuern per System-Prompt-Toggle

Prompt (vollständig, kopierbar):

## System Prompt: Silence Control

When responding, follow these rules:
1. If the user's query has a clear, direct answer with no ambiguity, respond with ONLY the answer — no preamble, no hedging, no explanation.
2. If the query involves uncertainty, tradeoffs, or multiple valid perspectives, you may include your reasoning, but keep it under 3 sentences.
3. Never use phrases like "I think", "it depends", "however", or "on the other hand" unless the user explicitly asks for analysis.
4. If you genuinely do not know, say "I don't know" directly rather than hedging.

Am besten mit: Claude Opus 4.8, GPT-5.5, GLM-5.2

Warum effektiv: Ein einzelner System-Prompt-Schalter reduziert unnötige Ausfälligkeit („silence") bei LLMs signifikant. Die A/B-Tests zeigen messbar kürzere Antworten bei gleicher Korrektheit. Besonders wertvoll für API-Integrationen, wo Token-Kosten und Antwortlänge direkt die UX beeinflussen.

Quelle: https://twitter.com/RayanPal_/status/2067816563995189631 | 9 Upvotes (HN)

Community Resonanz: Auf HN als Show HN geteilt — zeigt, dass ein minimalistischer System-Prompt die Antwortcharakteristik eines LLMs dramatisch verändern kann, ohne die inhaltliche Qualität zu beeinträchtigen.


🖼️ TOP 3 PROMPTS — Bildgenerierung

1. North Virginia Opossum on an E-Scooter (GLM-5.1 SVG-Prompt)

Prompt (vollständig, kopierbar):

Generate an SVG of a NORTH VIRGINIA OPOSSUM ON AN E-SCOOTER. Make it a fully self-contained HTML document with embedded CSS animations. The opossum should have a comical, expressive pose — gripping the handlebars with wide eyes. Add motion blur effects on the wheels and a subtle road-scrolling background. Ensure all animations are self-contained within the SVG — no external dependencies.

Am besten mit: GLM-5.1 (für beste Ergebnisse), GLM-5.2, Claude Fable 5

Warum effektiv: Dieses Prompt hat sich in Simon Willisons Tests als All-Time-Favorit etabliert. GLM-5.1 lieferte eine perfekt animierte, humorvolle SVG-Grafik mit synchronisierten CSS-Animationen. GLM-5.2 reproduziert die Struktur, jedoch mit leicht reduzierter Animationsqualität — ein Beleg dafür, dass neue Modelversionen nicht automatisch bessere Ergebnisse liefern.

Quelle: https://simonwillison.net/2026/Jun/17/glm-52/ | 26 Upvotes (HN)

Community Resonanz: Der direkte Vergleich GLM-5.1 vs. GLM-5.2 zeigt: 5.2 ist leistungsstärker bei Code-Aufgaben, kann aber bei kreativen SVG-Animationen schwächer sein. Wichtig für Produzierende: Immer eigene Eval-Suite laufen lassen vor dem Upgrade.


2. KV-Cache Visualisierung (arXiv:2606.20245 Prompt-Pattern)

Prompt (vollständig, kopierbar):

You are an expert at visualizing transformer attention mechanisms. Given the following LLM layer configuration:
- Model: [MODEL_NAME]
- Layer: [LAYER_NUMBER]
- Context length: [N] tokens

Create an SVG heatmap showing the attention pattern between query positions (rows) and key positions (columns). Use a color gradient from dark blue (lowest attention) to bright yellow (highest attention). Label axes with token positions. Include a color scale legend. The SVG should be self-contained with inline CSS.

Am besten mit: GLM-5.2, Claude Opus 4.8

Warum effektiv: Die arXiv-Praxis zeigt, dass LLM-interne Wissenskonflikte zwischen parametrischem und kontextuellem Wissen durch Visualisierung von Attention-Patterns diagnostiziert werden können. Dieses Prompt generiert direkt einsatzbereite SVG-Heatmaps ohne externe Tools.

Quelle: https://arxiv.org/abs/2606.20245 | arXiv

Community Resonanz: Forschungspublikation mit praktischen Anwendungen für Prompt-Debugging und Modellverhalten-Analyse.


3. Prompt-Struktur für Code-Vervollständigung (Salesforce CodeGen)

Prompt (vollständig, kopierbar):

# Step 1.
# Write a Python function normalize_words(text).
# It should lowercase text, remove punctuation characters .,!?:;, and split into words.
# Do not import packages.
def normalize_words(text):

# Step 2.
# Write a Python function word_counts(words).
# It receives a list of words and returns a dictionary mapping each word to its frequency.
# Do not import packages.
def word_counts(words):

# Step 3.
# Write a Python function top_word(counts_dict).
# It receives a word frequency dictionary and returns the most frequent word.
# Do not import packages.
def top_word(counts_dict):

Am besten mit: Salesforce CodeGen, GLM-5.2, DeepSeek V4

Warum effektiv: Das Multi-Turn-Prompt-Pattern bricht komplexe Programmieraufgaben in sequentielle, abhängige Einzelschritte. Jeder Schritt baut auf dem vorherigen auf — die Funktionssignaturen dienen als Anker, der Kontext wird schrittweise erweitert. Ideal für agentic Coding-Workflows mit Tool-Calling.

Quelle: https://www.marktechpost.com/2026/06/18/salesforce-codegen-tutorial-generate-validate-and-rerank-python-functions-with-unit-tests-and-safety-checks/ | MarkTechPost

Community Resonanz: Die Benchmark-Ergebnisse zeigen signifikant höhere Pass-Raten bei Best-of-N-Candidates im Vergleich zu One-Shot-Ansätzen. Das strukturierte Template ist direkt auf jede Code-Generierungsaufgabe übertragbar.


🎬 TOP 3 PROMPTS — Videogenerierung

1. Grok Imagine Video 1.5 — Prompt-Struktur

Prompt (vollständig, kopierbar):

Cinematic wide-angle shot of a futuristic cityscape at golden hour. Camera slowly pans right, revealing a glass skyscraper reflecting warm orange sunlight. Gentle wind moves the clouds above. 4K resolution, photorealistic, smooth camera motion, 4-second duration. Style: modern architectural photography with subtle motion blur on foreground elements.

Am besten mit: Grok Imagine Video 1.5 (xAI)

Warum effektiv: Grok Imagine Video 1.5 ist das neueste Video-Generierungsmodell von xAI. Die Prompt-Struktur folgt dem bewährten Muster: Kameraposition → Licht/Tageszeit → Kamera-Bewegung → Dauer → Stil-Referenz. Das Modell reagiert besonders gut auf explizite Kameradirektiven (pan, zoom, dolly).

Quelle: https://x.ai/news/grok-imagine-video-1.5 | 5 Upvotes (HN)

Community Resonanz: Auf HN als Neuvorstellung gelistet — die Community diskutiert die wachsende Zahl an Video-Modellen auf dem Markt (Grok, Runway, Kling, Seedance).


2. AI-Agente-gesteuerte Robotik-Trainingsvideos

Prompt (vollständig, kopierbar):

Create a step-by-step robotic arm training video sequence:
Frame 1: Wide shot of a robotic arm in a clean lab environment, gripper open, neutral position.
Frame 2: Close-up of the gripper slowly closing around a small blue cube.
Frame 3: Side angle showing the arm lifting the cube 10cm off the surface.
Frame 4: Top-down view as the arm rotates 90 degrees clockwise while holding the cube.
Frame 5: The arm smoothly places the cube into a marked target zone and releases.
Each frame: 2-second duration, smooth motion paths, no sudden movements. Background: white lab bench with subtle grid pattern. Lighting: evenly diffused, no harsh shadows.

Am besten mit: Kling 2.0, Seedance 2, Runway Gen-4, Grok Imagine Video 1.5

Warum effektiv: AI-Coding-Agents können jetzt autonom Roboter-Trainingssequenzen generieren. Dieses Prompt erzeugt konsistente Frame-Sequenzen mit expliziten Kamerawinkeln, Objekten und Bewegungsparametern — direkt nutzbar für Video-Modelle im R2V-Workflow (Reference-to-Video).

Quelle: https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/ | Ars Technica, 43 Comments

Community Resonanz: 43 Diskussionen auf Ars Technica — der Artikel zeigt, dass Coding-Agents (Claude Code, Cursor) jetzt physische Roboter-Trainingsszenarien als Video-Sequenzen spezifizieren können.


3. R2V-Workflow für Seedance 2/ähnliche Modelle

Prompt (vollständig, kopierbar):

[Reference Frame]: A person sitting at a desk in a modern office, mid-30s, wearing a navy blue blazer over a white shirt. The desk has a laptop, coffee mug, and notebook. Natural lighting from a large window on the left.

[Action Sequence]:
Phase 1 (0-2s): Person looks up from the laptop, mild expression of curiosity.
Phase 2 (2-4s): Person leans forward slightly, reaches toward the camera.
Phase 3 (4-6s): Hand gently touches the lens, slight blur transition.

[Constraints]:
- Keep the person's appearance consistent with the reference frame throughout.
- No additional characters or objects entering the scene.
- Camera: fixed position, slight zoom during Phase 2.
- Negative constraints: no text overlays, no cartoon effects, no distorted faces.

Am besten mit: Seedance 2, Seedance 2.0, Kling 2.0

Warum effektiv: Das R2V-Pattern (Reference-to-Video) trennt Referenz-Frame-Konsistenz von Bewegungsbeschreibung. Die Phasenstruktur (0-2s, 2-4s, 4-6s) gibt dem Modell explizite Timing-Vorgaben. Explizite Negative Constraints verhindern typische Artefakte. Funktioniert mit allen aktuellen R2V-Modellen.

Quelle: Community Pattern basierend auf Seedance 2 R2V-Workflows | Prompta.ch Forschung

Community Resonanz: Das Pattern wird in der Community zunehmend als Gold Standard für Referenz-basierte Video-Generierung verwendet — besonders wenn Charakter-Konsistenz über mehrere Frames hinweg kritisch ist.


🧠 TOP 3 NEUE TECHNIKEN

1. Cache-Aware Inference Routing (Prompt-Cache-Optimierung)

Zusammenfassung: Durch intelligente Auswahl des Inference-Providers basierend auf Prompt-Cache-Hit-Raten lassen sich 7,7–38,3% der LLM-Kosten einsparen.

Erklärung: Auriko hat in einer Studie mit 80.000 API-Aufrufen an 37 Modelle gezeigt, dass identische Sessions je nach Provider dramatisch unterschiedliche Kosten verursachen — bei manchen Modellen bis zu 4x teurer. Die Technik analysiert vor dem API-Call: (1) Token-Preis des Providers, (2) Prompt-Cache-Verfügbarkeit, (3) Session-Kontinuität. Ein Cache-Aware-Routing-Layer leitet Requests zum günstigsten Provider mit Cache-Hit. Der größte Hebel entsteht bei Coding-Agent-Workflows mit repetitiven Prompts, wo Cache-Hit-Raten am höchsten sind.

Beispielprompt:

# Cache-Aware System Prompt Architecture
# Structure your prompts to maximize prefix-cache hits:

PREFIX (always identical, maximizes cache reuse):
You are a senior Python developer specializing in data engineering.

TASK FRAME (semantically identical, reordered for cache):
Review the following code for: (1) performance, (2) security, (3) style

VARIABLE (changes per request, placed last for partial cache):
Code to review: [PASTE CODE HERE]

Geeignet für: Claude Opus 4.8, GPT-5.5, GLM-5.2 über OpenRouter/Multi-Provider-Setups

Ursprung: https://www.auriko.ai/reports/llm-cost-arbitrage | 5 Upvotes (HN)

Warum heute wichtig: Mit explodierenden Agent-Run-Kosten ist die Token-Effizienz einer der wichtigsten Hebel. Cache-Aware-Routing spart bei identischer Modell-Output-Qualität bis zu 38,3% der Kosten. Für Teams mit 100+ Agent-Runs pro Tag bedeutet das signifikante Budget-Freiräume.


2. Thesis-Driven Research mit LLM-Wiki

Zusammenfassung: Forschungsaufträge an Agent-Schwärme werden durch eine These strukturiert — statt breiter Suche wird gezielt nach unterstützenden, widersprechenden und mechanistischen Beweisen gesucht.

Erklärung: Anstatt "Research fiber neuroinflammation" zu prompten, formuliert man eine präzise These: "fiber reduces neuroinflammation via SCFAs". Der Agent-Schwarm wird dann aufgeteilt: ein Subagent sucht unterstützende Evidenz, ein anderer widersprechende Studien, ein weiterer mechanistische Erklärungen, und ein vierter prüft Meta-Analysen. Die Quellen, die nicht zu den Variablen der These passen, werden aussortiert. Das Ergebnis ist ein strukturiertes Verdict (supported/partially supported/contradicted/insufficient evidence/mixed) statt einer ungerichteten Informationsflut. Bei Bedarf wird eine zweite Recherche-Runde mit Fokus auf die schwächere Seite durchgeführt, um Confirmation Bias entgegenzuwirken.

Beispielprompt:

Research the following claim in thesis mode:
"Fiber reduces neuroinflammation via short-chain fatty acids (SCFAs) produced by gut bacteria."

Instructions:
1. Split search into 4 parallel paths:
   - Supporting evidence (direct studies confirming the hypothesis)
   - Opposing evidence (studies contradicting or failing to replicate)
   - Mechanistic explanation (how SCFAs interact with inflammatory pathways)
   - Meta reviews (systematic reviews and meta-analyses)

2. Sources not directly related to the claim's variables should be skipped.

3. Output a verdict: supported, partially supported, contradicted, insufficient evidence, or mixed.

4. If evidence is heavily skewed toward one side, conduct a second round focused on the weaker arguments.

Return structured findings with source citations for each path.

Geeignet für: Claude Code (via llm-wiki Plugin), OpenAI Codex, OpenCode, Pi

Ursprung: https://llm-wiki.net/ | 16 Upvotes (HN)

Warum heute wichtig: Standard-LLM-Recherche liefert unstrukturierte Informationsmengen. Thesis-Driven Research erzwingt kritische Ausgewertung — besonders wertvoll für medizinische, wissenschaftliche und strategische Entscheidungen. Die 10x-Performance-Steigerung gegenüber Standard-Coding-Harnesses kommt von der strukturierten Aufteilung.


3. Self-Improving Agent Memory (Perplexity Brain Pattern)

Zusammenfassung: Agent-Speicher wird vom Benutzer-Profil auf den Arbeits-Kontext umgestellt — Agenten lernen aus eigenen Erfolgen, Misserfolgen und Korrekturen.

Erklärung: Perplexitys "Brain"-System verschiebt den Fokus der AI-Speicherung: Statt Benutzerpräferenzen zu merken, speichert der Agent einen Context-Graph seiner eigenen Arbeit. Jeder durchgeführte Task wird analysiert: Was hat funktioniert? Was war eine Sackgasse? Welche Korrekturen hat der Benutzer vorgenommen? Overnight wird der Wiki aktualisiert und der Agent erhält einen stärkeren Signal für den nächsten Tag. Das Ergebnis: +25% Antwortkorrektheit bei bekannten Tasks, +16% Recall, -13% Kosten bei kontextabhängigen Aufgaben. Das Pattern ist auf beliebige Agent-Architekturen übertragbar.

Beispielprompt:

# Agent Memory System Prompt

## Persistent Context Rules:
1. After each task completion, write a brief summary to your memory file containing:
   - What task you performed (concise description)
   - Which tools/sources were most effective
   - Which sources were dead ends (do not reuse)
   - Any corrections or feedback provided by the user

2. Before starting a new task, consult your memory for:
   - Similar past tasks and their outcomes
   - Preferred sources that have proven reliable
   - Known pitfalls and corrections to avoid

3. Track correction patterns: If the user has corrected the same type of error twice or more, encode it as a hard rule in your memory.

4. Every night (or on-demand), synthesize your memory into a refined context document that prioritizes:
   - High-confidence facts over speculative conclusions
   - Verified source quality over quantity
   - Token-efficient retrieval (key facts only, not full transcripts)

Geeignet für: Claude Code, OpenAI Codex, OpenCode, alle Agent-Frameworks mit persistentem Speicher

Ursprung: https://www.marktechpost.com/2026/06/18/perplexity-launches-brain/ | MarkTechPost

Warum heute wichtig: Agent-Runs verbrauchen enorme Token-Mengen. Selbst-verbessernde Agenten reduzieren den Bedarf: Je länger sie laufen, desto effizienter werden sie. Das Pattern ist framework-agnostisch und lässt sich mit jeder persistenten Speicherlösung (Wiki, JSON, Vector-DB) implementieren.


🏆 Highlight des Tages

GLM-5.2 — Das leistungsstärkste Open-Weights LLM, MIT-Lizenz, $1.40/Mio Token

Chinas Z.ai hat GLM-5.2 veröffentlicht — 753B Parameter, 1.51TB Modellgewicht, 40 aktive Parameter (MoE), 1 Million Token Context Window. MIT-Lizenz. Auf OpenRouter ab $1.40/Mio Input- und $4.40/Mio Output-Tokens verfügbar — deutlich günstiger als GPT-5.5 ($5/$30) oder Claude Opus ($5/$25).

Prompt-Test-Ergebnisse:

  • SVG-Generierung: Vollständig animierte, selbstständige SVGs mit CSS — Augen fallen nicht ab, Räder drehen sich synchron
  • Code Arena WebDev: Platz 2 hinter Claude Fable 5 für Frontend-Entwicklung
  • Artificial Analysis Intelligence Index v4.1: Platz 1 bei Open-Weights mit 51 Punkten

Wichtiger Hinweis: Der Vergleich GLM-5.1 vs. GLM-5.2 zeigt den klassischen "neuer ≠ besser" Effekt — bei SVG-Animationen war GLM-5.1 teils überlegen. Immer eigene Eval-Suite vor dem Upgrade laufen lassen.

Direkt nutzbar auf OpenRouter: https://openrouter.ai/search?provider=9 (Model: zhipu/glm-5.2)

Quelle: https://simonwillison.net/2026/Jun/17/glm-52/ | 26 Upvotes (HN)


📰 Erlesene Artikel & Ressourcen


Bericht erstellt am 2026-06-19 Quellen: Hacker News, AI News Portals, arXiv, GitHub, Personal Blogs