🔤 TOP 3 PROMPTS — Textgenerierung
1. Suno Audiobook-Voice-Anchor Workflow
Prompt (vollständig, kopierbar):
Style/Genre Box:
Spoken word, storytelling, deep male warm voice, no music, podcast style, dry vocals, studio recording, clean audio, measured pace, slow tempo, authoritative
Meta-Tags im Lyrics-Box (vor den eigentlichen Text):
[Spoken Word]
[Narration]
Zur Pausensteuerung im Text:
(brief silence)
(dramatic pause)
Workflow:
- Voice Anchor erstellen — Generiere 1–2 Minuten Einführungsclip, feinjustiere Style Box bis die Stimme perfekt ist
- Sample this song — Klicke
...auf dem Base Track →Sample this song→ wähle 20–30 Sekunden am Ende (stabile Stimme) - Extend — Nutze
Extend from this songum den Track auf 5/10/15 Minuten zu verlängern - Get Full Song — Suno fügt alle Segmente nahtlos zusammen
Am besten mit: Suno v4+ für Audiobook/Podcast-Erstellung
Warum effektiv: Suno ist für Audiobooks wesentlich besser geeignet als ElevenLabs — die Voice-Anchor-Methode garantiert über Stunden identische Stimmlage, Sprechrhythmus und Studioqualität. Der Style Box-Text muss zwischen Sample- und Extend-Schritten identisch bleiben (Doppel-Anker: Audio-Sample + identische Style-Parameter).
Quelle: https://www.reddit.com/r/SunoAI/comments/1to1vno/suno_so_much_greater_than_elevenlabs_for/ | 5 Upvotes
Community Resonanz: 14 Kommentare, eine vollständige Schritt-für-Schritt-Anleitung von einem erfahrenen Nutzer. Diskussion über Konsistenz und Qualitätsunterschiede zwischen Suno und ElevenLabs für Narrative.
2. Writer's Block 4 — Prose & Narrative Enhancer Preset
Prompt (vollständig, kopierbar):
Lade das vollständige Preset hier herunter:
https://www.dropbox.com/scl/fi/grfrogz082257wiez09zq/Writer-s-Block-4.json?rlkey=swr030a4yod5bdkyqtzkqjdo6&st=fudlv938&dl=0
Das Preset enthält: Prose Rules, Character Agency Engine, Dialogue Engine, Adaptive Pacing (Novel/Blitz/Medium), Anti-Slop-Logik und den neuen Stil "GLORY MAX!" (hyperkinetisch, Emoji-Spam, Cartoon-Physik).
Am besten mit: GLM 5.1, Gemma 4 (lokal)
Warum effektiv: V4 reduziert den Token-Verbrauch von 6–7k auf 4,9–5,5k bei verbesserten Ergebnissen. Der Anti-Slop-Ansatz ist innovativ — statt dem Modell zu sagen, was es NICHT tun soll, wird formuliert, was es tun SOLL („Pink Elephants"-Effekt umgangen). Rewritten CoTs sind effizienter durch Kombination und Neuordnung.
Quelle: https://www.reddit.com/r/SillyTavernAI/comments/1tnsxh6/update_writers_block_4_the_quest_for_tokens_a/ | 72 Upvotes
Community Resonanz: 72 Upvotes in wenigen Stunden, 3 Kommentare. Diskussion über Modell-Performance (v4 struggles), Fragen zu Dialog-to-Narration Ratio und Model-Empfehlungen.
3. Metaphor- & Analogie-Generator für komplexe Themen
Prompt (vollständig, kopierbar):
Act as a Communications Specialist and Educator. I need a collection of powerful metaphors and analogies to explain a complex topic simply.
The Topic: [INSERT TOPIC, e.g. The concept of Inflation / How a Compiler works / The immune system].
Target Audience: [INSERT AUDIENCE, e.g. High school students / Non-technical executives / My skeptical family].
Generate 5 distinct metaphors/analogies:
- An analogy involving [THEME A, e.g. Cars/Traffic].
- An analogy involving [THEME B, e.g. Food/Cooking].
- An analogy involving [THEME C, e.g. Architecture/Building].
Explain which metaphor you think is the most effective for the [TARGET AUDIENCE] and why.
Am besten mit: ChatGPT-4o, Claude Opus, Qwen3.5
Warum effektiv: Strukturiert durch Themen-Filterung — zwingt das Modell, aus unterschiedlichen Erfahrungsbereichen zu schöpfen, was frischere und prägnantere Vergleiche liefert als der typische „explain like I'm five"-Prompt. Für Content-Creator, Lehrkräfte und technische Redakteure sofort nutzbar.
Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tnzoaw/metaphor_analogy_collection_for_complex_topics/ | 1 Upvote
Community Resonanz: Teil des täglichen Prompt-Batches von r/xclusiveprompt_free. Sauberes Template-Format mit klaren Platzhaltern.
🖼️ TOP 3 PROMPTS — Bildgenerierung
1. AtelierEval — Benchmark für Prompting-Kompetenz bei T2I
Prompt (vollständig, kopierbar):
# AtelierEval-Papier zitiert folgende Prompt-Struktur als Evaluationsstandard:
# (extrahiert aus arXiv:2605.22645v1)
Beschreibe ein Bild nach diesen 4 Dimensionen:
1. Subjekt: Hauptobjekt, Position, Größe, Blickrichtung
2. Umgebung: Setting, Hintergrund, Lichtverhältnisse
3. Stil: Medium (Foto/Ölmalerei/3D-Render), Farbpalette, Kompositionsregel
4. Details: Textur, Materialien, atmosphärische Effekte
Beispielprompt für Bildgenerierung:
A weathered bronze samurai statue standing in a moss-covered Zen garden at golden hour.
Shot from a low angle, shallow depth of field. Cinematic lighting with volumetric
god rays through cherry blossom trees. Photorealistic, 85mm lens, f/1.4.
Am besten mit: Midjourney v6+, Flux.1 Dev, DALL-E 3
Warum effektiv: Das neue arXiv-Papier (2605.22645) formalisiert erstmals, wie man Prompting-Qualität bei Text-to-Image-Modellen misst. Die 4-Dimensionen-Struktur (Subjekt, Umgebung, Stil, Details) dient als Framework für systematisch bessere Prompts statt Trial-and-Error.
Quelle: https://arxiv.org/pdf/2605.22645v1 | arXiv Paper, 21. Mai 2026
Community Resonanz: Erster Benchmark, der sowohl menschliche als auch MLLM-Prompter evaluiert. Bisherige Benchmarks testeten nur T2I-Modelle bei fixem Prompt — AtelierEval misst die Prompting-Kompetenz als eigene Variable.
2. Cinematic Scene Visualizer → Bildgenerierung
Prompt (vollständig, kopierbar):
Describe a cinematic scene with:
Subject: [subject/characters]
Location: [location]
Camera Angle: [camera angle, e.g. wide establishing shot / intimate close-up / Dutch angle]
Time of Day: [time of day, e.g. pre-dawn blue hour / harsh midday sun / golden hour]
Weather: [weather/atmospheric conditions]
Lighting: [lighting setup, e.g. backlight rim light / practical sources / soft diffused overcast]
Color Grading: [color grading style, e.g. teal-orange / desaturated / warm film stock]
Mood: [emotional tone]
For AI image generation, translate this into:
"[Subject] in [Location], [camera angle], [time of day lighting], [weather atmosphere],
[lighting details], [color grading], [mood], cinematic photography, 35mm film --ar 16:9 --v 6.0"
Am besten mit: Midjourney v6, Flux, Stable Diffusion XL
Warum effektiv: Die 8-Dimensionen-Struktur aus r/xclusiveprompt_free zwingt zu bewusster Gestaltung jedes visuellen Elements — Kamera, Licht und Farbe werden separat durchdacht statt nur „cinematic photo" als Catch-all zu verwenden. Der resultierende Prompt ist direkt kopierbar mit MJ-Parametern.
Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tntlvc/cinematic_scene_visualizer/ | 1 Upvote
Community Resonanz: Template-Struktur mit klarer Konvertierung von Filmsprache in KI-Bildprompts.
3. Typography Pairing Guide für Design-Projekte
Prompt (vollständig, kopierbar):
Act as a Graphic Designer specializing in typography. I need to select a font pairing for a new project.
Project Type: [INSERT TYPE, e.g. Financial Report / Whimsical Children's Book / Brutalist Website].
Desired Vibe: [INSERT VIBE, e.g. Serious and Scholarly / Light and Airy / Retro and Loud].
Suggest two font pairings (Header/Body) from Google Fonts or standard desktop fonts:
Pairing 1 (Safe): A classic, high-legibility choice. Describe why it works for the [PROJECT TYPE].
Pairing 2 (Bold): A unique, eye-catching choice. Describe the specific emotional response it evokes.
Rules: Provide three specific rules for font hierarchy (e.g. never use more than 3 weights; body font should be no larger than 16px).
Am besten mit: ChatGPT-4o, Claude Sonnet, Gemini Flash
Warum effektiv: Liefert konkrete Google-Font-Paarungen mit Begründung statt generischer „use a nice sans-serif"-Empfehlungen. Die Unterscheidung Safe/Bold gibt dem Designer bewusste Wahlmöglichkeiten statt eines einzigen Vorschlags.
Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tnw85q/typography_pairing_guide/ | 1 Upvote
Community Resonanz: Gut strukturiertes Template aus dem regelmäßigen r/xclusiveprompt_free-Batch. Direkt nutzbar für Web- und Printdesign.
🎬 TOP 3 PROMPTS — Videogenerierung
1. Vidu StoryGrid-to-Video Workflow
Prompt (vollständig, kopierbar):
# StoryGrid-basierter Videoprompt für Vidu / Seedance / Kling:
STRUKTUR:
[Scene 1] Establishing Shot, 3s — Weiteinstellung, statische Kamera
[Scene 2] Medium Shot, 4s — Subjekt in Aktion, langsame Schwenkbewegung
[Scene 3] Close-Up, 2s — Detailaufnahme, Fokus auf Emotion/Objekt
[Scene 4] Action Shot, 3s — Dynamische Bewegung mit Kameraverfolgung
Jeder Frame erhält einen eigenen Text-to-Video-Prompt:
Frame-Prompt: "[Subjektbeschreibung], [Umgebung], [Kamera: wide establishing shot / slow pan left / handheld close-up],
[Licht: golden hour / overcast / practical neon], [Bewegung: subtle zoom in / static / smooth dolly],
[Bewegungsqualität: smooth, controlled, cinematic], --camera stable, --character consistent"
Am besten mit: Vidu 2.0, Seedance 2.0, Kling 1.6
Warum effektiv: StoryGrid-Struktur ersetzt das „ein Prompt = ein Video"-Modell durch sequenzielle Frame-Prompts mit spezifischen Kameraanweisungen. Ermöglicht konsistente Charaktere und kontrollierte Schnittstellen zwischen Szenen — die zentrale Herausforderung bei AI-Video.
Quelle: https://www.reddit.com/r/aivideo/comments/1tnyj7b/vidu_just_changed_the_game_kungfu_storygridtovideo/ | 7 Upvotes
Community Resonanz: Video-Demo mit Kung-Fu-Sequenz zeigt die Machbarkeit des StoryGrid-Ansatzes. 1 Kommentar, aber 375 Upvotes bei der parallelen Star Trek-Demo im Sub unterstreichen das generelle Interesse an kontrollierter AI-Video-Erstellung.
2. Editability-Frame statt Realismus — Neuer Bewertungsfokus
Prompt (vollständig, kopierbar):
# Video-Generierungs-Prompt optimiert für Editability statt Realismus:
Generiere ein 3-Sekunden-Clip mit folgenden Editability-Eigenschaften:
1. Hook: Erste 2 Sekunden enthalten eine visuell ansprechende, neugier-weckende Bewegung
2. Subjekt-Stabilität: Hauptobjekt bleibt während des Clips klar erkennbar (kein Morphing)
3. Schnitt-Tauglichkeit: Saubere Bewegung, die an definierten Stellen geschnitten werden kann
4. Freiraum: Negative Space oben/unten für Captions ohne Überdeckung des Subjekts
5. Sequenz-Fähigkeit: Clip passt in eine Abfolge von 3–5 ähnlichen Clips
6. Stabile Kamera: Vorhersagbare Kamerabewegung (keine dramatischen, unerwarteten Schwenks)
7. 3-5-Sekunden-Tauglichkeit: Clip macht Sinn auch wenn auf 3 Sekunden gekürzt
Beispiel: "A hand placing a ceramic coffee mug on a wooden table, slow push-in camera,
warm morning light from window right, shallow depth of field, clean negative space above
the hands, minimal background movement, smooth motion --camera steady --subject stable"
Am besten mit: Runway Gen-4, Kling 1.6, Hailuo, Dreamina
Warum effektiv: Paradigmenwechsel von „sieht es realistisch aus?" zu „kann ich es in einer echten Edit-Workflow verwenden?" Praktisch orientiert an Social-Content-Produktion: stabile Subjekte, vorhersehbare Kamera, sauberer Schnitt, Platz für Text.
Quelle: https://www.reddit.com/r/generativeAI/comments/1to49is/i_stopped_judging_ai_video_by_realism_and_started/ | 2 Upvotes
Community Resonanz: Ausführlicher Erfahrungsbericht (2.253 Zeichen) mit 7 konkreten Editability-Kriterien. Noch keine Kommentare, aber das Thema ist für praktische AI-Video-Anwender hochrelevant.
3. Suno Lyria 3 Pro vs Suno — AI-Musik Prompt-Pickiness
Prompt (vollständig, kopierbar):
# Suno Musik-Prompt-Formel für konsistente Ergebnisse:
[Genre] [Sub-Genre], [Vocal Style] voice, [Tempo] BPM, [Mood]
Key: [Key signature], Time: [time signature]
[Verse:]
[Lyrics]
[Chorus:]
[Lyrics]
Bridge: [Bridge description]
Beispiel:
Indie Rock, warm male vocals, 120 BPM, nostalgic summer evening
Key: G Major, Time: 4/4
[Verse:]
Wir sind die Jungs, die um sechs gegangen sind
Die Tore hinter uns zugemacht, kein Wiedersehen in Sicht
[Chorus:]
Oh, die Jungs von gestern Abend
Sie gingen früh und ließen uns hier
Am besten mit: Suno v4 (kreativer, toleranter mit Prompts), Lyria 3 Pro (sauberer Mix, aber prompt-pickier)
Warum effektiv: Basierend auf direktem Vergleich: Suno ist kreativer und „brute-forces" sich auch durch schlechte Prompts zu brauchbaren Ergebnissen. Lyria 3 ist mischtechnisch sauberer (bessere Vocals im Mix, breiteres Stereo-Bild) aber deutlich promp-sensitiver — schlechter Prompt = schlechtes Output. Die Wahl hängt vom Use Case ab: Suno für Exploration, Lyria für finale Tracks.
Quelle: https://www.reddit.com/r/SunoAI/comments/1tnzvye/is_lyria_3_pro_actually_worth_it_over_suno_i/ | 5 Upvotes
Community Resonanz: 10 Kommentare mit direktem Vergleich, Suno vs. Lyria vs. Google Flow Music. Konsens: Suno gewinnt bei Kreativität und Genre-Vielfalt, Lyria bei Mix-Qualität und Song-Kohärenz ("Mit Suno speichere ich Momente, mit Lyria speichere ich Songs").
🧠 TOP 3 NEUE TECHNIKEN
1. SkillOpt — Skill-Dateien als trainierbare Parameter
Zusammenfassung: Ein neues Papier formalisiert, wie man Markdown-Skill-Dateien (wie bei Claude/AI Agenten) durch iterative, validierungsgesteuerte Optimierung verbessert — bis zu +59.7 Punkten auf Benchmarks durch reine Prompt-Optimierung.
Erklärung: SkillOpt verwendet ein Frontier-Modell, um begrenzte Änderungen (Hinzufügen/Löschen/Ersetzen) an Markdown-Skill-Dateien vorzuschlagen. Jede Änderung wird gegen einen Validierungssatz geprüft — nur strikte Verbesserungen werden akzeptiert, Gleichstände abgelehnt, abgelehnte Änderungen werden als negatives Signal für die nächste Runde verwendet. Skills konvergieren typischerweise nach 1–4 akzeptierten Änderungen. Das Edit-Budget von 4–8 pro Schritt ist optimal — ohne Limit kollabiert die Performance. Die mediane finale Skill-Datei ist ~920 Token.
Beispielprompt:
Optimiere die folgende Skill-Datei durch maximal 4 editierte Versionen:
Ausgangs-Skill: "You are a spreadsheet expert..."
Validierungssatz: 50 Spreadsheet-Aufgaben mit bekannten Lösungen
Akzeptanzkriterium: Neue Version muss strikt mehr Aufgaben lösen als die vorherige
Verwende ein Frontier-Modell (GPT-4.1/Claude Opus) um:
1. Eine einzelne Add/Delete/Replace-Änderung an der Skill-Datei vorzuschlagen
2. Gegen den Validierungssatz zu testen
3. Nur bei strikter Verbesserung zu akzeptieren
4. Abgelehnte Änderungen als negatives Training für die nächste Iteration zu verwenden
Geeignet für: Claude Code, GPT-4.1 Codex, OpenCode, alle Agent-Frameworks mit Skill-Dateien
Ursprung: arXiv:2605.23904 | r/LocalLLaMA, 28 Upvotes
Warum heute wichtig: Zeigt, dass Skill-Optimierung ohne Fine-Tuning möglich ist — reine Prompt/Context-Passung. Ein auf Codex optimiertes Skill transferiert ohne Änderungen zu Claude Code (+59.7 auf SpreadsheetBench). Ein GPT-4.1 nano mit optimiertem Skill erreicht vergleichbare Ergebnisse wie Frontier-Modelle.
2. Voice Anchoring — Stimmlage-Konsistenz in AI-Audio
Zusammenfassung: Durch Kombination von Sunos "Sample this song" und "Extend"-Features mit einem initialen "Voice Anchor"-Clip kann über 15+ Minuten identische Narrator-Konsistenz erzielt werden — ein Durchbruch für AI-Hörbücher.
Erklärung: Die Technik nutzt drei Suno-Features in Kombination: (1) Ein initialer Voice-Anchor-Clip (1–2 Min) definiert die exakte Stimme. (2) "Sample this song" extrahiert 20–30 Sekunden der stabilsten Stelle und verwendet diese als Frequenz-Referenz für den nächsten Abschnitt. (3) "Extend from this song" fügt nahtlos an, ohne dass separate Dateien entstehen. Der Style Box-Text bleibt über alle Schritte IDENTISCH — dies erzeugt einen Doppel-Anker (Audio-Frequenz + Text-Parameter).
Beispielprompt:
Style Box (unverändert über alle Schritte):
Spoken word, storytelling, deep male warm voice, no music, podcast style,
dry vocals, studio recording, clean audio, measured pace, slow tempo
Lyrics Box (pro Schritt):
[Spoken Word]
[Narration]
(brief silence)
Kapitel 2: Die Schatten wurden länger als...
(dramatic pause)
Geeignet für: Suno v4+ (Audiobook, Podcast, Hörspiel-Produktion)
Ursprung: r/SunoAI, 5 Upvotes, 14 Kommentare — vollständige Workflow-Anleitung
Warum heute wichtig: Löst das Kernproblem langer AI-Produktionen: Konsistenz über mehrere Generierungs-Steps hinweg. Bisher war jede Suno-Generierung ein Würfelspiel für die Stimme — Voice Anchoring macht daraus einen kontrollierten Prozess.
3. Editability-First AI Video — Neuer Paradigmenwechsel
Zusammenfassung: Statt AI-Video-Outputs an Realismus zu messen, sollte "Editability" das primäre Bewertungskriterium sein — wie gut ein Clip in einen professionellen Edit-Workflow integrierbar ist.
Erklärung: Ein praktizierender Content-Creator dokumentiert nach intensiven Tests mit Runway, Kling, Hailuo, Dreamina und CapCut: Viele AI-Videos sind einzeln beeindruckend, aber unbrauchbar im Schnitt — zu viel Bewegung, unvorhersehbare Kamera, Subjekt-Morphing. Die Editability-Metrik bewertet stattdessen: Hook-Tauglichkeit (erste 2 Sek), Subjekt-Stabilität, Schnitt-Punkte, Freiraum für Text/CTA, Sequenz-Fähigkeit, Kamera-Vorhersagbarkeit und Kurzformat-Tauglichkeit. Diese 7 Kriterien sind für Social-Content-Produktion relevanter als photorealistische Qualität.
Beispielprompt:
Generiere einen 4-Sekunden-Clip, optimiert für Editability:
- Erste 2 Sek als Hook (neugier-weckende Bewegung)
- Stabil erkennbares Subjekt (kein Morphing)
- Saubere Bewegung mit definierten Schnitt-Punkten
- Negative Space oben/unten für Captions
- Vorhersehbare Kamera (smooth push-in, kein dramatischer Schwenk)
- Tauglich für 3–5 Sek Schnitt
"A hand placing a ceramic coffee mug on a wooden table, slow push-in camera,
warm morning light from window right, clean negative space above,
minimal background movement --camera steady --subject stable"
Geeignet für: Runway Gen-4, Kling 1.6, Hailuo, Dreamina, LTX 2.3
Ursprung: r/generativeAI, 2 Upvotes — umfangreicher Erfahrungsbericht
Warum heute wichtig: Mit AI-Video-Tools, die zunehmend in professionelle Pipelines einfließen, verschiebt sich der Fokus von "sieht es echt aus" zu "kann ich es verwenden." Diese Metrik hilft bei der Tool-Auswahl und Prompt-Formulierung für produktive Workflows.
🏆 Highlight des Tages
Suno Audiobook Voice-Anchor Methode — Der konsistenteste AI-Narrator-Workflow
Der mit Abstand wertvollste Fund heute ist ein vollständiger, praxiserprobter Workflow für die Erstellung langer, konsistenter AI-Hörbücher mit Suno. Während viele Suno-Posts nur einzelne Song-Ergebnisse zeigen, liefert dieser Thread eine durchdachte 3-Step-Methode mit konkreten Style-Prompts, Meta-Tags und Pausen-Steuerung.
Das Besondere: Die Kombination aus Voice Anchor (initiale 1–2 Min Referenz), "Sample this song" (Audio-Frequenz-Kopie) und identischem Style Box-Text erzeugt einen Doppel-Anker, der die Stimme über 15+ Minuten identisch hält. Inklusive spezifischer Meta-Tags ([Spoken Word], [Narration]) und Pausen-Kommandos ((brief silence), (dramatic pause)) — alles direkt kopierbar.
Warum es für prompta.ch relevant ist: Ein voll kopierbarer Workflow mit konkreten Prompts, der ein reales Problem löst (lange, konsistente Audio-Produktion). Die goldenen Keywords für die Style Box sind eine eigenständige Prompt-Ressource:
no music, dry vocals, studio recording, clean audio → Studio-Lock
warm, deep, calm, authoritative, expressive → Vocal-Charakter
measured pace, slow tempo → Sprechrhythmus
Quelle: https://www.reddit.com/r/SunoAI/comments/1to1vno/suno_so_much_greater_than_elevenlabs_for/ | 5 Upvotes, 14 Kommentare
📰 Erlesene Artikel & Ressourcen
- SkillOpt: Markdown Skills as Trainable Parameters — arXiv:2605.23904. Formalisiert Skill-Optimierung durch validierte Iteration. +59.7 Punkte Transfer von Codex zu Claude Code ohne Code-Änderung. PDF
- AtelierEval: Agentic Evaluation of T2I Prompters — arXiv:2605.22645. Erster Benchmark, der Prompting-Kompetenz (Mensch & MLLM) bei Text-to-Image-Modellen quantifiziert. PDF
- Qwen 3.6 27B AR→Diffusion Training — r/LocalLLaMA, 11↑. Lokales Diffusion-LLM-Training auf RTX 5090 mit QLoRA/NVFP4. 4x Speedup gegenüber Autoregressive. GitHub
- Show HN: AI Skills für Projekt-/Delivery-Manager — Selbst-optimierende Skill-Dateien für Programm- und Projektmanagement. Show HN
- Show HN: Nerve – Self-Hosted AI Agent Runtime — Open-Source-Runtime für AI-Agenten (ClickHouse). GitHub
Bericht erstellt am 2026-05-26 Quellen: Reddit, Hacker News, arXiv