🇨🇭 prompta.ch — Daily Prompt Intelligence Report | 20. Mai 2026
🔤 TOP 3 PROMPTS — Textgenerierung
1. SutniPrompt v0.1.0 — Anti-Plapper-Systemprompt
Prompt (vollständig, kopierbar):
<system>
Act as an analytical, intellectual partner. Strict directives:
1. TONE & STEALTH
- Be concise, precise, and serious. Zero pleasantries, redundancy, filler, or flattery.
- Avoid moral disclaimers ("As an AI..."), excessive safetyism, or hedging.
- Treat the user as a critical, autonomous thinker. Do not assume emotions.
- Stealth: Never announce your state or explain your tone. Execute silently.
2. REASONING & STRUCTURE
- Prioritize analytical reasoning, mental models, and frameworks over definitive conclusions.
- Use clean Markdown (headers, bullets, tables, code blocks) to maximize readability.
- Fix logic/code flaws with minimal verbosity.
- Do not summarize your own output. Always conclude sentences properly.
3. INTERACTION & GATING (STRICT)
- Encourage autonomy: provide tools/models instead of final answers when appropriate.
- FORBIDDEN: You are strictly forbidden from providing solutions, plans, or hypothetical analyses for:
a) Broad/underspecified requests (e.g., plans, curricula, strategies).
b) Unrecognized or non-existent entities, protocols, or events.
- MANDATORY HALT: In these cases, you MUST stop and provide ONLY 2-3 targeted clarifying questions or state "I lack verified data on [X]" and ask for source context.
4. MANDATES
- Wikipedia: Always append exactly ONE relevant English Wikipedia link (en.wikipedia.org) at the very end.
- Tools/Calendar: Use concise titles and always append "[AI]" to the title.
</system>
Am besten mit: Claude (System Prompt), Gemini (modularer Einsatz), ChatGPT (als erste Nachricht)
Warum effektiv: Dieser Systemprompt eliminiert das typische KI-Geschwätz ("As an AI...", Floskeln, übertriebene Höflichkeit) und zwingt das Modell zu sachlicher, strukturierter Analyse. Das "Mandatory Halt"-Feature verhindert Halluzinationen bei vagen Anfragen, indem das Modell stattdessen Rückfragen stellt. Funktioniert als Framework mit 4 Modulen (Tone, Reasoning, Gating, Mandates).
Quelle: https://github.com/sutnip/sutniprompt | Reddit: https://www.reddit.com/r/PromptEngineering/comments/1thz21l/i_got_sick_of_llm_pleasantries_and_disclaimers_so/ | 4 Upvotes (frischer Post)
Community Resonanz: Reddit-Nutzer bestätigen das Problem der LLM-Höflichkeit und ergänzen eigene Systemprompt-Ideen aus ihrer Erfahrung. Die Diskussion zeigt, dass dieses Problem branchenweit relevant ist.
2. Omni-Channel Content Repurposer
Prompt (vollständig, kopierbar):
Act as a social media strategist. I have a long-form article/transcript about [INSERT TOPIC]. Here is the text: [INSERT SOURCE TEXT].
I need you to repurpose this content for three specific platforms, adhering to the best practices of each:
LinkedIn: Write a professional post (approx. 150 words) that highlights the business value/insight. Use a hook, bullet points for readability, and a clear Call to Action (CTA) for comments.
Twitter/X: Create a thread of 5 tweets summarizing the key takeaways. Ensure the first tweet is a strong hook and the last tweet links back to the source.
Instagram: Write a caption that is personal and engaging. suggest a visual idea (e.g., "A photo of...") to accompany the text, and include 15 relevant, high-traffic hashtags.
Am besten mit: ChatGPT, Claude, Gemini
Warum effektiv: Verwandelt einen einzelnen langen Text in drei plattformoptimierte Beiträge mit jeweils eigenen Konventionen (Hook, CTA, Thread-Struktur, Hashtags). Spart Stunden an manueller Content-Anpassung und stellt sicher, dass jeder Kanal die richtige Tonalität erhält.
Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tic515/the_omnichannel_content_repurposer/ | 1 Upvote
Community Resonan: Teil der täglichen Prompt-Serie von r/xclusiveprompt_free — eine Quelle für sofort kopierfähige, strukturierte Prompts ohne Fülltext.
3. Feynman-Technik Wissensgenerator
Prompt (vollständig, kopierbar):
I want to deeply understand [INSERT COMPLEX TOPIC OR CONCEPT]. Act as a master educator applying the Feynman Technique.
First, explain this concept to me in simple terms as if I were a 12-year-old student, avoiding all unnecessary jargon. Use a distinct, real-world analogy involving [INSERT PREFERRED ANALOGY THEME, e.g., Cooking, Sports, Gardening] to help me visualize the mechanics of the concept.
Once the summary is complete, identify the three most common misconceptions people have about this topic and correct them. Finally, quiz me with 3 critical thinking questions that force me to apply this knowledge to a new scenario, rather than just recalling facts.
Am besten mit: Claude, Gemini, GPT-4o
Warum effektiv: Nutzt die bewährte Feynman-Technik (Erklären wie für einen 12-Jährigen → Missverständnisse identifizieren → kritisches Denken testen) für tiefes Verständnis komplexer Themen. Die Analogie-Funktion macht abstrakte Konzepte greifbar, und die Quizfragen am Ende testen echtes Verständnis statt oberflächliches Erinnern.
Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tiedls/the_universal_concept_simplifier_feynman/ | 1 Upvote
Community Resonanz: Regelmäßig veröffentlichter Prompt-Typ auf r/xclusiveprompt_free — sofort einsetzbar, klar strukturiert, ohne unnötige Fülltexte.
🖼️ TOP 3 PROMPTS — Bildgenerierung
1. Anima v1.0 + Turbo LoRA — 4s Inferenz Workflow
Prompt (vollständig, kopierbar):
# ComfyUI Workflow-Konfiguration für Anima v1.0
Base Model: Anima v1.0 (circlestone-labs/Anima)
LoRA: Turbo LoRA (civitai.com/models/2560840/anima-turbo-lora)
Plugin: Raylight (github.com/komikndr/raylight)
# Konfiguration für 1024x1024 @ 3.8s:
LoRA: ON
Compile: ON (inductor backend)
Ulysses: 1
Ring: 2
GPU Setup: 2x RTX 5060Ti (OC +250/+2000), PCIe 4.0 x8
# Konfiguration für 2048x2048 @ 13.0s:
LoRA: ON
Compile: ON
Ulysses: 1
Ring: 2
# OHNE Turbo LoRA: 1024x1024 → 23.5s, 2048x2048 → 98.0s
# Compile-Backend muss "inductor" sein (nicht "cudagraphs")
Am besten mit: ComfyUI, Anima v1.0, Turbo LoRA, dual GPU Setup
Warum effektiv: Detaillierte Benchmark-Tabelle zeigt, dass Turbo LoRA + Compile die Inferenz von 23.5s auf 3.8s bei 1024x1024 reduziert — ein 6x Speedup. Bei 2048x2048 geht es von 98s auf 13s. Das Plugin Raylight ermöglicht effiziente dual GPU-Nutzung. Praktisch sofort anwendbar für alle ComfyUI-Nutzer.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti16p0/anima_turbo_lora_2x_5060ti_4s/ | 27 Upvotes | 7 Kommentare
Community Resonanz: Aktive Diskussion über alternative Caching-Methoden (Spectrum) und INT8-Quantisierung für weitere Geschwindigkeitsgewinne. Community bestätigt hohe Reproduzierbarkeit der Ergebnisse.
2. LTX 2.3 OmniNFT RL LoRA — Kohärenz & Qualität
Prompt (vollständig, kopierbar):
# LTX 2.3 Video-Prompt mit OmniNFT RL LoRA
# LoRA herunterladen:
# hf.co/Kijai/LTX2.3_comfy/blob/main/loras/LTX-2.3-OmniNFT-RL-Lora_bf16.safetensors
# Empfohlener Workflow:
1. Generiere Video mit LTX 2.3 Base Model
2. Wende OmniNFT RL LoRA an (Standard-Stärke: 1.0)
3. Verwende LTX Tiled Sampler als 2. Pass nach dem Upscaler
- Tiled Sampler: github.com/TenStrip/10S-Comfy-nodes
- Deutlich bessere Qualität als Standard-Sampler
- Sollte eigentlich nativ in ComfyUI sein
# Ergebnis:
# Erhöhte Kohärenz, reduzierte Artefakte, verbesserte Bewegungsdarstellung
# Referenz: zghhui.github.io/OmniNFT/
Am besten mit: ComfyUI, LTX 2.3, OmniNFT RL LoRA, 10S-Comfy-nodes Tiled Sampler
Warum effektiv: Dieser LoRA verbessert die Videoqualität von LTX 2.3 signifikant — mehr Kohärenz über Frames hinweg, weniger Artefakte, natürlichere Bewegungen. Der empfohlene LTX Tiled Sampler als zweiter Pass nach dem Upscaler liefert zusätzliche Qualitätssteigerung. Community berichtet von spürbar besserer Bewegungsdarstellung.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti3jar/rl_lora_for_ltx23_it_greatly_increases_coherence/ | 235 Upvotes | 32 Kommentare
Community Resonanz: Höchster Score des Tages. Kommentare bestätigen die Qualitätsverbesserung, diskutieren LoRA-Stärke, Kompatibilität mit i2v, und die Kombination mit dem destillierten LoRA. Der Tiled Sampler wird als Muss bezeichnet.
3. Nvidia RTX 2-Pass Upscaler für AI-Videos
Prompt (vollständig, kopierbar):
# Nvidia RTX 2-Pass Upscaler Node für ComfyUI
# Offizielle Doku: docs.nvidia.com/maxine/vfx/latest/Filters/VideoSuperResolution.html
# Vier Modi verfügbar:
1. DeBlur — Schärfen unscharfer Videos (am besten AI-generiert)
2. DeNoise — Rauschreduktion (separat anwenden bei AI-Videos)
3. SuperResolution — Klassisches Upscaling
4. DeNoise+DeBlur — Kombiniert
# VRAM-Anforderung: 4GB VRAM + 8GB RAM
# Vergleich: Ersetzt teilweise Topaz AI Abo
# Workflow-Tipp (aus Community):
# RTX VSR vs. Lanczos — RTX VSR zeigt klare Vorteile bei
# Felltextur (Wolfs-Beispiel), Kantenschärfe, und Detailschärfe
Am besten mit: ComfyUI, Custom RTX Upscale Node, Nvidia RTX GPU
Warum effektiv: Implementiert alle vier Nvidia RTX Upscaling-Optionen in einer ComfyUI Node. Besonders DeBlur ist wertvoll für AI-generierte Videos, die oft Unschärfen haben. Erfordert nur 4GB VRAM und ersetzt teilweise kostenpflichtige Topaz AI Workflows. Die Community bestätigt sichtbare Verbesserungen gegenüber Lanczos-Resampling.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti0dfv/nvidia_rtx_2_pass_upscaler_4gb_vram_8gb_ram/ | 177 Upvotes | 34 Kommentare
Community Resonanz: Gemischte aber überwiegend positive Resonanz. Einige Nutzer testen erfolgreich, andere berichten von subtilen Unterschieden. Vorher-/Nachher-Vergleiche zeigen klare Verbesserung bei Texturdetails.
🎬 TOP 3 PROMPTS — Videogenerierung
1. LTX 2.3 Foley — Audio zu beliebigem Video hinzufügen
Prompt (vollständig, kopierbar):
# LTX 2.3 V2V Foley Workflow — Audio zu jedem Video hinzufügen
# Workflow herunterladen:
# hf.co/RuneXX/LTX-2.3-Workflows/blob/main/Video-2-Video/LTX-2.3_-_V2V_Foley_Add_Sound_To_Any_Video.json
# Hardware-Voraussetzungen:
# Bestätigt funktionierend auf: RTX 3060 12GB + 64GB RAM
# Anwendung:
# 1. Lade dein bestehendes Video (egal welches Modell: WAN, LTX, etc.)
# 2. Verwende den V2V Foley Workflow
# 3. LTX 2.3 generiert automatisch passende Soundeffekte
# Wichtige Hinweise aus der Community:
# - Funktioniert auch mit WAN-videos (nicht nur LTX)
# - Audio-Qualität ist "hit or miss" — mehrere Seeds probieren
# - Alternative: Civitai WAN-Modell mit Audio-Generierung
# civitai.com/models/2516432/wan-22-all-in-wan (Mode 4 aktivieren)
Am besten mit: LTX 2.3, RTX 3060 12GB (oder besser), ComfyUI
Warum effektiv: Löst ein häufiges Problem: AI-generierte Videos haben kein Audio. Dieser Workflow fügt automatisch passende Soundeffekte hinzu, funktioniert mit Videos von WAN und anderen Modellen, und läuft bereits auf einer RTX 3060. Die Community bestätigt die Funktionalität mit konkreten Hardware-Angaben.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti5pvo/is_it_possible_to_add_audio_to_a_wan_video_with/ | 25 Upvotes | 7 Kommentare
Community Resonanz: Top-Kommentar (20↑) liefert den direkten Workflow-Link und Hardware-Bestätigung. Alternative Civitai-Lösung mit eingebauter Audio-Generierung als Mode 4 empfohlen.
2. LTX Tiled Sampler — 2. Pass nach Upscaler
Prompt (vollständig, kopierbar):
# LTX Tiled Sampler für bessere Videoqualität
# Nodes installieren: github.com/TenStrip/10S-Comfy-nodes
# Einsatz im Workflow:
# 1. Generiere Video mit LTX 2.3
# 2. Upscale das Video
# 3. Verwende LTX Tiled Sampler als 2. Sampler NACH dem Upscaler
# Warum der 2. Pass wichtig ist:
# - Deutlich bessere Detailtreue nach dem Upscaling
# - Vermeidet Tiling-Artefakte bei der Vergrößerung
# - Verbessert Texturkonsistenz über das gesamte Frame
# - "Sollte eigentlich nativ in ComfyUI sein" (Community-Empfehlung)
# Kombination empfohlen mit:
# - OmniNFT RL LoRA für LTX 2.3
# - Nvidia DeBlur als zusätzlicher Pass
Am besten mit: ComfyUI, LTX 2.3, 10S-Comfy-nodes
Warum effektiv: Dieser spezifische Workflow-Tipp stammt vom Autor des meist-upgevoteten Postings des Tages (235↑). Der Tiled Sampler als separater, zweiter Pass nach dem Upscaler verbessert die Videoqualität signifikant — besser als ein einzelner Durchlauf mit höherer Auflösung.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti3jar/rl_lora_for_ltx23_it_greatly_increases_coherence/ | 235 Upvotes
Community Resonanz: Explizit als "HIGHLY recommended" vom Originalautor bezeichnet. Mehrere Kommentare bestätigen den Mehrwert des separaten Tiled-Sampler-Passes.
3. WAN-to-Audio via Civitai All-in-WAN Modell
Prompt (vollständig, kopierbar):
# WAN 2.2 All-in-ONE mit integrierter Audio-Generierung
# Modell: civitai.com/models/2516432/wan-22-all-in-wan
# Features:
# - I2V, V2V, F2LF (Face-to-Lip-Face), SVI
# - Optional: LTX F2LF Nag für V2A (Video-to-Audio)
# - "Pulse of Motion" LoRA Optimizer
# - CFG Ctrl mit 4 Modi
# Audio-Generierung aktivieren:
# Mode 4 aktivieren ODER
# Während der Video-Generierung Audio-Generierung parallel aktivieren
# Alternativ: Separater LTX 2.3 Foley Workflow
# (siehe Eintrag 1 dieser Kategorie)
Am besten mit: ComfyUI, WAN 2.2, Civitai All-in-WAN Modell
Warum effektiv: All-in-One Lösung von Civitai, die Video- und Audio-Generierung in einem Modell kombiniert. Besonders Mode 4 oder die parallele Audio-Aktivierung während der Video-Generierung liefert integrierte Ergebnisse ohne separaten Workflow.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti5pvo/is_it_possible_to_add_audio_to_a_wan_video_with/ | 25 Upvotes | Kommentar von @RuneXX (1↑)
Community Resonanz: Ergänzt den Foley-Workflow als Alternative. Community diskutiert beide Ansätze — der Foley-Workflow wird als zuverlässiger bewertet, das All-in-WAN-Modell als praktischer für integrierte Workflows.
🧠 TOP 3 NEUE TECHNIKEN
1. Mandatory Halt — Halluzinations-Block durch Clarifying Questions
Zusammenfassung: Ein Systemprompt-Mechanismus, das LLMs verbietet, bei unklaren Anfragen zu halluzinieren, und stattdessen gezielte Rückfragen erzwingt.
Erklärung: SutniPrompt implementiert einen "Mandatory Halt" — wenn eine Anfrage zu vage ist, nach nicht-existierenden Entitäten fragt oder auf nicht vorhandenen Informationen basiert, DARF das Modell keine Antwort generieren. Stattdessen MUSS es exakt 2-3 zielgerichtete Rückfragen stellen oder "I lack verified data on [X]" antworten. Dies verhindert den typischen AI-Halluzinations-Modus, bei dem Modelle selbstbewusst falsche Pläne generieren. Der Mechanismus verwendet drei Trigger: (a) breite/unterspezifizierte Anfragen, (b) nicht-existierende Entitäten, (c) fehlende Kontextinformationen.
Beispielprompt:
SYSTEM-REGEL: Wenn eine Anfrage zu vage ist oder nach etwas fragt, das du nicht
verifizieren kannst, antworte NICHT mit einer Lösung. Stattdessen:
1. Identifiziere das fehlende Datum oder die unklare Annahme.
2. Stelle genau 2-3 präzise Rückfragen, die zur Klärung nötig sind.
3. Warte auf die Antwort des Nutzers, bevor du fortfährst.
Beispiel:
Nutzer: "Erstelle einen Marketingplan für mein Startup."
Antwort: "Ich benötige weitere Informationen: 1) In welcher Branche ist Ihr
Startup tätig? 2) Wer ist Ihre Zielgruppe? 3) Was ist Ihr aktuelles Budget?"
Geeignet für: Claude, Gemini, GPT-4/5 — alle kommerzielle LLMs
Ursprung: https://github.com/sutnip/sutniprompt | Reddit-Diskussion
Warum heute wichtig: Je leistungsfähiger LLMs werden, desto überzeugender werden ihre Halluzinationen. Der Mandatory Halt zwingt Modelle zur intellektuellen Ehrlichkeit und verhindert, dass sie plausible aber falsche Antworten bei unklaren Anfragen generieren. Besonders wertvoll für Geschäftsentscheidungen, wo falsche Analysen reale Kosten verursachen.
2. Guardrails für 8B-Modelle — Von 53% auf 99% bei Agentischen Tasks
Zusammenfassung: Ein neues Framework (Forge) bringt 8B-Parameter durch Guardrails von 53% auf 99% Erfolgsrate bei agentischen Aufgaben (ACM CAIS '26 Preprint).
Erklärung: Die Forschung zeigt, dass kleine LLMs (8B Parameter) durch strukturierte Guardrails — also Eingabe-/Ausgabevalidierung, Tool-Aufruf-Beschränkungen, und Zustandsmaschinen für Agenten-Aktionen — auf Niveau von deutlich größeren Modellen gebracht werden können. Der Anstieg von 53% auf 99% bedeutet, dass Guardrails nicht nur Sicherheit erhöhen, sondern auch die reine Leistung verdoppeln. Der Schlüssel liegt darin, dem 8B-Modell klar definierte Handlungsrahmen zu geben statt freier Generierung. Das Framework ist peer-reviewed und wird auf einer Konferenz präsentiert.
Beispielprompt:
# Guardrails-Pattern für 8B-Modelle in agentischen Workflows
SYSTEM-PROMPT STRUKTUR:
1. Erlaubte Tools: [explizite Liste] — ALLE anderen Aufrufe werden blockiert
2. Zustandsvalidierung: Jeder Tool-Aufruf MUSS einen gültigen Status-Übergang haben
3. Output-Schema: Alle Antworten MÜSSEN dem definierten JSON-Schema entsprechen
4. Retry-Logik: Bei ungültigem Output wird max. 2x neu generiert, dann Fallback
5. Selbst-Korrektur: Das Modell prüft seinen eigenen Output vor dem Senden
Ergebnis: 8B-Modelle erreichen mit dieser Struktur vergleichbare Zuverlässigkeit
wie 70B+ Modelle ohne Guardrails.
Geeignet für: Qwen 2.5 7B/14B, Llama 3.1 8B, Gemma 3 8B — lokale Agenten
Ursprung: https://github.com/antoinezambelli/forge | ACM CAIS '26 Preprint | Reddit: r/LocalLLaMA
Warum heute wichtig: Mit dem Preisdruck auf kleine Modelle (Qwen, Gemma, Llama) zeigt diese Forschung, dass 8B-Modelle durch Guardrails enterprise-tauglich werden — ohne teurere Modelle mieten zu müssen. Praktisch relevant für jede:r, der/die lokale AI-Agenten betreibt und Hardware-Kosten senken will.
3. Prompt-Shape Sensitivität bei neuen Modell-Releases
Zusammenfassung: Neue Modellversionen können mit bestehenden Prompts schlechter performen als Vorgänger — nicht wegen schlechterer Fähigkeiten, sondern wegen veränderter Prompt-Empfindlichkeit.
Erklärung: Ein aktueller Benchmark von Gemini 3.5 Flash zeigt, dass das "neue" Modell bei bestehenden Prompts schlechter abschneidet als Gemini 3.1 Pro und sogar 3.1 Flash Lite. Die Community-Diskussion identifiziert zwei Ursachen: (1) Neue Modelle optimieren für öffentliche Benchmarks, nicht für individuelle Task-Verteilungen. (2) Gemini-Modelle reagieren besonders sensitiv auf "Prompt Shape" — also wie eine Anfrage formuliert und strukturiert ist. Die praktische Konsequenz: Bei jedem neuen Modell-Release sollte man bestehende Prompts re-evaluieren statt blind zu upgraden. Die beste Praxis ist, neue Releases wie Code-Deployments zu behandeln: zuerst die eval suite laufen lassen, nichts über "newer = better" annehmen.
Beispielprompt:
# Prompt-Adaption für neue Modell-Releases
TEST-CHECKLISTE beim Modellwechsel:
1. Benchmark bestehende Prompts mit altem UND neuem Modell
2. Wenn Score sinkt: Prompt-Shape anpassen (mehr/weniger Kontext,
andere Struktur, explizitere Output-Spezifikation)
3. Temperatur prüfen — neue Modelle können andere Sweet Spots haben
4. Cost-Benefit: Ist die Verbesserung den Preis-Anstieg wert?
Gemini 3.5 Flash Beispiel:
- 10x teurer als 3.1 Flash Lite
- Schlechterer Score bei bestehender Eval-Suite
- Mögliche Lösung: Prompt-Reframing statt Modell-Downgrade
Geeignet für: Alle Provider — Gemini, OpenAI, Anthropic, xAI
Ursprung: https://www.reddit.com/r/PromptEngineering/comments/1thxy70/i_benchmarked_the_new_release_gemini_35_flash_on/ | 84 Upvotes | 7 Kommentare
Warum heute wichtig: Model-Provider vermarkten jede neue Version als "besser", aber die Realität zeigt oft Regressionen bei bestehenden Use Cases. Wer diese Technik kennt, spart Kosten und vermeidet frustrierende Ergebnisse. Besonders relevant bei den aktuellen Releases (Gemini 3.5, Qwen 3.7, Claude Opus 4.6/4.7).
🏆 Highlight des Tages
RL LoRA für LTX 2.3 + LTX Tiled Sampler — Der komplette Qualitäts-Workflow
Prompt (vollständig, kopierbar):
# KOMPLETTER LTX 2.3 QUALITÄTS-WORKFLOW (20. Mai 2026)
# SCHRITT 1: OmniNFT RL LoRA herunterladen und installieren
# LoRA: hf.co/Kijai/LTX2.3_comfy/blob/main/loras/LTX-2.3-OmniNFT-RL-Lora_bf16.safetensors
# Forschung: zghhui.github.io/OmniNFT/
# Anwendung: LoRA-Stärke = 1.0, kompatibel mit i2v und t2v
# SCHRITT 2: 10S-Comfy-nodes installieren
# Tiled Sampler: github.com/TenStrip/10S-Comfy-nodes
# Dieser muss als EXTRA NODES in ComfyUI installiert werden
# SCHRITT 3: Workflow aufbauen
# 1. LTX 2.3 Base Model laden
# 2. OmniNFT RL LoRA anwenden (Stärke 1.0)
# 3. Video generieren (Standard-Einstellungen)
# 4. Upscale durchführen
# 5. LTX Tiled Sampler als ZWEITER PASS nach dem Upscaler
# → Verbessert Detailtreue, reduziert Tiling-Artefakte,
# verbessert Texturkonsistenz
# SCHRITT 4 (Optional): Nvidia RTX DeBlur als weiterer Pass
# Für besonders unscharfe AI-Videos
# Doku: docs.nvidia.com/maxine/vfx/latest/Filters/VideoSuperResolution.html
# ERGEBNIS:
# Signifikant mehr Kohärenz zwischen Frames
# Reduzierte Artefakte
# Natürlichere Bewegungen
# Schärfere Details nach Upscaling
Am besten mit: ComfyUI, LTX 2.3, OmniNFT RL LoRA, 10S-Comfy-nodes, GPU mit ≥8GB VRAM
Warum effektiv: Dieser kombinierte Workflow vereint drei aktuelle Community-Entdeckungen in einem pipeline: Das OmniNFT RL LoRA für Frame-Kohärenz, den Tiled Sampler als zweiten Pass für Upscaling-Qualität, und optional den Nvidia DeBlur für Schärfung. Mit 235 Upvotes und 32 Kommentaren ist dies der meistdiskutierte Beitrag des Tages. Die Community bestätigt durchgehend die Qualitätsverbesserung, und multiple Nutzer berichten, dass dieser Workflow ihre bisherigen Ergebnisse signifikant übertrifft.
Quelle: https://www.reddit.com/r/StableDiffusion/comments/1ti3jar/rl_lora_for_ltx23_it_greatly_increases_coherence/ | 235 Upvotes | 32 Kommentare
Community Resonanz: Höchster Score des gesamten Research-Tages. Nutzer diskutieren LoRA-Stärke, i2v-Kompatibilität, Kombination mit destilliertem LoRA, und empfehlen zusätzlich den Tiled Sampler und den Nvidia RTX Upscaler. Der Thread gilt als praktische Referenz für jeden LTX-2.3-Nutzer.
📰 Erlesene Artikel & Ressourcen
1. Gemini 3.5 Flash Benchmark — 13 Modelle im Vergleich Umfangreicher Vergleich von Gemini 3.5 Flash mit 12 anderen Modellen (GPT-5.4, Claude Opus 4.6, Sonar, Grok-4, Llama 4 Maverick u.a.) bei Emotion-Detection. Überraschendes Ergebnis: 3.5 Flash unterperformt gegenüber 3.1 Pro und sogar 3.1 Flash Lite. Enthält vollständige Metriken (Score, Stabilität, Cost, Time, Acc/$, Acc/min). 🔗 Reddit: https://www.reddit.com/r/PromptEngineering/comments/1thxy70/ | 84 Upvotes
2. Guardrails: 8B von 53% auf 99% bei agentischen Tasks Peer-reviewed Preprint (ACM CAIS '26) über "Forge" — ein Guardrail-Framework für kleine LLMs. Zeigt, dass strukturierte Eingabe-/Ausgabevalidierung die Performance von 8B-Modellen verdoppeln kann. Relevant für alle, die lokale AI-Agenten mit begrenzter Hardware betreiben. 🔗 GitHub: https://github.com/antoinezambelli/forge/blob/main/docs/forge_ieee_preprint.pdf | Reddit: r/LocalLLaMA | 11 Upvotes
3. DeepMind „Co-Scientist" — Multi-Agent KI-Partner für Forschung Google DeepMinds neuer multi-agent KI-Partner beschleunigt wissenschaftliche Forschung durch koordinierte Agenten-Arbeit. Auf Hacker News mit 3 Upvotes gelistet, repräsentiert den wachsenden Trend zu spezialisierten Multi-Agent-Systemen statt einzelner Allzweck-Modelle. 🔗 DeepMind Blog: https://deepmind.google/blog/co-scientist-a-multi-agent-ai-partner-to-accelerate-research/ | HN: 3 Upvotes
4. Qwen3.7 Max — Artificial Analysis Benchmark Qwen3.7 Max wurde von Artificial Analysis benchmarked, mit 27B/35B-Versionen in der Warteschlange. Wichtig für alle, die Qwen-Modelle als Alternative zu Claude/GPT evaluieren. Die Community diskutierte Quantisierungs-Erfahrungen (16 vs Q8 vs Q4). 🔗 Reddit: https://www.reddit.com/r/LocalLLaMA/comments/1tie6gy/qwen37_max_scored_by_artificial_analysis_27b35b/ | 41 Upvotes | 27 Kommentare
5. id-agent — Token-effiziente UUID-Alternative für AI Agents Show HN: Ein UUID-Alternative die speziell für AI Agents optimiert ist — token-effizienter als Standard-UUIDs. Relevant für Agent-Architekturen, wo jeder Token in Systemprompts und Kontextfenstern Kosten verursacht. 🔗 GitHub: https://github.com/vostride/id-agent | HN: 36 Upvotes
Bericht erstellt am 20. Mai 2026 Quellen: Reddit, Hacker News, arXiv (ratelimit)