🎨

Kostenlose Bild-Prompts für KI-Bildgenerierung

Kostenlose Bild-Prompts für Midjourney, FLUX & DALL-E. Portraits, Logos, Produktfotos, Illustrationen & UX-Mockups sofort kopieren.

Bild-Prompts für jeden Anwendungsfall

Die richtigen Bild-Prompts machen den Unterschied zwischen mittelmäßigen und herausragenden KI-Ergebnissen. Ob du Blogartikel, SEO-Content, E-Mail-Kampagnen oder Produktbeschreibungen erstellst — mit unseren kuratierten KI-Bildgenerierung für ChatGPT, Claude und Gemini sparst du Zeit und erzielst bessere Resultate. Jede Vorlage ist auf Deutsch formuliert und sofort kopierbar.

Unsere Bild-Prompts decken die häufigsten Anwendungsfälle ab. Die Prompts enthalten Platzhalter-Variablen, die du einfach an deine Anforderungen anpasst. So bekommst du bei jedem KI-Tool maßgeschneiderte Ergebnisse.

Alle Bild-Prompts auf Prompta.ch sind kostenlos, ohne Anmeldung nutzbar und für die jeweils besten KI-Tools optimiert.

Alle Bild-Prompts

Wähle einen Prompt und kopiere ihn mit einem Klick.

Fotorealistisches Portrait

🟢 Einsteiger

Portrait mit natürlichem Licht, 85mm

A professional portrait photograph of [SUBJECT], natural soft lighting, 85mm lens, f/1.8, shallow depth of field, warm skin tones, [BACKGROUND], golden hour, eye-level angle, photorealistic, 8K, ultra-detailed --ar 4:5 --style raw --s 750
Variablen: [SUBJECT] [BACKGROUND]

Logo-Design

🟡 Fortgeschritten

Minimalistisches Logo mit Brand Guidelines

Minimalist logo design for [BRAND], [ICON/SYMBOL] motif, clean lines, [COLOR SCHEME], flat design, vector style, centered composition, white background, professional branding, modern typography --[BRAND NAME] lettermark optional --no gradient --no photorealism
Variablen: [BRAND] [ICON/SYMBOL] [COLOR SCHEME]

Produktfotografie

🟡 Fortgeschritten

Studio-Lighting, White-Background Produktshots

Professional product photography of [PRODUCT], studio lighting, white background, soft shadows, commercial quality, 3/4 view angle, [PROPS/CONTEXT], sharp focus, f/8, product photography style, clean composition, luxury feel --ar 4:5 --style raw --s 250
Variablen: [PRODUCT] [PROPS/CONTEXT]

Architektur-Visualisierung

🔴 Profi

Photorealistische Gebäude-Aussendarstellung

Photorealistic architectural visualization of [BUILDING TYPE], [ARCHITECTURAL STYLE], exterior view, [TIME OF DAY] lighting, landscaped surroundings, [MATERIALS] facade, glass reflections, dramatic sky, professional architectural photography, tilt-shift perspective, V-Ray quality, 8K --ar 16:9 --style raw --s 750
Variablen: [BUILDING TYPE] [ARCHITECTURAL STYLE] [TIME OF DAY] [MATERIALS]

Illustration / Comic

🟢 Einsteiger

Cartoon-Style, flache Illustrationen

Cartoon illustration of [SCENE/CHARACTER], flat design, bold outlines, vibrant colors, [ART STYLE] inspired, fun and playful, clean composition, no shading, digital art style --ar [RATIO] --niji 6
Variablen: [SCENE/CHARACTER] [ART STYLE] [RATIO]

Mode / Fashion Design

🟡 Fortgeschritten

Fashion-Mockups, Lookbook-Bilder

High fashion editorial photograph, [GARMENT/OUTFIT] on model, [SETTING] background, [MOOD] atmosphere, Vogue magazine style, professional fashion photography, dramatic lighting, [POSE], luxury fabric texture detail --ar 3:4 --style raw --s 500
Variablen: [GARMENT/OUTFIT] [SETTING] [MOOD] [POSE]

Food Photography

🟢 Einsteiger

Appetitliche Food-Shots

Professional food photography of [DISH], [ANGLE] view, [SURFACE] background, garnished with [GARNISH], natural window light, slight steam, appetizing colors, shallow depth of field, food styling, cookbook quality --ar 4:3 --style raw --s 400
Variablen: [DISH] [ANGLE] [SURFACE] [GARNISH]

UI/UX Mockup

🔴 Profi

App- und Website-Design Konzepte

UI/UX design mockup of [APP/WEBSITE TYPE], modern minimalist interface, [COLOR SCHEME] color palette, clean typography, [DEVICE] screen display, dark mode [yes/no], glassmorphism elements, professional app design, Dribbble quality, Figma style --ar [RATIO]
Variablen: [APP/WEBSITE TYPE] [COLOR SCHEME] [DEVICE] [yes/no] [RATIO]

Kunst / Abstrakt

🟢 Einsteiger

Abstrakte Kunst, Malerei-Stile

Abstract art, [STYLE] inspired, [COLORS] color palette, [TEXTURES] texture, [EMOTION] mood, large canvas composition, [TECHNIQUE] technique, contemporary art gallery quality, expressive brushstrokes --ar 3:2 --s 750
Variablen: [STYLE] [COLORS] [TEXTURES] [EMOTION] [TECHNIQUE]

Icon-Design

🟢 Einsteiger

SVG-ready Icons, einheitlicher Stil

Set of [NUMBER] minimalist icons for [CATEGORY/PURPOSE], consistent line weight, [LINE WEIGHT]px strokes, [STYLE] style, [COLOR] on white background, rounded corners, simple and recognizable, uniform grid, SVG-ready design, system icon style
Variablen: [NUMBER] [CATEGORY/PURPOSE] [LINE WEIGHT] [STYLE] [COLOR]

Interior Design

🟡 Fortgeschritten

Raumaufbau, Einrichtung visualisieren

Interior design visualization, [ROOM TYPE] in [STYLE] style, [COLOR PALETTE], natural light from large windows, [FURNITURE], [MATERIALS], plants, architectural detail, professional interior photography, wide angle, real estate listing quality --ar 16:9 --style raw --s 500
Variablen: [ROOM TYPE] [STYLE] [COLOR PALETTE] [FURNITURE] [MATERIALS]

Packaging Design

🟡 Fortgeschritten

Verpackungskonzepte, Produktverpackung

Product packaging design for [PRODUCT], [BRAND] branding, [STYLE] aesthetic, [MATERIAL] material, [COLOR SCHEME], minimalist typography, die-cut template view, professional product shot, shelf-ready, premium feel, [SIZE] format --ar 3:4 --s 500
Variablen: [PRODUCT] [BRAND] [STYLE] [MATERIAL] [COLOR SCHEME] [SIZE]

Anima Turbo LoRA — CFG 1, 12 Steps

🟡 Fortgeschritten

99 Upvotes in r/StableDiffusion. Das Turbo-LoRA (v0.2) reduziert die nötigen Steps von typischen 20-30 auf nur 8-12 bei gleichzeitig CFG Scale 1. Das bedeutet 2-3x schnellere Generierung bei akzeptabler Qualität.特别适合 für schnelle Iterationen und Batch-Generierung. Der Entwickler empfiehlt Euler über ER-SDE, da dieser neutraler und weniger „fried" ist. Am besten mit: Anima 1.0 + ComfyUI oder Automatic1111

CFG Scale: 1
Steps: 8-12
Sampler: Euler (nicht ER-SDE)
LoRA-Stärke: 1.0 (leicht reduzieren für mehr Vielfalt)
Base Model: Anima 1.0

AtelierEval — Benchmark für Prompting-Kompetenz bei T2I

🟡 Fortgeschritten

Das neue arXiv-Papier (2605.22645) formalisiert erstmals, wie man Prompting-Qualität bei Text-to-Image-Modellen misst. Die 4-Dimensionen-Struktur (Subjekt, Umgebung, Stil, Details) dient als Framework für systematisch bessere Prompts statt Trial-and-Error. Am besten mit: Midjourney v6+, Flux.1 Dev, DALL-E 3

# AtelierEval-Papier zitiert folgende Prompt-Struktur als Evaluationsstandard:
# (extrahiert aus arXiv:2605.22645v1)

Beschreibe ein Bild nach diesen 4 Dimensionen:

1. Subjekt: Hauptobjekt, Position, Größe, Blickrichtung
2. Umgebung: Setting, Hintergrund, Lichtverhältnisse
3. Stil: Medium (Foto/Ölmalerei/3D-Render), Farbpalette, Kompositionsregel
4. Details: Textur, Materialien, atmosphärische Effekte

Beispielprompt für Bildgenerierung:
A weathered bronze samurai statue standing in a moss-covered Zen garden at golden hour.
Shot from a low angle, shallow depth of field. Cinematic lighting with volumetric
god rays through cherry blossom trees. Photorealistic, 85mm lens, f/1.4.

Anima-Bildbearbeitung — Zwei Methoden

🟡 Fortgeschritten

145 Upvotes in r/StableDiffusion. Zeigt, dass Anima-Modelle nicht nur generieren, sondern auch editieren können — ohne separate Edit-Modelle. Die Split-Screen-Methode nutzt Inpainting mit Referenz-Context, während die LoRA-Methode direktes Prompt-Switching während des Samplings ermöglicht. Beide Methoden funktionieren lokal ohne Cloud-API. Am besten mit: Anima 1.0, kohya-ss Anima-LLLite ControlNet, ComfyUI

Methode 1: Split-Screen + Anima-LLLite-Inpainting
- Platziere das Referenzbild neben der Zielregion (Split-Screen-Layout)
- Verwende Inpainting mit dem ControlNet "anima-lllite-inpainting-v2" (kohya-ss)
- Das ControlNet liest die Referenz und editiert nur die masked Region

Methode 2: AnimaEditV1 LoRA
- Lade das AnimaEditV1 LoRA (HuggingFace)
- Nutze die Latent-Edit-Funktion: Prompt-Wechsel während des Sampling-Prozesses
- Besonders gut für: Kleidung wechseln, Farbanpassungen, Gesichtsausdrücke
- Optional: Schwarz-Weiß-Bilder kolorisieren (mit lora_edit_ZeroTwo)

Fotorealistische Mirror-Selfie-Prompts für Z-Image Turbo/Base

🟡 Fortgeschritten

Sechsspaltige Prompt-Struktur (Subject → Clothing → Action → Environment → Camera → Style Details) erzeugt konsistent fotorealistische Ergebnisse. Die Kamera- und Lichtbeschreibungen simulieren echte Handyfotos statt Studio-Aufnahmen. Am besten mit: Z-Image Turbo (ZIT), ComfyUI

A young woman with long dark wavy hair takes a mirror selfie in a bedroom.

Subject: A young woman with long dark wavy hair and a warm complexion smiles softly at the camera while holding a smartphone up to capture her reflection.

Clothing: She wears a fitted white short-sleeved t-shirt tucked into high-waisted dark grey leggings, revealing a tattoo on her left upper arm.

Action: She holds a smartphone with a camouflage-patterned case in her right hand, posing with her body angled slightly away from the mirror while looking back over her shoulder.

Environment: The setting is a bedroom featuring light wood flooring, a wooden bed frame with a patterned blue and white sheet, and cream-colored walls.

Camera: The shot is a vertical mirror selfie taken at eye level with a slight wide-angle distortion typical of front-facing smartphone cameras.

Lighting: Warm ambient indoor lighting casts soft shadows and highlights the texture of her hair and skin.

Style Details: The image has a candid, casual aesthetic with natural color tones and a slightly grainy texture common in mobile photography.

Cinematic Scene Visualizer → Bildgenerierung

🟡 Fortgeschritten

Die 8-Dimensionen-Struktur aus r/xclusiveprompt_free zwingt zu bewusster Gestaltung jedes visuellen Elements — Kamera, Licht und Farbe werden separat durchdacht statt nur „cinematic photo" als Catch-all zu verwenden. Der resultierende Prompt ist direkt kopierbar mit MJ-Parametern. Am besten mit: Midjourney v6, Flux, Stable Diffusion XL

Describe a cinematic scene with:

Subject: [subject/characters]
Location: [location]
Camera Angle: [camera angle, e.g. wide establishing shot / intimate close-up / Dutch angle]
Time of Day: [time of day, e.g. pre-dawn blue hour / harsh midday sun / golden hour]
Weather: [weather/atmospheric conditions]
Lighting: [lighting setup, e.g. backlight rim light / practical sources / soft diffused overcast]
Color Grading: [color grading style, e.g. teal-orange / desaturated / warm film stock]
Mood: [emotional tone]

For AI image generation, translate this into:
"[Subject] in [Location], [camera angle], [time of day lighting], [weather atmosphere],
[lighting details], [color grading], [mood], cinematic photography, 35mm film --ar 16:9 --v 6.0"

Gemma 4 SillyTavern-Preset „Moonlight"

🟡 Fortgeschritten

16 Upvotes in r/SillyTavernAI. Speziell für kreatives Storytelling optimiert. Das Framing als „Collaborative Dungeons & Dragons" produziert bessere NPC-Namen und höhere Textqualität. MBTI-Typen für NPCs sorgen für emotional distincte Charaktere. Das Preset ist vollständig auf HuggingFace verfügbar. Am besten mit: Gemma 4-31B-IT (Q6_K_L, Bartowski), 32K Context

You are {{char}}, the game master of the collaborative dungeons and dragons like storytelling session.
The User's avatar in the story is {{user}}.

You and the User are writing a story together.
It follows the following pattern:
1. The user advances the plot by narrating the actions of {{user}}.
2. You advance the plot by using proactive prose:
- Showing the consequences of {{user}} actions.
- Progressing narrative where User left it off to build up or trigger a new event.
- Creating new events and complications to move the story forward.
- Introducing new NPCs and locations.

NPC generation (MBTI-basiert):
<!--
- Name: string
- Race: string
- Age: number
- Personality: string (based on MBTI type {{random::INTJ::INTP::ENTJ::ENTP::INFJ::INFP::ENFJ::ENFP::ISTJ::ISFJ::ESTJ::ESFJ::ISTP::ISFP::ESTP::ESFP}})
- Appearance: string (paragraph)
- Strengths: string (one to five)
- Weaknesses: string (one to five)
-->

Writing Style:
- Show, don't tell.
- Prefer plain and awkward phrasing over literary polish.
- Prefer concrete and beige prose over flowery and purple prose.
- Prefer reactive prose over incidental prose for background NPCs.
Variablen: [char] [user]

Comfy-Org Lens: Kompakter 1.1B-Prompt-Adhärenz-Test

🟡 Fortgeschritten

Das neue Lens-Modell von Comfy-Org (ca. 1.1B Parameter) bietet mit einem kompakten Encoder überraschend gute Prompt-Adhärenz und Spezieserkennung. Unterstützt Auflösungen von 736×1472 bis 1472×1472. Laufzeit: ~1.2 it/s auf RTX 4090 (~40s/50 Steps). Ideal für schnelle konzeptionelle Iterationen ohne große VRAM-Belastung. Am besten mit: Comfy-Org/Lens (HF: `Comfy-Org/Lens`), Native Support bald in ComfyUI Core (#14077)

A red fox sitting calmly on a moss-covered tree stump in an autumn forest, morning light filtering through golden leaves, intricate fur detail, sharp focus on the eyes, cinematic depth of field, photorealistic, 16:9 aspect ratio

Krea 2 Medium Cosplay-Charakter-Prompt

🟡 Fortgeschritten

Meta-Prompt-Ansatz: Ein LLM erzeugt den Bildprompt, der dann in Krea 2 eingespeist wird. Die Kombination aus Moodboards (4 echte Porträtfotos als Style-Referenz) und dem strukturierten Prompt erzeugt beeindruckende Fotorealismus-Ergebnisse. Am besten mit: Krea 2 Medium + Moodboards Style Transfer

Create a detailed prompt for a high quality Cosplay and Live-Action "character" as a real person. Describe their outfit as being as close as possible to their natural description and regular attire. Describe their facial features. Describe their skin tone as being natural with pores, and subsurface scattering. Picture it as a phone snapshot taken by a third party of the character portrayed in everyday life taken without their knowing. Do not include negative prompts. Separate into "core concept", "subject appearance", "outfit details", "environment details", "pose", and "photography style". Limit to a maximum of 1500 characters. Their hands are at their side. School Courtyard. They are sitting down unaware of a photo being taken.

Typography Pairing Guide für Design-Projekte

🟡 Fortgeschritten

Liefert konkrete Google-Font-Paarungen mit Begründung statt generischer „use a nice sans-serif"-Empfehlungen. Die Unterscheidung Safe/Bold gibt dem Designer bewusste Wahlmöglichkeiten statt eines einzigen Vorschlags. Am besten mit: ChatGPT-4o, Claude Sonnet, Gemini Flash

Act as a Graphic Designer specializing in typography. I need to select a font pairing for a new project.

Project Type: [INSERT TYPE, e.g. Financial Report / Whimsical Children's Book / Brutalist Website].
Desired Vibe: [INSERT VIBE, e.g. Serious and Scholarly / Light and Airy / Retro and Loud].

Suggest two font pairings (Header/Body) from Google Fonts or standard desktop fonts:

Pairing 1 (Safe): A classic, high-legibility choice. Describe why it works for the [PROJECT TYPE].
Pairing 2 (Bold): A unique, eye-catching choice. Describe the specific emotional response it evokes.

Rules: Provide three specific rules for font hierarchy (e.g. never use more than 3 weights; body font should be no larger than 16px).

Nineth Style LoRA — Komplexe Szenen mit 23-Inpainting-Workflow

🟡 Fortgeschritten

Dieser Workflow demonstriert Profi-Level Bildgenerierung mit Flux.2 Klein und dem Nineth-Style-LoRA. Das Basis-Prompt liefert eine komplexe, mehrschichtige Szene mit mehreren Subjekten und atmosphärischer Tiefe. Der Autor kombiniert dies mit einem 23-Schicht-Inpainting-Verfahren — jede Ebene maskiert spezifische Bildbereiche und wird separat gerendert. Das Ergebnis: Bilder, die „auf den ersten Blick nicht nach AI aussehen", sondern wie professionelle Concept-Art auf ArtStation. Am besten mit: Flux.2 Klein + Nineth v1.0 LoRA (Civitai: model 2427415)

nineth style. Landscape of a dark shadowed valley, long dry wheat grass across rolling plains.
In the far distance on the left is two riflemen hiding in the grass. They are looking at a very
fast moving blurred odd looking 8 arm giant monster creature with sharp claws running across
the field. The creature is a dark mass with a humanoid outline, almost transparent, moving at
extreme speed. Dust trails behind and around it. Cinematic lighting, golden hour, shot on 35mm lens.

--ar 16:9 --v 10 --style raw --s 250

AsymFLUX.2-klein-9B: Organische Textur-Makroaufnahme

🟡 Fortgeschritten

AsymFLUX.2 ist spezialisiert auf nicht-menschliche Subjekte undTexturen. Durch reduzierte Datenkuration im Trainingsprozess gewichtet das Modell nicht-menschliche Trainingsdaten stärker, was es ideal für Materialextreme, organische Strukturen und Hintergrund-Rendering macht. Offizieller Workflow verfügbar unter `github.com/Lakonik/ComfyUI-piFlow`. Am besten mit: AsymFLUX.2-klein-9B, ComfyUI-piFlow Workflow

Extreme close-up of weathered tree bark covered in iridescent moss and morning dew drops, macro photography style, sharp texture details, natural lighting, shallow depth of field, 4k resolution, highly detailed surface patterns

Architektonischer Schnittplan-Generator (Midjourney)

🟡 Fortgeschritten

Wandelt architektonische Konzepte in professionelle technische Zeichnungen um. Der Prompt kombiniert CAD-Rendering-Stil mit konkreten Materialvorgaben und Maßstab-Angaben. `--ar 5:2` liefert das klassische Schnittformat. Am besten mit: Midjourney v7.0

Technical drawing, architectural section, clean lines, linework, orthographic projection, detailed hatching, CAD rendering, minimalist tiny home with exposed concrete and recycled timber, glass curtain walls, annotated, labeled, 1:50 scale, monochromatic black and white --ar 5:2 --style raw

Reference-Guided Flow Matching für FLUX.2 (kein LoRA nötig)

🟡 Fortgeschritten

Statt ein LoRA zu trainieren, werden Referenzbilder direkt als Style-Steuerung in den Generation-Prozess eingespeist. Die Paper-Methode „Follow the Mean: Reference-Guided Flow Matching" erlaubt Stil-Mixing ohne Training. Ideal für schnelles Style-Testing: Dasselbe Prompt, verschiedene Referenzbilder = verschiedene Stilvarianten. Am besten mit: FLUX.2-klein (lokal oder HuggingFace Space)

# Workflow über HuggingFace Spaces: https://huggingface.co/spaces/multimodalart/follow-the-mean

# 1. Lade 1–3 Referenzbilder hoch (gleicher Stil, gleiche Farbpalette oder Struktur)
# 2. Gib deinen Hauptprompt ein:
"A pink elephant standing in a grassy meadow, watercolor style, soft lighting"
# 3. Das Modell steert Generation zur Referenz — ohne LoRA-Training, ohne Fine-Tuning
# Code & Paper: https://pedrocurvo.com/follow-the-mean

Regional-Prompting-Technik im Anima Checkpoint — Mehrere Charaktere ohne Tools

🟡 Fortgeschritten

Der Anima Checkpoint ermöglicht Mehrfachcharakter-Kompositionen ohne zusätzliche Plugins wie Regional Prompter. Durch die Gewichtungssyntax (:: 0.8, :: 0.6 etc.) können Charaktere präzise im Bild platziert werden. Die Community diskutiert aktiv weitere Tricks für saubere Trennungen — die Technik ist besonders für Multi-Character-Szenen mit unterschiedlichen Outfits und Ausrichtungen nützlich. Am besten mit: Anima Checkpoint (Pony-Derivat für Stable Diffusion)

[Im Anima Checkpoint verwenden — kein Regional Prompter Plugin nötig]

Master-Prompt: (masterpiece, best quality, ultra-detailed), 2 characters:

[Character 1 - LEFT SIDE]: female warrior, silver armor, long flowing red hair, determined
expression, holding raised longsword, facing right, :: 0.8

[Character 2 - RIGHT SIDE]: massive blue dragon with scaled armor, glowing yellow eyes,
smoke from nostrils, facing left, :: 0.6

[Background]: dark cave interior, crystalline formations reflecting light,
torchlight from walls, deep shadows, :: 0.3

Positioning: Use region-specific weighting with :: syntax to separate characters
spatially. Higher weight = closer to their designated area.

Krea 2 Open-Weight Experiment (Preview-Workflow)

🟡 Fortgeschritten

Erste Community-Tests mit Krea 2 zeigen deutliche Fortschritte in der Lichtsetzung und Szenenkoherenz. Obwohl noch nicht offiziell als Open-Weight released, laufen Experimente mit der Demo-Version vielversprechend für atmosphärische, narrative Bildgenerierung ohne manuelles Nachbearbeiten. Am besten mit: Krea 2 (Open-Weight Preview), SDXL/ComfyUI Backends

A futuristic cyberpunk street market at dusk, neon signs reflecting in rain puddles, diverse crowd under transparent umbrellas, volumetric fog, cinematic composition, moody color grading, 16:9

🏗️ Flux 2 Klein Workflow mit LoRA-Manager

🟡 Fortgeschritten

Der meistgefragte Workflow der Woche in r/StableDiffusion. Integriert LoRA-Management direkt mit visuellen Cover-Thumbnails und automatischer Aktivierung von Parametern — kein manuelles Suchen von Activation-Keywords nötig. Sage Attention bringt messbare Geschwindigkeitsvorteile. Am besten mit: Flux 2-klein (lokal, ComfyUI)

Flux 2-klein mit folgendem ComfyUI-Workflow für universelle Bildgenerierung:

1. Basis: FLUX.2-klein mit Sage Attention für schnelle Generierung
2. LoRA Manager: Loras über Hover-Cover-Bilder identifizieren, Aktivierungs-Keys automatisch synchronisiert
3. Bild-Aspekt-Aktivierung je nach Anwendungsfall auswählen
4. High-Resolution Generation mit schnellen Inferenzzeiten

Workflow verfügbar unter: https://civitai.com/models/2640066?modelVersionId=2964326

Key-Loras für Realismus und Style-Transfer:
- Snof 1.1/1.4 für Fotorealismus
- Bessere Haut- und Textur-LoRAs
- Workflow unterstützt I2I-Modus für Bild-zu-Bild-Transformationen

Anima Base (2B) — Minimal-Prompting für Anime/Creative Art

🟡 Fortgeschritten

Ein 2B-Modell, das deutlich bessere und kreativere Ergebnisse liefert als erwartet. Anders als FLUX oder SDXL reagiert es nicht mit repetitiven Outputs — es ergänzt unvollständige Prompts kreativ („SD 1.5 mit SDXL-Qualität"). Keine LLM-Prompt-Rewrites nötig, funktioniert mit kurzen Sätzen. RTX 3060: unter 2 Minuten pro Bild. Am besten mit: Anima Base 2B (lokal, ComfyUI/SD WebUI, GPU ab 8 GB VRAM)

# Anima Base 2B — funktioniert am besten mit kurzen, natürlichen Prompts (kein LLM-Rewrite nötig!)
# Einfach die Idee eingeben, das Modell ergänzt kreativ:

"blue-haired warrior girl in an abandoned temple, moonlight, detailed eyes"
"cyberpunk city street at sunset, neon signs reflecting in puddles, rain"
"ancient dragon perched on a crystal mountain, aurora borealis, majestic"

# Keine komplizierten Negativ-Prompts nötig
# --ar 16:9 für Midjourney-kompatible Ausgaben
# SDXL/Pony-Ära Feeling: kurze Tags oder Sätze genügen

Anima v1.0 + Turbo LoRA — 4s Inferenz Workflow

🟡 Fortgeschritten

Detaillierte Benchmark-Tabelle zeigt, dass Turbo LoRA + Compile die Inferenz von 23.5s auf 3.8s bei 1024x1024 reduziert — ein 6x Speedup. Bei 2048x2048 geht es von 98s auf 13s. Das Plugin Raylight ermöglicht effiziente dual GPU-Nutzung. Praktisch sofort anwendbar für alle ComfyUI-Nutzer. Am besten mit: ComfyUI, Anima v1.0, Turbo LoRA, dual GPU Setup

# ComfyUI Workflow-Konfiguration für Anima v1.0

Base Model: Anima v1.0 (circlestone-labs/Anima)
LoRA: Turbo LoRA (civitai.com/models/2560840/anima-turbo-lora)
Plugin: Raylight (github.com/komikndr/raylight)

# Konfiguration für 1024x1024 @ 3.8s:
LoRA: ON
Compile: ON (inductor backend)
Ulysses: 1
Ring: 2
GPU Setup: 2x RTX 5060Ti (OC +250/+2000), PCIe 4.0 x8

# Konfiguration für 2048x2048 @ 13.0s:
LoRA: ON
Compile: ON
Ulysses: 1
Ring: 2

# OHNE Turbo LoRA: 1024x1024 → 23.5s, 2048x2048 → 98.0s
# Compile-Backend muss "inductor" sein (nicht "cudagraphs")

🎯 Referenzbild-gesteuerte Flux-Kontrolle ohne LoRA-Training

🟡 Fortgeschritten

Eliminiert das zeitaufwendige LoRA-Training für einmalige Stil-Referenzen. Funktioniert besonders gut, wenn die Referenz strukturell ähnlich zum gewünschten Output ist (z.B. Profilansicht → Frontalansicht). Deutlich schneller als traditionelles Fine-Tuning. Am besten mit: FLUX.2-klein (via HuggingFace Spaces oder lokal)

"Follow the Mean: Reference-Guided Flow Matching" mit FLUX.2-klein:

1. Wähle 1-3 Referenzbilder (für Farbe, Stil oder Struktur)
2. Verwende denselben Prompt und Seed
3. Tausche nur die Referenzbilder aus, um Stilrichtung zu ändern
4. Keine LoRA, kein Fine-Tuning, kein Training erforderlich

Demo: https://huggingface.co/spaces/multimodalart/follow-the-mean
Code: https://pedrocurvo.com/follow-the-mean

Einsatz: "Want a pink elephant? Here is a reference of a pink elephant,
now follow my prompt and skew the generation toward my reference."
Bestes Ergebnis bei Profil→Frontal-Ansicht oder Stilübertragung
mit ähnlichen Motiven.

Minimalist Vector Logo Generator

🟡 Fortgeschritten

Meta-Prompt: Erst erzeugt das Modell einen optimierten MJ- oder DALL-E-Prompt, nicht direkt das Logo. Der Trick: Negative Constraints (`--no shading, realistic, 3d`) erzwingen den Flat-Vector-Look. Beschränkte Farbpaletten verhindern das typische AI-Logo-Chaos. Am besten mit: Midjourney v7 / DALL-E 3

Act as a Brand Designer. I need a prompt to generate a logo for a company called [INSERT COMPANY NAME].

The industry is [INSERT INDUSTRY] and the brand personality is [INSERT PERSONALITY, e.g., Serious, Playful, Eco-friendly].

Write a Midjourney/DALL-E 3 prompt that includes:

Subject: A specific symbol or abstraction representing [INSERT SYMBOL IDEA, e.g., a Leaf, a Circuit Board, a Lion].

Style: Flat vector art, minimalist, Paul Rand style, negative space usage.

Colors: Restricted color palette (e.g., "Duotone Cyan and Black" or "Matte White on Dark Blue background").

Parameters: Ensure you specify --no shading, realistic, 3d to keep it looking like a logo.

Pixel Art / Retro Game Asset Generator

🟡 Fortgeschritten

Meta-Prompt-Kaskade: Der Meta-Prompt generiert den eigentlichen Bildprompt mit allen benötigten technischen Parametern (Perspektive, Farblimitierung, Konsolen-Referenz, Aspect Ratio). Doppelte Strukturierung sorgt für präzise Outputs. Am besten mit: Flux, Midjourney v7

Act as a 2D Video Game Designer and Pixel Artist. I need a prompt to generate a game asset in a retro style.

Asset Type: [INSERT ASSET TYPE, e.g., 16-bit RPG Character Sprite / 8-bit Platformer Background Tile / Arcade Cabinet Art].
Theme: [INSERT THEME, e.g., Post-apocalyptic desert / High fantasy medieval / Underwater cyberpunk].
Color Restriction: [INSERT COLOR LIMITATION, e.g., 32-color palette / Game Boy green scale].

Write a prompt for a generative image tool:

1. Include technical keywords: "Pixel art, low resolution, isometric, orthographic, dithered shading, [COLOR RESTRICTION]."
2. Specify the perspective: "Side view," "Top-down view," or "Isometric projection."
3. Reference a specific console/era for style guidance (e.g., "Inspired by SNES/Sega Genesis").
4. Include parameters for aspect ratio (e.g., --ar 16:9) and styling modifiers (e.g., --stylize 100, --v 7).

Output only the final image generation prompt, ready to paste into Midjourney or Flux.

LTX 2.3 OmniNFT RL LoRA — Kohärenz & Qualität

🟡 Fortgeschritten

Dieser LoRA verbessert die Videoqualität von LTX 2.3 signifikant — mehr Kohärenz über Frames hinweg, weniger Artefakte, natürlichere Bewegungen. Der empfohlene LTX Tiled Sampler als zweiter Pass nach dem Upscaler liefert zusätzliche Qualitätssteigerung. Community berichtet von spürbar besserer Bewegungsdarstellung. Am besten mit: ComfyUI, LTX 2.3, OmniNFT RL LoRA, 10S-Comfy-nodes Tiled Sampler

# LTX 2.3 Video-Prompt mit OmniNFT RL LoRA

# LoRA herunterladen:
# hf.co/Kijai/LTX2.3_comfy/blob/main/loras/LTX-2.3-OmniNFT-RL-Lora_bf16.safetensors

# Empfohlener Workflow:
1. Generiere Video mit LTX 2.3 Base Model
2. Wende OmniNFT RL LoRA an (Standard-Stärke: 1.0)
3. Verwende LTX Tiled Sampler als 2. Pass nach dem Upscaler
- Tiled Sampler: github.com/TenStrip/10S-Comfy-nodes
- Deutlich bessere Qualität als Standard-Sampler
- Sollte eigentlich nativ in ComfyUI sein

# Ergebnis:
# Erhöhte Kohärenz, reduzierte Artefakte, verbesserte Bewegungsdarstellung
# Referenz: zghhui.github.io/OmniNFT/

🎨 Krea 2 — Open Source kommende Bildgenerierung

🟡 Fortgeschritten

Krea 2 wird als „sehr kreatives Modell" beschrieben — im Gegensatz zu deterministischen Generatoren wie Z Image Turbo produziert es überraschende, originelle Kompositionen. Das kommende Open-Source-Release ermöglicht lokale Nutzung mit Community-LoRAs. Am besten mit: Krea 2 (webbasiert), lokale Version demnächst verfügbar

Krea 2 Bildgenerierung:

- Kreative, nicht-deterministische Bildgenerierung (Gegensatz zu Z Image Turbo)
- Community-optimierte LoRA-Unterstützung erwartet (ähnlich Qwen Image 2512)
- Architektur basiert auf Flow Matching (Pixel-Space oder Latent-Space)
- Open-Source-Version angekündigt — lokale Nutzung bald möglich
- X Spaces Release-Event geplant: https://x.com/krea_ai/status/2057244293547614551

Architektur-Zeichnung Generator (Midjourney)

🟡 Fortgeschritten

Kombiniert den Stil-Befehl „Technical drawing, architectural section" mit konkreten Materialien und den Midjourney-Parametern `--ar 5:2 --style raw`. Das Ergebnis sind professionelle Architektur-Zeichnungen statt generischer KI-Bilder. Lässt sich auf jeden Gebäudetyp anpassen. Am besten mit: Midjourney v6+, Flux 1.1

Technical drawing, architectural section, clean lines, linework, orthographic projection, detailed hatching, CAD rendering, annotated, labeled, 1:50 scale, exposed concrete, recycled timber, glass curtain walls --ar 5:2 --style raw

LumiPic: SDR→HDR-LoRA für Qwen-Bildmodelle

🟡 Fortgeschritten

SDR→HDR-Conversion als LoRA statt als separates Tool. Besonders wertvoll für Bildbearbeitungs-Workflows, bei denen der erweiterte Dynamikbereich zusätzliche Belichtungs- und Farbkorrekturmöglichkeiten bietet. Demnächst auch für Kline Base verfügbar. Am besten mit: Qwen Image-Modelle, ComfyUI

# ComfyUI Workflow: SDR → HDR Conversion mit LumiPic LoRA

1. Lade die LumiPic SDR→HDR LoRAs von Oumoumad (Creator des LTX Video LoRAs)
2. Base Model: Qwen Image Model (demnächst auch Kline Base 4 & 9)
3. Verbinde den LoRA-Loader mit dem UNet/CLIP-Eingängen
4. Input: SDR-Bild (8-bit) → Output: HDR-EXR-Datei (Float-Werte)
5. Denoise-Wert: 0.35-0.45 empfohlen

# Anwendungsszenarien:
- Belichtungs-/Farbkorrektur im Post-Editing
- EXR-Export für professionelle Compositing-Pipelines
- Erweiterte Dynamik als Basis für weitere LoRA-Anwendungen

Nvidia RTX 2-Pass Upscaler für AI-Videos

🟡 Fortgeschritten

Implementiert alle vier Nvidia RTX Upscaling-Optionen in einer ComfyUI Node. Besonders DeBlur ist wertvoll für AI-generierte Videos, die oft Unschärfen haben. Erfordert nur 4GB VRAM und ersetzt teilweise kostenpflichtige Topaz AI Workflows. Die Community bestätigt sichtbare Verbesserungen gegenüber Lanczos-Resampling. Am besten mit: ComfyUI, Custom RTX Upscale Node, Nvidia RTX GPU

# Nvidia RTX 2-Pass Upscaler Node für ComfyUI
# Offizielle Doku: docs.nvidia.com/maxine/vfx/latest/Filters/VideoSuperResolution.html

# Vier Modi verfügbar:
1. DeBlur — Schärfen unscharfer Videos (am besten AI-generiert)
2. DeNoise — Rauschreduktion (separat anwenden bei AI-Videos)
3. SuperResolution — Klassisches Upscaling
4. DeNoise+DeBlur — Kombiniert

# VRAM-Anforderung: 4GB VRAM + 8GB RAM
# Vergleich: Ersetzt teilweise Topaz AI Abo

# Workflow-Tipp (aus Community):
# RTX VSR vs. Lanczos — RTX VSR zeigt klare Vorteile bei
# Felltextur (Wolfs-Beispiel), Kantenschärfe, und Detailschärfe

Tech-„Knolling" (Flat Lay) Produktfotografie für Midjourney/DALL-E

🟡 Fortgeschritten

Das Prompt generiert systematisch vollständige Midjourney-Prompts mit allen technischen Parametern (Aspektverhältnis, Version, Style). Der Knolling-Stil (90-grad-arrangement) ist ein beliebter, aber schwer zu treffender Look — dieses Prompt gibt die exakten Formulierungen vor. Am besten mit: Midjourney v6.0, DALL-E 3

Act as a Product Photographer. I want to create a "Knolling" style image (overhead flat lay where items are arranged at 90-degree angles).

Main Object: [INSERT OBJECT, e.g., A vintage Gameboy / A disassembled mechanical watch / A survival kit]
Theme: [INSERT THEME, e.g., Matte Black Tactical / Pastel Retro 80s / Industrial Blueprint]

Write a prompt for Midjourney/DALL-E 3 including:
- Composition: "Overhead view, knolling photography, meticulous arrangement, equal spacing."
- Lighting: "Softbox lighting, no shadows, high key" OR "Moody directional lighting, hard shadows."
- Texture/Background: "Placed on a [INSERT SURFACE, e.g., Cutting mat / Marble slab / Textured concrete]."
- Tech Specs: "--ar 3:2 --v 6.0 --style raw"

Physik-basierte Lichtbeschreibung für Seedance & GPT Image 2

🟡 Fortgeschritten

Drei konkrete Prompt-Regeln aus dem Alltag: Physik-basierte Lichtparameter, Reihenfolge Subjekt→Stil, und Lens-spezifisches Framing. Diese drei Patterns liefern messbar bessere Ergebnisse bei Video- und Bildgenerierung. Am besten mit: Seedance, GPT Image 2, Midjourney v6+

[SUBJECT: main subject with appearance details], warm tungsten key from the left, soft bounce fill from a white wall, 100mm macro lens, shallow depth of field, natural skin texture --ar 16:9 --style raw

Cinematic Scene Visualizer

🟡 Fortgeschritten

Systematischer Aufbau von Szenenbeschreibung (9 Parameter) → Bildprompt-Conversion. Deckt alle relevanten Kinematografie-Aspekte ab: Kamerawinkel, Beleuchtung, Color Grading, Stimmung, Komposition. Besonders effektiv für story-basierte Bildgenerierung. Am besten mit: Flux, Midjourney v7

Describe a cinematic scene with: [subject/characters] in [location], shot from [camera angle], during [time of day], with [weather/atmospheric conditions], [lighting setup], [color grading style], [mood], featuring [specific visual elements]. Style should evoke [film/director reference] with attention to [composition technique].

Then convert this scene description into an image generation prompt optimized for Midjourney or Flux. Include all cinematic parameters (camera angle, lighting, color grade, mood) as explicit keywords. Add --ar 16:9 --v 7 for Midjourney or equivalent Flux parameters.

Steampunk-Charakter mit mechanischen Verbesserungen

🟡 Fortgeschritten

Vollständig strukturiert mit klarer Charakterbeschreibung, Umgebung, Beleuchtung und Qualitätsangabe. Die Kombination aus konkretem Charakter (Alter, Beruf) und spezifischen Gadgets liefert konsistente Ergebnisse. Ideal als Vorlage — ersetze einfach die Eckdaten in Klammern durch eigene Parameter. Am besten mit: Midjourney v6, Flux 2, DALL-E 4

Generate a highly detailed character design for a steampunk inventor protagonist. The character should be a female engineer in her early 30s wearing Victorian-era clothing modified with functional gadgets. Include a mechanical arm with interchangeable tools, brass goggles with multi-lens capabilities, and a corseted leather apron with hidden pockets containing tiny mechanical parts. Background: a cluttered workshop with half-built automatons, blueprints scattered across wooden tables, and warm golden light streaming through stained-glass windows. Cinematic lighting, highly detailed digital painting style, ArtStation quality.

AI Art Style Fusion Generator

🟡 Fortgeschritten

Ein kompaktes aber wirkungsvolles Template, das zwei Kunststile kombiniert — z.B. „Bauhaus meets Impressionismus" — und damit einzigartige Bildästhetiken erzeugt. Die strukturierten Platzhalter ermöglichen schnelles Iterieren verschiedener Stil-Kombinationen. Am besten mit: Midjourney v6.0, DALL-E 3, Stable Diffusion (Flux 2)

Create a [subject] in a fusion style combining [art movement 1] and [art movement 2], featuring [specific elements], with [lighting style], [color palette], and [mood]. The composition should emphasize [focal point] with [additional details]. Render in high quality with attention to [specific artistic technique].

Seedance 2.0: Statische Kamera mit detaillierter Szene

🟡 Fortgeschritten

Das wichtigste Seedance-Pattern: „Static camera with a detailed scene beats complex camera movements almost every time." Referenzframe-Konsistenz + detaillierte Aktionsszene + feste Kamera liefern stabileres Video als wildes Kamerageflatter. Am besten mit: Seedance 2.0, Kling 1.6

Keep appearance consistent with the first frame. A woman in a red coat walks slowly through a Parisian alley at dusk, the warm glow of streetlights reflecting on wet cobblestones. Camera: locked tripod, slow 2-meter dolly forward. Warm ambient fill from shop windows. Subtle steam rising from a nearby vent --ar 16:9

Minimalistisches Logo-Design mit Sacred Geometry

🟡 Fortgeschritten

Kombiniert Sacred Geometry mit modernem minimalistischem Branding — ein sehr spezifischer Stil, der sonst schwer zu beschreiben ist. Die Anforderung an 3 Variationen und Skalierbarkeit macht es direkt nutzwertig für echte Projekte. Am besten mit: Flux 2, Midjourney v6.1, DALL-E 4

Create a logo design system based on sacred geometry for a wellness coaching business called "Harmonic Balance". The primary logo should incorporate the Flower of Life pattern merged with a stylized human figure in meditation pose. Use a monochromatic color scheme in deep indigo with subtle gold accents. The logo should work in black and white, at small sizes (favicon), and in full color. Include 3 variations: primary (full mark), secondary (icon only for social media), and wordmark (text only with sacred geometry accent). Deliver as clean vector-style design, modern minimalist aesthetic with spiritual undertones. --ar 1:1 --v 6.1

Exobiology Creature Designer (Evolutionärer creature-Designer)

🟡 Fortgeschritten

Kombiniert wissenschaftliches Denken (evolutionäre Anpassung) mit kreativem Design. Die physikalischen Constraints der Umwelt zwingen das Modell zu konsistenten, biologisch plausiblen Designs — perfekt für Concept Art, Tabletop-Designs oder Weltbau. Am besten mit: Claude Opus 4.7 + Midjourney v6.0 (zuerst Text, dann visuell)

Act as an Exobiologist and Concept Artist. I need to design a creature for a sci-fi setting.

Environment: [INSERT ENVIRONMENT, e.g., A high-gravity planet with dense fog / A deep-sea trench on an ice moon]
Niche: [INSERT NICHE, e.g., Apex Predator / Scavenger / Pack Hunter]

Describe the creature's physiology based on evolution:
- Sensory Organs: How does it navigate without sight (if applicable)? (e.g., Echolocation, heat sensing).
- Locomotion: How does it move in this specific terrain? (e.g., Six limbs for stability, gas bladders for floating).
- Defense/Attack: What is its primary weapon?
- Name: Give it a scientific Latin name and a common name given by human explorers.

„Inadvertent Vertigo" — Fraktale Rekursion mit Cel-Shading

🟡 Fortgeschritten

Die Kombination aus mathematischen Konzepten (Mandelbrot, Sierpiński) mit organischer Bildsprache erzeugt visuell einzigartige Ergebnisse. Der `--chaos 35` Parameter sorgt für kontrollierte Unvorhersehbarkeit, während `--sref` visuelle Konsistenz über mehrere Generationen hinweg garantiert. Am besten mit: Midjourney v6 / v6.1

overhead view as if looking down a broken kaleidoscope. reality is broken. recursive glide reflection. High-fidelity 3d cel-shading animation, cinematic cel composition, crisp outlines. a thousand fractal tree limbs are making an angry face. Mandelbrot and Sierpiński in fine-lined symmetry, an organic circuit from the far future. close-up. science fiction liquid chrome motif. impossible tilt-shift effect making only the tree in the middle of the image appear in realistic scale while the rest is a miniature, cinematic realism, experimental optical photography, highly detailed

Futuristische nachhaltige Stadt — Architekturrendering

🟡 Fortgeschritten

Sehr spezifische Umgebungsbeschreibung mit klaren Nachhaltigkeitselementen. Die Kombination aus Architekturdetails, Beleuchtung und Render-Engine-Referenz erzeugt hochqualitative Ergebnisse. Perfekt als Template — tausche das Jahr und die Gebäudeelemente aus. Am besten mit: Midjourney v6.1, Flux 2

Design a photorealistic architectural visualization of a futuristic sustainable city block in the year 2075. The scene should showcase vertical farms integrated into residential towers, transparent solar panel facades, elevated pedestrian walkways with hanging gardens, and autonomous electric vehicles on ground level. Include a small water feature (rainwater collection canal) running through the center. Golden hour lighting with warm sunlight reflecting off glass surfaces. Ultra-realistic rendering, Unreal Engine 5 style, architectural photography perspective, 8K resolution. --ar 16:9 --v 6.1

NegPip für Z-Image Turbo: Negative Prompts mit CFG = 1

🟡 Fortgeschritten

Destillierte Modelle wie Z-Image Turbo ermöglichen normalerweise keine negativen Prompts (CFG=1). NegPip umgeht diese Einschränkung und erlaubt gezielte Negation unerwünschter Elemente — ähnlich mächtig wie bei Standard-Diffusionsmodellen. Am besten mit: ComfyUI, Z-Image Turbo, Flux Klein

# NegPip ermöglicht negative Prompts mit CFG = 1 bei Z-Image Turbo
# Negativprompts funktionieren bei CFG=1 normalerweise nicht — diese Node umgeht das

# Installation:
# cd ComfyUI/custom_nodes
# git clone https://github.com/BigStationW/ComfyUI-ppm

# Workflow: Negative Prompts über NegPip-Node in den generativen Prozess einbinden
# Download des Beispiel-Workflows:
# https://github.com/BigStationW/ComfyUI-ppm/blob/master/example_workflows/z_image_turbo_negpip.json

# Alternativ: NAG (Normalized Attention Guidance)
# https://chendaryen.github.io/NAG.github.io/
# Biet bessere Prompt-Adherence und realistischeres Ergebnis auf Kosten von ~8+ Steps

Geometrisches Pattern-Template — Nahtlose Designs für Textilien & Oberflächen

🟡 Fortgeschritten

Die Template-Struktur mit klar benannten Platzhaltern ([PATTERN FOCUS], [COLOR PALETTE], [TEXTURE]) macht es trivial, dutzende Varianten zu generieren. Der `--tile` Parameter in Midjourney garantiert perfekte nahtlose Wiederholungen — ideal für kommerzielle Nutzung. Am besten mit: Midjourney v6, DALL-E 3

Seamless pattern, generative design, op art, flat graphic, hypnotic, [INSERT SHAPES, e.g., Tessellated triangles / Interlocking circles / Recursive spirals].

Tileable, repeating pattern, infinite zoom, high resolution vector quality.

[INSERT SPECIFIC COLORS, e.g., Pastel pinks and cyans / Monochromatic black and white / 70s Earth tones]. [INSERT TEXTURE, e.g., Woven tapestry / Polished marble mosaic / Digital glitch effect]. Inspired by [INSERT ART MOVEMENT, e.g., Escher / Islamic geometry]

--tile --ar 1:1

ZImage Base — Stilvergleich mit konkreten Test-Prompts

🟡 Fortgeschritten

Dieser Stress-Test-Prompt aus einem detaillierten Modellvergleich zeigt, welche Modelle komplexe relationale Strukturen (Verzweigungen, Zyklen, exakte Text-Labels) korrekt rendern können. ZImage Base schlägt HiDream-O1-Dev bei den meisten Stil-Kategorien, insbesondere bei Diagrammen und infografischen Elementen. Der Prompt selbst ist eine exzellente Vorlage für alle, die datengetriebene Visualisierungen generieren wollen. Am besten mit: ZImage Base, HiDream-O1-Dev, Flux 2 Pro

A visually appealing circular or semicircular Food Cycle Diagram in the style of an infographic. Nodes should be icons with clear labels. Some connections must clearly branch to TWO valid outcomes. Exact nodes and arrows: Sun → Grass, Grass → Grasshopper, Grass → Rabbit, Grasshopper → Frog, Rabbit → Fox, Frog → Snake, Fox → Eagle, Snake → Eagle, Eagle → Decomposer, Decomposer → Sun.

OmniNFT LoRA für LTX-2 Videogenerierungs-Qualität

🟡 Fortgeschritten

Das OmniNFT-LoRA verbessert spezifisch die visuelle Qualität von LTX-2 generierten Videos — schärfere Details, konsistentere Bewegung. Obwohl noch nicht für LTX-2.3 portiert, bleibt es eins der vielversprechendsten LoRAs für das LTX-Ökosystem. Am besten mit: LTX-2, ComfyUI

# OmniNFT LoRA für LTX-2: Verbessert Video-Qualität gegenüber dem Basismodell
# Hugging Face: https://huggingface.co/zghhui/OmniNFT
# Projektseite: https://zghhui.github.io/OmniNFT/
# Hinweis: Noch nicht für LTX-2.3 verfügbar

# Einsatz im ComfyUI-Workflow:
# 1. LoRA laden: LTX-2 Basismodell
# 2. OmniNFT LoRA mit Stärke 0.8-1.0 verbinden
# 3. Negativprompt über NegPip-Node (optional)
# 4. Generieren

Brand-Identity-Generator — Visuelle Style Guides auf Knopfdruck

🟡 Fortgeschritten

Liefert keine generischen Farbvorschläge, sondern verknüpft jede Designentscheidung mit der Farbpsychologie und der spezifischen Branche der Zielgruppe. Die Do's/Don'ts-Regeln machen das Ergebnis sofort als Team-Referenz einsetzbar. Am besten mit: Claude, GPT-4o, Gemini

Act as a Creative Director for a high-end design agency. I am launching a brand in the [INSERT INDUSTRY] space. The core values of the brand are [INSERT VALUES].

I need you to generate a comprehensive Visual Style Guide concept. Please include:

Color Palette: A primary color, two secondary colors, and an accent color (provide Hex codes), explaining the color psychology behind each choice relative to my industry.

Typography: Suggest a header font and body font pairing (Google Fonts preferred) that conveys [INSERT DESIRED VIBE].

Imagery Guidelines: Describe the type of photography or illustration style that should be used.

Do's and Don'ts: List 3 distinct rules for how the logo and visual elements should never be used.

Japanese Film Photography Style (Midjourney)

🟡 Fortgeschritten

Erzeugt den typischen japanischen Film-Look durch subtile Körnung, natürliches Licht und zurückhaltende Farbgebung — statt übertriebener "Film-Effekte", die künstlich aussehen. Der Schlüssel liegt in der restraint: "everyday lighting" statt dramatischer Inszenierung. Am besten mit: Midjourney v8.1 (Parameter: `--v 8.1 --style raw --s 250`)

Shot on Konica Centuria 200 film, a young woman sits quietly by a Tokyo apartment window in the late afternoon, sunlight filtering through sheer curtains casting soft amber shadows across wooden floors, dust particles visible in the light, she's wearing a faded linen shirt, expression calm and slightly distant, small potted plants on the windowsill, the room feels lived-in and intimate --ar 16:9 --v 8.1 --style raw --s 250

FACS-Grid für Gesichtsausdrücke (Seedance 2.0 Vorbereitung)

🟡 Fortgeschritten

Dieses FACS-Grid (Facial Action Coding System) dient als Referenz-Sheet für die präzise Steuerung von Gesichtsausdrücken in AI-Videos. Sobald man dieses Sheet generiert hat, kann man die AU-Codes (AU1, AU12, AU45 etc.) direkt in Seedance 2.0 Prompts verwenden, um millisekundengenaue Emotionen in Videos vorzugeben. Die farbcodierte Kategorisierung macht das Sheet sowohl für Menschen als auch für AI-Modelle besser lesbar. Am besten mit: GPT Image 2, Nano Banana Pro, DALL·E 3

Create a clean educational FACS Action Unit expression grid featuring a realistic adult female character. Use minimal studio lighting, neutral white background, high readability, professional facial anatomy reference sheet aesthetic, realistic skin texture, consistent identity across all panels. COLOR SYSTEM: Use soft pastel color coding for categories while keeping the overall sheet minimal and elegant. Forehead & Brow AUs: soft pastel blue. Eye & Eyelid AUs: soft pastel lavender. Nose & Cheek AUs: soft pastel peach. Lip & Mouth AUs: soft pastel pink. Head Movement AUs: soft pastel mint. Eye Direction AUs: soft pastel cyan. Special / Misc AUs: soft pastel beige. Apply the color subtly as panel background tint, thin borders, or small label accents. Keep colors soft, muted and professional. Include these Action Units: FOREHEAD & BROW: AU1 Inner Brow Raiser, AU2 Outer Brow Raiser, AU4 Brow Lowerer. EYE & EYELID: AU5 Upper Lid Raiser, AU7 Lid Tightener, AU43 Eyes Closed, AU45 Blink, AU46 Wink. LIP & MOUTH: AU10 Upper Lip Raiser, AU12 Lip Corner Puller, AU15 Lip Corner Depressor, AU25 Lips Part, AU27 Mouth Stretch.

Makrofotografie-Prompt-Generator (Extreme Close-up)

🟡 Fortgeschritten

Generiert systematisch strukturierte Makrofotografie-Prompts mit konkreten technischen Parametern (100mm Macro, 400x Vergrößerung, Focus Stacking). Die Kombination aus Fachvokabular und detaillierten Eingabefeldern liefert reproduzierbar hochwertige Ergebnisse. Am besten mit: Midjourney V8.1, DALL-E 3, Flux

Act as a Nature Photographer and Generative AI prompt engineer. I want to create an image focusing on extreme detail.

Subject: [INSERT SUBJECT, e.g., The surface of a rusty bolt / A dewdrop on a spider silk strand / The crystalline structure of sugar].
Lighting: [INSERT LIGHTING, e.g., Harsh sidelight / Soft diffused studio light / Ring flash].
Background: [DESCRIBE BACKGROUND, e.g., Pure black abyss / Blurry bokeh of light / Highly textured wood].

Write a Midjourney/DALL-E 3 prompt:
Keywords: "Macro photography, ultra-close-up, 100mm macro lens, 400x magnification, focus stacking, highly detailed surface textures, [SUBJECT DESCRIPTION], [LIGHTING DESCRIPTION], [BACKGROUND DESCRIPTION], photorealistic, 4K resolution"

High-End Tech „Knolling" (Flat Lay) Photography

🟡 Fortgeschritten

Knolling-Fotografie (Ordnung im 90-Grad-Raster) ist bei Social Media extrem beliebt, aber schwer zu prompten. Dieser Prompt löst das mit vier klar getrennten Parametern: Objekt, Thema, Komposition und Beleuchtung. Die expliziten Parameter (`--ar 3:2 --v 6.0 --style raw`) sorgen für konsistente Ergebnisse. Am besten mit: Midjourney V6, DALL-E 3

Act as a Product Photographer. I want to create a "Knolling" style image (overhead flat lay where items are arranged at 90-degree angles).

Main Object: [INSERT OBJECT, e.g., A vintage Gameboy / A disassembled mechanical watch / A survival kit].
Theme: [INSERT THEME, e.g., Matte Black Tactical / Pastel Retro 80s / Industrial Blueprint].

Composition: "Overhead view, knolling photography, meticulous arrangement, equal spacing."
Lighting: "Softbox lighting, no shadows, high key" OR "Moody directional lighting, hard shadows."
Texture/Background: "Placed on a [INSERT SURFACE, e.g., Cutting mat / Marble slab / Textured concrete]."

Parameters: --ar 3:2 --v 6.0 --style raw

Vintage 1970s Japanese Capsule Hotel Advertisement

🟡 Fortgeschritten

Niedrige Stylize-Werte (150) + `--raw` erzeugen den authentischen Retro-Effekt, ohne dass Midjourney zu stark "verschönert". Perfekt für Vintage-Werbung, Nostalgie-Marketing oder kreative Kampagnen. Am besten mit: Midjourney v8.1 (Parameter: `--ar 4:5 --raw --stylize 150 --hd --v 8.1`)

Vintage 1970s colorful bizarre advertising for Japanese commuter capsule hotel, very cramped, happy Japanese customer, kanji text elements, retro advertisement photography style, warm film tones --ar 4:5 --raw --stylize 150 --hd --v 8.1

Cinematic Scene Visualizer

🟡 Fortgeschritten

Strukturierte Szenebeschreibung mit expliziten Parametern für jeden Aspekt des Bildes — Kamera, Licht, Farbe, Stimmung. Das beigefügte Beispiel zeigt, wie aus den Platzhaltern eine vollständige, kopierbare Bildbeschreibung wird. Ideal für Storyboarding und concept art. Am besten mit: Midjourney v8.1, Flux 2, Seedream 4.5, Ideogram

Beschreibe eine filmische Szene mit: [Hauptfigur/Charaktere] in [Ort], aufgenommen aus [Kamerawinkel], während [Tageszeit], bei [Wetter/atmosphärische Bedingungen], [Beleuchtungs-Setup], [Color-Grading-Stil], [Stimmung], mit [spezifische visuelle Elemente]. Der Stil soll [Film/Regisseur-Referenz] evozieren mit Fokus auf [Kompositionstechnik].

Beispiel: Eine alternde Tänzerin in einem verlassenen Theater, aufgenommen aus einer leichten Untersicht, während der goldenen Stunde, bei leicht nebligem Licht durch zerbrochene Fenster, warmes Seitenlicht von links, cineastisches teal-orange Color Grading, melancholische Stimmung, mit Staubpartikeln im Lichtkegel und einem einzelnen Spiegel an der Wand. Der Stil soll Darren Aronofskys „Black Swan" evozieren mit Fokus auf symmetrische Komposition.

Midjourney Niji 7 — Graphic Novel Style

🟡 Fortgeschritten

Der Style-Reference-Parameter `--sref 4064340293` erzeugt einen konsistenten Graphic-Novel-Look mit sichtbarer Textur — kein glattes, generisches Fantasy-Art, sondern eine gedruckte Ästhetik mit leicht rauen Ink/Paint-Kanten. Die Community lobt besonders, dass der Stil „nicht nach generischem Fantasy-Polish aussieht." Am besten mit: Midjourney Niji 7

[Fantasy-Szene beschreiben], graphic novel style --niji 7 --sref 4064340293 --ar 16:9

Isometric „Cozy Room" 3D Design Generator

🟡 Fortgeschritten

Isometrische „Cozy Room"-Bilder sind ein eigenes Genre auf Social Media. Der Prompt gibt eine klare Struktur mit drei konfigurierbaren Feldern plus die passenden Rendering-Begriffe (Blender, Octane Render, miniature world) für den gewünschten Look. Am besten mit: Midjourney V6, DALL-E 3

Act as a 3D Modeler and Interior Designer. I want to generate a "Cozy Isometric Room" image.

Room Type: [INSERT TYPE, e.g., Gamer Bedroom / Witch's Potion Shop / Cyberpunk Hacker Den].
Key Elements: [INSERT ITEMS, e.g., A sleeping cat, multiple monitors, bubbling cauldrons, rain on window].
Color Palette: [INSERT COLORS, e.g., Lo-fi Purple and Blue / Earthy Greens and Browns].

Write a Midjourney V6 prompt using:
- Keywords: "Isometric view, 3D render, Blender, Octane Render, miniature world, cutaway box."
- Lighting: "Warm glow from computer screens" or "Soft diffuse daylight."
- Texture details: "Wood grain floor, fluffy rug, metallic finish."

Parameters: --ar 1:1 --stylize 250

Moodboard — Cartoon Digital Art Style

🟡 Fortgeschritten

Zeigt wie Midjourney-Profiles (über `--profile`) spezifische Stilvariationen freischalten. Hoher Stylize-Wert (1000) bei gleichzeitigem Profile-Setting erzeugt einen konsistenten Cartoon-Look über mehrere Generationen hinweg. Am besten mit: Midjourney v8.1 mit Profile `xy7lrnr` und hohem Stylize (1000)

Cartoon digital art moodboard featuring [YOUR SUBJECT], bold clean linework, flat vibrant colors, cel-shaded characters, comic panel composition, modern webcomic aesthetic --ar 16:9 --profile xy7lrnr --stylize 1000 --v 8.1 --hd

Fantasy-Landschaft-Generator (Midjourney / DALL-E 3)

🟡 Fortgeschritten

Strukturierte Parameter für Environment, Architektur, Vegetation, Wetter, Stil, Perspektive, Licht und Farbpalette — dieser Aufbau erzeugt reproduzierbare Ergebnisse. Jedes Tag kann ausgetauscht werden, ohne die Gesamtstruktur zu brechen. Ideal für Konzept-Art und Worldbuilding. Am besten mit: Midjourney v7, DALL-E 3

Generate a fantasy landscape showing a floating archipelago with crystal waterfalls,
art deco skybridges connecting ancient ruins, luminous moss, and bioluminescent clouds.
During golden hour with volumetric rays. Style: Studio Ghibli meets Thomas Kinkade.
Perspective: low-angle establishing shot, dramatic foreshortening.
Lighting: warm rim lighting, god rays through mist, color palette: aquamarine and amber.
Atmosphere: ethereal, sense of wonder. --ar 16:9 --v 7 --s 750

HiDream-O1-Image — Der integrierte Prompt-Engine

🟡 Fortgeschritten

HiDream-O1-Image ist ein neues 8B-Pixel-Space-Modell, das ohne externen VAE auskommt und bis zu 2048×2048 generiert. Der beigefügte Prompt-Engine transformiert vage Beschreibungen in hochpräzise Bildgenerierungs-Prompts — eine Technik, die für jedes Bild-Modell funktioniert. Das Modell unterstützt Text-zu-Bild, Bildbearbeitung und Subject-Driven-Personalisierung in einem. Am besten mit: HiDream-O1-Image oder HiDream-O1-Image-Dev (8B Pixel Space Model, kein VAE nötig)

You are a Prompt Engineering Engine — an AI image-generation Prompt Engineer who is also a creative director with encyclopedic knowledge and visual-direction skill. Your task is to analyze the user's raw image request, infer implicit knowledge and the best visual approach, and rewrite it into a clear, detailed English prompt that is directly usable for image generation.

## Core Goal
Image generation models can only execute direct, concrete visual instructions. Your job is to bridge the gap between abstract user intent and specific visual description.

## Process
1. Analyze the user request for: subject, scene context, mood, style, composition, lighting
2. Infer missing visual details that would make the image compelling
3. Rewrite into a structured, highly-detailed English prompt
4. Ensure all visual elements are explicitly described — no vagueness

AI Art Style Fusion Generator

🟡 Fortgeschritten

Stil-Fusion ist eine der effektivsten Techniken für einzigartige Bilder. Dieser Prompt zwingt dazu, zwei Kunstbewegungen explizit zu kombinieren (z.B. Impressionismus + Cyberpunk statt nur „cooles Bild"), was zu überraschenden und originellen Ergebnissen führt. Am besten mit: Midjourney V6, Flux 1.0 Pro, DALL-E 3

Create a [subject] in a fusion style combining [art movement 1] and [art movement 2], featuring [specific elements], with [lighting style], [color palette], and [mood]. The composition should emphasize [focal point] with [additional details]. Render in high quality with attention to [specific artistic technique].

Americana — Midjourney Malerei-Style

🟡 Fortgeschritten

Die generierten Bilder waren so überzeugend, dass ein Kommentator (selbst Maler) schrieb: „Honestly, as a painter im uncomfortably impressed." Die Bilder zeigen, dass Midjourney bei Americana/Nostalgie-Themen photorealistische Malerei-Qualität erreicht. Am besten mit: Midjourney v6.1

Americana oil painting, nostalgic American scenes, vintage gas stations, sun-faded landscapes, warm golden hour lighting, painterly brushstrokes, Americana nostalgia aesthetic —v 6.1 —ar 16:9 —style raw

Low-Poly 3D Illustration Generator (DALL-E 3 / Flux)

🟡 Fortgeschritten

Low-Poly-Stil ist durch klare geometrische Begrenzungen besonders gut für AI-Bildgenerierung geeignet. Der Prompt kombiniert präzise Stilvorgaben (flat shading, minimal polygon count) mit einer konkreten Szene und Farbpalette — was Flux und DALL-E zu konsistenten Ergebnissen bringt. Am besten mit: DALL-E 3, Flux.1 Dev, Midjourney v7

A low-poly 3D rendered illustration of a cozy campsite at night around a crackling campfire,
under a starry sky with the Milky Way visible. Surrounded by geometric pine trees and rolling hills.
Color palette: warm amber fire glow contrasting with cool deep blue sky and green-blue terrain.
Flat shading, minimal polygon count aesthetic, clean edges, game art style.
Composition: eye-level, centered on the campfire. --ar 16:9 --style raw

Flux.2-Klein — 1:1 Character-Editing mit Padding-Trick

🟡 Fortgeschritten

Der Padding-Trick (übernommen von Qwen-Edit-2511) ermöglicht pixelgenaue Character-Edits: Rechteckige Bilder werden mit schwarzen Balken quadratisch gemacht, dann wird „maintain the black bars" zum Prompt hinzugefügt. Flux.2-Klein überträgt Charaktere nahezu 1:1 — selbst subtile Gesichtsausdrücke bleiben erhalten. Bei klarer Quelle und hoher Skala ist das Ergebnis „freakishly close" zum Original. Am besten mit: Flux.2-Klein-4B, ComfyUI

[Dein Charakter-Bild quadratisch machen durch schwarze Padding-Balken an den Seiten]

Prompt: [Charakter beschreiben], maintain the black bars, [gewünschte Änderung]
-- Model: Flux.2-Klein-4B
-- Bild-Skala: 1MB (ImageScaleToTotalPixels für beste Detailtreue)

IChing-Buch der Wandlungen als Midjourney-Prompt

🟡 Fortgeschritten

Klassische chinesische Schriftzeichen aus dem I Ching (Buch der Wandlungen) dienen als rein visuelle Prompts. Die KI interpretiert die Zeichenformen als aesthetische Vorgaben und generiert atmosph aerische Bilder. Der Trick: `--no text, character, letters` unterdrueckt unerwuenschten Text auf den generierten Bildern. Am besten mit: Midjourney v7

元亨利貞 --v 7 --ar 16:9 --no text, character, letters

REALSTAGRAM_ZIMG — Realismus-LoRA für Z-Image Turbo

🟡 Fortgeschritten

Ein neues, frei verfügbares LoRA (17 MB, Rank 64) das Z-Image Turbo-Ausgaben einen echten, amateurhaften Instagram-Look verleiht — ohne den Charakter-LoRA zu überfahren. Stärke 0.2–0.6 als叠加 auf den gewünschten Charakter-LoRA, oder 1.0 solo für den reinen Fotolook. Kein Trigger-Word nötig. Civitai-Link: https://civitai.red/models/2600698/realstagram Am besten mit: Z-Image Turbo / De-Turbo + ClownsharKSampler (RES4LYF) in ComfyUI

[Character LoRA deiner Wahl], candid instagram photo, amateur photography, natural lighting, everyday moment, subtle realism -- LoRA: REALSTAGRAM_ZIMG at strength 0.2–0.6

Minimalistisches Vektor-Logo (Midjourney / DALL-E 3)

🟡 Fortgeschritten

Klare Begrenzungen (2 Farben, kein Text, keine Schatten, keine Gradients) produzieren deutlich bessere Logo-Ergebnisse als offene Beschreibungen. Die Negativ-Parameter (`--no`) filtern typische MJ-Artefakte heraus. Am besten mit: Midjourney v7, DALL-E 3

Design a minimalist vector logo for a sustainable fashion brand called "EcoThread".
Subject: A single continuous line forming an abstract leaf that loops into a thread needle eye.
Style: Clean geometric, flat design, limited to 2 colors (forest green #2D5F2D and warm white #F5F0E8).
Background: Solid warm white. No text, no gradients, no shadows.
Style similar to Nike or Apple logo simplicity. Vector art, scalable design, 2D illustration.
--ar 1:1 --v 7 --style raw --no text, typography, letters, gradient

Brutaler Steampunk-Charakter — Midjourney V8

🟡 Fortgeschritten

Die Schwarz-Weiß-Ästhetik lenkt den Fokus auf Form und Textur statt Farbe. Goggles und Hut als visueller Ankerpunkt erzeugen einen klaren Fokusbereich, während der neblige Hintergrund eine Welt jenseits des Bildes suggeriert. Der „leicht zu seltsam um echt zu sein"-Effekt gibt ihm die AI-Kunst-Signatur ohne platt zu wirken. Am besten mit: Midjourney V8 / V8.1

/imagine prompt: brutal steampunk character, black and white realism, vintage photography style, dramatic chiaroscuro lighting, wearing brass goggles and weathered leather hat, foggy industrial ships in background, old photograph aesthetic slightly too strange to be real, hyper-detailed, gritty texture, cinematic composition --v 8.0 --ar 16:9 --style raw

Dark-Fantasy-Mashup in Midjourney

🟡 Fortgeschritten

Genreverschmelzung von Gothic-Architektur mit biomechanischen Alien-Elementen. Midjourney v7 liefert bei diesem Prompt besonders starke Resultate durch seine verbesserte Kompositionslogik. Am besten mit: Midjourney v7

dark fantasy mashup, gothic architecture fused with alien biomechanical forms, volumetric fog, dramatic chiaroscuro lighting, hyperdetailed, cinematic composition --v 7 --ar 16:9 --stylize 250

Beyond Land #124 — Fantasy Landscape Serie

🟡 Fortgeschritten

Die Serie demonstriert Midjourneys Fähigkeit, kohärente Fantasy-Landschaften in einem konsistenten visuellen Stil zu produzieren — relevant für Nutzer die Storyboards, Spielwelten oder Concept Art erstellen. Am besten mit: Midjourney v6.1

epic fantasy landscape, towering crystalline mountains, ancient ruins overgrown with luminous vegetation, dramatic atmospheric perspective, concept art style —v 6.1 —ar 16:9 —style raw

"Uncanny"-Modifier: Das böse Variable-Expander-Tool

🟡 Fortgeschritten

Das Wort „uncanny" (unheimlich) wirkt als universaler Stimmungs-Booster in Cloud-basierten Bildmodellen. Es löst bei Google- und OpenAI-Modellen eine Neupriorisierung der Prompt-Gewichte aus — die Bilder werden düsterer, atmosphärischer und visuell komplexer. Ein User testete: „It works like an evil/unsettling variable expander in any situation." Am besten mit: Google Imagen, DALL-E 3, OpenAI GPT-Bilderzeugung

Uncanny creature, in an uncanny barn, uncanny atmospheric effects

Pixel Art Retro Game Asset Generator

🟡 Fortgeschritten

Die Kombination aus technischen Pixel-Art-Schlüsselwörtern (dithered shading, isometric) mit konkreten Console-Referenzen (SNES, Sega Genesis) erzeugt authentische Retro-Ästhetik. Der `--tile`-Parameter macht Assets direkt in der Spieleentwicklung nutzbar. Am besten mit: Midjourney Niji 6, DALL-E 3, Flux

Act as a 2D Video Game Designer and Pixel Artist. I need a prompt to generate a game asset in a retro style.

Asset Type: [INSERT ASSET TYPE, e.g., 16-bit RPG Character Sprite / 8-bit Platformer Background Tile / Arcade Cabinet Art]
Theme: [INSERT THEME, e.g., Post-apocalyptic desert / High fantasy medieval / Underwater cyberpunk]
Color Restriction: [INSERT COLOR LIMITATION, e.g., 32-color palette / Game Boy green scale]

Generate a pixel art prompt with these technical keywords: "Pixel art, low resolution, isometric, orthographic, dithered shading, [COLOR RESTRICTION]."

Specify the perspective: "Side view," "Top-down view," or "Isometric projection."
Reference a specific console/era for style guidance (e.g., "Inspired by SNES/Sega Genesis").
Parameters: --v 8.0 --ar 16:9 --style raw --tile (for seamless tiling) or --v 8.0 --niji 6 (for anime-style pixel art).

SYNTHETICA FIGURA — Synthetische Geometrie

🟡 Fortgeschritten

43 Upvotes zeigen das wachsende Interesse an nicht-figurativer, synthetischer Bildgenerierung als Gegenpol zu fotorealistischen Outputs. MJ v7 beherrscht parametrische Aesthetik besonders gut. Am besten mit: Midjourney v7

synthetic geometric forms, mathematical abstraction rendered as sculptural objects, clean white background, studio lighting, parametric design aesthetic, crystalline structures --v 7 --ar 4:5 --stylize 150

Charakterblatt-Workflow für Open-Source-Modelle (Flux 2 Dev)

🟡 Fortgeschritten

FLUX.2 Dev mit Character Sheet Input liefert die besten Ergebnisse bei komplexen Mehrpersonenszenen. Die Kombination aus Charakterreferenz + Text-Prompt erzeugt Szenen, bei denen jedes Detail — Haltung, Mimik, Lichtstimmung — kontrolliert wird. Wichtig: 32mm virtuelle Linse, spezifische Lichtführung, kein photorealistischer Stil für beste Ergebnisse im animierten Look. Am besten mit: FLUX.2 Dev, GPT Image 2 (für Character Sheet Input)

A polished stylized 3D animated cinematic movie still inside a grimy convenience store, rendered like high-end animated feature key art with hand-painted concept-art textures and painterly PBR materials, not photoreal photography.

[CHARAKTER 1], [AUSFÜHRLICHE BESCHREIBUNG: Aussehen, Kleidung, Pose, Expression], steht auf der linken Seite im 16:9-Frame. [BELEUCHTUNGSDETAIL: z.B. Neonlicht färbt Fellkanten].

Auf der rechten Seite [CHARAKTER 2], [DETAILBESCHREIBUNG]. Im Vordergrund [Objekte], im Mittelgrund [Umgebung/Details], im Hintergrund [weitere Elemente mit spezifischer Beleuchtung].

Use a virtual 32mm cinema lens at eye level with a slight low-angle tension. Fluorescent ceiling strips lead diagonally from the left foreground toward the right side, creating strong leading lines and layered depth. Lighting motivated by [konkrete Lichtquellen], with soft [Farbe] rim light catching [spezifische Details]. Add subtle negative fill, soft volumetric haze, controlled bloom, clean exaggerated facial expressions, crisp silhouettes, visible fabric weave, fine animated-film grain, ultra-clean high-resolution production keyframe.

Anima Anime-LoRA mit vollständigen ComfyUI-Einstellungen

🟡 Fortgeschritten

Ein auf 20.000 sorgfältig kuratierten Anime-Bildern trainiertes LoRA, das den Qualitäts-Boden (Floor) anhebt — also selbst einfache Prompts produzieren bessere Ergebnisse. Unterdrückt übermäßig lebhafte Farben und flache Shading-Stile. Kann mit 12-16 GB VRAM trainiert werden. Am besten mit: Anima Preview 3 Base (Base-Modell)

1girl, looking at viewer, tri drills, bodystocking, small breasts, three quarter view, sidelighting, bathroom, drill hair, looking up, black ribbon, twin drills, very long hair, grey hair, light smile, closed mouth, hand on own chest, blunt bangs, long hair, two-tone eyes, ribbon, solo

Negative Prompt: worst quality, low quality, score_1, score_2, score_3, old, early, mid, lowres, bad anatomy, comic, text, signature

Kinematische Szene Visualizer — Midjourney

🟡 Fortgeschritten

Dieser Template-Prompt deckt alle Dimensionen ab, die ein kinematisches Bild ausmachen: Kamera, Licht, Farbe, Stimmung, Referenz und Komposition. Durch Ersetzen der Platzhalter kann jede erdenkliche Filmszene generiert werden. Am besten mit: Midjourney V8

A cinematic scene: [subject/characters] in [location], shot from [camera angle: e.g., low angle / bird's eye / dutch angle], during [time of day: e.g., golden hour / blue hour / midnight storm], with [weather: e.g., heavy rain / light fog / clear sky], dramatic [lighting: e.g., rim lighting / volumetric god rays / neon reflections], [color grading: e.g., teal and orange / desaturated / high contrast noir], mood: [mood: e.g., tension / wonder / isolation], featuring [specific visual elements], style evoking [film or director reference: e.g., Denis Villeneuve / Ridley Scott / Wong Kar-wai], attention to [composition technique: e.g., rule of thirds / leading lines / foreground framing] --v 8.0 --ar 16:9 --style raw

Charakter-Sheet Referenz-Prompt mit Bezugslatenzen

🟡 Fortgeschritten

Drei-Ebenen-Struktur — (1) Szene + Figur links, (2) Figuren rechts + Umgebung, (3) Kamera + Licht. Besonders stark: die explizite Lichtbeschreibung (kränkliches Grün + Gefrier-Blau + rosa Rimlight), die den Bildton definiert. Am besten mit: Z-Image (Base oder Distilled), FLUX 2 Dev, Klein 9b

A polished stylized 3D animated cinematic movie still inside a grimy convenience store, rendered like high-end animated feature key art with hand-painted concept-art textures and painterly PBR materials, not photoreal photography. Unit Snuggles, a heavy-set orange-and-cream anthropomorphic tomcat, stands in the left third of the wide 16:9 frame with a big fluffy belly, sharp confident eyes, tan muzzle, curled striped tail, maroon short-sleeve tactical shirt, modular pouch rig, back harness, fingerless gloved paws, knee pads, battered boots, and a spiral insignia patch. A faint neon pink aura-mana glow licks around his ears and fur as he grips a custom black scoped rifle with both paws, the barrel aimed toward the two men on the right but kept just off-center for clear dramatic readability.

On the right, a heavy bearded man with a round face, dark swept hair, full brown beard, black T-shirt, blue suspenders, cuffed dark jeans, and brown shoes raises both hands high, his wide worried eyes and forced nervous smile clearly visible. Beside him stands a fit blond man with styled tousled hair, light stubble, faded olive T-shirt, loose American-flag pants split into stars and stripes, sneakers, and a utility pouch at his hip, his confident smirk replaced by anxious raised brows and open palms. The foreground has a knocked-over basket, spilled snack bags, and a crushed soda cup. The midground shelves are packed with candy bars, dusty cereal boxes, cheap sunglasses, and lottery signs. In the background, refrigerator doors glow blue-white behind fogged glass, with a handwritten sign behind the counter reading "NO MASKS, NO MAGIC, NO REFUNDS" and a security camera dangling by one wire.

Use a virtual 32mm cinema lens at eye level with a slight low-angle tension, giving the cat heroic weight while keeping the men trapped against the right aisle. Fluorescent ceiling strips lead diagonally from the left foreground toward the right side of the frame, creating strong leading lines and layered depth. The lighting is motivated by sickly green fluorescent tubes and freezer-blue refrigerator light, with soft pink rim light from the cat's aura catching fur edges, rifle metal, glossy tile, and scuffed plastic. Add subtle negative fill on the men's shadow sides, soft volumetric haze in the aisle, controlled bloom around highlights, clean exaggerated facial expressions, crisp silhouettes, visible fabric weave, worn leather, scratched plastic edges, lifted cool shadows, warm orange fur contrast, fine animated-film grain, ultra-clean high-resolution production keyframe.

ZIT/Base zeigt maximales Realismus-Potenzial

🟡 Fortgeschritten

Der ZIT/B-User zeigt, dass das Modell ohne LoRAs und mit sorgfältiger Prompt-Formulierung die beste Texturqualität im Open-Source-Segment liefert. Die entscheidende Erkenntnis: Viele Tester scheitern nicht am Modell, sondern an falscher Anwendung (falsche Upscaling-Pipeline, unnötige LoRAs). Am besten mit: ZIT/B (FP32), FLUX.2 Klein (zum Vergleich)

ZIT/B ohne LoRA — nur Original-Modell in FP32. Alle Prompts werden mit GPT geschrieben.
Workflow-Empfehlung:
- Keine tiled Upscales; Single-Pass auf maximale Auflösung (vor Crash)
- Nur Originalmodelle, keine LoRAs
- GPT für Prompt-Formulierung verwenden
- dype-Node für Auflösungs-Erhöhung

Beispiel-Prompt-Struktur:
[Detailgetreue Personenbeschreibung mit Fokus auf Hauttextur]
+ [Umgebungsbeschreibung mit atmosphärischer Lichtstimmung]
+ [spezifische Kameraeinstellungen: Lens, Angle, Depth of Field]

Visueller Style-Regelwerks-Generator

🟡 Fortgeschritten

Generiert ein vollständiges Design-Regelwerk für jeden beliebigen visuellen Stil. Das Ergebnis kann direkt als Midjourney-Prompt-Kontext, als Branding-Guide oder als Basis für KI-Bildgenerierung verwendet werden. Am besten mit: Claude Sonnet 4.5, GPT-4.1

I am fascinated by the design style of [INSERT VISUAL STYLE/ERA, e.g., Vaporwave / 1920s Art Deco / Cyberpunk]. I need a guide to recreate it perfectly in any medium.

Act as a Design Theorist. Analyze this style and create a rulebook:

1. Primary Color Palette: (Provide 3-5 key colors and their relationship)
2. Key Visual Motifs: (What symbols, objects, or textures are mandatory? E.g., Grids, Statues, Neon)
3. Typography Rules: What kind of fonts are allowed/forbidden? (Serif, Sans-serif, Script)
4. Lighting/Ambience: What is the dominant lighting type? (e.g., Harsh fluorescent, Soft warm candlelight)
5. Composition: Is the style generally symmetrical, chaotic, or minimal?

Flux2Klein: Deformierte Gliedmaßen reparieren

🟡 Fortgeschritten

Die Community hat herausgefunden, dass Flux2Klein bei der Korrektur deformierter Gliedmaßen deutlich besser funktioniert, wenn man „replace"-Logik statt „fix"-Logik verwendet. Prompts wie „remove X and replace with Y" funktionieren besser als „fix hand" oder „correct foot". Der Kniff: Explizit das zu ersetzende Element benennen UND das gewünschte Ergebnis beschreiben. Am besten mit: Flux2Klein (in ComfyUI), Inpainting-Workflow

remove the right hand and replace it with a normal hand with four knuckles

Comic-Meets-3D Neon-Prompt

🟡 Fortgeschritten

Der Prompt nutzt den „Schulter-Angel vs. Schulter-Teufel"-Aufbau für visuell lesbare Sprechblasen und charakterstarke Komik. Die Checkliste („AI Projects" angehakt) gibt dem Bild eine narrative Pointe. Am besten mit: Z-Image Base, FLUX 1 Dev

Create a funny, polished, wide landscape digital illustration in a colorful comic-meets-3D style.

Taylor Swift is sitting at a glowing computer desk on a Friday evening, looking amused and tempted as she tries to decide whether to spend the night doing more AI hobby projects. She is in a cozy neon-lit creative studio with music gear, AI tools, laptops, keyboards, notebooks, and glowing monitors around her.

On one shoulder is a tiny Teenage Mutant Ninja Turtle dressed like a mischievous little devil, with small red horns, a tiny cape, and a playful grin. He is pointing toward the computer and saying in a speech bubble:

"Do it... train one more model!"

On her other shoulder is another tiny Teenage Mutant Ninja Turtle dressed like an angel, with a halo, little white wings, and a sweet supportive smile. He is saying in a speech bubble:

"AI IS pretty cool... and it IS Friday after all."

Taylor is smiling like she knows she is about to give in. Make the scene funny, charming, and expressive, with readable speech bubbles and strong character acting.

In the background, add bold neon branding that says:

"GGF"

Also include fun little details around the desk, like a mug that says "GGF FUEL", a sticky note that says "just one more workflow", and a notebook titled "Friday Plan" with checkboxes:

- Relax
- Be normal
- AI Projects

The "AI Projects" box is checked.

Use vibrant neon lighting, crisp details, clean composition, and a funny YouTube-thumbnail-worthy look. Make it high-quality, energetic, and visually clear.

FLUX.2 Klein Identity Feature Transfer V3 (Final)

🟡 Fortgeschritten

V3 der Identity Feature Transfer-Node löst das größte Problem von Klein 9B — die Tendenz, Kopfpositionen zu ändern. Mit HARD_LOCK bleibt die exakte Kopfposition und sogar kleine Details erhalten. Final-Version (trotzdem kommt bestimmt noch eine „Final_revision1"). Am besten mit: FLUX.2 Klein 9B in ComfyUI

Workflow: FLUX.2 Klein + Identity Feature Transfer V3 (ComfyUI)
- HARD_LOCK auf Zoom-Position: Fixiert exakte Kopfposition und Details
- Ohne den Node möchte 9B Kopfpositionen ändern → mit V3 bleibt die Pose stabil
- Verwendung für Face-Identity-Transfer zwischen Bildern

ComfyUI Workflow:
1. FLUX.2 Klein als Basis-Modell
2. Identity Feature Transfer V3 Node als Referenz-Input
3. HARD_LOCK aktiviert für Zoom-/Positions-Consistency
4. Standard-Sampler, 30-50 Steps

Multi-Injection: Identitätstransfer mit mehreren Stufen

🟡 Fortgeschritten

Ein neues ComfyUI-Node-Konzept injiziert Referenz-Identität in mehreren Stufen (mid + post injection) statt nur an einem Punkt. Das führt zu mehr Stabilität bei Identity-Transfer-Aufgaben: Gesichter, Charakter-Konsistenz und Stilübertragung werden robuster. Der Ansatz kombiniert Mid-Injection für Struktur mit Post-Injection für Feinabstimmung. Am besten mit: Flux2Klein (ComfyUI), Custom Nodes

[Identity Transfer Node — ComfyUI Workflow]
Mid-stage injection: Inject reference features into transformer blocks at layer ~25-35
Post-stage injection: Reinforce reference identity in final output layers (~45-55)
Target blocks: Attention layers in selected transformer stages
Plug-and-play preset with configurable strength parameters

Face-Swap ComfyUI-Workflow für FLUX

🟡 Fortgeschritten

Automatisierter Face-Swap-Pipeline mit Referenz-Latenz-Conditioning — deutlich schneller als manuelle Inpainting-Workflows. Besonders nützlich für Charakter-Konsistenz über mehrere Bilder. Am besten mit: FLUX (ComfyUI), CUDA-GPU für InsightFace

# ComfyUI Face Swap Workflow

1. Face Crop: Extrahiere saubere Gesichts-Crops (Source + Target)
2. Mask Generation: Erstelle Masken für den Swap-Bereich
3. Reference Latent Conditioning: Nutze Referenz-Bilder für Latent-Conditioning
4. Post-Processing: Color Match, Cinematic Grading
5. Output: Konsistente Faces auch bei Low-Quality-Bildern

# Hinweis: GPU mit CUDA empfohlen
# Funktioniert am besten mit FLUX + InsightFace Kombination

Eve-Universum: Art-Style-Prompts für konzeptuelle Architektur

🟡 Fortgeschritten

Eine Serie von vier Prompts zeigt, wie dasselbe Motiv (Jovian Observatory) durch verschiedene Kunststil-Modifikatoren völlig unterschiedlich interpretiert wird: abstrakter Expressionismus, Impressionismus, Konstruktivismus und konzeptueller Stil. Der Trick: Kombiniere eine architektonische Grundbeschreibung mit einem Kunststil-Suffix und lass die KI die Stilkonsequenzen durchziehen. Am besten mit: Midjourney v6/v7

Caldari Jovian Observatory : abstract expressionist architecture, geometric angular structures, cold blue metallic surfaces, minimal ornamentation, functionalist towers, fog-shrouded, dramatic atmospheric perspective, photorealistic sci-fi rendering, cinematic lighting --ar 16:9 --v 3.7

Amarr Jovian Observatory : impressionist architecture, golden ornate spires, rich warm color palette, baroque decorative elements, sunlit marble, sweeping curved domes, painterly texture, photorealistic sci-fi rendering, warm dramatic lighting --ar 16:9 --v 3.7

Looney-Tunes-Hintergründe mit Z-Image Turbo + LoRA

🟡 Fortgeschritten

Dieser LoRA für Z-Image Turbo verwandelt beliebige Szenenbeschreibungen in authentische Looney-Tunes-Kulissen. Der Clue: Das Prompt selbst bleibt extrem minimalistisch — nur Ort, Stil-Tags und der „looneytunes background, cartoon"-Suffix. Die eigentliche Magie liegt in den ComfyUI-Settings: KSampler mit 9 Steps, CFG Scale 1.0, ModelSamplingAuraFlow Shift=3.0, LoRA-Stärke 1.25. Die Texterkennung funktioniert — Gebäudebeschriftungen wie „Bank" und „Saloon" werden korrekt gerendert. Am besten mit: Z-Image Turbo (Basis-Modell: z_image_turbo_bf16.safetensors) + LoRA: looneytunesbackground_zit.safetensors

main street of a Wild West town circa 1870, looneytunes background, cartoon. One building has a sign "Bank", another "Saloon", another "Sheriff"

Open-Source System Prompt für 1.446 Trending Image Prompts

🟡 Fortgeschritten

Basierend auf der Analyse von 1.446 der meistgelikedten Image Prompts von X/Twitter. Drei Patterns wurden identifiziert: Negative Constraints funktionieren nach wie vor besser als erwartet, multi-sensorische Beschreibungen verbessern Qualität signifikant, und scene-type-basiertes Formatting liefert konsistent bessere Ergebnisse als generische Prompts. Am besten mit: GPT Image 2, Flux.1, Midjourney v7

You are an expert prompt engineer for AI image generation. Given a short description, expand it into a structured image prompt using these techniques:

1. NEGATIVE CONSTRAINTS: Specify what the image should NOT contain (e.g., "no text, no people, no shadows")
2. MULTI-SENSORY DESCRIPTIONS: Beyond visuals, add texture, temperature, atmosphere (e.g., "steam rising from a warm ceramic bowl, rich umami scent implied through visual cues")
3. SCENE-TYPE FORMATTING: Structure based on category:
- Photography: camera angle, lens type, lighting, depth of field
- Product/Brand: clean background, studio lighting, commercial aesthetic
- Food & Drink: plating style, steam/freshness cues, overhead vs 45° angle
- Illustration & 3D: art style, render engine, material properties
- Poster Design: typography style, composition grid, color palette
- UI & Graphic: layout structure, interface elements, screen format

Input: [KURZE BESCHREIBUNG, z.B. "a bowl of ramen"]
Category: [Photography/Illustration/Product/Food/Poster/UI]

Output: Complete, copy-pasteable image prompt optimized for GPT Image 2 / Midjourney / Flux.

Midjourney V8.1 Alpha — Neues Model mit bekannter V7-Ästhetik

🟡 Fortgeschritten

Mistral hat mit V8.1 die Lücke zwischen V7 und V8 geschlossen. Die neue Version bringt die bewährte V7-Ästhetik zurück, behält aber V8s bessere Detailtreue. Besonders wichtig: Style-References sind jetzt deutlich stabiler — was vorher Glückssache war, liefert jetzt konsistente Ergebnisse. Für bestehende Midjourney-Nutzer bedeutet das: Prompt-Workflow bleibt gleich, aber die Ergebnisse werden zuverlässiger. Am besten mit: Midjourney V8.1 (alpha.midjourney.com)

Verwende Midjourney V8.1 Alpha für neue Generationen:
- V8.1 hat eine konsistente und vertraute Ästhetik im Stil von V7
- Moodboards und Style-References (srefs) sind jetzt super stabil
- HD-Mode ist jetzt 3x schneller und liefert schärfere Ergebnisse
- Verwende `--v 8.1` als Parameter

Beispiel: beautiful girl with blue hair and golden eyes. she has an angel halo above her head. in the background, there is darkness around her. her tongue is slightly out, as if savoring something delicious. --chaos 10 --v 8.1

Z-Image Turbo Workflow mit Qwen Text Editor

🟡 Fortgeschritten

Die Kombination aus Z-Image Turbo mit Euler-Sampler und beta_schedule in nur 10 Steps liefert ästhetisch hochwertige Bilder verschiedener Stile. Qwen als Text-Editor-Modell korrigiert automatisch Textfehler. LoRA-Stacking mit Slider-LoRAs ermöglicht vorhersagbare Anpassungen (dunkler, nebliger, glänzender). Am besten mit: Z-Image Turbo (F16 GGUF), Ultra-Flux VAE, Qwen Text Editor (GGUF)

Elegant woman wearing a red silk evening dress, golden hour lighting,
cinematic portrait photography, shallow depth of field, --ar 16:9
--sampler euler_a --beta_schedule linear --steps 10 --cfg_scale 3.5

Looneytunes Background Style für Z-Image Turbo

🟡 Fortgeschritten

Das beliebte Looneytunes-Backgrounds-LoRA ist jetzt als Z-Image Turbo Version verfügbar (nach SDXL und SD1.5). Besonders gut für Architektur und abstrakte Kunststile. SD1.5-Version bleibt die beste für sehr abstrakte Styles, aber ZIT-Version ist schneller und besser für Text-integration. Am besten mit: Z-Image Turbo (ZIT) + Looneytunes Background LoRA (Civitai)

cartoon background in classic Looney Tunes style, painted watercolor backdrop with exaggerated perspective, stylized hills and buildings, vibrant saturated colors, hand-painted cel animation aesthetic, abstract simplified shapes, golden age animation background art --model Z-Image-Turbo --lora Looneytunes-Background-ZIT

Saubere weiße Hintergründe — 10 Modelle im Vergleich

🟡 Fortgeschritten

Ein systematischer Vergleich von 10 T2I-Modellen hat gezeigt: ChatGPT 1.5 (1.5) und ChatGPT 2.0 produzieren die saubersten weißen Hintergründe, gefolgt von Wan 2.7 Pro und Flux 2 Max. Für Flux Klein (der meistgenutzten Version) wird der Tipp gegeben, statt „perfectly white background" die Begriffe „isolated on white background" oder „cut-out on white background" zu verwenden — das sind die Standard-Begriffe aus der Profi-Fotografie und werden von den Modellen besser interpretiert. Am besten mit: ChatGPT 1.5 oder 2.0 (sauberste Ergebnisse), alternativ: Probiere „isolated on white background" oder „cut-out on white background" für Flux Klein

Full body photograph of a female model on a perfectly white background.

Sumo-Biking Poster — Vintage-Werbungsstil (Midjourney v8.1)

🟡 Fortgeschritten

Die Kombination aus absurdem Sujet (Sumo-Ringer auf Motorrädern) mit strengem Vintage-Stil erzeugt visuell überzeugende Ergebnisse. Die Parameter `--stylize 150` und `--raw` halten den Output nah am Prompt ohne Über-Interpretation. Am besten mit: Midjourney v8.1

1960s japanese advertising photo poster of a motocycle race with sumo wrestlers pilots riding the bikes in full gear, vintage look, kodachrome, colourful intricate detailed, kanji --ar 4:5 --raw --stylize 150 --hd --v 8.1

Flux Klein Konsistenz-LoRA mit negativen MPS-Werten

🟡 Fortgeschritten

Zwei Techniken kombiniert: (1) Der Konsistenz-LoRA für Flux Klein verhindert Gesichtsveränderungen bei Bild-Editing. (2) Negative MPS-LoRA-Werte (-0.3/-0.5) pumpen Qualität ohne Konsistenz zu zerstören. Zusätzlich die explizite Negativ-Instruktion „do NOT change the face" im Prompt funktioniert bei Klein überraschend gut. Am besten mit: Flux 2 Klein 9B + Consistency LoRA, negativer MPS LoRA bei -0.3 bis -0.5

Replace the dress with red and black dragon scale armor with bone decorations.
Change the lemonade into pitchers of red blood. Alter the sign text to say
"Dragon Blood". Replace the lemon in her hand with a torn out heart.
Change the facial expression to a fierce battle cry.

[Settings: Inpaint strength 100%, original image as reference,
do NOT change the face, do NOT alter hands or fingers]

Midjourney Covert-Design Field Test

🟡 Fortgeschritten

Mit 420 Upvotes der Top-Post des Tages in r/midjourney. Die Mischung aus Anime, Noir und Art Deco erzeugt einen unverwechselbaren "Regime Change Noir"-Stil. Die dichten, taktischen Kompositionen mit überlappenden visuellen Elementen unterscheiden sich deutlich vom typischen Midjourney-Look. Am besten mit: Midjourney v7

regime change noir poster design, anime-noir-art deco fusion aesthetic, tactical composition with crowded visual elements, contemporary political thriller poster style, layered graphic design with bold geometric forms, muted color palette with dark reds and deep blacks, propaganda poster meets modern editorial illustration --v 7 --ar 2:3 --style raw

«The Cozy Life» — Midjourney V8.1 Cozy-Core Ästhetik

🟡 Fortgeschritten

Die V8.1-Alpha-Serie zeigt dramatisch verbesserte Innenraum-Komposition und Beleuchtung. «Cozy Retro-Futurism» als Genre-Anker funktioniert besonders stark — warme Farbskalen kombiniert mit Sci-Fi-Elementen erzeugen sofort erkennbare, shareable Bilder. Am besten mit: Midjourney V8.1 Alpha

cozy retro-futuristic apartment interior, warm amber lighting, curved furniture built into walls, porthole windows overlooking a neon cityscape, plants everywhere, vintage CRT monitors, plush modular seating, lived-in sci-fi aesthetic, soft film grain, analog photography feel --v 8.1 --ar 16:9 --style raw

LTX2.3 Video-LoRA Training — Optimale Einstellungen

🟡 Fortgeschritten

Der Autor hat die Default-Einstellungen reverse-engineered und systematisch optimiert. Das Ergebnis: LoRA-Training in 3,5 Stunden statt 12+ Stunden mit deutlich höherer Likeness-Genauigkeit. Der Knackpunkt: Differential Guidance = 3 in Phase 1, Guidance Scale = 10 beim Sampling. Am besten mit: LTX2.3 in Ostris AI Toolkit, RTX 5090 (24GB VRAM)

LTX2.3 LoRA-Training — Phase 1 (600 Schritte, RTX 5090):

Training Panel:
- LoRA Rank: 48
- Steps: 700 (speichert bei Schritt 600)
- Gradient Accumulation: 2
- Cache Text Embeddings: ON
- Differential Guidance (Advanced Panel): 3

Dataset Panel:
- Number of Frames: 25 (1 Sekunde × 25 Frames)
- Number of Repeats: 4 bei 25 Clips / 2 bei 50 Clips
- Resolution: 512x512 nur
- Normalise Audio: ON

Sample Settings (nach Phase 1):
- 2 Samples: Close-up + Medium Shot
- 512x512, 49 Frames
- Guidance Scale: 10 (verhindert schlechte Ergebnisse)

Trigger-Wort verwenden für bessere Kontrolle.

SenseNova U1 mit NEO-Unify — Any-to-Any Modell

🟡 Fortgeschritten

SenseNova U1 ist ein neues Any-to-Any Modell mit T2I Reasoning im Think-Mode — das Modell „denkt" über das Bild nach, bevor es generiert. Native 2048×2048 Ausgabe ohne Upscaling. Die reasoning-Funktion verbessert insbesondere Infografiken und textlastige Bilder. Am besten mit: SenseNova U1 (native 2048×2048), mit T2I Reasoning (Think Mode)

Generate a professional infographic showing the lifecycle of AI model training,
with clean typography, data visualization elements, and a modern tech aesthetic.
Resolution: 2048x2048, reasoning mode enabled.

Midjourney v8.1 — "Red" (Gritty Fantasy)

🟡 Fortgeschritten

Das Axt-Detail transformiert ein klassisches Märchenmotiv in eine düstere Fantasy-Szene mit narrativer Tiefe. Hoher Chaos-Wert (75) erzeugt unerwartete Kompositionen, während die Style-Reference (--sref) konsistente Ästhetik sichert. 182 Upvotes auf r/midjourney. Am besten mit: Midjourney v8.1 (Niji 7 Modus)

gritty fantasy, little red riding hood carrying an axe and a werewolf, dark ambiance --chaos 75 --raw --sref 224864270 --stylize 800 --weird 87 --niji 7

Chroma v41/v48 — Visuell beeindruckendste Open-Source-Modelle im Vergleich

🟡 Fortgeschritten

Laut Community-Vergleich mit 50+ Prompts liefert Chroma in 90 % der Fälle die visuell ansprechendsten Ergebnisse — besonders bei v41 und v48 DC. Die Modelle erzeugen «eye-catching colors» und «out-of-the-box ideas». Allerdings nur mit gutem Workflow und Seed2VR-Refinement nutzbar. Am besten mit: Chroma v41 / Chroma v48 DC / Chroma v50HD (via ComfyUI mit Seed2VR-Refinement)

vibrant cinematic portrait, dramatic saturated colors, high contrast rim lighting, ethereal atmosphere, eye-catching color palette, bold visual composition, artistic lighting design

Z-Image Workflow — Fotorealistische Portrait-Pipeline

🟡 Fortgeschritten

Der Deturbo-Returbo-Ansatz (Entschleunigung + Re-Schärfung) produziert außergewöhnlich fotorealistische Porträts. Die Kombination aus Qwen3-4b als Text Encoder und spezialisierten Upscalern je nach Stil liefert konsistente Ergebnisse ohne die bei Flux bekannten Body-Horror-Probleme. Am besten mit: Z-Image-Deturbo-Returbo-Base in ComfyUI, GPU mit 12GB+ VRAM

ComfyUI Z-Image Diffusers Workflow:

Modell: Z-Image-Deturbo-Returbo-Base
Text Encoder: Qwen3-4b-Z-Image-Engineer-V4 (safetensors)

VAE: ae + Z-Image_half_natural_vae

Upscaler (stilabhängig):
4x: Nomos2_realplksr_dysample + 4xPurePhoto-RealPLSKR
1x: DeNoise_realplksr_otf + SkinContrast-High-SuperUltraCompact

Loader: Z-Image Diffusers Loader (ComfyUI-Zlycoris Custom Node)
Dateien verfügbar auf Hugging Face.

FLUX.2 Klein Identity Feature Transfer Advanced

🟡 Fortgeschritten

Ermöglicht präzise Identitätsübertragung zwischen Bildern mit wesentlich mehr Kontrolle als die Basisversion. Neue Subject-Mask-Funktion verhindert, dass höhere Stärken den Hintergrund mitübertragen. Besonders effektiv für Charakterkonsistenz. Am besten mit: FLUX.2 Klein über ComfyUI

Tool: ComfyUI-Flux2Klein-Enhancer
Workflow: https://github.com/capitan01R/ComfyUI-Flux2Klein-Enhancer

Kern-Feature: Identity Feature Transfer mit Advanced Controls:
- Subject Mask (optional) für präzise Identitätsübertragung
- Separate Identitätsmaske vom Hintergrundkontext
- Parameter sind "Taste-basiert" — individuelle Anpassung empfohlen

Midjourney v8.1 — Drache mit Artist Anchor

🟡 Fortgeschritten

Der --profile Parameter (3bsadp7 = Artist Anchor) definiert einen konsistenten künstlerischen Fingerabdruck über Generationen hinweg. Zusammen mit --seed 1 für Reproduzierbarkeit und --stylize 1000 für maximale kreative Freiheit ergibt das extrem detaillierte, charakterstarke Ergebnisse. 144 Upvotes. Am besten mit: Midjourney v8.1

dragon --seed 1 --profile 3bsadp7 --stylize 1000 --hd --v 8.1

Pixel Art Dusk — Midjourney V8.1 Pixel-Art

🟡 Fortgeschritten

V8.1 hat signifikante Verbesserungen bei Pixel-Art-Rendering — saubere Kanten, konsistente Farbskalen, atmosphärische Depth-Effekte die über klassische Pixel-Art hinausgehen. Am besten mit: Midjourney V8.1 Alpha

pixel art dusk scene, golden hour lighting, atmospheric retro gaming aesthetic, 16-bit style landscape with modern depth effects, warm orange and purple gradient sky, silhouetted trees, peaceful mood --v 8.1 --ar 16:9

Chroma-Modell-Ökosystem — Universeller Basis-Prompt für alle Modelle

🟡 Fortgeschritten

Derselbe Prompt funktioniert über 9 verschiedene Modelle hinweg mit konsistent hoher Qualität. Chroma liefert interessante Details als Basis, während Z Image Turbo und Klein 9B für den Feinschliff optimiert sind. Die Community bestätigt: Chroma-Modelle zeigen besonders interessante Detailtiefe als Erstschritt-Generation. Am besten mit: Chroma V41, Chroma V48 DK, Zeta-Chrome Alpha, Z Image Turbo, Klein 9B Turbo, Qwen 2512

Masterpiece, best quality, ultra detailed 8k raw photo, National Geographic award-winning underwater
photography of a majestic Moon Jellyfish (Aurelia aurita),

dramatic side-front low angle shot from slightly below and to the side, elegant and majestic composition,
35cm diameter extremely delicate translucent bell, paper-thin membrane with natural subtle thickness
variations, highly intricate fine radial canals with microscopic vein structures, crystal clear glass-like
transparency, four vivid glowing lavender-pink horseshoe-shaped gonads clearly visible, long flowing
extremely delicate frilly silk-like oral arms trailing gracefully and ethereally downwards like a wedding dress,

tropical sunlight dramatically piercing through the surface creating powerful volumetric god rays and
sparkling caustic patterns dancing across the bell, beautiful rim lighting that makes the jellyfish glow,

crystal clear turquoise Caribbean water, tiny suspended plankton and delicate air bubbles floating around,
soft dreamy bokeh of distant coral reef in background,

authentic biological accuracy, majestic and ethereal atmosphere, realistic volumetric lighting,
subtle soft shadows, natural imperfections, subtle subsurface scattering, excellent depth and dimension

LLaDA2.0-Uni — Neues Diffusionsmodell

🟡 Fortgeschritten

Neues Edit-Modell, das potenziell eine Alternative zu FLUX.2 Klein darstellt. Die Community diskutiert Comfy-Support und Vergleichstests. Am besten mit: ComfyUI (Support wird erwartet)

Modell: inclusionAI/LLaDA2.0-Uni
HuggingFace: https://huggingface.co/inclusionAI/LLaDA2.0-Uni

Hinweis: Edit-Modell — Vergleich mit FLUX.2 Klein und Qwen Edit empfohlen

Bild-zu-Prompt mit Qwen3.6-35B-A3B — Reverse Engineering

🟡 Fortgeschritten

Der Community-Konsens auf r/StableDiffusion: Qwen 3.6 übertrifft Gemma 4 bei der Bildbeschreibung. Besonders die Uncensored-Wasserstein-Version (35B Parameter, aktiviert nur 3B) liefert detaillierte, realistische Prompts aus bestehenden Bildern — ideal zum Reverse-Engineering erfolgreicher Generierungen. Am besten mit: Qwen3.6-35B-A3B (via llama.cpp) oder Gemini Flash 3

You are an expert image captioning assistant. Please analyze this image and give me a detailed prompt for it, followed by a simplified prompt. Write a Midjourney-compatible prompt with aspect ratio, style reference, and version parameters.

IRL-zu-2.5D RPG: Foto in Nintendo-DS-Stil konvertieren

🟡 Fortgeschritten

Zeigt meisterhaft das Prinzip «Style Anchor beats Adjective List» — statt «Pixel-Art + retro + isometrisch» zu stapeln, wird ein konkreter visueller Referenzpunkt (Nintendo DS-Ära Pokémon HeartGold/SoulSilver) gesetzt. Das Modell kollabiert den Stilraum präzise statt zu improvisieren. Am besten mit: Flux.1 / Midjourney v8.1 / GPT Image (Image-to-Image)

Convert this real-life image into a top-down 2.5D pixel-art RPG scene. Make it look like a handheld Nintendo DS-era adventure game map. Use a soft pastel colour palette, simplified tile-based ground, chibi proportions, clean dark outlines, low-detail textures, and a slightly overhead camera angle. Keep the same basic layout and objects from the original image, but translate them into game-map elements. Avoid realism, 3D rendering, modern vector art, heavy shadows, text, UI, and overly detailed backgrounds.

If there is a road, turn it into a tile path. If there are trees, turn them into rounded pixel-art trees. If there are buildings, make them small stylised RPG buildings with simple roofs and windows. Keep everything readable like a game screenshot.

Fooocus_Nex: Context over "Better AI"

🟡 Fortgeschritten

Erkenntnis, dass nicht bessere Modelle, sondern bessere Kontextbereitstellung den Unterschied macht. User wollen "one prompt to rule them all", aber in Wirklichkeit braucht es strukturierte Kontext-Inputs. Am besten mit: Fooocus_Nex (neue UI)

Philosophie: "Die Modelle sind bereits gut. Was fehlt, ist der Kontext,
den der Benutzer dem Modell bereitstellt."

Ansatz: Statt nach dem "einen silbernen Bullet-Prompt" zu suchen,
wird dem Modell durch strukturierten Kontext geholfen, die Vision
des Nutzers zu reproduzieren.

Midjourney v8.1 Retrofuturistischer Winter-Olympic Prompt

🟡 Fortgeschritten

Der `--sref`-Parameter zieht aus 1990er-Jahre Line-Art-Comics und verbindet Retrofuturismus mit Midjourneys v8.1-Stärken bei künstlerischen Stilen. Die Kombination `--raw` + hoher Stylize-Wert erzeugt einen einzigartigen Look zwischen Sci-Fi und handgezeichnetem Comic. 229 Upvotes zeigen die starke Community-Resonanz. Am besten mit: Midjourney v8.1

Offworld retrofuturist winter olympics, figure skating --ar 5:6 --raw --sref 2659073960 --stylize 200 --hd --v 8.1

Flux Klein 9B — LLM-erweiterter Kompositionsprompt mit emotionaler Struktur

🟡 Fortgeschritten

AI Local Image Generation" — Fotograf-in-Rahmen mit dramatischem Split LLM-erweiterte Prompts mit emotionaler Struktur (🔹-Marker, kinematografische Beschreibungen, `chiaroscuro`-Attributen) liefern deutlich komplexere Kompositionen. Die Emoji-Marker (🔹) helfen dem Modell, visuelle Abschnitte zu trennen. Der Prompt zeigt, dass Flux Klein 9B ohne zusätzliche LoRAs hochkomplexe Kompositionen mit Textrendering erzeugt. Am besten mit: Flux 2 Klein 9B, Ernie Image Turbo, Z-Image Turbo

A professionally composed, dramatic wide-angle shot of a framed photograph
hung on a warm, cozy wall inside a sunlit living room. The scene is captured
from a dynamic, slightly elevated angle, emphasizing depth and atmospheric
tension with rich lighting and subtle shadows.

The frame itself is elegant yet worn — vintage wood with subtle fading at
the edges — and it houses a breathtaking multi-stage landscape within:

A majestic river flows with three distinct, fluid currents: one molten gold,
one deep magenta, and one shimmering amber, all perfectly aligned and flowing
in mesmerizing harmony along the river's natural curves.

The water reflects the sky and the surrounding mountains, which rise softly
with fluffy, cottony clouds, radiating a sense of generosity and quiet peace.

Floating gently above the river and along the edges of the scene are birds
with open, majestic wings — some within the frame, others gracefully drifting
just beyond it — their presence adding warmth, movement, and a sense of life.

Centered at the bottom of the inner image, the text "AI Local Image
Generation 0182" is delicately decorated — in a hand-crafted, flowing script
with soft gradients and subtle metallic glints — blending seamlessly into
the scene.

Suddenly, the entire photo is split down the center by a deep, jagged tear —
a dramatic, almost cinematic fracture that reveals two distinct emotional halves:

🔹 Left side (grayscale, faded):
A cracked, weathered split reveals a damaged, desaturated world.
The text "OLD MEMORIES" appears distorted and scattered, smeared like ink
on old paper, with tiny sparkles of light (gold and silver) scattered across
it — as if memories are fading but still glowing.
Around the edges, delicate petals drift in slow motion — in muted tones —
forming a soft, quiet halo of melancholy.

🔹 Right side (full color, vibrant):
Bright, warm colors dominate — golden light floods the scene.
The text "HAPPY" appears cleanly, in radiant, sparkling font — glowing
with soft energy, like sunlight breaking through clouds.
Petals float freely in vibrant hues — red, pink, gold — swirling around
the boundaries of both splits, creating a sense of joy and renewal.

The entire composition is rendered with professional cinematic tone — dramatic
chiaroscuro lighting, rich textures, and emotional contrast. The cozy home
environment is subtly visible through the window behind the frame, with
sunlight spilling across the floor and soft shadows on the wall.

CRT-Terminal-Animation LoRA für LTX Video 2.3

🟡 Fortgeschritten

Bisher konnte kein Video-Generations-Modell einen authentischen CRT-Terminal-Look erzeugen. Diese LoRA wurde mit nur 20 Clips trainiert, liefert aber überzeugende Phosphor-Scanline-Effekte. Der `linear_quadratic` Scheduler wurde als äquivalent zu den offiziellen ManualSigmas entdeckt und ermöglicht einen sauberen Workflow ohne hartcodierte Sigma-Werte. Am besten mit: LTX Video 2.3 + ComfyUI

# LoRA: huggingface.co/lovis93/crt-animation-terminal-ltx-2.3-lora
# Prompt-Beispiel:
CRT terminal animation, green phosphor text on black screen, scanlines, flicker, retro computing

# Workflow:
1. LTX-Video 2.3 Modell laden
2. CRT Animation LoRA anwenden (Gewicht: 0.8–1.0)
3. linear_quadratic Scheduler mit 8 Steps verwenden
4. Optional: LTXVLatentUpsampler für Upscaling

Nano Banana — Galerie-Interior (Trending auf PromptHero)

🟡 Fortgeschritten

Nano Banana-2 ist das aktuell heißeste Modell auf PromptHero (Trending #1). Der Prompt nutzt präzise Fotografie-Parameter (Brennweite, Blende, Lichtsituation) für hyperrealistische Innenarchitektur-Ergebnisse. Das Modell reagiert außergewöhnlich gut auf Kamera-und Lichtspezifikationen. Am besten mit: Nano Banana (nano-banana-2)

contemporary art gallery interior, minimal museum space, polished concrete floor, soft neutral walls, dramatic natural light from skylight, museum-grade lighting, clean architectural lines, empty gallery awaiting exhibition, wide-angle architectural photography, 35mm lens, f/8, golden hour

Multi-Modell-Vergleich mit LLM-Prompt-Rewriting via Midjourney

🟡 Fortgeschritten

Der Ansatz nutet Midjourneys überlegene visuelle Kreativität als Referenz und überträgt den Stil via LLM-Prompt-Rewriting auf Open-Source-Modelle. Besonders Chroma V41 Low Step und Klein 9b Turbo zeigen starke Ergebnisse mit LoRA-Unterstützung. Am besten mit: Midjourney v8.1 → LLM-Rewriting → Zielmodell (Chroma, Klein, Z Image, Ernie)

1. Bild in Midjourney v8.1 erstellen (original Prompt)
2. Den Midjourney-Prompt von einem LLM umschreiben lassen, um den visuellen Stil auf Open-Source-Modelle zu übertragen
3. Vergleiche: Chroma V41/V48, Zeta Chroma Alpha, Ernie Turbo, Klein 9b Turbo, Z Image Turbo
4. Jeweils mit und ohne LoRA testen

Z Image Turbo — Leica-Fotografie-Ästhetik

🟡 Fortgeschritten

Z Image Turbo reagiert extrem präzise auf Kamera- und Objektiv-Spezifikationen. Der Prompt kombiniert echte Hardware-Angaben (Leica M11, Summilux 50mm f/1.4) mit Belichtungsparametern und Farbgrading, was zu verblüffend authentischen Foto-Ergebnissen führt. „ISO 64" signalisiert sauberes Bild mit minimalem Noise. Am besten mit: Z Image Turbo

raw photo captured with Leica M11, wide open aperture, low key lighting, high contrast, ISO 64, subtle film grain, shot on 50mm f/1.4 Summilux, shallow depth of field, moody street photography aesthetic, natural skin tones, cinematic color grading

Anima Qwen-Image Workflow — Narratives Cat-Design

🟡 Fortgeschritten

Demonstriert den aufkommenden Trend, Qwen-basierte CLIP-Modelle als Text-Encoder in ComfyUI-Workflows einzusetzen — eine Architektur, die in den letzten Wochen stark an Popularität gewinnt. Die Mischung aus Qualitäts-Tags (`score_9`, `absurdres`) mit narrativen Elementen (Gedankenblase, emotionale Beschreibung) plus Artist-Referenz-Tags produziert außergewöhnlich ausdrucksstarke Ergebnisse. Am besten mit: Anima Preview 3 Base (Checkpoint) + Qwen 3 0.6B CLIP + Qwen Image VAE

Positive Prompt:
year_2025, newest, score_9, score_8, best_quality, masterpiece, highres, absurdres

len \(tsukihime\), bow, white bow, black cat, cat, feral cat, sitting, she is eating cucumber

in thought bubble there are her thoughts "it is so bad... but it was free..."

Cat is crying but eating cucumber
[@karasu raven | realistic | @kaamin \(mariarose753\)]
4toes, digitigrade, quadruped

Negative Prompt:
worst quality, low quality, score_1, score_2, score_3, blurry, jpeg artifacts, monochrome, erotic, questionable, anthro, explicit

ChatGPT Image v1 — Editorial Fashion JSON-Prompt

🟡 Fortgeschritten

ChatGPT Image v1 verarbeitet strukturierte JSON-Prompts signifikant besser als Freitext. Der JSON-Ansatz zwingt das Modell, jeden Aspekt (Szene, Stil, Licht, Komposition) isoliert zu verarbeiten — das Ergebnis ist deutlich kohärenter und kontrollierter. Diese Technik wurde auf X/Twitter als „AI Prompt Cheat Sheet 2026" mit der Formel Role+Task+Context+Format+Tone verbreitet. Am besten mit: ChatGPT Image v1

{
"scene": {
"type": "editorial fashion surrealism",
"location": "barren white desert with geometric shadow castings",
"subject": "model in avant-garde oversized structural garment, monochromatic palette",
"composition": "rule of thirds, negative space dominance, leading lines from dunes",
"lighting": "harsh overhead sunlight, deep contrast shadows, high-key background"
},
"style": {
"reference": "Vogue Italia editorial, Tim Walker aesthetics",
"color_grading": "desaturated with accent warm tones",
"mood": "ethereal, unsettling beauty"
}
}

„Dancing Raindrops" — Transluzente Ballett-Figuren im Regen

🟡 Fortgeschritten

Der Prompt meistert drei Schlüsselkonzepte: (1) Material-Transparenz als Gestaltungselement, (2) Vordergrund/Hintergrund-Trennung durch bewusste Unschärfe-Komposition, (3) Atmosphärische Lichtführung durch reflektierende Oberflächen. Keine künstlichen Qualitäts-Tags nötig — die Qualität kommt aus der präzisen räumlichen und atmosphärischen Beschreibung. Am besten mit: Midjourney v6.1+

multiple translucent, water like figures in various ballet poses stand on a rain soaked street. the street surface is dark and reflective, with visible raindrops and splashes around the figures. the background shows out of focus car headlights and streetlights casting soft glows, along with the vague outlines of urban buildings. the sky is dark and obscured by rain. the composition places the figures prominently in the foreground and midground, leading the eye towards the blurry background.

Zelda / Princess-Illustrious Charakter-Design

🟡 Fortgeschritten

Veranschaulicht die Best-Practice-Struktur für Illustrious-basierte Charaktergenerierung: Qualitäts-Tags am Anfang, gefolgt von Posen/Kamerawinkel, dann Attribut-Listen. Der gezielte Einsatz von Kommas (keine überflüssigen Konnektoren) und die Vermeidung von widersprüchlichen Tags machen diesen Prompt besonders effektiv. Am besten mit: Illustrious SDXL 1.6.0 + ZeldaRig-IL LoRA

Positive Prompt:
<lora:ZeldaRig-IL:1>, z3ld4, masterwork, masterpiece, highres, very aesthetic, absurdres, 8k, uhd, best quality, amazing quality, perfect composition, intricate details, (absolutely gorgeous), dynamic angle, cowboy shot, 1girl, solo, looking at viewer, smile, short hair, blue eyes, simple background, shirt, blonde hair, long sleeves, hair ornament, gloves, closed mouth, medium breasts, standing, green eyes, braid, cowboy shot, black gloves, pointy ears, pants, hairclip, belt, fingerless gloves, parted bangs, gradient background, v over eye, princess zelda

Negative Prompt:
(bad fingers), ((border)), black border, outside border, bad anatomy, white border, lowres, worst quality, text, signature, watermark, censored, bad quality, english text, korean text

Midjourney v7.1: „Neon Ukiyo-e Cinematic"

🟡 Fortgeschritten

Cyberpunk-Traditionsmischung mit volumetrischer Beleuchtung v7.1's aktualisierter Attention-Mechanismus verbessert Cross-Cultural-Aesthetic-Blending drastisch. `--style raw` mit `--s 400` verhindert Über-Stilisierung; `--chaos 15` für organische Variation in Regen-Reflexionen. Am besten mit: Midjourney v7.1

cinematic wide shot of a futuristic Kyoto intersection at dusk, neon rain reflections, hyper-detailed ukiyo-e woodblock texture fusion, volumetric fog, shot on ARRI Alexa 65 --v 7.1 --ar 16:9 --style raw --s 400 --chaos 15

Flux.1 [Pro]: „Biolumineszent Macro"

🟡 Fortgeschritten

Makro-Photorealismus mit komplexer Lichtsituation Flux' Transformer-Diffusion-Architektur übertrifft bei Spatial-Nesting-Aufgaben („inside a hollowed-out"). Niedrige CFG (3.5) erhält Photorealismus und verhindert Color-Clipping in biolumineszenten Highlights. Am besten mit: Flux.1 [Pro] (v1.2 Scheduler)

macro DSLR photograph of a cozy reading nook inside a hollowed-out ancient redwood tree, warm bioluminescent fungi lighting, shallow depth of field, 85mm lens, photorealistic, natural wood grain detail, soft morning mist, high fidelity textures

SD3.5 Turbo / DALL-E 3: „Isometric Miniature"

🟡 Fortgeschritten

Isometrische Miniaturwelten mit Turbo-Effizienz SD3.5's verfeinertes Spatial-Reasoning lockt strikte geometrische Constraints. Nur 20 Steps dank Turbo-Distillation ohne Qualitätsverlust. DALL-E 3 nutzt denselben Vorteil durch den verbesserten NLP-Spatial-Parser. Am besten mit: SD3.5 Turbo oder DALL-E 3

isometric 3D render of a miniature cyberpunk coffee shop inside a transparent glass snow globe, macro photography perspective, soft studio lighting, claymation aesthetic, octane render, 4k, highly detailed, clean background

Passende KI-Tools für Bild-Prompts

Midjourney (v7)

Beste künstlerische Qualität, fotorealistisch

Midjourney

DALL-E 3 (3)

Bestes Prompt-Verständnis, ChatGPT-integriert

OpenAI

FLUX.1 (1)

Open-Source, exzellente Text-im-Bild Fähigkeit

BlackForest

Stable Diffusion (SDXL / SD3)

Maximal anpassbar, lokal betreibbar

Stability AI

Ideogram

Beste Typografie im Bild

Ideogram

Alle Tools (Vergleich)

Zeigt Prompt-Varianten für alle verfügbaren Tools

Weiterlesen