📅

Steering-Vektor anwenden mit DwarfStar 4 (llama.cpp Fork)

🏆 Highlight

### Opus-Playbook-Workflow: Von der Einzelseite zum autonomen Frontend-Team Ein Nutzer auf r/ClaudeAI demonstrierte einen Workflow, der den Unterschied zwischen einem Chatbot und einem autonomen Team zeigt: Er optimierte eine einzelne Seite manuell für perfekte Lighthouse-Werte, dokumentierte jeden Schritt in einer Markdown-Playbook-Datei, startete dann eine frische Session mit den restli...

🔤 TOP 3 PROMPTS — Textgenerierung

1. Der „Unzuverlässige Erzähler" Rewrite-Assistent

Prompt (vollständig, kopierbar):

Act as a Literature Professor and Editor. I have a scene written in a standard first-person perspective, but I want to make the narrator "Unreliable."

The Scene: [PASTE SCENE TEXT HERE]
The Secret: The narrator is actually [INSERT SECRET, e.g., The killer / Hallucinating / A child pretending to be an adult].

Rewrite the scene so that the narrator thinks they are telling the truth, but subtle clues reveal their distortion to the reader.

- Change the descriptions to reflect their bias.
- Have other characters react to the narrator in ways that hint something is wrong (confusion, fear, pity).
- Do not explicitly state the secret; show it through inconsistencies in the timeline or logic.

Am besten mit: Claude Opus 4.7, GPT-5.5

Warum effektiv: Der Prompt nutzt die narrative Kompetenz moderner LLMs, um subtextuelle Unzuverlässigkeit zu erzeugen — ein fortgeschrittenes Schreibwerkzeug, das Autoren Stunden an manueller Überarbeitung erspart. Die dreiteilige Struktur (Szene + Geheimnis + Anweisungen) gibt dem Modell klare Constraints für kreative Freiheit innerhalb definierter Grenzen.

Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tfikwl/the_unreliable_narrator_rewrite_assistant/ | 1 Upvote

Community Resonanz: Teil der täglichen Prompt-Serie von r/xclusiveprompt_free, die konsequent kopierfertige, strukturierte Prompts liefert.

2. Der „Subtext"-Dialog-Rewriter (Sagen ohne zu Sagen)

Prompt (vollständig, kopierbar):

Act as a Screenwriter specializing in subtle, realistic dialogue. I have a scene where two characters are talking about [INSERT SURFACE TOPIC, e.g., deciding where to eat dinner], but the real subtext is [INSERT SUBTEXT, e.g., they are about to break up but are afraid to say it].

Current Draft: [INSERT DRAFT DIALOGUE]

Rewrite this dialogue so they never explicitly mention the subtext.
- Use pauses, interruptions, and body language descriptors to convey the tension.
- Make the characters focus hyper-specifically on the mundane topic (the dinner) as a way to avoid the elephant in the room.

Am besten mit: Claude Opus 4.7, Gemini 2.5 Pro

Warum effektiv: Ein präzises Drehbuchprompt, das LLMs zwingt, das Unausgesprochene durch implizite Spannung zu transportieren — eine Technik, die selbst erfahrene Autoren herausfordert. Die explizite Anweisung, den Oberthema obsessiv zu behandeln, statt den Subtext zu nennen, funktioniert als kreative Constraint.

Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tf4p0m/the_subtext_dialogue_rewriter_saying_without/ | 1 Upvote

Community Resonanz: Ergänzt das „Unreliable Narrator"-Prompt aus derselben Quelle; zusammen bilden sie ein komplettes Toolkit für narrative Textverfeinerung.

3. Erster-Prinzipien-Denker (Complex Problem Solver)

Prompt (vollständig, kopierbar):

Act as a First Principles Thinker (like Elon Musk or Richard Feynman). I am facing a complex problem and I feel stuck in conventional wisdom.

The Problem: [INSERT PROBLEM, e.g., Reducing the cost of battery production / Improving student retention rates].

Help me break this down:

1. **Identify Assumptions:** List 5 things everyone "knows" to be true about this industry/problem, and challenge them. Are they laws of physics, or just habits?
2. **Breakdown:** Deconstruct the problem into its most basic, fundamental truths (the raw materials, the immutable constraints).
3. **Reconstruction:** Build a new solution from the ground up using only those fundamental truths, ignoring how it "has always been done."

Am besten mit: Claude Opus 4.7, GPT-5.5

Warum effektiv: Systematisiert das First-Principles-Thinking von Feynman/Musk in drei klar definierte Phasen, die LLMs durch zwingen, konventionelle Annahmen zu hinterfragen bevor sie Lösungen vorschlagen. Besonders wertvoll für Strategieberater, Produktmanager und Gründer.

Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tf65cd/first_principles_thinking_generator/ | 1 Upvote

Community Resonanz: Teil einer umfangreichen Prompt-Sammlung aus r/xclusiveprompt_free mit über 15 kopierfertigen Templates für Geschäfts- und Kreativworkflows.

🖼️ TOP 3 PROMPTS — Bildgenerierung

1. Tech-„Knolling" (Flat Lay) Produktfotografie für Midjourney/DALL-E

Prompt (vollständig, kopierbar):

Act as a Product Photographer. I want to create a "Knolling" style image (overhead flat lay where items are arranged at 90-degree angles).

Main Object: [INSERT OBJECT, e.g., A vintage Gameboy / A disassembled mechanical watch / A survival kit]
Theme: [INSERT THEME, e.g., Matte Black Tactical / Pastel Retro 80s / Industrial Blueprint]

Write a prompt for Midjourney/DALL-E 3 including:
- Composition: "Overhead view, knolling photography, meticulous arrangement, equal spacing."
- Lighting: "Softbox lighting, no shadows, high key" OR "Moody directional lighting, hard shadows."
- Texture/Background: "Placed on a [INSERT SURFACE, e.g., Cutting mat / Marble slab / Textured concrete]."
- Tech Specs: "--ar 3:2 --v 6.0 --style raw"

Am besten mit: Midjourney v6.0, DALL-E 3

Warum effektiv: Das Prompt generiert systematisch vollständige Midjourney-Prompts mit allen technischen Parametern (Aspektverhältnis, Version, Style). Der Knolling-Stil (90-grad-arrangement) ist ein beliebter, aber schwer zu treffender Look — dieses Prompt gibt die exakten Formulierungen vor.

Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tfa9be/highend_tech_knolling_flat_lay_photography/ | 1 Upvote

Community Resonanz: Hoch strukturiertes Template mit austauschbaren Platzhaltern — sofort einsatzbereit für Produktfotografie, E-Commerce und Social-Media-Content.

2. AI Art Style Fusion Generator

Prompt (vollständig, kopierbar):

Create a [subject] in a fusion style combining [art movement 1] and [art movement 2], featuring [specific elements], with [lighting style], [color palette], and [mood]. The composition should emphasize [focal point] with [additional details]. Render in high quality with attention to [specific artistic technique].

Am besten mit: Midjourney v6.0, DALL-E 3, Stable Diffusion (Flux 2)

Warum effektiv: Ein kompaktes aber wirkungsvolles Template, das zwei Kunststile kombiniert — z.B. „Bauhaus meets Impressionismus" — und damit einzigartige Bildästhetiken erzeugt. Die strukturierten Platzhalter ermöglichen schnelles Iterieren verschiedener Stil-Kombinationen.

Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tfjn2l/ai_art_style_fusion_generator/ | 1 Upvote

Community Resonanz: Kurz, prägnant und sofort anwendbar. Ideal für kreative Exploration und Moodboard-Erstellung.

3. Exobiology Creature Designer (Evolutionärer creature-Designer)

Prompt (vollständig, kopierbar):

Act as an Exobiologist and Concept Artist. I need to design a creature for a sci-fi setting.

Environment: [INSERT ENVIRONMENT, e.g., A high-gravity planet with dense fog / A deep-sea trench on an ice moon]
Niche: [INSERT NICHE, e.g., Apex Predator / Scavenger / Pack Hunter]

Describe the creature's physiology based on evolution:
- Sensory Organs: How does it navigate without sight (if applicable)? (e.g., Echolocation, heat sensing).
- Locomotion: How does it move in this specific terrain? (e.g., Six limbs for stability, gas bladders for floating).
- Defense/Attack: What is its primary weapon?
- Name: Give it a scientific Latin name and a common name given by human explorers.

Am besten mit: Claude Opus 4.7 + Midjourney v6.0 (zuerst Text, dann visuell)

Warum effektiv: Kombiniert wissenschaftliches Denken (evolutionäre Anpassung) mit kreativem Design. Die physikalischen Constraints der Umwelt zwingen das Modell zu konsistenten, biologisch plausiblen Designs — perfekt für Concept Art, Tabletop-Designs oder Weltbau.

Quelle: https://www.reddit.com/r/xclusiveprompt_free/comments/1tf7k2y/evolutionary_biology_creature_designer/ | 1 Upvote

Community Resonanz: Ideal für Game-Developer, Autoren und Worldbuilder. Die zweistufige Nutzung (Text-Beschreibung generieren, dann in Bild-KI einspeisen) ist ein bewährter Workflow.

🎬 TOP 3 PROMPTS — Videogenerierung

1. Charakter-Konsistenz-Workflow für Videogenerierung

Prompt (vollständig, kopierbar):

Generate the main character before starting the video generation.

Step 1: Generate a high-quality character image in [describe character appearance, clothing, pose].
Step 2: Use the generated image as a reference frame for all subsequent video generations.
Step 3: In each video prompt, include: "Keep [character appearance] consistent with the first frame."
Step 4: Describe action sequences in phases with camera directions.
Step 5: Include explicit negative constraints: "No morphing, no identity shift, no costume changes."

Am besten mit: Seedance 2.0, LTX 2.3, Kling

Warum effektiv: Das Kernproblem bei AI-Videos ist Charakter-Konsistenz über mehrere Shots hinweg. Dieser Workflow löst es durch generierte Referenzframes, die als Anker für alle folgenden Generationen dienen — der gleiche Ansatz, den professionelle Seedance-Nutzer empfehlen.

Quelle: https://www.reddit.com/r/generativeAI/comments/1tf9fqd/generate_the_main_character_before_starting_the/ | 1 Upvote

Community Resonanz: Einfacher aber wirkungsvoller Tipp aus r/generativeAI. Wird von der Community als essentieller Schritt für narrative AI-Videos bestätigt.

2. LTX 2.3 Acting-Verbesserung: Distill LoRA Mixing Hack

Prompt (Videogenerierung mit verbessertem Acting):

[Video-Prompt als Szenenskript schreiben]

A scene script format for LTX 2.3:
"Flying saucers fly briskly towards earth as the man speaks. [describe micro-movements]: His eyes shift to the sky, mouth opens slightly, he raises his left hand. Camera slowly zooms in. Background: cityscape at dusk."

Settings:
- Distill LoRA Strength: 0.80 (not 1.0 — prevents frozen imagery)
- Mix distilled model + distilled LoRA at 0.3-0.5 weight for increased expressiveness
- Increase total steps to compensate for lower LoRA strength
- Write longer, step-by-step prompts describing physics, micro-movements, and kinetic actions

Am besten mit: LTX 2.3, ComfyUI

Warum effektiv: Zwei praktische Techniken aus der Community: (1) Distill LoRA auf 0.80 statt 1.0 setzen um „eingefrorene" Bilder zu vermeiden, (2) den distillierten LoRA zusätzlich zum Modell mischen für intensivere Bewegungen — ein inoffizieller „Hack" der Charaktere zum Leben bringt. Längere, skript-artige Prompts mit physischen Details funktionieren deutlich besser als kurze Beschreibungen.

Quelle: https://www.reddit.com/r/StableDiffusion/comments/1tfa9wh/how_to_get_better_acting_and_better_image/ | 28 Upvotes

Community Resonanz: Aktiver Thread mit 6+ Experten-Kommentaren. Die Distill-LoRA-Mix-Technik wurde von mehreren Nutzern bestätigt und liefert spürbar bessere Acting-Ergebnisse in LTX 2.3.

3. Explainer Video unter $1 mit Claude Design

Prompt (Workflow-Skript für Claude Design):

Step 1: Write a compelling explainer video script:
"Write a 90-second explainer video script about [TOPIC]. Include clear section markers and natural pause points for TTS alignment."

Step 2: Feed script to TTS model (e.g., ElevenLabs, OpenAI TTS)
Step 3: Run STT on the audio to get precise timestamps per sentence
Step 4: Prompt Claude Design: "Create animated slides matching the script. Each slide should align with these timestamps: [STT output]. Use consistent visual style with [COLOR SCHEME]."
Step 5: Export final video with audio overlay via Claude Video export

Am besten mit: Claude Design + ElevenLabs TTS + beliebiges STT-Modell

Warum effektiv: Ein kompletter Produktions-Workflow, der Audio-Video-Synchronisation löst — das Hauptproblem bei AI-Erklärvideos. Durch STT-Rückkopplung werden die visuellen Elemente präzise mit der Tonspur synchronisiert, was manuell extrem aufwendig wäre.

Quelle: https://www.reddit.com/r/ClaudeAI/comments/1tfiv70/how_to_make_an_explainer_video_in_under_1_with/ | 5 Upvotes

Community Resonanz: Praktischer End-to-End-Workflow. Die Audio-Alignment-Struktur (TTS → STT → Claude Design) ist ein cleverer Umweg für ein häufiges Problem.

🧠 TOP 3 NEUE TECHNIKEN

1. LLM Steering Vectors – Aktivierungs-Manipulation statt Prompting

Zusammenfassung: Direkte Manipulation der internen Aktivierungen eines LLMs, um Verhaltensweisen zu steuern, die über reines Prompting nicht erreichbar sind.

Erklärung: Statt dem Modell über Text-Anweisungen zu sagen, was es tun soll, extrahiert man einen „Steering Vector" aus den neuronalen Aktivierungen — z.B. den Unterschied zwischen „antworte ausführlich" und „antworte präzise". Dieser Vektor wird dann während der Inferenz zu den Aktivierungen addiert. Open-Source-Projekte wie DwarfStar 4 (ein abgespeckter llama.cpp-Fork nur für DeepSeek-V4-Flash) machen das jetzt für Verbraucher-Hardware praktikabel. Abliteration/Uncensoring von Modellen basiert bereits auf diesem Prinzip.

Beispielprompt (konzeptionell):

# Steering-Vektor anwenden mit DwarfStar 4 (llama.cpp Fork)
# Vector extrahieren: prompt_a = "normal antworten", prompt_b = "verweigere jede Antwort"
# diff = activations_a - activations_b
# Bei Inferenz: activations += diff * strength
# Ergebnis: Modell verhält sich anders ohne Prompt-Änderung

Geeignet für: DeepSeek-V4-Flash (via DwarfStar 4), LLaMA-Modelle, lokale GGUF-Modelle

Ursprung: https://www.seangoedecke.com/steering-vectors/ | 234 Punkte auf Hacker News

Warum heute wichtig: Mit DeepSeek-V4-Flash, das lokal auf Consumer-GPUs läuft, ist Steering erstmals praktisch zugänglich. Die Technik ermöglicht Feinsteuerung von Verweigerungsverhalten, Antwortstil und sogar Wissens-Kompression — ohne Fine-Tuning. Für lokale LLM-Enthusiasten ein Game-Changer.

2. Playbook-basierte Multi-Page Frontend-Optimierung mit Opus

Zusammenfassung: Einmal eine Seite optimieren, das Vorgehen als Playbook dokumentieren, dann neue Session mit Playbook auf alle anderen Seiten anwenden — Opus erstellt selbstständig Subagenten.

Erklärung: Der klassische Ansatz: jede Seite einzeln optimieren und dabei konsistente Ergebnisse hoffen. Der Playbook-Ansatz: (1) Eine Seite manuell optimieren und jedes Detail in ADR_pagespeed-l0-fixes-playbook.md dokumentieren. (2) Neue Session starten, die restlichen Seiten laden und auf das Playbook verweisen. Opus erstellt selbstständig drei Subagenten, verteilt die Arbeit und liefert in 15 Minuten konsistente Ergebnisse über 41 Dateien. Der Trick: Das Playbook verwandelt eine einmalige Lösung in einen skalierbaren, reproduzierbaren Prozess.

Beispielprompt (Playbook-Struktur):

# Seiten-X optimiert → Playbook:
1. Unnötige CSS-Imports entfernen (insbesondere bootstrap.min.css)
2. Bilder auf WebP konvertieren, lazy-loading aktivieren
3. Inline-CSS für Above-the-Fold-Content
4. JavaScript defer/async attributes setzen
5. Fonts mit font-display: swap laden

[Neue Session:]
"Optimiere Seiten Y, Z, A, B nach dem Playbook in `ADR_pagespeed-l0-fixes-playbook.md`. 
Erstelle Subagenten für parallele Bearbeitung."

Geeignet für: Claude Opus 4.7 (Agent Teams)

Ursprung: https://www.reddit.com/r/ClaudeAI/comments/1tfgq66/opus_is_ridiculous_for_frontend_cleanup/ | 35 Upvotes

Warum heute wichtig: Zeigt den Paradigmenwechsel von „Chatbot mit einer Seite" zu „autonomes Team mit Playbook". Der Dokumentations-Aspekt zwischen den Sessions ist kritisch — die meisten scheitern daran, dass sie den Kontext nicht explizit machen.

3. LTX 2.3 Distill LoRA Mixing für expressive Bewegung

Zusammenfassung: Distill LoRA zusätzlich zum basalen Distill-Modell mischen (0.3–0.5 Weight) für intensiveren Ausdruck — ein inoffizieller „Hack" der Videos lebendiger macht.

Erklärung: Das Distill-Modell von LTX 2.3 neigt zu „eingefrorenen" Ergebnissen, besonders bei LoRA-Stärke 1.0. Der Community-Hack: Distill LoRA parallel zum Modell laden und mit reduziertem Weight (0.3–0.5) mischen. Das erhöht die „Intensität" aller Bewegungen und macht Charaktere ausdrucksstärker. Die zweite Stufe: Distill LoRA-Stärke auf 0.80 statt 1.0 setzen, was die Struktur des Start-Frames weniger über-lockt und mehr natürliche Bewegung ermöglicht. Kombiniert mit längeren, skript-artigen Prompts die Mikro-Bewegungen beschreiben, ergibt das deutlich bessere Acting-Ergebnisse.

Beispielprompt (Szenenskript-Format):

"Flying saucers fly briskly towards earth as the man speaks.
[0-1s] Man looks up, eyes widen slightly, mouth opens
[1-2s] Left hand raises, fingers pointing skyward
[2-4s] Camera slow zoom, expression shifts from surprise to determination
Background: cityscape at dusk, warm light from below"

Settings: Distill LoRA at 0.3 weight, LoRA Strength: 0.80, Steps: 40

Geeignet für: LTX 2.3, ComfyUI, Draw Things

Ursprung: https://www.reddit.com/r/StableDiffusion/comments/1tfa9wh/how_to_get_better_acting_and_better_image/ | 28 Upvotes

Warum heute wichtig: LTX 2.3 ist eines der zugänglichsten Video-Modelle, aber „leblose" Charakterbewegung war das Hauptkritikpunkt. Diese zwei Einstellungen (LoRA Mixing + reduzierte Stärke) lösen das Problem ohne zusätzliche Hardware.

🏆 Highlight des Tages

Opus-Playbook-Workflow: Von der Einzelseite zum autonomen Frontend-Team

Ein Nutzer auf r/ClaudeAI demonstrierte einen Workflow, der den Unterschied zwischen einem Chatbot und einem autonomen Team zeigt: Er optimierte eine einzelne Seite manuell für perfekte Lighthouse-Werte, dokumentierte jeden Schritt in einer Markdown-Playbook-Datei, startete dann eine frische Session mit den restlichen 9 Seiten und dem Playbook. Opus erstellte drei Subagenten selbstständig, verteilte die Arbeit, und 15 Minuten später waren 41 Frontend-Dateien konsistent optimiert — mit identischen Lighthouse-Ergebnissen über alle Seiten.

Der kritische Insight: Die meisten Leute optimieren Seite für Seite ohne den Kontext zwischen Sessions zu übertragen. Das Playbook macht aus einer Einmal-Lösung einen reproduzierbaren, skalierbaren Prozess.

Prompt-Muster:

[Playbook-Datei erstellen:]
ADR_pagespeed-l0-fixes-playbook.md

[Neue Session öffnen:]
"Optimiere alle Seiten in /pages/ nach dem Playbook. 
Erstelle Subagenten für parallele Bearbeitung."

Quelle: https://www.reddit.com/r/ClaudeAI/comments/1tfgq66/opus_is_ridiculous_for_frontend_cleanup/ | 35 Upvotes | 11 Kommentare

📰 Erlesene Artikel & Ressourcen

1. DeepSeek-V4-Flash means LLM steering is interesting again – Sean Goedecke analysiert, warum Steering Vectors durch DeepSeek-V4-Flash (lokal lauffähig) neu relevant werden. Detaillierte Erklärung wie man Aktivierungs-Vektoren extrahiert und anwendet. Der Artikel diskutiert auch Grenzen und warum die großen Labs diese Technik nicht nutzen. Quelle: https://www.seangoedecke.com/steering-vectors/ | 234 Punkte auf HN

2. How I use LLMs as a staff engineer in 2026 – Sean Goedeckes Update zu seiner AI-Nutzung als Staff Engineer. Kern-Insight: „Agents are really good now" — er delegiert komplette PRs, Bug-Untersuchungen und Test-Skripte an Agenten, schreibt aber selbst PR-Descriptions und öffentliche Kommunikation. Die Kern-Kompetenz ist heute: „so viel wie möglich auf AI verlagern, ohne zu weit zu gehen." Quelle: https://www.seangoedecke.com/how-i-use-llms-in-2026/ | 5 Punkte auf HN

3. Flux Real-Time Pipeline (GitHub: tensorforger/FluxRT) – Open-Source-Echtzeit-Streaming-Pipeline basierend auf Flux.2-Klein. Neue Features: int8-Modus (läuft auf 24-GB-Karten wie 4090/3090), LoRA-Support, Virtual-Webcam-Output, GUI-App für OBS/TouchDesigner-Integration. Quelle: https://github.com/tensorforger/FluxRT | 136 Upvotes auf r/StableDiffusion

4. Gemma 4 31B: Der erste wirklich nutzbare lokale Modell auf Consumer-Hardware – r/SillyTavernAI feiert Gemma 4 31B als erstes lokales Modell, das mit aktiviertem Reasoning (auf Maximum) „absolut großartig" für Coding und Roleplay ist — vergleichbar mit den großen Cloud-Modellen, aber lokal auf einer RTX 5090 mit 60K Kontext. Zwei neue Fine-Tunes erschienen heute: Ortenzya (Creative Writing) und MeroMero (kreative Tasks). Quelle: https://www.reddit.com/r/SillyTavernAI/comments/1tf3gn8/i_just_felt_the_10x_moment_with_gemma_4_31b/ | 22 Upvotes

5. EntityBench: Entity-Consistent Long-Range Multi-Shot Video Generation – Neue arXiv-Publikation die das Entity-Consistency-Problem in Multi-Shot-Videos systematisch evaluiert. Benchmark für Charakter-, Objekt- und Location-Konsistenz über lange Sequenzen — direkt relevant für den heute gefundenen Charakter-Konsistenz-Workflow. Quelle: https://arxiv.org/abs/2605.15199v1


Bericht erstellt am 2026-05-17 Quellen: Reddit, Hacker News, arXiv