Posta era (och andras) AI-bilder här! (bilder och tips)

Ondsint roBot

Veteran
Joined
13 Aug 2023
Messages
95
Bli bättre på SDXL del: ...jag vet inte rikigt? Är någon intresserad av en guide egentligen?

Clip_skip

Vad är Clip? Clip, eller conditioning, är filtret som Stable Diffusion lägger på "startbilden", som består av brus, för att filtrera fram din bild. I SD 1.5 använder den 12 lager, i SDXL är det oklart, men kan sätta ner till -24 i ComfyUI. Varje lager har (mycket förenklat) sin egen uppgift. Ju färre lager man går igenom, ju mindre effekt har din promt. I de sista lagren läggs detaljer på.

Clip_skip låter dig skippa de sista lagren. Det innebär att du får en stil som påminner mindre om ett foto och mer om en illustration. Det första två lagren, vid -2 och -3 har stor effekt på resultatet. Därefter minskar effekten. Att använda -24 är chansartat. Ofta är bilden oanvändbar, men ibland kan det trilla ut en riktigt bra bild.

Om vill testa effekten, behåll samma seed. I Automatik1111 behöver man ändra från -1, i ComfyUI sätter man den till "fixed". I bilderna nedan har jag använt samma inställningar, seed och prompt, men clip_skip från -1 till -3. Notera den dramatiska skillnaden i detaljer och hud från -1 till -2.

Vill du ha realism sätt clip_skip till -1.
Vill du ha en målad bild sätt clip_skip till -2 eller -3.


Positiv prompt: enki bilal,philippe druillet,moebius inspired euro fantasy art, "a fierce warrior (woman:1.4) in battle worn plain armor in a fantasy city" the contrast in colors and textures should be distinct highly detailed,grainy texture,surreal, clean historic , dramatic lighting, sfw

Negativ prompt: minimalist,abstract,overly bright, helmet, man, nfsw, cleavage

Notera att min prompt vill ha "sfw" (Safe For Work), men inte "cleavage" och "nfsw" (Not Safe For Work). I clip_skip -1 så fungerar det. Med -2 och -3 tar den mindre hänsyn till min promt och det blir opraktiskt och dragigt för krigarna.

Det finns inget "bästa läge", allt beror på vilket resultat du vill ha. En del checkpoints vill ha -2 för bästa resultat, ofta om de siktar på en tecknad stil.

ComfyUI_01056_downsize.jpgComfyUI_01055_downsize.jpgComfyUI_01054_downsize.jpg
 

Mattias G

Veteran
Joined
30 Dec 2012
Messages
31
Location
Stockholm
Prompt: enki bilal,philippe druillet,moebius inspired euro fantasy art, "a warrior woman in armor leaning against a wall in a European fantasy city" the contrast in colors and textures should be distinct highly detailed,grainy texture,surreal, clean historic ,dramatic lighting

Negativ: minimalist,abstract,overly bright, helmet
Tänkte att det kanske kunde vara intressant att se samma prompt i Midjourney (inte för att jag på nåt sätt försöker argumentera för midjourney vs stable diffusion, jag har bara erfarenhet av den förra, och är inte så imponerad av förmågan att styra den).

mattiasgustavsson_enki_bilalphilippe_druilletmoebius_inspired_e_8b0d5720-1515-49a9-8224-57d75c...jpg
 

JohanL

Champion
Joined
23 Jan 2021
Messages
7,591
Tänkte att det kanske kunde vara intressant att se samma prompt i Midjourney (inte för att jag på nåt sätt försöker argumentera för midjourney vs stable diffusion, jag har bara erfarenhet av den förra, och är inte så imponerad av förmågan att styra den).

View attachment 13694
De här ser onekligen mycket mer ut som euro-seriekonst, och särskilt posen i fjärde bilden.
 

Ondsint roBot

Veteran
Joined
13 Aug 2023
Messages
95
Tänkte att det kanske kunde vara intressant att se samma prompt i Midjourney (inte för att jag på nåt sätt försöker argumentera för midjourney vs stable diffusion, jag har bara erfarenhet av den förra, och är inte så imponerad av förmågan att styra den).

View attachment 13694
Midjourney gör seriöst snygga bilder. Jag skulle inte spontant gissat att det skulle vara en krigare. Att lägga till "nsfw" och "cleavage" i den negativa delen gör henne kanske mer till krigare?

Man kan få ut bilder av samma kvalitet från MJ och SD, men SD kräver mer jobb. Det är som vanligt - vill man ha något med alla rattar och inställningar så blir det lite mer jobb att lära sig hur de fungerar.

På tal om bias, som diskuterats här. Det enklaste sättet att ändra hårfärgen på mina krigarbilder är inte att skriva "blonde" i prompten (även om det också fungerar) - det är att flytta "nsfw, cleavage" från den negativa till den postiva promten. Bimbon i opraktisk klädsel som dyker upp blir blond.
 

Mattias G

Veteran
Joined
30 Dec 2012
Messages
31
Location
Stockholm
Midjourney har en intressant tolkning av vad som räknas som "armor".
Den har också en intressant tolkning av vad "leaning against a wall" innebär :p

Utan att ha använt SD har jag ändå fått intrycket att det man skriver i prompten har större inverkan på bilden än vad samma ändring har i MJ (som känns lite som en slot machine).
 
Joined
8 Sep 2020
Messages
897
Location
Fruängen
Nu tigger jag hjälp av er som har AI appar och sånt igen ;)

Är det någon som har lust att generera en liten bild jag kan ha här på forumet? Lite trist med bara ett S på grön bakgrund.. ;)
 

Rickard

Urverk speldesign
Joined
15 Oct 2000
Messages
18,319
Location
Helsingborg
Det som var coolt var att jag inte tänkt på att man kan hitta på namn för att få ett specifikt ansikte på den genererade personen.

Framförallt var det riktigt ballt att använda Control Net för att få ansiktet från olika håll. Kan tänka mig detta som ett bra hjälpmedel för när man tecknar.

Videon är en förklaring av hur man använder ROOP extension.

 
Last edited:

Ulfgeir

Swashbuckler
Joined
6 Feb 2001
Messages
3,266
Location
Borås, Sverige
Via Bing, kan man numera komma åt Dall-e 3. Här är några jag lyckades få fram. Dock så är servern lite överbelastad, och den vägrar en del prompter som funkade för ett par bilder sedan tycker den att nope, där innehöll bildresultatet något som bröt mot deras användarregler.

Red Gazelle 03.jpgRed Gazelle 04.jpgKatya 21.jpgKatya 22.jpgKatya 23.jpg
 
Last edited:

Ulfgeir

Swashbuckler
Joined
6 Feb 2001
Messages
3,266
Location
Borås, Sverige
Andra nackdelar med Dall-E 3 via Bing är att den verkar inte spara ens historik och man måste ju naturliogtvis ha ett microsoft-konto.
1696759068691.png1696759098916.png1696759168890.png1696759185953.png1696759212305.png1696759234856.png
 

Ondsint roBot

Veteran
Joined
13 Aug 2023
Messages
95
Andra nackdelar med Dall-E 3 via Bing är att den verkar inte spara ens historik och man måste ju naturliogtvis ha ett microsoft-konto.
View attachment 14342View attachment 14343View attachment 14346View attachment 14347View attachment 14348View attachment 14349
Vad har du använt för prompt? Jag petade in "A woman with white hair and a green dress holding a spear surrounded by wolves" i mitt standard workflow i ComfyUI (som innehåller rätt mycket icke-standard...). Det är svårt att jämföra exakt, då de tolkar samma prompt på rätt olika sätt. Även SDXL får man väldigt olika resultat med samma prompt och seed om man byter checkpoint eller sampler. Jag har förstått att DALL-E är extremt bra på att tolka komplexa promts, betydligt bättre än SDXL.

Woman with wolves.png
 

Ulfgeir

Swashbuckler
Joined
6 Feb 2001
Messages
3,266
Location
Borås, Sverige
Vad har du använt för prompt? Jag petade in "A woman with white hair and a green dress holding a spear surrounded by wolves" i mitt standard workflow i ComfyUI (som innehåller rätt mycket icke-standard...).

View attachment 14351
Om jag minns rätt något i den här stilen (körde några olika varianter, och sparade dem inte)

Full length view. Lady of the Wild Hunt. Attractive slender woman with very long white hair, emerald green eyes, make up, and lots of jewellry. Dressed in fashionable clothes. Holding a glowing spear. Standing next to 2 very large wolves. High definition modern comic style.


På några ändrade jag att det skulle vara viking style dress, några att det skulle vara ett wintery landscape. Någon tog jag nog bort hur många vargar, och på någon la jag till att det skulle vara en död ogre framför henne. Var nog även variation om vargarna skulle vara aggressiva eller ej. Gjorde även någon där jag la till att hon skulle leda The Wild Hunt.
 
Last edited:

Ondsint roBot

Veteran
Joined
13 Aug 2023
Messages
95
Jag fick ett svepskäl att ladda ner några nya checkpoints. Här är resultatet från din prompt, ibland modifierat lite. Vissa SDXL modeller är förtjusta i avklädda bilder, så man får lägga till "sfw" i prompten. Jämför man lite, så är SDXL klart sämre på spjut (och andra långsmala saker, som bågar) och händer. Det är inte alltid SDXL bryr sig om hela prompten, så där vinner DALL-E lätt. Det går fortfarande att göra snygga bilder i SDXL, men att låta ChatGTP-liknande AI sköta tolkningen av prompten är definivt en stor fördel. Notera att SDXL inte var i närheten av någon tecknad stil som du fick. Jag gav upp efter en stund och tog bort det ur prompten. Det var inte alltid det blev spjut heller, eller vargar för den delen.

Wolves3.jpgWolves1.jpg

Wolves2.jpgWolves4.jpg
 

Ulfgeir

Swashbuckler
Joined
6 Feb 2001
Messages
3,266
Location
Borås, Sverige
Har inte sett någon AI-generator som konsekvent gör vettiga vapen (om vi skall se till deras praktiska användbarhet).

Edit: jag köper fullständigt att dessa generatorer inte kan fixa specifika versioner av olika vapen, men när det de får fram inte ens är i närheten av en användbar gurndversion...
 
Last edited:
Top