Diskussion om AI-genererade bilder

pellejones · 9 Sep 2022

vije said:
Coolt! Minns du måntro vad du hade för parametrar för banshee-bilden?

Jodå

etheral undead Medusa banshee screaming, black and white pencil drawing --w 400 --h 700 --test --creative

Oscar Silferstjerna · 9 Sep 2022

Undrar just hur stor marknaden för prompts kan tänkas bli. Är det inte roligare och kanske rentav bättre att hitta på själv?

Professional AI whisperers have launched a marketplace for DALL-E prompts

What makes a description of anime pinup art worth $5?

www.theverge.com

pellejones · 9 Sep 2022

Der tar ju rätt lång tid att få till något bra så jag förstår att folk betalar för det.

CapnZapp · 9 Sep 2022

Detta ämne är superintressant, men om man är intresserad av exempelvis SLP illustrationer som jag, verkar det som att man behöver vänta några månader till. De databaser som de neurala nätverken har haft tillgång till verkar vara begränsade vad gäller sådant som "hur många ben har en människa", och har huvudsakligen varit Safe For Work.

Men detta ändras i rasande hastighet

CapnZapp · 9 Sep 2022

PAX said:
Vänta bara tills vi ser en film med realtidsskapad story och bilder i UltraK upplösning. Unik för dig och din filmsmak.

Ars Technica spekulerade att vi snart har massiv komprimering - istället för att tanka hem flera gigabyte av data för senaste långfilmen laddar du bara hem dess manus, samt ett seedvärde*, så fixar AIn själva bilderna.

*) så alla får samma resultat

Oscar Silferstjerna · 9 Sep 2022

CapnZapp said:
Detta ämne är superintressant, men om man är intresserad av exempelvis SLP illustrationer som jag, verkar det som att man behöver vänta några månader till. De databaser som de neurala nätverken har haft tillgång till verkar vara begränsade vad gäller sådant som "hur många ben har en människa", och har huvudsakligen varit Safe For Work.

Men detta ändras i rasande hastighet

Följer du några av de grupper om AI-bilder som finns på FB? Rena mugshots av god kvalitet är ganska enkla att få fram. Vad som däremot fortfarande är svårt är att regissera specifika scener och få dem att se vettiga ut. Men du har förstås rätt i att utvecklingen går fort. Det händer saker varje vecka. Nya filter och funktioner, snyggare och mer varierade bilder.

Troberg · 9 Sep 2022

Rickard said:
Här ser vi också en nackdel med Midjourney just nu. Alla ansikten blir likadana.

Jag kör StableDiffusion, och där hjälper det att nämna några kända personers namn. Har man flera namn så mixar den ihop dem så att det inte syns vem det är, men det blir olika ansikten, och den blir bättre på att göra bra ansikten (färre mysko ögon och sånt).

God45 · 9 Sep 2022

Den här grejen var ju lite creepy: https://www.pcgamer.com/ai-image-generaotr-loab-cryptid-supercomposite/

Rickard · 10 Sep 2022

Sista dagen på mitt 30$-prenumeration. Här var en riktigt bra genomgång i prompts för Midjourney:

Lemur · 10 Sep 2022

Rickard said:
Sista dagen på mitt 30$-prenumeration. Här var en riktigt bra genomgång i prompts för Midjourney:

Hur funkade $30 prenumerationen? Kunde du göra hur många bilder som helst då fast i långsam takt? Hur funkade det isf?

Rickard · 10 Sep 2022

Lemur said:
Hur funkade $30 prenumerationen? Kunde du göra hur många bilder som helst då fast i långsam takt? Hur funkade det isf?

Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.

Oscar Silferstjerna · 10 Sep 2022

Rickard said:
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.

Ok, jag har inte provat MJ ännu, men ska. Wombo Dream, som jag har använt, ger inte riktigt lika spektakulära bilder än så länge, men å andra sidan obegränsat många så länge man har abonnemang. Där behöver man inte heller ha lika exakta prompts för att få vettiga bilder. Möjligen gör det också slumpen större.

Hur enkelt tycker du att det har varit att bli bra på prompts?

Rickard · 10 Sep 2022

Oscar Silferstjerna said:
Hur enkelt tycker du att det har varit att bli bra på prompts?

Bra och bra? Tja, tyckte det inte tog så lång tid, men jag är mycket (på grund av mitt yrke som programmerare) för att testa och sedan sitta och läsa innan jag testar på nytt.

Jag har inte heller några krav på hur bilden ska se ut, utan ville alltid bli överraskad av resultatet. Det går inte att sitta och ha en klar bild i huvudet och få ut den på "papper". Videon ovan hade varit guld att kunna innan, särskilt att man kan skriva [holy tree, gold, purple] + [universe inside full portrait david bowie, teal, cyan, lightyellow] --q 2 --ar 687:425

Fast nu när jag testade så verkade hakparenteser [ ] inte fungera så särskilt bra. Midjourney tog prompter från ena och lade in i den andra.

Annars är det mest att sitta och testa. Att använda kända namn är ett plus, för ansiktena blir annars likadana. Att kunna färglägga bilder med alla sorts färger (men inte glömma "black, white") är schysst för att skapa personlighet eller slänga dit "epic scene, dramatic light" för att generera undersköna bilder eller kombinera olika konstnärer. Det gäller dock att generera flera versioner för att till slut hitta en bra.

Har börjat använda --stylized mer mot slutet för att få mer variation i de fyra rutorna som kommer.

Prompten jag skrev ovan fick jag förändra något och generera några gånger för att få detta:
[holy tree, gold, purple]::2 + [universe inside david bowie, full portrait, teal, cyan, lightyellow]::3, dramatic lighting, watercolor, ink splash --ar 425:687 --s 15000

Lemur · 10 Sep 2022

Rickard said:
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.

Jag kör $10 abonnemang och känner tyvärr att jag måste lägga band på mig för att inte mina kretider ska sina.

Rickard · 10 Sep 2022

Lemur said:
Jag kör $10 abonnemang och känner tyvärr att jag måste lägga band på mig för att inte mina kretider ska sina.

Ja, jag har genererat bilder för fyra rollspelsprojekt, en hemsida och två logotyper.

Ville inte heller känna "stressen" över att behöva tänka på begränsningar, så för mig var det värt 20$ extra trots att jag mest ville sitta och testa.

Oscar Silferstjerna · 10 Sep 2022

Rickard said:
Bra och bra? Tja, tyckte det inte tog så lång tid, men jag är mycket (på grund av mitt yrke som programmerare) för att testa och sedan sitta och läsa innan jag testar på nytt.

Jag har inte heller några krav på hur bilden ska se ut, utan ville alltid bli överraskad av resultatet. Det går inte att sitta och ha en klar bild i huvudet och få ut den på "papper". Videon ovan hade varit guld att kunna innan, särskilt att man kan skriva [holy tree, gold, purple] + [universe inside full portrait david bowie, teal, cyan, lightyellow] --q 2 --ar 687:425

Fast nu när jag testade så verkade hakparenteser [ ] inte fungera så särskilt bra. Midjourney tog prompter från ena och lade in i den andra.

Annars är det mest att sitta och testa. Att använda kända namn är ett plus, för ansiktena blir annars likadana. Att kunna färglägga bilder med alla sorts färger (men inte glömma "black, white") är schysst för att skapa personlighet eller slänga dit "epic scene, dramatic light" för att generera undersköna bilder eller kombinera olika konstnärer. Det gäller dock att generera flera versioner för att till slut hitta en bra.

Har börjat använda --stylized mer mot slutet för att få mer variation i de fyra rutorna som kommer.

Prompten jag skrev ovan fick jag förändra något och generera några gånger för att få detta:
[holy tree, gold, purple]::2 + [universe inside david bowie, full portrait, teal, cyan, lightyellow]::3, dramatic lighting, watercolor, ink splash --ar 425:687 --s 15000

Bra, då förstår jag mer vad skillnaden mellan MJ och Wombo Dream är. Hakparenteser har jag inte alls använt mig av. Jag kommer förmodligen att köpa ett lite större paket för att kunna göra många bilder på MJ. Alltför begränsat verkar dåligt.

Även för mig finns det en fördel i processen att pröva sig fram. En del av poängen ligger också i att resultatet ofta blir överraskande. Många som blir besvikna verkar bli det för att de inte enkelt kan klicka fram något väldigt specifikt och på förhand planerat. Jag tycker snarare att det är bra att det inte blir så. Gjorde ett par hundra bilder i Wombo för några veckor sedan och de bilder jag blev mest nöjd med är de som tolkade mina prompts på sätt jag inte kunde förutse. Det återstår att se om jag tycker att de är tillräckligt bra för att använda i några av mina kommande rollspelsprodukter. Tanken är att bygga upp en egen databas av bilder att välja mellan.

Till saken hör också att Wombo Dream har blivit klart bättre sedan dess. De verkar också ha integrerat Stable Diffiusion (var det väl?) i något eller några av sina filter. Ska testa att blanda olika kända personer för att undvika att få samma ansikten. Isometriska bilder vore också bra att få till, men jag vet inte hur svårt det är att få till det med AI.

En månad med Wombo tror jag kostade sju dollar (med obegränsat antal bilder), så det är möjligen mer prisvärt, beroende på exakt vad man är ute efter. Det verkar dock svårt att få till liggande format.

Troberg · 10 Sep 2022

Innan ni köper något, ta en titt på Stable Diffusion. Det är gratis, ni kan köra helt lokalt på er dator, och det finns ingen censur (typ, som Dall-E, som inte tillåter något som har med vapen, våld, sex, nakenhet eller liknande, inklusive att den inte kan skilja på "shot" som i att skjuta och som i att fotografera...). Det finns många bra frontends, i och med att den är open source, som är "ladda ner, installera, kör".

Istället för att fundera "Vad kostar den här bilden?", så kan man köra igång den på kvällen på "Generera 1000 varianter på den här prompten" och hittar alltid en packe bra bilder på morgonen.

Utvecklingstakten på den är enorm, det är massor av folk som gör stuff till den.

Genesis · 10 Sep 2022

Troberg said:
Innan ni köper något, ta en titt på Stable Diffusion. Det är gratis, ni kan köra helt lokalt på er dator, och det finns ingen censur (typ, som Dall-E, som inte tillåter något som har med vapen, våld, sex, nakenhet eller liknande, inklusive att den inte kan skilja på "shot" som i att skjuta och som i att fotografera...). Det finns många bra frontends, i och med att den är open source, som är "ladda ner, installera, kör".

Istället för att fundera "Vad kostar den här bilden?", så kan man köra igång den på kvällen på "Generera 1000 varianter på den här prompten" och hittar alltid en packe bra bilder på morgonen.

Utvecklingstakten på den är enorm, det är massor av folk som gör stuff till den.

Mm, funderar på att göra ett försök. Verkar krångligt att installera på OSX, men det finns ett par guider.

Genesis · 10 Sep 2022

Vore ju dock helfestligt om AI-censur kunde råda bot på rollspelens våldsfixering. :gremtongue:

Rickard · 10 Sep 2022

Genesis said:
Vore ju dock helfestligt om AI-censur kunde råda bot på rollspelens våldsfixering.

Jag tänker göra en egen AI-bildgenerering för rollspel och döpa den till AI Gore.

Diskussion om AI-genererade bilder

Grisodlare

Lovecraft spelade pingis.

Grisodlare

Myrmidon

Myrmidon

Lovecraft spelade pingis.

Sinister eater

#PrayersForBahakan

Urverk speldesign

Chatbot som låtsas vara en lemur

Urverk speldesign

Lovecraft spelade pingis.

Urverk speldesign

Attachments

Chatbot som låtsas vara en lemur

Urverk speldesign

Lovecraft spelade pingis.

Sinister eater

Ni dés ni maître

Ni dés ni maître

Urverk speldesign