Diskussion om AI-genererade bilder

Status
Not open for further replies.
Detta ämne är superintressant, men om man är intresserad av exempelvis SLP illustrationer som jag, verkar det som att man behöver vänta några månader till. De databaser som de neurala nätverken har haft tillgång till verkar vara begränsade vad gäller sådant som "hur många ben har en människa", och har huvudsakligen varit Safe For Work.

Men detta ändras i rasande hastighet 👍
 
Vänta bara tills vi ser en film med realtidsskapad story och bilder i UltraK upplösning. Unik för dig och din filmsmak.
Ars Technica spekulerade att vi snart har massiv komprimering - istället för att tanka hem flera gigabyte av data för senaste långfilmen laddar du bara hem dess manus, samt ett seedvärde*, så fixar AIn själva bilderna. :)

*) så alla får samma resultat
 
Detta ämne är superintressant, men om man är intresserad av exempelvis SLP illustrationer som jag, verkar det som att man behöver vänta några månader till. De databaser som de neurala nätverken har haft tillgång till verkar vara begränsade vad gäller sådant som "hur många ben har en människa", och har huvudsakligen varit Safe For Work.

Men detta ändras i rasande hastighet 👍

Följer du några av de grupper om AI-bilder som finns på FB? Rena mugshots av god kvalitet är ganska enkla att få fram. Vad som däremot fortfarande är svårt är att regissera specifika scener och få dem att se vettiga ut. Men du har förstås rätt i att utvecklingen går fort. Det händer saker varje vecka. Nya filter och funktioner, snyggare och mer varierade bilder.
 
Last edited:
Här ser vi också en nackdel med Midjourney just nu. Alla ansikten blir likadana.

Jag kör StableDiffusion, och där hjälper det att nämna några kända personers namn. Har man flera namn så mixar den ihop dem så att det inte syns vem det är, men det blir olika ansikten, och den blir bättre på att göra bra ansikten (färre mysko ögon och sånt).
 
Hur funkade $30 prenumerationen? Kunde du göra hur många bilder som helst då fast i långsam takt? Hur funkade det isf?
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.
 
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.

Ok, jag har inte provat MJ ännu, men ska. Wombo Dream, som jag har använt, ger inte riktigt lika spektakulära bilder än så länge, men å andra sidan obegränsat många så länge man har abonnemang. Där behöver man inte heller ha lika exakta prompts för att få vettiga bilder. Möjligen gör det också slumpen större.

Hur enkelt tycker du att det har varit att bli bra på prompts?
 
Hur enkelt tycker du att det har varit att bli bra på prompts?
Bra och bra? Tja, tyckte det inte tog så lång tid, men jag är mycket (på grund av mitt yrke som programmerare) för att testa och sedan sitta och läsa innan jag testar på nytt.

Jag har inte heller några krav på hur bilden ska se ut, utan ville alltid bli överraskad av resultatet. Det går inte att sitta och ha en klar bild i huvudet och få ut den på "papper". Videon ovan hade varit guld att kunna innan, särskilt att man kan skriva [holy tree, gold, purple] + [universe inside full portrait david bowie, teal, cyan, lightyellow] --q 2 --ar 687:425

Fast nu när jag testade så verkade hakparenteser [ ] inte fungera så särskilt bra. Midjourney tog prompter från ena och lade in i den andra.

Annars är det mest att sitta och testa. Att använda kända namn är ett plus, för ansiktena blir annars likadana. Att kunna färglägga bilder med alla sorts färger (men inte glömma "black, white") är schysst för att skapa personlighet eller slänga dit "epic scene, dramatic light" för att generera undersköna bilder eller kombinera olika konstnärer. Det gäller dock att generera flera versioner för att till slut hitta en bra.

Har börjat använda --stylized mer mot slutet för att få mer variation i de fyra rutorna som kommer.

Prompten jag skrev ovan fick jag förändra något och generera några gånger för att få detta:
[holy tree, gold, purple]::2 + [universe inside david bowie, full portrait, teal, cyan, lightyellow]::3, dramatic lighting, watercolor, ink splash --ar 425:687 --s 15000
 

Attachments

  • Rickard_holy_tree_gold_purple_63272e30-4a94-4fab-b470-c9628b3926c2.png
    Rickard_holy_tree_gold_purple_63272e30-4a94-4fab-b470-c9628b3926c2.png
    604.9 KB · Views: 12
  • Rickard_holy_tree_gold_purple_6abe94df-5d2c-497b-bed0-21676ea7e9d3.png
    Rickard_holy_tree_gold_purple_6abe94df-5d2c-497b-bed0-21676ea7e9d3.png
    663 KB · Views: 12
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.
Jag kör $10 abonnemang och känner tyvärr att jag måste lägga band på mig för att inte mina kretider ska sina.
 
Jag kör $10 abonnemang och känner tyvärr att jag måste lägga band på mig för att inte mina kretider ska sina.
Ja, jag har genererat bilder för fyra rollspelsprojekt, en hemsida och två logotyper. :) Ville inte heller känna "stressen" över att behöva tänka på begränsningar, så för mig var det värt 20$ extra trots att jag mest ville sitta och testa.
 
Bra och bra? Tja, tyckte det inte tog så lång tid, men jag är mycket (på grund av mitt yrke som programmerare) för att testa och sedan sitta och läsa innan jag testar på nytt.

Jag har inte heller några krav på hur bilden ska se ut, utan ville alltid bli överraskad av resultatet. Det går inte att sitta och ha en klar bild i huvudet och få ut den på "papper". Videon ovan hade varit guld att kunna innan, särskilt att man kan skriva [holy tree, gold, purple] + [universe inside full portrait david bowie, teal, cyan, lightyellow] --q 2 --ar 687:425

Fast nu när jag testade så verkade hakparenteser [ ] inte fungera så särskilt bra. Midjourney tog prompter från ena och lade in i den andra.

Annars är det mest att sitta och testa. Att använda kända namn är ett plus, för ansiktena blir annars likadana. Att kunna färglägga bilder med alla sorts färger (men inte glömma "black, white") är schysst för att skapa personlighet eller slänga dit "epic scene, dramatic light" för att generera undersköna bilder eller kombinera olika konstnärer. Det gäller dock att generera flera versioner för att till slut hitta en bra.

Har börjat använda --stylized mer mot slutet för att få mer variation i de fyra rutorna som kommer.

Prompten jag skrev ovan fick jag förändra något och generera några gånger för att få detta:
[holy tree, gold, purple]::2 + [universe inside david bowie, full portrait, teal, cyan, lightyellow]::3, dramatic lighting, watercolor, ink splash --ar 425:687 --s 15000

Bra, då förstår jag mer vad skillnaden mellan MJ och Wombo Dream är. Hakparenteser har jag inte alls använt mig av. Jag kommer förmodligen att köpa ett lite större paket för att kunna göra många bilder på MJ. Alltför begränsat verkar dåligt.

Även för mig finns det en fördel i processen att pröva sig fram. En del av poängen ligger också i att resultatet ofta blir överraskande. Många som blir besvikna verkar bli det för att de inte enkelt kan klicka fram något väldigt specifikt och på förhand planerat. Jag tycker snarare att det är bra att det inte blir så. Gjorde ett par hundra bilder i Wombo för några veckor sedan och de bilder jag blev mest nöjd med är de som tolkade mina prompts på sätt jag inte kunde förutse. Det återstår att se om jag tycker att de är tillräckligt bra för att använda i några av mina kommande rollspelsprodukter. Tanken är att bygga upp en egen databas av bilder att välja mellan.

Till saken hör också att Wombo Dream har blivit klart bättre sedan dess. De verkar också ha integrerat Stable Diffiusion (var det väl?) i något eller några av sina filter. Ska testa att blanda olika kända personer för att undvika att få samma ansikten. Isometriska bilder vore också bra att få till, men jag vet inte hur svårt det är att få till det med AI.

En månad med Wombo tror jag kostade sju dollar (med obegränsat antal bilder), så det är möjligen mer prisvärt, beroende på exakt vad man är ute efter. Det verkar dock svårt att få till liggande format.
 
Last edited:
Innan ni köper något, ta en titt på Stable Diffusion. Det är gratis, ni kan köra helt lokalt på er dator, och det finns ingen censur (typ, som Dall-E, som inte tillåter något som har med vapen, våld, sex, nakenhet eller liknande, inklusive att den inte kan skilja på "shot" som i att skjuta och som i att fotografera...). Det finns många bra frontends, i och med att den är open source, som är "ladda ner, installera, kör".

Istället för att fundera "Vad kostar den här bilden?", så kan man köra igång den på kvällen på "Generera 1000 varianter på den här prompten" och hittar alltid en packe bra bilder på morgonen.

Utvecklingstakten på den är enorm, det är massor av folk som gör stuff till den.
 
Innan ni köper något, ta en titt på Stable Diffusion. Det är gratis, ni kan köra helt lokalt på er dator, och det finns ingen censur (typ, som Dall-E, som inte tillåter något som har med vapen, våld, sex, nakenhet eller liknande, inklusive att den inte kan skilja på "shot" som i att skjuta och som i att fotografera...). Det finns många bra frontends, i och med att den är open source, som är "ladda ner, installera, kör".

Istället för att fundera "Vad kostar den här bilden?", så kan man köra igång den på kvällen på "Generera 1000 varianter på den här prompten" och hittar alltid en packe bra bilder på morgonen.

Utvecklingstakten på den är enorm, det är massor av folk som gör stuff till den.
Mm, funderar på att göra ett försök. Verkar krångligt att installera på OSX, men det finns ett par guider.
 
Status
Not open for further replies.
Back
Top