AA testua irudi bilakatzeko, hasierako inpresioak

Bizitzan egiteko askorik ez dudan momentu honetan, txiripaz Twitterren Adimen Artifizialak sortutako irudi batzuk ikusi ondoren, probatzea erabaki nuen.

Marrazten jakin ez arren ~~komiki~~ nobela grafiko bat sortzera nindoan.

Testua irudi bilakatzeko hiru aukera handi daude (utzi zure iruzkina ados ez bazaude): Midjourney, Dall-e eta Stable Diffusion.

• Midjourney da ezagunena eta —antza denez— ahalmen handiena duena; Discord bidez erabiltzen da baina ordainpekoa da.
• Dall-ek hilero 12 irudi-eskaera egiteko aukera ematen du “debalde” (izena eman ondoren) eta hasierako orrian irudi itxuroso batzuk erakusten baditu ere, ezin izan dut antzeko emaitzarik lortu nik.
• Amaitzeko Stable Diffusion dago. Stable Diffusionen ezaugarririk interesgarriena kode irekikoa dela da. Eta horri esker lokalean exekutatu daiteke, internet konexiorik gabe. Ezin hobeto.

Nola erabili?

• DiffusionBee macOS plataforman Stable Diffusion exekutatzeko aplikazioa da. Programa bera 200 Mb inguru da eta ondoren pare bat fitxategi deskargatu behar dira, bakoitza 2 Gb-koak. Horrekin oinarrizko programa dugu.
• Linuxerako (baita macOS eta Windowserako ere) badago Easy Diffusion, baina oraindik ez dut probatzeko aukerarik izan. Espero dut laister egin ahal izatea.
• Automatic1111 ere badago, baina ez dirudi instalatzeko hain erraza denik.

Paisaiak eta bestelako irudi batzuk sinesgarriak izan daitezkeen arren, gizakien irudiak ez dira batere errealak, zoritxarrez. Gizakiok beste gizaki batzuk desberdintzeko garatu dugu burmuina, begietan jarri ohi dugu arreta bereziki, eta zerbait gaizki dagoenean berehala konturatzen gara. Biziraute-sena edo nik zer dakit.

Izan ere, Adimen Artifiziala ez da dioten bezain adimentsua: lehenik trebatu beharra dago. Ziurrenik Stable Diffusion ez dago Midjourney zein Dall-e bezain trebatua komertziala ez izateagatik eta horregatik gizakien irudiak ez dira nahikoa onak, baina badago irtenbidea lortzen ditugun emaitzak gure gustokoak ez badira: Hugging Face bezalako webguneek eredu eta baliabide gehigarriak dituzte.

Estilo edo itxura zehatz, bereziren bat lortu nahi izanez gero, beharrezkoa izango zaizkigu eredu horiek deskargatu eta programan gaitzea. Adibidez Pokémonak sortzea bada gure helburua.

Emakumeak nabarmentzen dira eredu gehienetan

18 probatu ditut eta horietatik pare bat gustatu zaizkit gehien: rMadArt eta DreamShaper. Lehenengoa nahiko errealista da, benetako gizakiak dirudite; bigarrenak sortzen dituen gizakiak, ordea, plastikozko itxura daukate, baina baliagarria izan daiteke. X-mix eta dreamlike-anime ereduak ere ez dira txarrak anime estiloko irudiak sortzeko.

Hala ere beti topatzen dut arazo bera: pertsonaiak oso femeninoak dira. Aurpegiak, ile/orrazkera, janzkerak, posturak…

Bizarra duten pertsonaiak sortzea zaila da eta zer esanik ez ilea gorputzean izan dezatela eskatzen badiezu.

Listerineren iragarkian bezala.

Gustatu ez zaidan beste zera bat da adina zehaztu arren pertsonaiak gazteegiak direla, eta gorputzak perfektuegiak: emakumeak badira, lirainak; eta gizonak izatekotan, muskulatuak. Uko egin beharko diot nire nobela grafikoaren protagonista izateari, baina hemen beste arazo bat azaltzen da: ezin da pertsonaia bat berrerabili.

Demagun pertsona baten deskribapen fisikoa sartzen dudala, ohean, iratzargailua itzaltzen ari dela. Ondoren deskribapen fisiko bera zehaztuko dut, oraingoan bizikleta gainean lanerako bidean. Antzekoak izan arren, AAk bi pertsona desberdin marraztuko ditu, komikiaren raccorda pikutara botako duena.

Futbol jokalariak zelaian.

Defektuz beti dira emakumeak, beti lirainak, eta beti da Artizarreko udako egunik beroena.

Ez da, beraz, komikiak egiteko tresnarik aproposena. Bai, badago modua AA zure argazkiekin trebatzeko, baina ez dut ezagutzen lokalean egiteko tresnarik, edota niretzat zailegiak dira.

Une honetan dakidan apurrarekin uste dudana

Hiperfeminizazioa, sexualizazioa, gaztetasuna eta gorputzen itxura “perfektu” hori trebakuntzaren ajeak dira, eredua trebatu duenak emakume gazte eta lirainak erabiliko zituen ziurrenik. Beste ereduren bat bilatu beharko nuke.

Ereduetako bat deskribatzeko traolak

Pertsonaia bat berrerabiltzeko gaitasuna ere, egun erabiltzaile xume guztion eskura egon ez arren, ziur etorkizunean erabil dezakegula.

Gauzak horrela, zer edo zer —ideia abstraktuak bereziki— ilustratzeko irudi bat lortzea erraza den arren, buruan dugun irudi konkretu hori sortzea ez da hain erraza, niretzat behintzat ez da izan.

Redditen badago hamaika adibide eta gida, baina une honetako nire internetarekin ezin dut askorik egin.

Bi tipo egongelan eserita PlayStationarekin jolasean.

Noiz kaleratu dituzte titiburuak joystick bilakatzeko inplanteak? Ez dut horren berririk topatu Game Erauntsian.

Adimen Artifizial eta eredu bakoitza apur bat desberdina dira eta irudiak sortzeko testua idaztea ez da dirudien bezain erraza. Badaude beste aldagai batzuk ere: pausoak (zenbat eta gehiago orduan eta gehiago orraztu beharko luke irudia, pausu gutxirekin irudi onak lortzea badagoen arren), hazia (ausa), eta AAri ematen diogun askatasuna (zehatz-mehatz errespetatu beharko luke guk egindako eskaera/idatzitako deskribapena?).

Eskaera idazteaz gain bertan agertzea nahi ez duguna ere zehaz dezakegu: negative prompt deritzaio. Anatomia errespetatzea da eskaerarik hedatuena, AAk ez omen dakielako esku bakoitzean bost atzamar izan ohi ditugula.

Irudiak sortu ahala deskribapena finduz joan gaitezke eredu horretara hobeto moldatzeko eta nahi dugun irudia lortu ahal izateko.

Ordenagailuaren baliabideen eta guk zehaztutako aldagaien arabera denbora gehiago edo gutxiago beharko da irudiok sortzeko. 75 pausoko (maximoa) irudi bat emateko 25 minutu behar ditu nire ordenagailuak (2017koa, 3 GHz Quad-Core Intel Core i5, Radeon Pro 555 2 GB, 8 GB 2400 MHz DDR4).