Der er meget arbejde i at lave en bog om dyr. Frygtelig meget arbejde. Man skal finde historier om dyrene, man skal finde billeder der passer til - det kan godt tage lang tid. Men så fik jeg den geniale idé at bruge AI. Så er man også med på noderne.
Og når vi nu kan udnytte kræfterne fra antropomorfiseret silicium, hvorfor så nøjes med f.eks. 100 dyr? Nej, vel. Så her er mere end 400, bogstaveligt talt utrolige, historier og billeder af dyr, eller noget der ligner.
Bogen KLAINS DYR er et moderne, dadaistisk projekt der udkommer på Forlaget Caisen i en postfaktuel fremtid nær dig, men indtil da kan du bladre i dyrene her på siden. Besøg f.eks. paddelammeren eller det flotte flyveegern.
ChatGPT blev brugt til at lave en lang liste med dyr (knap 500, når dubletter blev fjernet). Det er ikke gået lige godt hele tiden... Desuden brugte jeg samme AI til at lave en liste med temaer og stemninger for historier samt en liste over byer med berømte zoologiske haver. Jeg ved ikke om der rent faktisk er zoologiske haver i de byer den kom med.
Med listen af dyr brugte jeg Googles Gemini 1.5 Flash-model til at lave en beskrivelse af hvordan dyret så ud. Modellen fik instrukser om bare at finde på noget, hvis det ikke var et rigtigt dyr.
Hele listen af dyr og beskrivelser blev sammen med byerne, temaerne og stemningerne (som blev valgt tilfældigt) brugt til at lave en historie om hvert dyr, samt en beskrivelse af et billede der skulle passe til historien.
Jeg forsøgte nu at lave billederne med brug af Black Forest Labs Flux-Schnell-model hos Replicate, men det virkede ikke særlig godt. I stedet brugte jeg igen Gemini-modellen til først at oversætte billedebeskrivelserne til engelsk for derefter at generere billedet med Flux-modellen, hvilket gik meget bedre.
Det hele blev pakket i en Python Flask-app med Gunicorn og Nginx foran.