La oss begynne med å innrømme at det alltid har vært noe urealistisk med utseendet til fotomodeller. Det er tross alt summen av finjustert sminke og lyssetting, håndplukkede kameralinser, nøye valgte vinkler og positurer, samt fotofikling i etterkant. Det billedskjønne er delvis resultatet av fotomagi.
Denne tradisjonsrike prosedyren er i ferd med å bli gammelmodig. Nå skapes magien uten å involvere modeller, sminkører eller fotoassistenter. Det holder med noen velvalgte tastetrykk.
Uniforme resultater
Stadig flere av ansiktene på nettet er 100 prosent dataskapte. De titter frem i reklame, markedsføring, spill og underholdning – fordi det er blitt billig og enkelt å lage dem. Google og Meta tilbyr annonsørene KI-bistand om de trenger det.
Samtidig er filmindustrien nysgjerrig på Sora, OpenAIs nye respektinngytende bildegenerator. Skriv noen beskrivende tekstrader, og den tryller frem en korresponderende filmsekvens.
De visuelle mediene har alltid vært der man finner skjønnhetsidealene i fri utfoldelse. Derfor tvinger KIs inntog oss til å spørre hvordan algoritmene definerer hva som er vakkert.
The Washington Post satte de tre største bildegeneratorene – MidJourney, DALL-E og Stable Diffusion – til å lage bilder av «en vakker kvinne».
Kommandoene ble variert i dusinvis formuleringer, med vekt på ulike detaljer, men avisen oppdaget at resultatene uansett ble ganske uniforme: «En vakker kvinne» er uten unntak slank og nesten alltid ung.
Kun 2 prosent av de digitale modellene viste synlige tegn på å være godt voksne. En tredjedel av dem hadde en «medium hudfarge», men bare 9 prosent var mørke.
Bildeverktøyene slet ellers med å skape realistiske ansikter hvor øynene har epikantisk fold (det vanlige i Øst-Asia), selv om instruksjonene spesifikt ba om det. Det samme gjaldt for brede neser.
Tillærte idealer
Det eneste selskapet som ga en kommentar til avisen, var OpenAI. KI-ingeniøren Sandhini Agarwal innrømmer at kroppsfigurer er spesielt utfordrende, siden programvaren bygger på «hvordan folk er representert i medier, kunsten og underholdningsindustrien».
Saken er nemlig at bildegeneratorene egentlig ikke har noen egne skjønnhetsidealer. De lærer seg dette gjennom å mates med millioner eller milliarder av foto der bildebeskrivelsen inneholder ordene «vakker», «skjønn», «pen» og så videre. Disse beskrivelsene er gjerne skrevet av mennesker.
Råmaterialet til opplæringen høstes inn gjennom automatisert tråling av innholdet på nettet og preges ubønnhørlig av hva som finnes der.
Mange av kildene er pornosider eller sogner til andre kulørte deler av underholdningsindustrien.
«Datasett med animekunst er populært i treningen av bilde-KI, delvis fordi ivrige fans har gjort bildetekstarbeidet gratis. Men figurenes tegneserieaktige hofte-til-midje-forhold kan påvirke hva den kunstige intelligensen skaper», skriver The Washington Post.