Šią animacinę Mona Liza sukūrė AI, ir ji yra bauginanti

Pin
Send
Share
Send

Mįslinga, nutapyta „Mona Lizos“ šypsena žinoma visame pasaulyje, tačiau tas garsusis veidas neseniai parodė stulbinančią naują išraiškos spektrą, sutikdamas su dirbtiniu intelektu (AI).

Gegužės 21 d. „YouTube“ pasidalytame vaizdo įraše trys vaizdo klipai rodo nesąmoningus „Mona Lizos“ pavyzdžius, kai ji judina lūpas ir pasuka galvą. Ją sukūrė konvoliucinis nervų tinklas - tokio tipo AI, kuris apdoroja informaciją taip, kaip tai daro žmogaus smegenys, analizuoti ir apdoroti vaizdus.

Tyrėjai išmokė algoritmo, kad suprastų veido bruožų bendrąsias formas ir kaip jie elgiasi vienas kito atžvilgiu, o tada pritaikytų tą informaciją nejudantiems vaizdams. Rezultatas buvo tikroviška naujų veido išraiškų vaizdo seka iš vieno kadro.

Vaizdo įrašų „Mona Lisa“ metu AI „išmoko“ veido judesius iš trijų žmonių subjektų duomenų rinkinių, sukurdamas tris labai skirtingas animacijas. Nors visi trys klipai vis dar buvo atpažįstami kaip „Mona Liza“, treniruočių modelių išvaizdos ir elgsenos skirtumai suteikė „gyviesiems portretams“ skirtingas „asmenybes“, - teigė Skolkovo mokslo ir technologijos instituto inžinierius Egoras Zacharovas ir „Samsung AI Center“ (abu yra Maskvoje), paaiškinta vaizdo įraše.

Zacharovas ir jo kolegos taip pat sukūrė animacijas iš XX amžiaus kultūros ikonų, tokių kaip Albertas Einšteinas, Marilyn Monroe ir Salvadoras Dali, nuotraukų. Tyrėjai aprašė savo išvadas, kurios nebuvo vertinamos tarpusavyje, tyrime, paskelbtame internete gegužės 20 d., Prieš spausdinimo žurnale „ArXiv“.

Pažįstami veidai įgauna nepažįstamų išraiškų. (Vaizdo kreditas: E. Zacharovas ir kt.)

Sukurti tokius originalius vaizdo įrašus, žinomus kaip „deepfakes“, nėra lengva. Žmogaus galvos yra geometriškai sudėtingos ir labai dinamiškos; 3D galvos modeliai turi „dešimtis milijonų parametrų“, rašė tyrimo autoriai.

Be to, remiantis tyrimo duomenimis, žmogaus regėjimo sistema labai gerai atpažįsta „net nedideles klaidas“ 3D modeliais sukurtose žmogaus galvose. Pamačius tai, kas atrodo beveik žmogiška, bet ne visai, sukeliamas gilus neramumas, žinomas kaip nepaprastas slėnio efektas.

AI anksčiau įrodė, kad įmanoma sukurti įtikinamus giluminius vaizdus, ​​tačiau tam reikėjo kelių norimo objekto kampų. Naujojo tyrimo metu inžinieriai supažindino AI su labai dideliu referencinių vaizdo įrašų rinkiniu, kuriame rodomi žmonių veidai. Mokslininkai nustatė veido orientyrus, kurie būtų taikomi bet kokiam veidui, kad išmokytų nervų tinklą, kaip apskritai elgiasi veidai.

Tada jie išmokė AI naudoti nuorodų išraiškas šaltinio ypatybių judėjimui žemėlapyje. Tai leido AI sukurti gilų netikrumą net tada, kai turėjo tik vieną atvaizdą, iš kurio galėtų veikti, pranešė tyrėjai.

Daugiau šaltinio vaizdų pateikė dar išsamesnį galutinės animacijos rezultatą. Vaizdo įrašai, sukurti iš 32 vaizdų, o ne iš vieno, naudotojų tyrime pasiekė „tobulą realizmą“, rašė mokslininkai.

Pin
Send
Share
Send