Kohët e fundit jemi dëshmitarë të një ndryshimi të madh në procesin e gjenerimit të imazheve. Fluksi dhe rritja e fundit e mësimit të makinerive dhe inteligjencës artificiale ngre pyetje në lidhje me mënyrën në të cilën proceset krijuese evoluojnë dhe zhvillohen përmes teknologjisë.
Sistemet si DALL-E, DALL-E 2 dhe Midjourney janë programe të AI të trajnuar për të gjeneruar imazhe nga përshkrimet e tekstit duke përdorur një grup të dhënash çiftesh tekst-imazh.
Një grup i larmishëm i aftësive përfshin krijimin e versioneve antropomorfizuar të kafshëve dhe objekteve, kombinimin e koncepteve të palidhura në mënyra të besueshme dhe aplikimin e transformimeve në imazhet ekzistuese.
DALL-E dhe sisteme të ngjashme janë në gjendje të krijojnë imazhe të besueshme për një shumëllojshmëri të madhe fjalish që eksplorojnë strukturën kompozicionale të gjuhës.
DALL-E ka disa nga aftësitë e një motori rendering 3D, por ndryshimi qëndron në natyrën e hyrjeve.
Për paraqitjen 3D, hyrja duhet të specifikohet me detaje të plota, ndërsa DALL-E shpesh është në gjendje të “plotësojë boshllëqet”. Ai gjithashtu mund të kontrollojë në mënyrë të pavarur atributet e një numri të vogël objektesh.
Ndërsa këto modele kanë kufizime, fusha po evoluon me një ritëm të paparë.
Kohët e fundit, Apple ka lëshuar Gaudi, një “arkitekt nervor” që e çon këtë proces një hap më tej duke krijuar skena 3D nga tekstet si “shko lart” ose “shko nëpër korridor”.
Është e vështirë të parashikohet se ku do të na çojnë këto zhvillime, por ndikimi i tyre tashmë mund të ndihet.
Në fushat e arkitekturës dhe dizajnit, këto mund të kuptohen si mjete të fuqishme për të eksploruar, optimizuar dhe testuar me shpejtësi dizajnet kreative./Media Ndërtimi.