A Midjourney legújabb frissítése egy kameraszerű funkcióval nyűgözi le az AI művészeket

Csütörtökön a Midjourney bemutatta az AI-alapú képszintetizáló modelljének 5.2-es verzióját, amely egy új „zoom out” funkciót is tartalmaz. Ez lehetővé teszi egy központi szintetizált kép feldolgozását, miközben automatikusan egy nagyobb jelenetet épít ki körülötte, szimulálva a kamera objektívvel történő nagyítást.

Hasonlóan az outpaintinghez, ami egy mesterséges intelligenciára alapuló képalkotási technika, amelyet az OpenAI termékében a DALL-E 2-ben 2022. augusztusában jelent meg -, a Midjourney zoom-out funkciója is képes egy meglévő, mesterséges intelligencia által generált képet feldolgozni, és kiterjeszteni annak határait, miközben az eredeti témát az új kép középen megtartja. A DALL-E és a Photoshop generatív kitöltés funkciójával ellentétben azonban nem lehet egyéni képet választani a bővítéshez. Jelenleg a v5.2 nagyítási funkciója csak a Midjourney, egy előfizetéses AI képgenerátor szolgáltatáson belül generált képeken működik.

A Midjourney Discord szerverén (amely még mindig a Midjourney hivatalos felülete) a felhasználók kísérletezhetnek a nagyítással, bármely v5.2-es kép generálásával (most már az alapértelmezett verzió) és az eredmény felskálázásával. Ezután speciális „Zoom” gombok jelennek meg a kimenet alatt. A nagyítás 1,5x, 2x, vagy egy 1 és 2 közötti egyéni értékkel történhet. Egy másik gomb, a „Make Square” (négyzetté alakítás) a meglévő kép köré olyan módosítást generál, amely 1:1 négyzetes képarányt hoz létre.

David Holz, a Midjourney készítője csütörtök este a Discord platformon jelentette be az új v5.2 funkciókat és fejlesztéseket. A „zoom out” mellett a legjelentősebb újítások közé tartozik a jobb képminőséget ígérő, átdolgozott esztétikai rendszer és egy erősebb „–stylize” parancs, amely azt állítja, hogy egy kép mennyire tűnik nem reálisnak. Van egy új, alapértelmezés szerint aktivált „magas variációs mód” is, amely növeli a kompozíciós változatosságot a képgenerációk között
A v5.2 azonnali bevezetése ellenére Holz a bejelentésében hangsúlyozta, hogy a változások előzetes értesítés nélkül is bekövetkezhetnek. A Midjourney modell régebbi verziói továbbra is elérhetőek a „/settings” parancs vagy a „–v 5.1” parancs beírásával.

Midjourney

A Midjourney újításai

A rajongók ezt az új képszintézis művészeti formát, amelyet néha „szintetográfiának” is neveznek nagy örömmel fogadták. Néhány Midjourney felhasználó „lenyűgözőnek” és „észbontónak” nevezte a frissítés új funkcióit, amelyek azért nem szokatlan szuperlatívuszok a hájpolt mesterséges intelligencia világában.

A legutóbbi frissítés egy újabb epizód egy sor minőségi fejlesztés útján, amely már 2022. márciusa óta tart, amikor a modell viszonylag még rosszul definiált, részlethiányos képeket generált. Ebben az évben a Midjourney márciusban mutatta be a v5.0-ás, majd idén májusban a v5.1-es verziót, amelyek a realizmuson és a képek részletességén javítottak. A v5-ös verziósorozat bevezetése lehetővé tette Ferenc pápáról és Donald Trumpról készült nagyon valósághű képek létrehozását, amelyek a közösségi médiában azonnal a hamisításokkal kapcsolatos aggodalmakat váltottak ki.

Annak ellenére, hogy a Midjourney rajongói izgatottak az új funkciók miatt, a képszintézis továbbra is rendkívül ellentmondásos marad egyes művészek körében, mivel ezeket a mesterséges intelligencia rendszereket úgy képzik ki, hogy több millió, a világhálóról származó képet használnak fel a művészekkel való konzultáció, hitelesítés vagy engedély nélkül. A Midjourney hivatalosan soha nem fedte fel a forrásadatok pontos tartalmát. Az Adobe etikusabb utat próbál járni a Firefly segítségével, de a Venture Beat nemrég arról számolt be, hogy a művészek aktív hozzájárulása még mindig marginális.

Egyelőre nehéz nem pozitívan értékelni a Midjourney szemet gyönyörködtető technikai fejlesztéseit, miközben még mindig azon tűnődünk, hogy van-e etikusabb út a technológia számára – egy olyan, amely a hagyományos és a szintetográfus művészeknek egyaránt.