A Midjourney új AI képgeneráló modellt mutatott be

A Midjourney több mint egy év után egy új AI képgeneráló modellt mutatott be. A V7-nek nevezett modell egy alapos átdolgozás, amelynek most alfa verziója már elérhető a felhasználók számára. A V7-es verzióban két területen van jelentős javulás: az első a jobb képek, a második pedig az új eszközök és munkafolyamatok.
Kezdve a képi fejlesztésekkel, a V7 sokkal nagyobb koherenciát és konzisztenciát ígér a kezek, ujjak, testrészek és „mindenféle tárgyak” esetében. Sokkal részletesebb és valósághűbb textúrákat és anyagokat is kínál, például a bőr ráncait vagy egy kerámiaedény finomságait. Ezek a részletek gyakran a legnyilvánvalóbb árulkodó jelei annak, hogy egy képet mesterséges intelligencia generált. Hogy egyértelmű legyen, a Midjourney nem állítja, hogy olyan fejlesztéseket hajtott végre, amelyek a mesterséges intelligencia képeit felismerhetetlenné teszik a gyakorlott szem számára. Csak azt mondja, hogy a megszokott rendellenességek egy részét jelentős mértékben javították.
A funkciók terén bemutatták az új „Draft Mode” alkalmazást is. A felhasználókkal való különböző kommunikációs csatornáin (blog, Discord, X, stb.) a Midjourney azt hirdette, hogy „a Draft Mode feleannyi költséggel jár, és 10-szer gyorsabban rendereli a képeket”.
A képek minősége azonban gyengébb, mint a többi módban. Ezért nem ez a cél, hogy valaki így készítsen végleges képeket. Inkább arra szolgál, hogy a kívánt eredmény megtalálása érdekében iteráljon, mielőtt módot váltana, hogy kész legyen valami a nyilvános fogyasztásra.
A Midjourney V7-et teljesen személyre lehet szabni
A V7 a korábbi verziók legtöbb paraméterével működik (–ar, –seed, stb.), beleértve a felhasználók meglévő –sref kódjait a 6.1-ből, valamint a nemrég bevezetett személyre szabási funkciót. Valójában a V7 az első olyan Midjourney modell, amely alapértelmezésben engedélyezi a személyre szabást. Ez azt jelenti, hogy a felhasználóknak legalább 200 kép kiválasztásával kell betanítaniuk az esztétikai profiljuk kialakításához.
A személyre szabás több száznyi két kép közötti választási lehetőséget mutat be, így a rendszer megtanulja, hogy mit találsz „szépnek”, és a generált képeket ehhez az ízléshez igazítja. A személyre szabást azonban a korábbi modellekhez hasonlóan a V7-ben is kikapcsolható.
A Midjourney volt az egyik első AI képgeneráló eszköz, amely széles körben elterjedt. Kezdetben a Discordon volt elérhető és egy kissé rejtélyes szintaxison keresztül volt használható, de azóta egy modernebb webes felületet is elindították már.
A közösségi médiában megosztott mesterséges intelligencia alapú alkotások jelentős része a Discorddal készült. Ez a munkafolyamat kulcsfontosságú része sok AI-videó készítőjének is, akik gyakran a Midjourney-ben készítik el a kezdeti képet, mielőtt a Runwayhez hasonló alkalmazások kép/videó funkcióját használnák.
Bármennyire is népszerű, a Midjourney azonban több per tárgya lett az évek során. Egyúttal része annak a folyamatos vitának, hogy az AI modelleknek a weben található, szerzői jogvédelem alatt álló műveken való képzése tisztességes felhasználásnak minősül-e. Bárki, aki használta már a Midjourney-t, tudja, hogy szerzői jogi védelem alatt álló műveken képezték ki. Néha még vízjeleket és művészi aláírásokat is generál a kimeneteiben.