A Google Gemini két új népszerű AI funkciót kapott, jön a Gems chatbot és az Imagen 3 képgenerátor
A Google, hogy felvegye a harcot az OpenAI dominanciájával, elindította az első nagyobb frissítését a Gemini AI-modelljéhez. Érkezik a „Gems” nevű testreszabható chatbot, és az Imagen 3 AI képgenerátor is.
A Gemst először a májusi I/O eseményen mutatták be, és most a Gemini Advanced, Gemini Business és Gemini Enterprise felhasználók számára mobilon és asztali számítógépen is elérhetővé vált. A funkció fizetős 150 országban és több mint 30 nyelven elérhető.
Új funkciókkal frissít a Google Gemini
Gems chatbot
A Google mostantól a Gemini előfizetőinek lehetőséget kínál arra, hogy egyéni chatbotokat hozzanak létre Gems néven. Ezek a chatbotok különböző jellemzőkkel és konkrét utasításokon keresztül személyre is szabhatóak. A felhasználóknak egyszerűen csak el kell nevezniük a chatbotot, meg kell adniuk az utasításokat, és már használhatják is.
A Gems segítségével létrehozhat egy szakértői csapatot, amely segít átgondolni egy kihívást jelentő projektet, ötleteket gyűjteni egy közelgő eseményhez, vagy megírni a tökéletes feliratot egy közösségi média poszthoz.
– áll a Google közleményében.
A chatbot részletes utasítássorozatotok megjegyzésére is alkalmas, így rengeteg időt takaríthat meg az unalmas, ismétlődő vagy bonyolult feladatoknál.
Azok a felhasználók, akik nem szeretnének személyre szabott chatbotot használni, igénybe vehetik az előre elkészített Gemseket. Azonban a személyre szabott chatbotok különösen hasznosak lehetnek az ismétlődő feladatoknál, mivel így nem kell minden alkalommal külön-külön utasításokat adni.
Imagen 3
A Gemini közvetlenül integrálja majd a vállalat AI képgenerátorát, az Imagen 3-at is, amely azonban továbbra sem készít képeket emberekről, miután egy korábbi kiadás problémás és történelmileg nem pontos képeket készített, és a Google kénytelen volt offline állapotba helyezni az eszközt.
Kapcsolódó: Cenzúra a köbön: A Google korlátozza a Gemini chatbotjának válaszait
Széleskörű belső és külső red-teaming teszteléseket végzünk, és független szakértőkkel együttműködve biztosítjuk a folyamatos fejlesztést.
– mondta a Google képviselője, majd hozzátette, hogy rendelkezésre áll egy tiltott felhasználási szabályzat is, valamint tiltják az olyan válaszokat, amelyek sértik a szabályzatot.
Az ellentmondásos esetek ellenére a Geminit kérdezve a következő választ kapjuk:
Az emberek képi generációja hamarosan érkezik a Gemini Advancedhoz.
A Gemini képgenerálási képességei az Imagen 3-ra, a Google legújabb és legfejlettebb képgenerálási modelljére lesznek frissítve. A frissítéssel a felhasználók jobb képminőséget és pontosabb megértést kaphatnak majd a Gemini AI chatbot által generált képek során.
A Google a hónap elején indította az Imagen 3-at, bár a bejelentést már májusban megtették. A bevezetést követően az olyan eszközök, mint az OpenAI-tól származó Dall-E, a Midjourney és az Elon Musk Grok chatbotjába épített Flux kemény versenytárssal kell, hogy szembesüljenek.
Versenyben a ChatGPT-vel
Úgy tűnik, hogy a Google a Gems bevezetésével próbálja felvenni a versenyt az OpenAI alkalmazással, amely tavaly bejelentette, hogy a GPT Store-on keresztül elérhetővé tette az egyéni GPT-ket. Ezek szintén lehetővé teszik a felhasználók számára a saját, személyre szabott GPT-ket létrehozását.
Over the coming days, start creating and chatting with Gems: customizable versions of Gemini that act as topic experts. ?
We’re also launching premade Gems for different scenarios – including Learning coach to break down complex topics and Coding partner to level up your skills… pic.twitter.com/2Dk8NxtTCE
— Google DeepMind (@GoogleDeepMind) August 28, 2024
A Google DeepMind nemrégiben közzétett egy jelentést, amely az Imagen 3 teljesítményét vetette össze elődjével, az Imagen 2-vel. Emellett több vezető külső modellel is összehasonlították az új funkciót, köztük a DALL-E 3, a Midjourney v6, a Stable Diffusion 3 Large és a Stable Diffusion XL 1.0 programokkal.
Az emberi értékelés általános preferencia kategóriájában, amely azt mérte, hogy a felhasználó mennyire elégedett a képpel a beviteli prompthoz képest, az Imagen 3 jelentős előnnyel nyert.
A versenyképesség a Gemini chatbot bevezetésével erősödhet. Ugyanis a Geminiben ingyenesen lehet kiváló minőségű képeket generálni, míg a DALL-E 3 segítségével történő képgenerálás a ChatGPT-ben a ChatGPT Plus havi 20 dollárba kerül.
A Google azt is megosztotta, hogy az Imagen 3 integrációja beépített biztosítékokkal és Synth-ID-vel rendelkezik, amely vízjelekkel jelzi, hogy a generált képek AI segítségével készültek.