A Google Gemini két új népszerű AI funkciót kapott, jön a Gems chatbot és az Imagen 3 képgenerátor

2024. augusztus 31. 19:36 2025. március 12. 10:10 43

A Google, hogy felvegye a harcot az OpenAI dominanciájával, elindította az első nagyobb frissítését a Gemini AI-modelljéhez. Érkezik a „Gems” nevű testreszabható chatbot, és az Imagen 3 AI képgenerátor is.

A Gemst először a májusi I/O eseményen mutatták be, és most a Gemini Advanced, Gemini Business és Gemini Enterprise felhasználók számára mobilon és asztali számítógépen is elérhetővé vált. A funkció fizetős 150 országban és több mint 30 nyelven elérhető.

Új funkciókkal frissít a Google Gemini

Gems chatbot

A Google mostantól a Gemini előfizetőinek lehetőséget kínál arra, hogy egyéni chatbotokat hozzanak létre Gems néven. Ezek a chatbotok különböző jellemzőkkel és konkrét utasításokon keresztül személyre is szabhatóak. A felhasználóknak egyszerűen csak el kell nevezniük a chatbotot, meg kell adniuk az utasításokat, és már használhatják is.

A Gems segítségével létrehozhat egy szakértői csapatot, amely segít átgondolni egy kihívást jelentő projektet, ötleteket gyűjteni egy közelgő eseményhez, vagy megírni a tökéletes feliratot egy közösségi média poszthoz.

– áll a Google közleményében.

A chatbot részletes utasítássorozatotok megjegyzésére is alkalmas, így rengeteg időt takaríthat meg az unalmas, ismétlődő vagy bonyolult feladatoknál.

Azok a felhasználók, akik nem szeretnének személyre szabott chatbotot használni, igénybe vehetik az előre elkészített Gemseket. Azonban a személyre szabott chatbotok különösen hasznosak lehetnek az ismétlődő feladatoknál, mivel így nem kell minden alkalommal külön-külön utasításokat adni.

Imagen 3

A Gemini közvetlenül integrálja majd a vállalat AI képgenerátorát, az Imagen 3-at is, amely azonban továbbra sem készít képeket emberekről, miután egy korábbi kiadás problémás és történelmileg nem pontos képeket készített, és a Google kénytelen volt offline állapotba helyezni az eszközt.

Kapcsolódó: Cenzúra a köbön: A Google korlátozza a Gemini chatbotjának válaszait

Széleskörű belső és külső red-teaming teszteléseket végzünk, és független szakértőkkel együttműködve biztosítjuk a folyamatos fejlesztést.

– mondta a Google képviselője, majd hozzátette, hogy rendelkezésre áll egy tiltott felhasználási szabályzat is, valamint tiltják az olyan válaszokat, amelyek sértik a szabályzatot.

Az ellentmondásos esetek ellenére a Geminit kérdezve a következő választ kapjuk:

Az emberek képi generációja hamarosan érkezik a Gemini Advancedhoz.

A Gemini képgenerálási képességei az Imagen 3-ra, a Google legújabb és legfejlettebb képgenerálási modelljére lesznek frissítve. A frissítéssel a felhasználók jobb képminőséget és pontosabb megértést kaphatnak majd a Gemini AI chatbot által generált képek során.

A Google a hónap elején indította az Imagen 3-at, bár a bejelentést már májusban megtették. A bevezetést követően az olyan eszközök, mint az OpenAI-tól származó Dall-E, a Midjourney és az Elon Musk Grok chatbotjába épített Flux kemény versenytárssal kell, hogy szembesüljenek.

Versenyben a ChatGPT-vel

Úgy tűnik, hogy a Google a Gems bevezetésével próbálja felvenni a versenyt az OpenAI alkalmazással, amely tavaly bejelentette, hogy a GPT Store-on keresztül elérhetővé tette az egyéni GPT-ket. Ezek szintén lehetővé teszik a felhasználók számára a saját, személyre szabott GPT-ket létrehozását.

Over the coming days, start creating and chatting with Gems: customizable versions of Gemini that act as topic experts. 🤝

We’re also launching premade Gems for different scenarios – including Learning coach to break down complex topics and Coding partner to level up your skills… pic.twitter.com/2Dk8NxtTCE

— Google DeepMind (@GoogleDeepMind) August 28, 2024

A Google DeepMind nemrégiben közzétett egy jelentést, amely az Imagen 3 teljesítményét vetette össze elődjével, az Imagen 2-vel. Emellett több vezető külső modellel is összehasonlították az új funkciót, köztük a DALL-E 3, a Midjourney v6, a Stable Diffusion 3 Large és a Stable Diffusion XL 1.0 programokkal.

Az emberi értékelés általános preferencia kategóriájában, amely azt mérte, hogy a felhasználó mennyire elégedett a képpel a beviteli prompthoz képest, az Imagen 3 jelentős előnnyel nyert.

A versenyképesség a Gemini chatbot bevezetésével erősödhet. Ugyanis a Geminiben ingyenesen lehet kiváló minőségű képeket generálni, míg a DALL-E 3 segítségével történő képgenerálás a ChatGPT-ben a ChatGPT Plus havi 20 dollárba kerül.

A Google azt is megosztotta, hogy az Imagen 3 integrációja beépített biztosítékokkal és Synth-ID-vel rendelkezik, amely vízjelekkel jelzi, hogy a generált képek AI segítségével készültek.

Érdekelhet még: Új funkciókkal fejleszti videós szolgáltatásait a Google Drive

Címkék:

google