A Mistral bemutatta az AI modelljének legújabb verzióját

2024. július 28. 14:34

Alig egy nappal azután, hogy a Meta bejelentette július 24-én a LLaMA 3.1-et, csütörtökön a Mistral is bemutatta legújabb nyelvi modelljét. A cég állítása szerint a megoldásuk felveszi a versenyt a Meta legnagyobb AI modelljével is.

A Mistral Large 2 fej-fej mellett teljesít a LLaMA 3.1 205B-vel. De több kulcsfontosságú benchmarkban is felülmúlja a LLaMA 3.1-t, különösen azokban, amelyek a modellek kódgenerálási képességét mérik.

A Mistral Large többet teljesít kevesebből

A 123 milliárd paraméterével a Mistral Large 2 a közepes és a nagyméretű LLaMA modellek között helyezkedik el. Mégis jobban teljesített bizonyos feladatokban, mint a LLaMA 3.1 205 milliárd paraméteres változata.

Míg a LLaMA 3.1 205B tartja vezető helyét a kulcsfontosságú MMLU (Massive Multitask Language Understanding) benchmarkban, a Mistral Large 2 olyan területeken, mint a kódolás, a matematika és az utasításkövetés, az élre tört. A Mistral modellje a többnyelvű szöveggenerálás és következtetés terén is jól teljesít.

Tömörebb válaszok adása

A különböző kérdésekre adott mesterséges intelligencia-válaszok hosszát összehasonlítva a Mistral Large 2 rövidebb válaszokat ad, mint a LLaMA 3.1, a GPT-40 és a Claude 3. Hangsúlyozták, hogy a rövidebb válaszok költséghatékonyabbak a következtetés szempontjából. A Mistral hozzátette: „nagy erőfeszítéseket tettünk annak biztosítására, hogy a szöveggenerálás, amikor csak lehetséges, tömörek és lényegre törőek maradjanak”.

A modellek válaszainak átlagos hossza

A tömörségre való fókusz kiemeli a mesterséges intelligencia hatékonyságának növekvő fontosságát, amely a kisebb, kompaktabb modellek legújabb generációját inspirálta. Általában a hosszabb válaszok számos benchmarkban javítják a pontszámokat. De a Mistral Large úgy lett megtervezve, hogy ne legyen szükségtelenül bőbeszédű, ami segíthet az üzleti felhasználók körében.

A nyílt forráskódú AI riválisok között egyre élesebb a verseny

A Mistral Large 2 és a LLaMA 3.1 közötti rivalizálás rávilágít a nyílt forráskódú AI fejlesztés gyors fejlődésére és versenyképes jellegére. A teljesítményt tekintve a nyílt forráskódú AI most először jelent életképes alternatívát a Google és az OpenAI által kínált szabadalmaztatott modellekkel szemben.

Mindkét modell szabadon hozzáférhetővé vált kutatási célokra is. A Mistral és a Meta azonban eltér a nyílt forráskódú mesterséges intelligencia iránti elkötelezettségükben.

Míg a Meta a Microsofttal kötött partnersége óta a megengedőbb licenszek felé mozdult el, a Mistral az ellenkező irányba indult el, és legújabb verzióinak kereskedelmi alkalmazásait a fizető ügyfelekre korlátozta.

Címkék: