A Mistral bemutatta az AI modelljének legújabb verzióját
Alig egy nappal azután, hogy a Meta bejelentette július 24-én a LLaMA 3.1-et, csütörtökön a Mistral is bemutatta legújabb nyelvi modelljét. A cég állítása szerint a megoldásuk felveszi a versenyt a Meta legnagyobb AI modelljével is.
A Mistral Large 2 fej-fej mellett teljesít a LLaMA 3.1 205B-vel. De több kulcsfontosságú benchmarkban is felülmúlja a LLaMA 3.1-t, különösen azokban, amelyek a modellek kódgenerálási képességét mérik.
A Mistral Large többet teljesít kevesebből
A 123 milliárd paraméterével a Mistral Large 2 a közepes és a nagyméretű LLaMA modellek között helyezkedik el. Mégis jobban teljesített bizonyos feladatokban, mint a LLaMA 3.1 205 milliárd paraméteres változata.
Míg a LLaMA 3.1 205B tartja vezető helyét a kulcsfontosságú MMLU (Massive Multitask Language Understanding) benchmarkban, a Mistral Large 2 olyan területeken, mint a kódolás, a matematika és az utasításkövetés, az élre tört. A Mistral modellje a többnyelvű szöveggenerálás és következtetés terén is jól teljesít.
Tömörebb válaszok adása
A különböző kérdésekre adott mesterséges intelligencia-válaszok hosszát összehasonlítva a Mistral Large 2 rövidebb válaszokat ad, mint a LLaMA 3.1, a GPT-40 és a Claude 3. Hangsúlyozták, hogy a rövidebb válaszok költséghatékonyabbak a következtetés szempontjából. A Mistral hozzátette: „nagy erőfeszítéseket tettünk annak biztosítására, hogy a szöveggenerálás, amikor csak lehetséges, tömörek és lényegre törőek maradjanak”.
A tömörségre való fókusz kiemeli a mesterséges intelligencia hatékonyságának növekvő fontosságát, amely a kisebb, kompaktabb modellek legújabb generációját inspirálta. Általában a hosszabb válaszok számos benchmarkban javítják a pontszámokat. De a Mistral Large úgy lett megtervezve, hogy ne legyen szükségtelenül bőbeszédű, ami segíthet az üzleti felhasználók körében.
A nyílt forráskódú AI riválisok között egyre élesebb a verseny
A Mistral Large 2 és a LLaMA 3.1 közötti rivalizálás rávilágít a nyílt forráskódú AI fejlesztés gyors fejlődésére és versenyképes jellegére. A teljesítményt tekintve a nyílt forráskódú AI most először jelent életképes alternatívát a Google és az OpenAI által kínált szabadalmaztatott modellekkel szemben.
Mindkét modell szabadon hozzáférhetővé vált kutatási célokra is. A Mistral és a Meta azonban eltér a nyílt forráskódú mesterséges intelligencia iránti elkötelezettségükben.
Míg a Meta a Microsofttal kötött partnersége óta a megengedőbb licenszek felé mozdult el, a Mistral az ellenkező irányba indult el, és legújabb verzióinak kereskedelmi alkalmazásait a fizető ügyfelekre korlátozta.