Az OpenAI szerint a legújabb AI modellje új szinten képes gondolkodni, mielőtt válaszol

Az OpenAI több új mesterséges intelligencia-modellt is kiadott egy átdolgozott nevezetéktani rendszer keretében. Kezdve a legújabb OpenAI o1 modellel, amelyről azt állítja, hogy „gondolkodni tud, mielőtt válaszolna”.

„Az összetett következtetési feladatok esetében ez jelentős előrelépés, és az AI képességek új szintjét jelenti.” – írta az OpenAI egy szeptember 12-i blogbejegyzésben. „Ezt figyelembe véve visszaállítjuk a számlálót egyre, és OpenAI o1-nek nevezzük ezt a sorozatot”.

Az új modellek képesek időt szánni a gondolkodásra, és „gondolatláncokra épülő” érvelést használni az összetett feladatok megoldására – különösen a STEM (tudomány, technológia, mérnöki területek és matematika) és a kódolással kapcsolatos feladatokban. – közölte az OpenAI.

A mesterséges intelligenciával foglalkozó cég videókat osztott meg többek között arról, ahogy az OpenAI o1 egy videojátékot kódol egy prompt alapján, és megold egy összetett logikai feladványt is.

Sok benchmarkban jobban teljesített az OpenAI legújabb modellje

Az OpenAI o1 „preview” és „mini” modelleket a ChatGPT Plus előfizetők számára tették elérhetővé. De a cég azt tervezi, hogy a következő hónapokban továbbfejlesztett változatokat ad ki.

OpenAI

Az OpenAI o1 új modellje a GPT-4o-val összehasonlítva több benchmark alapján. Forrás: OpenAI

Az OpenAI olyan adatokat osztott meg, amelyek szerint az OpenAI o1 számos benchmarkban legyőzi a GPT-4o-t. Többek között a PhD-szintű természettudományos témákban a biológia, a kémia és a fizika területén, valamint az Egyesült Államok egyes középiskolai vizsgáiban.

Az OpenAI o1 mini a STEM érvelési képességekre való összpontosítása azt jelenti, hogy a szűkebb fókuszán kívül más területeken nem rendelkezik olyan nagy tudással, közölte az OpenAI. „A tényszerű tudása a nem-STEM témákban, például dátumok, életrajzok és kvízek terén hasonló a kis LLM-ekhez, például a GPT-4o minihez. A jövőbeli verziókban javítani fogjuk ezeket a korlátozásokat. Valamint kísérletezni fogunk a modell kiterjesztésével a STEM-en kívüli más modalitásokra és szakterületekre.” – tették hozzá.

Az iparági szakértők arra számítottak, hogy az OpenAI szeptemberben kiad egy érvelésre összpontosító AI-modellt Strawberry kódnéven. Az OpenAI azonban nem hozza nyilvánosságra a fejlesztés alatt álló különböző modellek közötti különbségeket.