OpenAI a publicat două modele de limbaj complet open-source, marcând prima astfel de mișcare din 2019 încoace. Modelele se numesc gpt-oss-20b și gpt-oss-120b, iar numele spun totul: primul are 20 de miliarde de parametri, al doilea – 120 de miliarde.

Ce e important aici e că vorbim de modele cu ponderi deschise, adică dezvoltatorii pot descărca direct parametrii interni, îi pot rula local, modifica sau integra în alte sisteme. Practic, nu mai ești blocat de API-ul OpenAI sau de infrastructura lor.

Totul e publicat pe GitHub, cu licență Apache 2.0, una dintre cele mai permisive din zona open-source. Asta înseamnă că modelele pot fi folosite inclusiv în proiecte comerciale, fără prea multe bătăi de cap legale.

Un alt detaliu interesant: rulează inclusiv pe Apple Silicon, deci pot fi folosite complet offline. Nu mai e nevoie nici de cloud, nici de servere dedicate. În contextul în care majoritatea modelelor AI sunt încă închise și rulează doar prin API, mișcarea e una neașteptată din partea OpenAI.

OpenAI

Modelul mai mare, gpt-oss-120b, e de tip Mixture-of-Experts, adică folosește doar o parte din parametri la fiecare inferență – rezultatele vin mai rapid și consumul de resurse e mai mic. Ambele modele suportă ferestre de context de până la 128.000 de token-uri, deci pot lucra cu documente lungi și sarcini mai complexe.

OpenAI a anunțat și o politică de „utilizare loială”, prin care încurajează folosirea acestor modele într-un mod sigur și responsabil.

Rămâne de văzut ce va face comunitatea cu aceste resurse. Deocamdată, e clar că deschiderea modelului vine cu un potențial imens, dar și cu niște întrebări – inclusiv legate de confidențialitate. Mai ales după ce OpenAI a declarat recent că discuțiile cu ChatGPT ar putea fi folosite în instanță, fiindcă nu beneficiază de protecție legală specială.