Odată cu avansarea rapidă a tehnologiei, pe piața inteligenței artificiale există sute de modele, fiecare specializându-se în diverse domenii. Alegerea celui mai bun model de inteligență artificială devine o sarcină dificilă, deoarece criteriile de evaluare pot varia considerabil. Cu toate acestea, acum avem o listă care își propune să identifice cele mai bune modele de inteligență artificială, clasificate în funcție de capacitățile lor de a evita „halucinații”.
Determinarea celui mai bun model de inteligență artificială este o sarcină complexă. Acest lucru se datorează dificultății stabilirii criteriilor relevante pentru evaluare. Structura setului de date pe care modelele sunt instruite și rezultatele produse direct de acestea sunt factori cheie în definirea performanței. Prin urmare, metoda cea mai eficientă de clasificare a acestor instrumente este evaluarea acurateții rezultatelor produse. În acest context, Vectara a publicat un tabel de halucinații pentru roboții de conversație cu inteligență artificială, clasându-i în funcție de abilitățile lor de a evita halucinațiile.
Cele mai bune modele de inteligență artificială conform Vectara:
- GPT-4: Potrivit măsurătorilor Vectara, GPT-4 are cea mai mică rată de halucinații și cea mai mare precizie, ceea ce îl face lider în domeniu.
- GPT 3.5: Acest model, dezvoltat de OpenAI, ocupă locul doi în clasamentul Vectara, având o performanță impresionantă și fiind deja utilizat în platforma ChatGPT.
- Llama 2 70B
- Llama 2 7B
- Llama 2 13B
- Cohere-Chat
- Cohere
- Anthropic Calude 2
- Mistral 7B
- Google Palm
- Google Plam-Chat
Conform măsurătorilor Vectara, toate aceste modele au tendința de a reflecta fenomenul cunoscut sub numele de „halucinații”. Cu alte cuvinte, aceste instrumente pot inventa, uneori, realități pentru a umple golurile. Aceste falsuri sunt atât de subtile și sofisticate încât o minte neatență poate fi ușor înșelată.
Deși liderul GPT-4 a fost testat doar pe o sursă de date fixă, el se remarcă prin cea mai mică rată de halucinații și cea mai mare precizie. Faptul că GPT-3.5 ocupă un loc puternic în clasament evidențiază, de asemenea, succesul impresionant al OpenAI în acest domeniu.
Cu toate acestea, la coada listei se află două modele mari ale Google, Palm și Palm-Chat, care se evidențiază prin performanțe slabe. În special, Palm-Chat atinge o rată de halucinații de peste 27%, ceea ce îl face cel mai puțin fiabil model. Conform măsurătorilor Vectara, răspunsurile Palm-Chat sunt complet inundate de urme de halucinații.
Lista modelelor de inteligență artificială furnizată de Vectara reflectă natura dinamică și competitivă a acestui domeniu, oferind utilizatorilor un ghid pentru identificarea modelelor de încredere și eficiente. Evoluția acestor modele în viitor rămâne o întrebare deschisă și va fi interesant de urmărit.
Sursa: tomshardware.com