Meta prezintă ImageBind, un model de AI care învață ca oamenii

ImageBind

Meta a anunțat recent lansarea unui model de inteligenta artificiala numit ImageBind, care pare sa depaseasca orice alt AI existenta. Scopul Meta este de a nu ceda teren in fata companiilor precum Google sau Microsoft in cursa pentru crearea celei mai bune inteligente artificiale de pe piata.

Modelul de AI ImageBind, dezvoltat de inginerii de la Meta, cauta sa invete in acelasi mod in care oamenii invata. Pentru a face acest lucru, acestia au adoptat un schema multisenzoriala care implica imagini, text, video si sunet, precum si date de adancime, termice si de inertie. ImageBind face parte din initiativa Meta de a crea sisteme multimodale care pot invata din diverse tipuri de date.

ImageBind
ImageBind

Modelul de AI nu intelege doar un singur element, ci poate sa il lege cu alte caracteristici. De exemplu, va fi capabil sa determine sunetul, forma, temperatura si modul in care se misca obiectele dintr-o fotografie.

Meta a declarat ca ImageBind depaseste alte modele antrenate pentru o singura modalitate. In plus, spre deosebire de AI generative precum ChatGPT sau Midjourney, alternativa dezvoltata de Meta poate lega sase tipuri de date intr-un index multidimensional. Cercetatorii ar putea utiliza oricare dintre acestea ca metoda de intrare sau sa le incropeasca intre ele.

ImageBind
ImageBind

Una dintre caracteristicile ImageBind este ca foloseste un concept de invatare similar cu cel aplicat de oameni. Compania Meta a declarat ca atunci cand oamenii absorb informatii din lume, folosim mai multe simturi in mod innascut. ImageBind foloseste proprietatea de legatura a imaginilor, ceea ce inseamna ca acestea coexista cu o varietate de modalitati si pot servi ca pod pentru a le conecta, asa cum ar fi legarea textului cu imaginea folosind datele web sau legarea miscarii la video folosind date de video capturate de camere portabile cu senzori IMU.

ImageBind este un model impresionant de AI dezvoltat de Meta, care poate lega sase tipuri de date diferite intr-un index multidimensional si poate invata intr-un mod similar cu cel al oamenilor. De asemenea, faptul ca este de cod deschis este o veste buna pentru cei interesati care vor putea accesa repository-ul pe GitHub pentru a-l imbunatati sau pentru a depista eventualele probleme.

Marian Ciobanu, redactor-şef la Geeki.ro, pasionat de tehnologie, maşini, divertisment, ştiinţă şi jocuri video. A fost fondator și redactor-șef la BetIT (2014-2018), iar din 2019 conduce Geeki.ro, un portal de știri IT&C și articole despre Hi-Tech și gaming.

Lasă un comentariu

Share to...