Facebook folosește miliarde de fotografii publice de pe Instagram ca să-și instruiască algoritmul de inteligență artificială. Fotografiile conțin 17.000 de hashtag-uri furnizate de utilizatorii.

Facebook are la dispoziție o cantitate uriașă de date pentru instruirea algoritmilor AI, inclusiv miliarde de fotografii ale utilizatorilor Instagram. Gigantul social media a achiziționat Instagram pentru 1 miliard de dolari în 2012. La acea vreme, unii au criticat valoarea plătită, pentru că platforma nu avea mai mult de 30 de milioane de utilizatori. Acum, însă, platforma are peste 800 de milioane de utilizatori lunari activi.

Instruirea computerelor ca să facă lucrurile pe care oamenii le fac în mod obișnuit – ca identificare fotografiilor – implică, de obicei, furnizarea unei cantități enorme de date. Dar aceste date trebuie să fie etichetate de oameni, ceea ce implică timp și costă bani. Facebook a dezvoltat un nou proces, astfel că nu trebuie să-și pună angajații la un birou să clasifice imaginile.

Facebook a instruit un algoritm de inteligență artificială să clasifice imaginile de la sine, folosind peste 3,5 miliarde de imagini postate pe Instagram. Algoritmul a ținut cont de cele 17.000 de hashtag-uri puse de utilizatori.

„Cea mai mare provocare pentru realizarea progresul computerelor – ca în mult alte domenii AI – este că ne bazăm aproape în întregime pe seturi de date semnate cu mâna umană”, a declarat Mike Schroepfer la conferința anuală a dezvoltatorilor F8. „ Am folosit 3,5 miliarde de imagini publice pentru a antrena mașinăria”.

În august anul trecut, IBM a stabilit un record pentru recunoașterea imaginilor, cu o rată de precizie de 33,8%, după ce a analizat 7,5 milioane de imagini în decurs de șapte ore. Acum, Facebook a întrecut cu mult acel standard.

Setul de date Instagram este de 10 ori mai mare decât un cache uriaș de fotografii pe care Google l-a folosit pentru a pregăti algoritmi de imagine, potrivit Wired. „Am creat acum cel mai bun sistem de vizualizare a computerului din lume, obținând cel mai mare scor de 84,5% din ImageNet – un set de date utilizat pe scară largă pentru benchmarking”.

Schroepfer a spus că Facebook utilizează deja sistemul de vizionare a calculatoarelor pe platforma sa pentru a detecta „conținut rău” care trebuie eliminat. Acest lucru include probabil nuditate și conținut legate de terorism.

Sursa articolului