Ce este „reinforcement learning” si viitorul AI

Inca un articol interesant despre cat de repede evolueaza de la an la an algoritmii din AI.

In 2015, predictiile specialistilor spuneau ca ne mai trebuie cel putin un deceniu pana cand AI-urile vor bate un campion mondial la GO.

In 2016, AI-ul AlphaGo il invinge pe Lee Sedol, 9-dan profesionist si multiplu campion mondial (cu 4-1).

In 2017, AI-ul AlphaGoMaster il invinge pe Ke Jie, 9-dan profesionist si campion mondial en-titre (cu 3-0) si pe ceilalti jucatori de top chinezi (tot la 0).

In 2018, AlphaGoZero, un AI bazat pe un nou algoritm de tip „reinforcement learning„, invata sa joace GO jucand doar cu el insusi, fara nici un input uman si dupa 40 de zile de studiu solitar bate toate variantele anterioare de AlphaGo fara nici o pierdere.

Practic AlphaGoZero a devenit de unul singur cel mai puternic jucator din lume, jucand la un nivel la care cei mai puternici jucatori umani abia reusesc sa inteleaga strategiile si tacticile folosite.

Progresul acesta accelerat inca nu este vizibil in restul de „narrow AI-uri” care folosesc diferiti algoritmi pentru tipuri diferite de domenii, dar, in cazul nostru, putem concluziona ca se verifica din nou principiul fizic care spune ca „acumularile cantitative duc la salturi calitative”.

In sah, Go, shogi si alte jocuri logice se pare ca saltul calitativ a fost facut, ramane sa vedem cand se va intampla si in restul de AI-uri.

Dar pana se va intampla asta, putem analiza impactul socio-economic al acestui AI care depaseste orice jucator uman, si sa aflam care va fi raspunsul la multe intrebari nelinistitoare:

– O sa fie disponibil public AlphaGoZero sau o sa fie tinut ascuns?
– O sa lanseze Google un app comercial de GO, bazat pe engine-ul AphaGoZero, ca partener si mentor de GO pentru oricine, oriunde, oricand?
– O sa dispara toate software-urile comerciale de GO de pe piata?
– O sa mai fie oamenii inspirati sa joace GO si sa concureze?
– O sa mai sponsorizeze vreo firma sau publicatie competitiile de GO?
– O sa mai aiba din ce trai jucatorii profesionisti de GO care acum traiesc din competitii si lectii de GO?
– O sa apara o piata neagra de AI-uri, creata de cei care vor propriul AI de care sa nu stie nimeni?
– O sa apara trisori care vor folosi astfel de AI-uri de pe piata neagra in concursuri sau meciuri pe bani?
– Cum se vor poteja competitiile umane de GO de trisorii care vor incerca sa se ajute cu AI-uri?
– Cum va evolua acest AlphaGoZero daca este lasat in continuare sa joace cu el insusi?
– Ce alte jocuri urmeaza sa pateasca aceeasi soarta (IN poker AI-ul deja bate constant jucatorii umani)?
– In ce alte domenii vom aplica acest tip de „reinforcement learning” pentru a crea AI-uri care vor rezolva problemele actualmente ineficient sau deloc rezolvate?

Voi ce credeti?

*sursa foto Deepmind.com

Leave a Reply