La intel·ligència artificial i els deu reptes de l'aprenentatge profund

Pablo Rodríguez Canfranc
Economista

Robotescribiendo


Com anticipem en un article anterior , en un recent treball acadèmic , el professor Gary Marcus   de la Universitat de Nova York planteja el risc que, després d'aquest període de grans expectatives que han viscut les xarxes neuronals en els últims anys, la intel·ligència artificial entre en un altre període hivernal, com el que va viure el 1970, quan després d'haver generat grans expectatives es va considerar que era una tecnologia massa fràgil, estreta i superficial per a ser utilitzada en la pràctica fora del marc experimental dels laboratoris.


Per Marcus no cal desestimar completament l'aprenentatge profund. Simplement, no ha de ser considerat com la solució universal i en canvi de ser contemplat com una eina estadística més, que ha de ser utilitzada al costat d'altres per aconseguir que el camp de la intel·ligència artificial avanç realment.


És per això, que Gary Marcus postula deu reptes als quals s'enfronta l'aprenentatge profund en l'actualitat.


1. El deep learning actual és un devorador de dades


A diferència del cervell humà, els algoritmes basats en l'aprenentatge profund no tenen mecanismes per aprendre termes abstractes a través de la simple definició verbal i necessiten ser entrenats amb milions d'exemples. Davant situacions o problemes on les dades no estan disponibles en grans quantitats, l'aprenentatge profund pot no resultar la millor solució.


2. L'deep learning actual és molt superficial i ofereix poques oportunitats de transferència


Per Marcus, els sistemes actuals no comprenen realment els conceptes i han estat entrenats per actuar en determinats escenaris o situacions. Quan es duen a terme els anomenats tests de transferència en què l'algoritme és confrontat amb escenaris que difereixen, encara que sigui lleugerament, d'aquells en els quals ha estat entrenat, les solucions que ofereix resulten superficials.


3. El deep learning actual no pot tractar de forma natural amb una estructura jeràrquica


Les correlacions que estableixen aquest tipus de sistemes entre diferents elements són planes i no jeràrquiques, com en una llista en què cada element està al mateix nivell que els altres. Quan s'enfronten amb una estructura jeràrquica, com ara una frase subordinada a una altra, aquests algoritmes poden aproximar-se de manera inadequada a la seva anàlisi.


Gary Marcus utilitza l'exemple d'una frase complexa. Els sistemes de reconeixement del llenguatge basats en l'aprenentatge profund abordaran la frase com una seqüència de paraules. No obstant això, en una frase com l'adolescent que prèviament va travessar l'Atlàntic va establir un rècord de vol al voltant del món, la clàusula principal seria l'adolescent que va establir un rècord de vol al voltant del món, mentre que prèviament va travessar l'Atlàntic estaria subordinada a la primera. Marcus dubte que el sistema pugui reconèixer aquesta jerarquia.


4. El deep learning actual xoca amb les inferències obertes


Els humans quan llegim un text podem inferir coses d'ell que no estan directament referenciades o només ho estan parcialment. Per exemple, endevinar les intencions d'un personatge determinat a través d'un diàleg en el qual les mostra de forma indirecta. L'aprenentatge profund aconsegueix desenvolupar-se amb èxit a situacions en què la solució està continguda en un text, però comença a tenir problemes quan aquesta no és tan explícita, bé perquè es combinin moltes frases, bé perquè les frases siguin explícites, però que facin al·lusió a un rerefons que no apareix en el fragment de text.


5. El deep learning actual no és prou transparent


Generalment, es parla de l'opacitat de les xarxes neuronals, fent referència al fet que són sistemes que analitzen milions de paràmetres per prendre decisions el funcionament concret queda fora del coneixement dels seus creadors. Una xarxa neuronal profunda es basa en milers de neurones simulades emmagatzemades en centenars de capes interconnectades. És una cosa excessivament més opac i inaccessible que qualsevol codi de programació convencional.


6. El deep learning actual no ha estat degudament integrat amb el coneixement previ


Marcus afirma que la principal aproximació a l'aprenentatge profund és hermenèutica, és a dir, autocontinguda i aïllada de qualsevol coneixement potencialment útil. El procés sol consistir en entrenar al sistema amb una base de dades que associa outputs o productes amb els respectius inputs, fent-li aprendre la relació entre tots dos per solucionar un problema donat. Un coneixement previ no sol ser introduït en l'algoritme.


Posa l'exemple concret d'un sistema destinat a estudiar la física de les torres que s'ensorren en què no s'han introduït prèviament les lleis de Newton, tot i que l'algoritme les acaba deduint més o menys a base a l'anàlisi dels milions d'exemples que se li han introduït en la seva fase d'entrenament.


7. El deep learning actual no és capaç de distingir clarament causalitat i correlació


Encara que l'aprenentatge profund aprèn a establir relacions entre les entrades que rep d'informació i l'output o producte, no es pot parlar que entengui la relació de causalitat. Per exemple, un sistema podria trobar la correlació entre l'alçada d'una persona i la riquesa en l'ús del llenguatge -com més alt és un nen, millor parla-, però no pot entendre la relació de causa entre el desenvolupament i creixement del xaval i la seva riquesa lingüística.


8. El deep learning actual creu viure en un món estable


L'aprenentatge profund funciona millor en un món estable amb regles precises, com per exemple, un joc de taula, i no tan bé en entorns menys predictibles, com pot ser l'evolució dels sistemes financers.


9. El deep learning actual funciona bé com una aproximació, però de vegades les seves solucions no són fiables del tot


Per les raons exposades anteriorment, l'aprenentatge profund funciona bé en determinades situacions, però pot ser fàcilment enganyat, per la qual cosa cal tractar amb molta cautela les seves prediccions i dictàmens.


10. El deep learning actual és difícil d'aplicar en l'enginyeria


L'autor apunta els riscos de treballar amb l'aprenentatge automàtic, ja que considera que són sistemes que poden funcionar en determinades circumstàncies, però per als quals és difícil garantir que funcionaran en circumstàncies alternatives amb dades noves que poden no semblar-se als que han estat utilitzats en el seu entrenament. Això impedeix que es pugui utilitzar per desenvolupar enginyeria robusta.

Sense comentarios

Escriu el teu comentari




No s'admeten comentaris que vulnerin les lleis espanyoles o injuriants. Reservat el dret d'esborrar qualsevol comentari que considerem fora de tema.


Més autors
Opinadors
Llegir edició a: ESPAÑOL | ENGLISH