Ariketa proposatu nahi dizuet: egin dezake zure ordenagailuak film baterako gidoia datuetatik soilik ikasitakoarekin?
Esperimenturako beharrezkoak dituzu:
- Ordenagailua (prozesagailu grafikoa – GPUa- badauka hobe).
- Euskarazko azpitituluen film datu-basea (dozenaka pelikula).
- Sare-neuronalak sortzeko programa (adib., Torch-RNN, PoetRNN).
Lehendabizi ziurtatu ordenagailu egokia aukeratzeaz. Gidoilaritza ikasteak esfortzu handia eskatzen du, eta gidoilari onenak irakurri eta emulatzeko lana arintzeko hobe buru bat baino gehiago erabiltzea. Programa batzuek berezkoa dute OpenCL edo CUDA bezalako programazio hizkuntzez baliatuta ikasketa karga GPU core askotan banatzeko aukera eta, horrela, ikasketa prozesua labur daiteke. Baina horrelakorik ez baduzu ere, berdin saiatu zintezke, nik ez dut GPU-rik erabili.
Zortekoak gu, Azpitituluak.com webguneak duela hamar urtetik sarean dauka komunitatean euskaratutako pelikula azpidatzi sorta interesgarria. Eskertzekoa da oso Azpitituluak.com-ekin @Luistxo-k eta komunitateak egindako inurri lana euskaraz azpititulatutako ikus-entzunezkoez disfruta dezagun. Ariketarako 30 pelikula aukeratu ditugu, Zibergara sareko hiru kideren artean hautatutako zientzia-fikzio eta fantasia filmak guztiak.
Behin ordenagailua eta datu-basea prest, sare-neuronala prestatu behar. Nik Torch-RNN liburutegia frogatu dut, Twitter, Facebook eta Google-eko ingenieriek sortutakoa. Hemen emaitzaren adibide bat “Zibegara” hitza emanda:
Zibergaraziko dizut abian, maitea.
Badakite hori gurekin, ere.
Bai.
Berak beste moduan, nire ama egin behar duzu?
Garaule bat da.
Eta harremana izan ez den beldur hortza behar dira.
Bai igarri duzue, sare-neuronalak sortutako azpitituluek ez dute koherentzia handirik. Baina, edonola, harritzekoa da datu sorta erlatiboki labur (azpititulu hauek 1.1MB-eko testu fitxategia osatzen dute eta hau “gutxi” omen da) neurria, hau da, azpitituluen egitura erreproduzitzeko gai izan den. Hitzak asmatzeko gaitasuna ere azpimarratzekoa, batzuk zentzu handiagoa izan dezakete (adib., “Zibergaraziko” “dizut”-ekin batera) eta beste batzuk txikiagoa (Adib., “Garaule”, agian: “Gar*” + “Paul” – “Her” eta “Dune” filmetan errepikatzen den pertsonaia). Kointzidentzia izan daiteke, baina, “Badakite” eta “Bai” hitzak ere baieztapenezkoak eta jarraian izateak ere izan dezakete loturarik. Poesiatik gertu dago, edonola, guztia (adib., “beldur hortza”), eta genero horretarako ideiak edo irudiak lortzeko helburua izan daiteke teknologia honen heldutasunarekin aplikazio aproposena (gogoratu erabilitako Torch programa duela bizpahiru urteko garapena dela).
Amaitzeko, polita da ikustea nola ikasten duen sareak belaunaldiz belaunaldi, hemen azpian jenerazio desberdinetako laginak.
Bost minutuko ikasketarekin botatako kopla:
A deonen beharra…
Öhiltzari matean, eta egin…
eta prantsegi zara.
Eta 25 minutuko ikasketarekin botatakoa:
-Zei zer den oirekin orduan,
Mundua dago zerbait zen gainezidan.
Baina ez zituten mutilak.
Bukatzeko, “Etzi” hitza emanda Azpisarek botatako elkarrizketa labur bezain profetikoarekin uzten zaituztet (50 belaunaldiko 120 minutuko ikasketa prozesua amaituta):
Etziko beharko lukeen.
Gure bidea da.
Zer sentitzen dut.
Eman horiek izan dezake?
Zure kontuak dira.