analisia

19
Mai
2009

Ikaslearen idazkera ordenagailuak aztertuta

Azkenengo Hizpiden HUHEZIko Asier Irizarrek eta IXA taldeko Kepa Sarasolak idatzi zuten artikulua irakurtzen egon naiz: Puntuazio arteko hiru hitzeko segiden arterketa ikasleen testuetan eta alderaketa kazetaritza-testuekin.

Teknologiak hizkuntzaren irakaskuntzan eman dezakeenaz dihardugula LMSak, bipuntuzeroak eta halakoak izaten ditugu mintzagai azkenotan, baina bada beste arlo bat, teknikoagoa eta ez hain erakargarriagoa agian, hizkuntzaren analisi informatikoa. Kepak eta Asierrek hortik ere zer hartua dagoela ohartarazi gaituzte.

Konputagailuak testu idatziak aztertzen jarri dituzte hain zuzen ere. Testuon artean euskara ikasleek idatzitakoak eta Egunkariarenak, eta alderaketa egin dute haien artean. Ikasleen testuen artean argudio-testuak dira nagusi, Egunkariarenak berriz edozertariko kazetaritza testuak direla ulertu dut.

Idazkien corpus horretan puntuazio-zeinuen artean hitz bakarreko, biko eta hiruko segidak bilatu zituzten, arreta bereziki testu-antolatzaileetan eta lokailuetan jarrita,  eta emaitza deigarri batzuk atera dira:

  • Ikasleek gehiago erabili dituzte komak eta puntu eta komak Egunkariakoek baino.
  • Ikasleen testuetan "beraz" da puntuazio-zeinuen artean gehien erabilitako hitza, Egunkarian berriz aldiz, "berriz".
  • "Halaber" Egunkarian sarri erabili den arren ikasleen testuan ez da ia agertu. "Badirudi ikasleei ez zaiela hitz hori gustatzen" diote egileek.
  • Bi hitzeko kateetan "izan ere" da erabiliena oro har. Ikasleen artean "hau da" ia bestearen parean. Egunkarian "hala ere" izan da bigarrena
  • Hiru hitzekoetan "hain zuzen ere" eta "hori dela eta" nagusi guztietan.
  • Ere tartean dagoen kateetan, "izan ere" nagusi guztietan.
  • Ikasleen testuetan "beraz", "horrela" eta "adibidez" maizago agertzen dira kazetaritza testuetan baino.
  • Ikasleek oso gutxi erabiltzen dituzte "hain zuzen", "ildo horretan", "nolanahi ere", "esate baterako" eta "aldi berean". Aldiz, "dena den", "era berean", "batez ere", "horretaz gain", "hau da" eta "alde batetik" Egunkarian baino askoz sarriago ikasleen idazkietan.

Analisia interesgarria edo deigarria izateaz gainera (eta kasu honetan esango nuke proba edo erakustaldia izan dela batez ere), sentsazioa izan dut emaitzetan kuantifikatuta agertu diren horiek testu bat ikasle batek idatzia delako "intuizioa" ematen diguten elementuak eta kopuruak izaten direla. Hizkuntza uste dugun baino neurgarriagoa da seguruenik, eta honen garapenak baliabide eta tresna gehiago ekar ditzakeela esango nuke. Autoreek ere hala uste dute:

...badira hizkuntzaren kalitatea neurtzeko beste hainbat eta hainbat elementu semantiko, sintaktiko edo pragmatiko ere guk hemen aztertu ez ditugunak. Saiatu beharko genuke beste neurri horiek lantzeko tresna informatikoak sortzen.

Espero dezagun hizkuntzaren azterketa konputazional-edo horrek laster batean fruitu gehiago ematea eta sotware-a zein erabilpenerako ideiak eta metodoak guztiok eskura izatea.

Bide batez. Asierrek eta Kepak eurek prestatu dituzte tresnok programazio-lengoiaren ezagutzaz baliatuta. Denok ez gara horraino ailegatzen, baina han-hemenka badira horrelako emaitza zehatzak eskaini barik ere, testuak aztertu edo haiekin jolasteko aukeraren bat ematen diguten beste tresna batzuk:

  • Wordle-k bezala etiketa-hodeiak edo hitz-odeiak sortzen dituztenak. Badakizue, hitzak testuan agertzen diren maiztasunaren arabera handiago edo txikiagoak izango dira hodeian.
  • Testu prozesadore gehienetan aukera izaten duzue testuaren hitz eta karaktere kopuruak kontatzeko. Ez da asko izaten, badira hala ere gauza gehiago bilatzen duten programak: gehien agertzen diren hitzak eta euren sailkapena adibidez. Probatu Windows-erako izen bereko bi programa hauek adibidez: TextSTAT edoTextStat, edo testuaren estatiskikak online ematen dituen Textalyser.

Test mining (Testu "meatzaritza") edo test analytics deitzen diren disziplinekin lotutako software-a bilatzen baduzue, zer edo zer aurkituko duzue beharbada, eta irudimen apur batekin ideia interesgarriren bat irten daiteke.

Gauza gehiago ere izango dira baina gaur apur bat alfertuta nabil aplikazio edo tresna gehiago bilatzeko, hala ere, seguru zuetako baten batek ikusi duela zerbait interesgarria hortik. EHUren proiektu hau bezala, izenagatik baino ez bada ere.

Sindikatu edukia