Ahotsak Corpusa
Ahotsak Ahozko Tradiziozko Corpusa izendatu dugun proiektu honen helburua da ahozko materialean oinarritutako corpus linguistiko bat osatzea. Euskal Herriko Ahotsak proiektuan zehar egindako transkripzioetan oinarrituz, 1900-1950 bitartean jaiotako euskaldunen bat-bateko hizkera naturalaren ezaugarriak bildu nahi ditu.
Hizlarien lekukotasunak oinarri hartuta, ondorengo informazioa jasoko dugu: 1) lema bakoitzaren aldaerak; 2) aldaeren eta lemen banaketa geografikoa; 3) datu estatistikoak. Kasu guztietan, bildutakoaren transkripzio-zatia eta bideoa kontsultatzeko aukera ere eskaintzen da.
Oraindik ere Beta fasean gaude, lematizazio fase esperimentala garatzen eta eskuzko zuzenketak egiten (ahozko lagin batean ez dagoelako lan automatikorik egiterik). Webgunean aurkituko dituzun datuak eta emaitzak, beraz, ez dira inola ere behin betikoak. Saio esperimental baten emaitza gisa ulertu eta erabili behar dira. Corpus irekia da, gainera, etengabe ari baikara transkripzio gehiago egiten eta materiala aztertzen.