Euskaltzaindiak Erreferentzia-corpusa ipini dau edonoren eskura bere webgunean: https://eec.euskaltzaindia.eus/. Corpus horrek hizkuntzaren nondik norako zehatzak eta orekatuak batu nahi ditu, arlo desbardinetako laginak bilduz, eta gaur eguneko euskerearen isla emonaz.
Berez zabalik dago, orain arteko materialak erakusten ditu baina geroago be zabaltzen joango da, eragile eta material barriakaz. Eta, zelan ez, kolektiboa da, Euskaltzaindiak Euskal Herriko 68 erakunde pribatu eta publikogaz batera egin dauelako, hedabide nagusiakaz eta gizarte-eragile askogaz batera.
Analisi linguistikorako, ikasketa automatikorako edo hizkuntza-ikerketetan hipotesiak baliozkotzeko oinarrizko tresna da, baina baita hizkuntza-, literatura- edo ikerketa-helburuetarako corpus estandar edo erreferente gisa erabili leitekena be. ‘Egungo’ egoera islatzen dauen neurrian, hizkuntzaren irakaskuntzan jarduten dabenek, zuzentzaileek… erabilgarri izango dabe EEC, lexiko- eta gramatika-zalantzak argitzeko.
Bersino honek 123.124 dokumentu, 154,21 milioi testu-hitz eta 129.817 lema jasoten ditu, 2000. urtetik hasi eta 2023ra bitartean euskeraz idatzitako edo ekoitzitako testuetatik hartuta. Testu horreek guztiak lematizatu eta sailkatu egin dira aurretik. Horretara, lema, forma eta kategoria gramatikalen bidezko konsultak egiteko bidea emoten dau