Xuxen.eus bertsio berria (2014ko abenduan)

Zer da Xuxen.eus eta nola erabiltzen da?

Xuxen.eus Xuxen zuzentzaile ortografikoa online erabiltzeko aukera ematen duen webgune bat da. Aurreko bertsiotik hona, hainbat aldaketa eta hobekuntza egin dira, bai Xuxenek oinarrian erabiltzen dituen datuetan, bai diseinuan. Xuxen.eus berrian, azken datu linguistikoak jarri dugu erabiltzailearen eskura, Euskal Herriko Unibertsitateko IXA taldearen eta Elhuyar Hizkuntza eta Teknologia unitatearen artean sortutako bertsioa.

Erabiltzailearen hiztegia kudeatzeko aukera ere gehitu dugu. Hiztegian sartutako hitzak ikus ditzake erabiltzaileak, eta hitzok gehitzeko eta kentzeko aukera du. Testu bat zuzentzean ere, erabiltzailearen hiztegia erabili ala ez aukeratu dezake.

Testuak zuzentzeko, hainbat funtzionalitate berri integratu ditugu webgunean; esate baterako, hitz hobetsiak proposatzeko aukera gehitu dugu. Zergatik? Bada, testu bat zuzena izan arren, testuko hitz batzuek forma hobetsiak izan ditzaketelako.

Beste adibide bat: testu-kutxan sartzen den testua Elhuyar Hizkuntza eta Teknologiaren TTS sistemarekin entzuteko aukera dago. Baita Matxin itzultzaile automatikoa erabiltzeko aukera ere. Gainera, testu-kutxan sartutako testuaren hizkuntza detektatzen da zuzentzera bidali baino lehen; hala, erabiltzaileak beste hizkuntza bateko testu bat sartzen badu, abisu bat aterako zaio pantailan. Adibidez, gaztelaniazko testu bat sartzen badu, sistemak detektatu egingo du, eta galdetuko dio ea euskarara itzuli nahi duen Matxin itzultzaile automatikoaren bidez.

Ondoko bideoak Xuxen.eus berrian testu bat nola zuzentzen den erakusten du, adibide baten bidez:

Xuxen 5 datuak

Itxura berritzeaz gain, testuak zuzentzen laguntzeko zenbait hobekuntza egin dira Xuxen.eus-en. Lexikoari dagokionez, 18645 sarrera berri erantsi ditugu, eta proposamenak egiteko sistema ere aldatu dugu. Esate baterako, gaizki idatzitako hitz baten inguruko proposamenak eskuratzeko, euskaraz idaztean egiten ditugun akats arruntenak hartu dira kontuan. Sistemak ematen dituen proposamenak ordenatzeko, berriz, aipatutako irizpidea erabiltzeaz gain, Internetetik automatikoki eskuratutako euskarazko corpus bateko datuen arabera ordenatu daitezke emaitzak. Erabiltzaileak horrela ordenatu nahi baditu proposamenak, hautatu egin behar du aukera hori testu-kutxaren azpian dituen aukeren artean. Interesgarria da proposamenak ordenatzeko irizpide hori, hala sistemak formarik erabilienak proposatuko baitizkigu gutxiago erabiltzen direnen aurretik. 

 

Erabiltzailearen hiztegia

Erabiltzailearen hiztegia erabiltzeko modua berritu dugu. Orain, nahitaezkoa da erregistratzea eta saioa hastea. Hala, zuzenketa-pantailan Xuxenek hitz ezezagun gisa markatzen dituen hitzak hiztegi pertsonalizatuan sar ditzake erabiltzaileak.

Hitz berriak hiztegian sartzeko hainbat aukera eskaintzen ditu Xuxen.eus berriak; esate baterako, hitza kategorizatzeko aukera ematen du. Besterik ezean, erabiltzailearen konfigurazio-pantailan aukeratuta dagoen kategoria esleituko zaio hiztegian sartzen den hitz berriari. Bestalde, ikusi eta editatzeko pantailatik sartzen badugu hitz berria erabiltzailearen hiztegian, unean bertan aukeratu dezakegu hitz horren kategoria. 

 

 

Hobetsiak

Hiztegiek bezala, Xuxen.eus-ek ere hitz hobetsiak proposatzen ditu. Hitz hobetsiok proposamen hutsak dira, erabiltzaileari adierazteko hark idatzitako hitzak, zuzena izan arren, forma hobetsi bat duela.

Xuxen bertsio honen datu-basea sortzeko erabili diren datuetan, Hiztegi Batua izan da oinarria. Beraz, Xuxen.eus-en proposatzen diren hitz hobetsiak Hiztegi Batuak proposatzen dituenak dira ("h." laburduraz adierazita daude han).

 

Beste funtzionalitate batzuk

Xuxen.eus berrian, hainbat funtzionalitate erantsi dira erabiltzailearentzat. Hauek dira batzuk: 

Hizkuntza detektatzen du

Sistemak biltegiratzen dituen datuak errepasatuta, ikusi dugu erabiltzaileek zuzentzeko sartzen dituzten testuak ez direla euskarazkoak izaten askotan. Xuxen euskarazko zuzentzaile bat denez, zuzentzeko sartzen den testuak euskaraz idatzia behar du. Beraz, badaezpada, testua zuzendu aurretik hizkuntza detektatzeko sistema batetik pasatzen du Xuxen.eus-ek. 

Erabiltzaileak testu-kutxan sartu duen testua euskarazkoa bada, zuzendu egiten du zuzenean. Aldiz, sistemak uste badu testua beste hizkuntza batean idatzia dagoela, ohar bat erakusten dio erabiltzaileari. 

 

Elhuyar hiztegietan kontsultatzeko aukera

Zuzenketa egiteko testu-kutxan (webgunearen pantaila nagusian) hitz baten gainean klik bakar bat eginez gero, Elhuyar hiztegietan bilatzeko aukera du erabiltzaileak. Bilaketa euskaraz egingo da beti, eta http://hiztegiak.elhuyar.org webguneko hiztegi guztietan egingo da kontsulta; hori izango da erabiltzaileak lortuko duen emaitza. Funtzionalitate hori aktibatu eta desaktibatu egin daiteke, testu-kutxaren azpian horretarako dauden aukerak erabiliz. 

Hitz baten gainean klik bikoitza egiten denean, aukeratutako hitza lematizatzen saiatzen da sistema. Beraz, Elhuyar hiztegietan egiten den bilaketa lematizatua izango da beti, eta euskaraz egingo da. Beste orri batean erakutsiko da emaitza.

Ahots-sintesia (TTS, Text To Speech)

Ahots-sintesiaren teknologiak ahots bihurtzen du testua. Elhuyar Hizkuntza eta Teknologia unitateak eta EHUko Aholab Taldeak intonazio neutrorako (eta hainbat hizkuntzatarako) garatutako ahots-sintesirako sistema probatu dezakezu webgune honetan. tts.elhuyar.org webgunetik egin daitekeen bezala, webgune honetan bertan ere testu-kutxan idatzitako testua entzun dezakezu, euskaraz, ahots-sintesiko sistemaren bidez. Sistema hori bera erabiltzen da Elhuyar hiztegietan, enpresen hizkuntza-kudeaketarako Hizkuna plataforman eta Matxin gaztelania-euskara itzultzaile automatikoaren webgunean. Horrez gainera, webguneak oso-osorik entzuteko ere erabiltzen dugu ahots-sintesia; adibidez, Elhuyar aldizkariaren webgunean, Zientzia.net-en eta Eitb.eus-en.