Nueva versión de Xuxen.eus (diciembre de 2014)

¿Qué es Xuxen.eus y cómo se utiliza?

Xuxen.eus es la página web que permite utilizar en línea el corrector ortográfico Xuxen . Desde la versión anterior a esta, se han hecho diversas modificaciones y mejoras tanto en los datos que utiliza Xuxen para su funcionamiento como en las cuestiones relacionadas con el diseño. Esta versión renovada de Xuxen.eus, pone a disposición del usuario la versión más nueva de los datos lingüísticos, creada gracias a la colaboración entre el grupo IXA, de la Universidad del País Vasco, y la Unidad de Lengua y Tecnología de Elhuyar.

También se ha incorporado la opción que permite gestionar el diccionario del usuario. El usuario puede consultar las palabras incluidas en el diccionario, y puede añadir o eliminar palabras. Al corregir un texto, se puede optar por utilizar o no el diccionario del usuario.

Hemos integrado diversas funcionalidades adicionales para la corrección de textos; por ejemplo, hemos introducido la propuesta de palabras preferentes. ¿Por qué? Porque, aunque un texto sea correcto, algunas palabras del texto pueden tener formas preferentes.

Otro ejemplo: se ofrece la posibilidad de escuchar con el sistema TTS, desarrollado por la unidad de Lengua y Tecnología de Elhuyar, el texto introducido en el campo de texto, así como la posibilidad de utilizar el traductor automático Matxin. Además, el sistema detecta el idioma del texto introducido en el campo de texto antes de enviarlo a corregir. De ese modo, si el usuario introduce un texto en otro idioma, recibe un aviso de inmediato. Por ejemplo, si introduce un texto en castellano, el sistema lo detecta, y pregunta al usuario si quiere traducirlo al euskera mediante el traductor automático Matxin.

El siguiente vídeo muestra, mediante un ejemplo, cómo corregir un texto en la nueva versión de Xuxen.eus:

Datos Xuxen 5

Además de renovar la imagen de Xuxen.eus, se han introducido mejoras para el proceso de corrección. En cuanto al léxico, se han añadido 18.645 entradas más desde la versión anterior, y también se ha cambiado el modo en que el sistema ofrece propuestas. Así, para ofrecer diversas propuestas ante una palabra incorrecta, se han tenido en cuenta los errores más habituales que hacemos cuando escribimos en euskera. Las propuestas ofrecidas por el sistema, además de utilizar dicho criterio, pueden ordenarse basándose en los datos de un corpus en euskera obtenido automáticamente de Internet. El usuario puede elegir ordenar así las propuestas activando la opción adecuada entre las situadas debajo del campo de texto. Es útil valerse de este criterio para ordenar las propuestas, porque, así, el sistema propone las formas más utilizadas por delante de las menos utilizadas. 

 

Diccionario del usuario

Desde la versión anterior a esta se ha cambiado el modo de utilización del diccionario del usuario. Ahora, es necesario registrarse en el sistema y empezar una sesión. De esta manera, se ofrece la posibilidad de introducir en el diccionario personalizado las palabras marcadas como desconocidas por Xuxen en la pantalla de corrección.

Esta nuevo versión de Xuxen.eus ofrece varias opciones para introducir nuevas palabras en el diccionario; por ejemplo, ofrece la posibilidad de categorizar la palabra. Por defecto, a la nueva palabra introducida en el diccionario se le asignará la categoría seleccionada en la pantalla de configuración del usuario. Si dicha palabra se introduce desde la pantalla de visualización y edición del diccionario del usuario, podemos seleccionar en el momento la categoría que queremos asignarle. 

 

 

Palabras preferentes

Al igual que los diccionarios, Xuxen.eus también propone palabras preferentes. Estas propuestas preferentes no son sino propuestas para el usuario, para señalar que, aunque la palabra escrita por el usuario sea correcta, existe una forma preferente.

En este caso, los datos utilizados para crear la base de datos se han basado en el Diccionario Unificado de Euskaltzaindia (Hiztegi Batua). Por lo tanto, las palabras preferentes propuestas por Xuxen.eus son las mismos que se proponen en el Diccionario Unificado de Euskaltzaindia, y se indican mediante la abreviatura «h».

 

Otras funcionalidades

El nuevo Xuxen.eus, ofrece varias funcionalidades adicionales al usuario. He aquí algunas de ellas: 

Detecta el idioma.

Tras analizar los datos que almacena el sistema, hemos observado que a menudo los textos introducidos por los usuarios para su corrección no suelen estar escritos en euskera. Puesto que Xuxen es un corrector de euskera, el texto introducido debería estar en euskera. Teniendo eso en cuenta, y a fin de detectar el error del usuario, el texto pasa por un sistema de detección de idioma antes de ser corregido. 

En caso de que el texto introducido por el usuario en el campo de texto esté en euskera, el sistema hace la corrección directamente. Pero si el sistema sospecha que el texto está en otro idioma, mostrará una notificación al usuario. 

 

Consulta a los diccionarios de Elhuyar

Situándonos en el campo de texto de la corrección de la pantalla principal, podemos buscar una palabra en los diccionarios de Elhuyar haciendo doble clic en dicha palabra. La búsqueda siempre se realizará en euskera, y la consulta se hará en todos los diccionarios disponibles en la página web http://hiztegiak.elhuyar.org; ese será el resultado que obtendrá el usuario. Se puede activar o desactivar esta función mediante las opciones que se encuentran debajo del campo de texto. 

Al hacer doble clic en una palabra, el sistema intenta lematizarla. Por lo tanto, la búsqueda que se realice en los diccionarios de Elhuyar siempre será lematizada, y dichas búsquedas se harán en euskera. El resultado se mostrará en una página nueva.

Síntesis de voz (TTS, Text To Speech)

La tecnología de síntesis de voz permite convertir el texto en voz. En esta página web, puede probar el sistema de síntesis de voz que han desarrollado conjuntamente la unidad de Lengua y Tecnología de Elhuyar y el grupo Aholab de la UPV para la entonación neutra de diversos idiomas. Al igual que en la página web tts.elhuyar.org, en esta página web puede escuchar también, gracias al sistema de síntesis de voz, el texto en euskera escrito en el campo de texto. Es el mismo sistema que se emplea en los diccionarios de Elhuyar, en la plataforma Hizkuna para la gestión lingüística de las empresas y en la página web del traductor automático castellano-euskera Matxin. También puede utilizarse para escuchar íntegramente las páginas web; por ejemplo, la página web de la revista de Elhuyar, en Zientzia.net y Eitb.eus.