Guillermo Muñoz: Luz, actualmente estás haciendo el doctorado. Podíamos empezar hablándome un poco sobre la temática general de tu investigación.
Luz Rello: Si, el tema general es comprender un poco cómo funciona la dislexia, desde un punto de vista diferente. Estamos utilizando unas herramientas informáticas que no se han utilizado hasta ahora para ver como leen las personas con dislexia. Pretendemos unir este tipo de comprensión con lo que ya se sabe y crear herramientas que hagan que los niños con dislexia aprendan a leer y a escribir antes y mejor, y que las personas que tienen dislexia en general puedan leer mejor, más rápido.
G: ¿Qué es entonces la dislexia?
L: La dislexia es una dificultad de lectura y, bueno, no se puede vincular biológicamente, pero casi todas las personas que tienen dislexia también tienen faltas de ortografía, así que digamos que también es una dificultad de escritura.
Escribir y leer no es natural. Realmente es algo que nosotros tenemos que aprender. Es algo que cada persona incorpora en su conocimiento como puede.
G: Faltas de ortografía, ¿en cuanto al orden?
L: La verdad es que casi que no hay faltas de ortografía de orden. Eso es un falso mito. Faltas de ortografía de todo lo que te puedas imaginar. Lo más frecuente, de hecho, es comerse letras, añadir letras, separar palabras y juntarlas con las que están detrás. Por ejemplo, en vez de poner “fin de semana”, poner “finde”, o “dese mana”. El problema es de decodificación de alfabetos. Nosotros, como seres humanos, innatamente estamos predispuestos a aprender a hablar. Si haces una imagen cerebral y ves qué pasa cuando los niños aprenden a hablar, se observa que tenemos una parte localizada de habla. Desde hace 250.000 años, desde el homo sapiens, tenemos prueba fósil de que nosotros hablamos. Hay personas que incluso piensan que antes se hablaba. Porque por lo menos el neandertal ya tenía el hueso hioides que permitía mover al unísono la laringe y la lengua, y por lo tanto también podría haber hablado. Pero, si miras las 6907 lenguas que hay ahora mismo catalogadas en el mundo, un porcentaje pequeñísimo se escriben. Es decir, escribir y leer no es natural. Y si luego te vas a los últimos avances de la neurología, se observa que cada persona sitúa la escritura y la lectura en una parte diferente del cerebro. Realmente es algo que nosotros tenemos que aprender. Es algo que cada persona incorpora en su conocimiento como puede.
G: No está en nuestros genes, digamos.
L: En absoluto. Lo que está en tus genes es aprender a comunicarte. Tú naces en Papúa Nueva Guinea y no vas a aprender a leer y escribir en tu vida. Entre otras cosas, porque hay 3000 lenguas en esa isla y no se escribe ni se lee. Una persona con dislexia entiende todo perfectamente. Pero el sonido, la imagen mental que nosotros tenemos, que eso lo adquirimos todos innatamente, hay que pasarlo, de algún modo, a la caligrafía.
G: Sonido e imagen mental, o sea que el sonido nos lo imaginamos. Ponemos imágenes del sonido. Todo eso me suena a sinestesia.
L: Eso, bueno, ¿eso es sinestesia?, y no es sinestesia. Hay estudios sobre eso, por ejemplo, … ¿has oído hablar de la teoría de los prototipos?,
G: No, en absoluto.
L: Si te digo fruta, ¿qué piensas?.
G: Pues mira, me he imaginado una pera.
L: ¿No te has imaginado una manzana?
G: No.
L: Vaya, eres la excepción. Si te digo A, ¿Qué color te imaginas?
G: Blanco.
L: ¿En serio? Pues creo que una mayoría importante de las personas se imaginan el rojo. Hay una mayoría significativa que para algunos tipos de sonidos, o para algunos tipos de conceptos, los asocian con el sonido, o con el color, o con el concepto más prototípico. Y eso no es baladí. La única letra que es universal en todas las lenguas es la A. Hay lenguas que solamente tienen la A, otras tienen la A y la U y la I, luego hay lenguas que tienen A, E, I, O, U, y otras que tienen 19. O sea, la A es la única letra universal. Y el color, si nosotros vamos a cómo funcionan nuestros ojos, el color que se descodifica antes es el rojo. Por eso, por ejemplo, las señales de circulación en la carretera también son rojas. Por esta razón se suelen relacionar esos conceptos primarios que tienen una fundamentación biológica o antropológica.
Por ahora tenemos dos aplicaciones ya en el mercado, y dos más que se están creando
G: Háblame un poco sobre las aplicaciones que habéis construido. Porque, ¿qué beneficio tienen para un disléxico utilizar estas aplicaciones?
L: A ver, pues muchas. Por ahora tenemos dos aplicaciones ya en el mercado, y dos más que se están creando. Dyseggxia es un juego que está en el itunes, en el Apple Store, y te lo puedes descargar para iphone y para ipad. Cuando un niño tiene dislexia tiene que hacer una serie de ejercicios para superarlos. Y esos ejercicios son tediosos, monótonos, pésimos. Y lo peor de todo es que además esos ejercicios minan la autoestima, porque cuando un chaval con dislexia está en su clase todos sus compañeros pueden leer y escribir perfectamente, y, sin embargo, a él le hacen meter una letra dentro de una palabra, o coger unas palabras y separarlas, … Todo esto en papel, una hoja tras otra. Además, como te he dicho, tienen faltas de ortografía y un problema con el formato papel. Porque precisamente se trata de descodificar ese alfabeto. Si el formato no es el óptimo, también tienes ese problema añadido. Es un fracaso. Lo que hemos hecho es estudiar cómo escriben los niños con dislexia, gracias a los estudios que estuve haciendo el año pasado. A los padres que vinieron les encantó el proyecto, colaboraron un montón y me han mandado textos que han escrito sus hijos. Hemos extraído patrones utilizando estrategias de procesamiento de lenguaje natural, pero muy sencillitas. O sea, extraer patrones de errores en textos. Son súper interesantes, porque en esos patrones no te encuentras la típica reversión de letras de la que todo el mundo habla, sino que te encuentras que hay una fundamentación fonética. Es decir, que en lo que está escrito realmente hay una correlación con esa representación mental y cómo funciona en nuestra cabeza. Esto lo acabamos de publicar en un congreso de psicología.
Me hace féliz poder decir lo que les pasa a mis participantes
G: O sea, no es que estén haciendo algo mal, es que están haciendo algo que no es normativo.
L: Bueno, cómo se escribe el lenguaje es un consenso y en ese sentido no se corresponde con la norma, son errores. Hemos extraído patrones de todos los errores, aunque cada persona tiene errores particulares. De esos patrones hemos creado unos ejercicios, pero en forma de juego. Es la estrategia contraria, en vez de empezar por la palabra bien escrita como en la mayoría de los ejercicios en papel, aquí empezamos desde el error, para llegar a interiorizar las cosas que hacemos mal y poder crear estrategias propias para corregirlas. Espero que funcione, ahora mismo estamos realizando con Creix Barcelona una evaluación masiva del juego con los alumnos del colegio Lestonnac Barcelona. Además, el diseño del texto de la pantalla lo hemos adaptado a los mejores parámetros de lectura siguiendo los resultados de otro estudio usando «eye-tracking». Está habiendo interés por parte de las familias y ahora mismo ya tenemos 5000 descargas sin hacer publicidad. O sea, que bien. La otra aplicación es un lector de libros electrónicos, IDEAL eBook reader, y la ha desarrollado Accessible Systems, una empresa india. A partir de los resultados de nuestra investigación (DysWebxia) sobre los mejores parámetros de diseño de lectura para disléxicos, ellos incluyeron en su app unos ajustes adaptados para la lectura de libros, puedes verlos en los DysWebxia settings de la app. También te la puedes descargar de Google Play, con 8.000 descargas y ha sido finalista de la Vodafone Foundation Smart Accessibility Awards. O sea, que bien también.
G: He visto que antes te estabas formando en Procesado de Lenguaje Natural. Es un poco tu base anterior, ¿no?, con la que te has ido construyendo luego toda la formación. Pero, a ver, explícame un poco qué es eso.
L: Vale, pues eso es, por ejemplo, algunas de las aplicaciones que tiene Google, como Google Translator, traducción automática. Eso es procesado de lenguaje natural, coger un texto y reconocerlo. Hay muchos ejemplos más: cuando estás escribiendo un mensaje de texto y te autocompleta el texto, o llamas a Telefónica y una maquina te dice que digas tal o cual cosa, te metes en el metro y aparece una voz que te dice la próxima estación, o estás escribiendo en Word y te corrige. Todo eso. Todo lo que es interacción entre lo que es el lenguaje y la informática.
G: ¿y por qué no es perfecto ese sistema?
L: Pues mira, por la naturaleza misma del lenguaje. El lenguaje tiene dos cosas que son la pesadilla de cualquier persona de mi rama. La primera es que el lenguaje es ambiguo. Es decir, una palabra puede significar muchas cosas dependiendo del contexto. Pero no solamente del contexto, dependiendo de la situación. Es más, no solamente de la situación, dependiendo del conocimiento de la persona con la que estés hablando. Tu sabes que, por ejemplo, “si” siempre va a ser “si”. Pero luego va y te dicen, -¿vamos al agua?-, y la respuesta es un -si,si- [entonando con retintín]. La cosa es que es ambiguo, y eso es muy, muy difícil de procesar. Ahora mismo, si vas al estado de la cuestión en mi campo, lo que se consigue medianamente bien es desambiguación de palabras dentro de contextos y utilizando corpus de datos enormes. Como hace Google Translator, casi toda la web. Pero si ya te vas a frases, es más difícil porque es menos probable encontrar frases enteras traducidas en la Web. Esa es la primera pesadilla, pero no es tan pesadilla como la siguiente: productividad. Lo que yo te estoy diciendo ahora es algo que tú no has escuchado nunca antes, y sin embargo lo estás entendiendo. Es decir, que puedo hacer cualquier producción que nunca se ha hecho antes en la historia de la humanidad y todo el que sepa mi lenguaje lo entiende. Pero eso una máquina no lo puede hacer. Con lenguajes que potencialmente son productivamente infinitos es muy difícil, muy difícil. O sea, que si alguna vez el texto predictivo te hace una chafada, de verdad es difícil [risas].
G: Tendré paciencia, ¿no?
L: Si [risas]. Esas son dos cualidades, no problemas, son cualidades del lenguaje. Bueno, menos mal que el lenguaje es así, ¿no? Pero son cosas que están en la naturaleza misma del lenguaje, que es muy difícil de procesar automáticamente.
G: He visto que has trabajado en unos proyectos que se llaman Elliphant y Coral, ¿no? ¿Puedes explicarme un poco los objetivos?
L: Coral fue, yo creo, el proyecto más ambicioso que he tenido. Pero porque era muy joven y entonces no sabía de qué estaba hablando. Coral fue una modelización del lenguaje que precisamente atajaba esos dos puntos, la ambigüedad y la productividad, de tal manera que un ordenador pudiera procesarlo. Por supuesto es teórico, es hipotético, pero se llevó dos premios de investigación y gracias a eso la verdad es que me abrió un montón de puertas, me encontraron algunas empresas y me llamaron para trabajar. Tuve una buena experiencia.
G: He visto que en la introducción de Coral pones una frase que dice “los sistemas de procesamiento de lenguajes naturales deberían centrarse en las estructuras entendibles más que en las estructuras correctas”. ¿Eso está en relación con lo que me comentabas?
L: Si, con lo de la funcionalidad, exacto. O sea, está bien que haya una norma, porque si no sería un cacao. Pero si empiezas a ver la naturaleza del lenguaje, observas que el lenguaje está vivo, que aparecen palabras nuevas porque tú utilizas palabras ahora que no utilizabas antes. El lenguaje va evolucionando. Si tú quieres conseguir que un sistema informático entienda el lenguaje no le puedes poner demasiadas normas, porque entonces va a entender el lenguaje de un momento determinado, en una situación determinada, en una época determinada.
G: Se necesitaría una mezcla de las normas suficientes para que pueda aguantarse por sí mismo, pero también …
L: [Luz se adelanta] Se puede hacer sin normas ya. Es que eso ahí todavía no lo sabía, pero serían normas aprendidas a partir de la experiencia. De lo que en informática se llama machine learning. O sea, escoger un montón de datos y empezar a extraer de ahí conclusiones. Eso, pero aplicado al lenguaje. Pero el proyecto Coral es muy antiguo, es super idílico.
G: Muy bien, ¿y respecto a Elliphant?
L: Elliphant. Esto es lo más técnico que tengo. Vamos a hacerlo escrito porque creo que es más sencillo [Luz coge bolígrafo y libreta y propone un ejercicio práctico para describir el funcionamiento de Elliphant (fotografía siguiente)]. Nosotros cuando hablamos no decimos todo lo que comunicamos. Comunicamos un montón más.
G: ¿A través del lenguaje?, ¿o sin el lenguaje?
L: A través del lenguaje. Por ejemplo, ahora mismo te estoy hablando, pero tú ya sabes que soy yo, porque estoy aquí, te estoy hablando a ti. El sujeto lo quitamos, los objetos los quitamos, … Comunicamos un montón más de lo que realmente decimos. Imagínate que me meto en tu web y con la información que encuentro escribo esta frase –Guillermo estudia/trabaja en la Universidad de Valencia. Le gusta el arte. Dirige Piratas (*). Pero no es un pirata. ¿Ah no?, Pues sí, es un pirata-. Esto se lo das a un ordenador, y le dices: ¿de qué trata el texto?, y el ordenador te dice: -trata sobre un Pirata -, porque hace un recuento de las palabras. Pero, ¿sobre qué trata este texto? No trata sobre piratas. Trata sobre alguien que se llama Guillermo. Si tú coges la primera frase –Guillermo estudia en la Universidad de Valencia, le gusta el arte-, realmente, después de la coma hay un Guillermo metido, –a Guillermo le gusta el arte-. Si seguimos así nos encontramos con que la frase esconde otros Guillermos –Guillermo dirige Piratas, pero Guillermo no es un Pirata, ¿ah no?. Pues, si, Guillermo es un Pirata-. Por tanto, en realidad tendríamos cinco Guillermos. Si la gente de lingüística te dijera que analizaras la frase inicial, aunque cada uno realice un análisis particular, al final todos están de acuerdo en que hay una cosa que existe pero que no está en la realización del lenguaje. Esto es un problema para un programa.
(*) Realmente Guillermo no dirige Piratas de la Ciencia.
G: ¿Y cómo actuaría Elliphant sobre la frase?
L: Pues Elliphant es un sistema que coge el texto y te dice que en esos espacios de la primera frase hay una cosa. No te dice qué es, pero sí que hay una cosa que falta. Y lo hace con un ochenta y siete por ciento de precisión. Está muy bien, supera el estado de la cuestión. Esto se llama detección de elipsis. Otra cosa que hace Elliphant que no hace otro sistema para el español, es detectar cosas que uno puede pensar que existen, pero que realmente no existen. Por ejemplo, si en la frase del principio seguimos escribiendo [luz vuelve al bolígrafo, papel, y escribe] y ponemos al final –Llueve-, podrías pensar que es una anáfora personal. El ordenador, que es muy listo dice [Luz chasquea los dedos] – ¡¡ aquí hay un pavo que llueve ¡¡ -, o sea, – Guillermo llueve -. Pero Elliphant dice -no, aquí no hay nada. Tú piensas que hay algo, pero no hay nada-. O sea, Elliphant puede llegar a diferenciar ambas situaciones. Total que mi tesis de máster trataba sobre detectar cosas que no existen y cosas que uno piensa que existen pero que no existen. El nombre Elliphant viene de Elipsis y de elefante, porque como al final era un trabajo tan grande tuve que ponerle elefante. ¡Era como un elefante!
G: Hay otra investigación que has hecho que trata sobre los colores, ¿no? Bien, pues cuéntame.
L: A ver, yo tenía mucho tiempo en el 2007 mientras estudiaba la carrera. Lo primero que me fascinó en este estudio era ver que intuía que había patrones que se cumplían para los colores que no se cumplían en el resto de las palabras. En los colores tu metías un sufijo, azul-azulino, rojo-rojizo, azulado, y todos los grupos tenían como un significado común. Mientras que tú metes sufijos en otras palabras y no significan lo mismo. Por ejemplo, fruta-frutero, frutero puede ser la persona o puede ser un continente. Mientras que en el caso de los sufijos para colores siempre es algo que tiende hacia ese color. Luego, también están las composiciones de palabras, tú lees “sacapuntas” y sabes que es una cosa que saca punta a algo, pero si te encuentras “verde-azulado”, es como una mezcla entre dos colores. Eso funciona como un patrón, y como ahí no sabía investigar bien pensaba que se me había ocurrido algo chachi. Luego me di cuenta que es algo que mucha gente, muchos lingüistas muy famosos, ya sabían. Ahí estaba en segundo de carrera, pero me dije: pues vamos a ver qué pasa con los colores. Empecé a ver todos los colores que se me ocurrían y a analizarlos.
G: Eso sería un trabajazo.
L: Claro, pero, ¿cómo vas a sacar conclusiones de algo si no tienes todos los colores?, y, por consiguiente, ¿cuántos colores existen? El ser humano puede percibir una serie de colores, pero no todos. Me fui al Corte Inglés y pregunté por los colores a los del maquillaje. O a Titanlux, que tienen un montón de colores que no te puedes ni imaginar que existen, aunque existen y tienen sus nombres. Al final uno piensa que hay que reducir la cosa porque si no el tema se puede poner complicado. Por ejemplo, se puede reducir a los colores que se usan en el lenguaje, que ya tiene tela, así que empecé a buscar todos los colores que existen en el lenguaje. ¿Y cómo los buscas? Piensa que no hay listas de colores en internet. Bueno, ahora si [risas de Luz]. No puedes buscar en los propios diccionarios, por lo menos hace unos años. Me compre el CD de la RAE para buscar los lemas. Busqué todas las palabras que contenían color. ¿Sabes cuántas palabras hay en el diccionario de la academia que contienen la palabra color? Unas siete mil, ocho mil. Me leí todas esas definiciones.
G: Pues sí que tenías tiempo libre, eh.
L: Si, tenía tiempo libre. La cosa es que con eso no descubres todos los colores, porque te encuentras definiciones en las que no aparece la palabra “color”. Empecé a buscar colores específicos en todas las definiciones. ¿Sabes cuantas definiciones tienen la palabra verde dentro de su definición?, unas cinco mil [Luz lo dice con desesperación]. Todas las plantas, animales,… ¡¡un montón!! Total, que al final saqué muchísimos, y extraje conclusiones interesantes desde el punto de vista filológico. Pero luego me fui a trabajar como lingüista a la empresa Daedalus, a raíz del premio Coral, y ahí tuve que hacer una ontología de todas las palabras que había en el diccionario de la Real Academia. En cinco meses, cinco horas al día, me leí los dos tomos del diccionario. Gracias a esto supe todos los colores que hay en el diccionario, haciendo la concesión a la lingüística. Después de todo esto escribí un artículo, pero ahora lo leo y me da una vergüenza tremenda. Voy a volverlo a coger, y ahora que sé un poco de informática analizaré los datos y haré una cosa de cuatro páginas. No de setenta, como tenía este, que era una cosa infumable. Me apasionan los colores.