El análisis semántico latente (l.s.a.) ¿es una teoría psicológica o una herramienta de análisis semántico?

Tesis doctoral de Ricardo Olmos Albacete

En esta tesis hemos abordado una amplia introducción teórica del lsa. Hemos situado sus inicios y los motivos de su nacimiento, su evolución y las raíces filosóficas y psicológicas de la que parte. Hemos hecho también alusión a los trabajos y aplicaciones que han hecho del lsa una herramienta eficaz como sistema de evaluación humano y la similitud que presenta con el funcionamiento de la memoria humana, salvaguardando ciertas limitaciones que hacen dudar de si el lsa puede considerarse o no una teoría psicológica. En otro apartado más experimental, hemos abordado algunas cuestiones referidas a los ámbitos de aplicación de la herramienta, para después tratar las limitaciones más evidentes a las que se enfrenta el lsa. En su parte más experimental, esta tesis ha pretendido analizar precisamente los límites del lsa en el dominio de la evaluación, y más específicamente en la evaluación de resúmenes realizados por estudiantes procedentes de diferentes niveles educativos. Entre las cuestiones que hemos trabajado están una minuciosa revisión de los métodos de evaluación con el lsa más utilizados por la investigación previa y la propuesta de otros nuevos que son más eficientes dentro de este contexto. Uno de estos límites ha versado sobre la evaluación de resúmenes altamente conceptualizados y concisos, campo hasta ahora inexplorado, obteniendo, creemos, resultados alentadores en relación a cómo el lsa se comporta de manera parecida a como lo hacen jueces expertos. En esta línea, hemos trabajado y analizado el lsa respecto a la cuestión de si esta configuración semántica proporciona evaluaciones fiables en textos con los que a priori no está preparada para trabajar bien. Hemos visto los límites de la herramienta comparándola siempre con juicios humanos. Hemos analizado, además, algunas propiedades que proporcionan una mejora en la herramienta teniendo en cuenta sus posibles aplicaciones en el campo educativo. Entre las mejoras propuestas destacamos la construcción de algoritmos que aproximan el lsa a algunas teorías psicológicas (dehiére et al., 2007; van dijk y kintsch, 1983) o algoritmos que trabajan el espacio semántico latente de forma más eficiente (hu et al., 2007; olmos, león, jorge-botana y escudero, en prensa). Además, se ha abordado el estudio de algunas propiedades de los corpus, como el tamaño y grado de especificación del corpus o los contrastes entre un corpus genérico y extenso respecto a otros más específico de dominio y reducido, llegando a la conclusión de que con poco puede hacerse mucho. Este estudio muestra al lsa como una herramienta valiosa y práctica por docentes, evaluadores o metodólogos que deseen confeccionar sus propios corpus de dominio específico para evaluar el discurso escrito en cualquiera de sus modalidades (olmos et al., 2009). Por último, hemos planteado cuestiones que deben investigarse a fondo en el futuro y para ello hemos hecho algunos trabajos experimentales que sirvan de esbozo para estas futuras líneas de investigación. Concretamente, hemos presentado algunos resultados sobre el problema de la primera dimensión (hu et al., 2003) y alguna perspectiva distinta que sirve para afrontar tal problema. Hemos estudiado igualmente desde la óptica de la macroestructura propuesta por kintsch (2002), algunos métodos que pueden resultar adecuados para minimizar los costes computacionales de la herramienta. Por último, hemos analizado algunas propiedades del lexesp (sebastián et al., 2000) en relación al lsa, detectando que en los corpus hay palabras mucho más influyentes que otras y que éstas absorben y capitalizan casi toda la información en las comparaciones semánticas. Esto puede indicar la presencia de sesgos importantes en los corpus con los que trabajamos y la necesidad de ponderar de diferentes formas las palabras para evitar dichos sesgos. es ahora cuando podemos hacer un balance de qué representa el lsa, qué utilidades, valores y virtudes tiene como herramienta matemática de representación semántica, qué alcance tiene a nuestro juicio en el ámbito de la evaluación y, por supuesto, qué implicaciones teóricas tiene con sus mecanismos propuestos para la adquisición del conocimiento. En lo que sigue se expondrán las conclusiones de la tesis desde dos puntos de vista que reflejan las preguntas y objetivos con los que comenzaron el estudio. Primero comentaremos qué opinión nos queda del lsa como teoría de adquisición del significado de las palabras, es decir, nuestra opinión del lsa como teoría. Posteriormente haremos un repaso exhaustivo sobre lo que consideramos que es lsa como herramienta semántica, fundamentalmente en el campo de la evaluación y a la vista de nuestros resultados experimentales alcanzados. el lsa como teoría de adquisición del conocimiento mecanismos del lsa como teoría de adquisición del conocimiento en nuestra opinión, el gran valor del lsa es que simula correctamente la representación del vocabulario entrenándose con un volumen de lenguaje parecido al que tenemos los seres humanos (o, si no tanto, al menos un volumen de textos realmente extenso). El lsa aborda la cuestión de la experiencia sobre el lenguaje de una forma elegante y encomiable, fundamentalmente por la cantidad de textos que es capaz de manipular (aunque sea en formato escrito) y porque a partir de ahí es capaz de simular aspectos psicológicos relevantes. Desde nuestro punto de vista, el valor teórico más importante del lsa es que se describen unos mecanismos de acción que permiten simular la adquisición de significado lidiando con el fenómeno de la pobreza del estímulo y manifestando claramente que, incluso, con las limitaciones empíricas a las que estamos expuestos, existe una buena solución para llegar a una representación semántica de las palabras. La solución al problema de platón (véase landauer y dumais, 1997) se da por un proceso de generalización a partir de los contextos, gracias al cual el conocimiento de unas palabras nos puede dar pistas para conocer otras sin que estén éstas presentes. Este proceso de inferencia en el lsa se basa en el conocimiento de las palabras a través de relaciones indirectas proporcionadas por otras palabras (jorge-botana et al., En prensa). Las relaciones indirectas se dan por el contexto, ambiente o familia de palabras. Si se llevan los mecanismos del lsa al ser humano y poniendo un ejemplo, el cerebro podría dar el salto o inferencia y comprender que las palabras automóvil y coche se acompañan de contextos parecidos, de modo que un buen día, leyendo o escuchando la palabra coche salta un resorte que nos hace comprender la palabra automóvil. Dicho de otro modo, una apuesta fuerte por el lsa recae en que es capaz de simular la adquisición de vocabulario mediante conexiones indirectas, a partir de un sistema totalmente interrelacionado en el que un cambio en un elemento cambia el resto de los elementos. La generalización de los contextos es todo lo que necesitamos para aprender qué significan las palabras, es decir, para adquirir una representación semántica de las palabras. Con una experiencia limitada pero teniendo un sistema ¿inteligente¿ que perciba las regularidades del ambiente, encajaremos las palabras en su sitio correspondiente y podremos llegar a comprender sus significados. Encajar las palabras donde corresponde en su espacio semántico es cuestión de que el sistema sea capaz de simplificar la estructura inabarcable y contingente de la experiencia. Esto lo resuelve también la teoría de forma elegante con la reducción de dimensiones por medio de la descomposición en valores singulares. La reducción de dimensiones con esta técnica matemática tiene el papel de dar orden y sentido al lenguaje, de extraer las regularidades semánticas de las palabras. Elimina el ruido de las subjetividades y deja la esencia del significado. ¿por qué no necesitamos estar expuestos demasiadas veces a la palabra automóvil para comprender su significado? Según el mecanismo propuesto, al estar expuestos a la palabra coche y, más importante, a las palabras que rodean a coche, es mucho más fácil comprender la palabra automóvil al estar también rodeada de un contexto muy parecido al de la palabra coche (véase el contexto común en la figura 6.1). Este hecho, acelera mucho la comprensión de la palabra automóvil. El mecanismo de generalización se daría por la descomposición en valores singulares, que capta que ambas palabras se rodean de contextos parecidos, aun cuando no hayan aparecido nunca juntas. La descomposición en valores singulares es un mecanismo de reducción de información y de generalización. En esta técnica matemática todas las palabras dependen del resto. Las palabras que aparecen son tan importantes como las que no aparecen en un momento dado. Esta técnica hace cambiar la situación de las palabras con cada nueva exposición al lenguaje, pues el movimiento de una palabra implica el movimiento del resto. La descomposición en valores singulares es un tejido enorme de ecuaciones para representar cada término, de forma que un cambio en una ecuación mueve todo el sistema. La representación vectorial de las palabras cambia con cada nuevo contexto. el lsa es una herramienta que trata la semántica y, además, la trabaja con éxito. Consigue simplificar un sistema tan vasto y extenso como la semántica de las palabras al aunarlas en un espacio simplificado y reducido de dimensiones, un espacio semántico que tiene la capacidad de emular correctamente el comportamiento humano. Y esto lo ha hecho sin tener que recurrir apenas a estructuras u órganos innatos, sin las habituales restricciones mentalistas (landauer y dumais, 1997). Es verdad que el lsa no necesita los a priori comunes que se establecen en otro tipo de teorías más innatistas, pero tampoco sería justo decir que el lsa prescinde por completo de presupuestos mentalistas. Hay dos elementos que a nuestro juicio en la teoría del lsa son asunciones de lo que el cerebro tendría que hacer de forma natural, dos aspectos que al lsa le vienen dados. Por un lado al lsa le viene dada una separación natural de los contextos. El lsa toma como punto de partida los contextos, así que de alguna forma los creadores del lsa tendrán que suponer que la mente es capaz de separar de forma significativa unidades contextuales que se procesan como experiencias separadas. Debe haber algún mecanismo innato que prepare al cerebro para separar de forma natural los cambios en el ambiente (dawkins, 2002). Por otro lado, está la asunción de que la mente es capaz de simplificar la acumulación de experiencias. Nos referimos a cómo llega el lsa a un espacio en el que se muestren las regularidades del lenguaje. La reducción de dimensiones es algo que también que le viene dado al lsa. Sin embargo estas dos asunciones no representan ningún punto de vista problemático, ya que landauer y dumais (1997) tampoco han negado organizaciones innatas en el cerebro que nos capacite para el lenguaje, aunque a decir verdad, también sería justo señalar que no justifican ni dan pruebas de cómo llegamos los humanos a hacer estas dos cuestiones, ni de si hay evidencias experimentales o de tipo neurológico que avalen de alguna manera estos hechos. el lsa es una teoría inmersa en el plano simbólico y sin conexión con el mundo para landauer, el lsa se sustenta en la noción de lenguaje del segundo wittgenstein según el cual el significado depende de en qué actividad de la vida se dé el lenguaje. Para el filósofo, el significado de una palabra no tiene una referencia inamovible en el sentido de san agustín, sino que depende del uso que se dé a la palabra. El segundo wittgenstein no habla de contexto explícitamente, sino de actividad (hadot, 2007). Lo que no queda demasiado claro es si landauer y dumais siguen todas las implicaciones de este gran filósofo, ya que para wittgenstein el lenguaje no es una herramienta que dé luz a los pensamientos, sino que los constriñe (pinker, 2002). ¿los límites del lenguaje […] Significan los límites de mi mundo¿ dijo wittgenstein. Tal vez landauer y dumais no lleven tan lejos lo que hay detrás de esta aseveración para la que el lenguaje representaría el medio de pensamiento, más que una herramienta que ayuda o complementa al pensamiento. Muchas de las teorías psicológicas del siglo xx han concebido el lenguaje así, hundiendo sus raíces en el concepto de tabla rasa. También la filosofía del pasado siglo ha estado salpicada con la noción de que lenguaje y pensamiento son una misma cosa, hasta llevarlo al extremo de los post-estructuralistas como ronald barthes o jacques derrida (sebrelli, 2007). Muchas de estas ideas están detrás de la lingí¼ística, cuya metodología fue adoptada por los estructuralistas y que defienden algo que ya hemos resaltado como crítica al lsa: la idea de que las palabras se definen por su relación con el resto de ellas. El lenguaje se sumerge en un círculo autorreferencial de modo que la forma natural de pensar en el lenguaje es como un sistema independiente de la realidad, un sistema arbitrario que no describe el mundo ni transmite pensamientos (pinker, 2002). Lo más probable es que los creadores del lsa conciban el lenguaje no como una prisión del pensamiento, ni tampoco como una limitación del sujeto encerrado entre los límites del lenguaje. A la vista de la concepción actual de la psicología es más probable que conciban el lenguaje como un sistema abierto al mundo. Sin embargo, sea como sea, landauer, dumais y demás seguidores, no han salido del plano simbólico en el que se mueve la herramienta cuando proponen al lsa como teoría de adquisición de conocimiento, lo cual lo ha convertido en fuente de críticas por teorías diferentes entre las que destacan las teorías corpóreas (barsalou, 1999; de vega, 2002, 2005; glenberg y robertson, 2000; zwaan, 2004). Landauer y dumais, tampoco se han ocupado de refrendar sus opiniones a partir de evidencias neurológicas que correlacionen con su modelo. en definitiva, es realmente notorio y elogiable cómo landauer y dumais dan una solución al problema de la inconmensurabilidad de la experiencia para llegar a una representación del significado de las palabras. La sola propuesta de un mecanismo plausible ya es un ejercicio enormemente valioso, entre otras cosas porque muchos de los modelos de adquisición del lenguaje se ven imposibilitados a hacer simulaciones realistas ¿al menos en cuanto a cantidad de lenguaje (landauer y dumais, 1997). Que tal mecanismo utilice como base el contexto también es muy valioso al menos porque le da verosimilitud al modelo, no es un mecanismo en el que subyacen propuestas etéreas y sacadas ad hoc, más cuando el contexto recibe apoyo desde muchas teorías psicológicas (véase venegas, 2006). Vemos que el lsa tiene un modelo del hombre más afín con la noción de tabla rasa, con el empirismo y con la idea de que el ser humano es altamente configurable o moldeable por la experiencia. Como teoría computacional, sin embargo, carece de una vinculación con el mundo, con lo corpóreo y con la realidad. ¿qué pensamos del lsa entonces como modelo teórico?, ¿es esto todo lo que necesitamos para explicar la adquisición de significado? Para nosotros la respuesta es no. La elegancia con la que el lsa explica la adquisición de conocimiento no implica que dicha explicación sea correcta, al menos no completamente. A nuestro modo de ver el principal problema del lsa es que no sale del plano simbólico. Es un sistema encerrado en sí mismo y el ser humano es, como cualquier ser vivo, alguien que interacciona constantemente con el mundo que le rodea. Siguiendo el ejemplo de la habitación china de searle (1980), si por un momento podemos imaginarnos a dos seres humanos que no hayan tenido el más mínimo contacto con el mundo real y que emitan indefinidamente signos arbitrarios resulta difícil pensar que alguna vez podrían comprender algo, incluso aunque esos signos que emiten sean contextualmente coherentes. Nuestra mente tal vez podría aprender que el símbolo x se relaciona mucho con el símbolo y, pero al no haber nada que los haya conectado con el mundo, al no haber ningún tipo de referente, la lógica nos dice que x sería únicamente un símbolo carente de significado, lo mismo que y. Todo esto entronca con una concepción muy mentalista, la del fantasma en la máquina (pinker, 2002), la dualidad cuerpo y alma o la noción de que la mente es independiente del cuerpo. A nuestro modo de ver necesitamos un sustrato, un suelo en el que pisar, una conexión con el mundo, un modelo que al menos al principio parta de la realidad. Es cierto que landauer, dumais y otros han subrayado que el lsa no es una teoría completa de adquisición de la semántica, pero no han hecho hincapié tampoco en la necesidad de estrechar el lazo entre la persona y el mundo. parece haber muchas evidencias a favor del innatismo lingí¼ístico (pinker, 1994), sobre todo en lo que a los aspectos formales del lenguaje se refiere (chomsky, 1991), aunque también esta postura se ha llevado al campo de la semántica (pinker, 2007). Por ejemplo, según pinker (2007) hay argumentos a favor para defender la idea kantiana de que tenemos unos a priori en nuestro cerebro producto de siglos de evolución que nos permiten afrontar la experiencia. Los a priori que escoge pinker de kant son la sustancia, la causalidad y el espacio y tiempo. Para pinker representan el contenido semántico básico de las palabras (sustantivos, verbos, etc), unas estructuras que nos posibilitan y además nos dirigen la comprensión del mundo. Por ejemplo, el verbo tirar podría comprenderse al principio como una acción que genera una fuerza en un espacio, fruto de una experiencia vivida por un niño (¿¡juan, tírale la pelota al perro!¿). Por medio de estructuras innatas gramaticales tirar es la acción en un espacio que acomete un agente, juan, y que tiene un objeto, pelota y un complemento indirecto el perro. La adquisición no es independiente del mundo, está enlazada en él. La causalidad, el espacio o el tiempo como artilugios mentales no se conciben como en tiempos de kant. El concepto de espacio del cerebro no es equivalente a la geometría euclidiana, sino que responde a unas concepciones más intuitivas y más simples del espacio. Por ejemplo, el ser humano podría pensar en una carretera como algo que tiene una dimensión principal, como una línea. El tiempo tampoco es una categoría delimitada por trazos continuos y constantes y el ser humano suele conferirle una dimensión espacial: el tiempo visto en una línea en la que habitualmente ubicamos el pasado, el presente y el futuro. Tampoco la causalidad se interpreta en términos de la fuerza tal como la concibe la física clásica, sino como una imagen-esquema de dinámica de fuerzas (de vega, 2005; pinker, 2007 refiriéndose a la concepción de leonard talmy). Los a priori conectan el mundo con el lenguaje, el significado con nuestra realidad externa. Del mismo modo, las teorías corpóreas subrayan las evidencias neurológicas que han emergido en los últimos años que parecen mostrar el vínculo que hay entre el significado y las zonas sensoriales del cerebro, las neuronas espejo o las áreas motoras (de vega, 2005). Comprendemos las palabras en estrecho vínculo con el mundo, comprendemos dentro de un modelo situacional y no a partir de unas entidades inamovibles. La palabra coche nos evocará cosas diferentes si estamos hablando del campeonato de fórmula 1 o si hablamos de un parking. Las palabras no se comprenden dentro de un círculo autorreferencial sin conexión con el mundo. ¿cómo se podría simular en un ordenador todas estas experiencias por las que el humano aprende los significados de las palabras? Kintsch (2008) habla de distintos niveles de análisis (perceptual, emocional o motor) que lógicamente complican el asunto muchísimo para los modelos computacionales y él prefiere tratarlos de forma independiente más que integrados en un único sistema, ya que el estado actual de la ciencia no puede dar cuenta de estos modelos integrados. Volveremos sobre esto más adelante. conciliar el plano simbólico del lsa con el plano más corpóreo nosotros sin embargo, aun estando de acuerdo en estas limitaciones del lsa difícilmente salvables cuando tratamos de justificar la herramienta como una teoría de adquisición de conocimiento, también queremos rendir cuentas al plano simbólico, llegando a una postura conciliadora entre las teorías corpóreas y a las teorías computacionales. Nos unimos a la propuesta de kintsch (2007, 2008) en la que habla de la necesidad de aunar el plano corpóreo con el plano simbólico. Vayamos por pasos. Por lo que sabemos, el lsa es capaz de simular correctamente muchos aspectos psicológicos del lenguaje. Como hemos visto hay sobradas evidencias de su éxito (landauer, 2002; landauer y dumais, 1997; landauer, foltz et al., 1998). Si es capaz de eso es razonable postular que su representación de las palabras puede asemejarse a las que tenemos nosotros en el cerebro. Nosotros compartimos la opinión de lowerse (2007) que plantea que la cuestión no es si la comprensión es simbólica o corpórea, sino hasta qué punto es lo uno y lo otro. Desde nuestro punto de vista la comprensión puede tener lugar en dos niveles de procesamiento, uno más inconsciente y simbólico, y luego otro que es más consciente y corpóreo. La parte más inconsciente sería un nivel de representación automático y superficial, capaz de procesar gran cantidad de lenguaje en un intervalo de tiempo muy breve. La activación simbólica que se realice a un nivel inconsciente pasaría a ser consciente en determinados momentos, lo que realmente se nos aparece a los seres humanos como comprensión. En esta fase más consciente, tal vez estrechamente vinculado a lo que tenemos en la memoria de trabajo, podríamos activar áreas sensoriomotoras en ese proceso en el que vinculamos los símbolos con el mundo. No proponemos ningún modelo específico de procesamiento de lenguaje, únicamente señalamos cómo podrían ser compatibles los dos planos, el simbólico y el corpóreo, en la comprensión y procesamiento del lenguaje. Ambos niveles probablemente interactuarían alimentándose mutuamente. Realmente, lo que queremos significar aquí es que es posible que el ser humano trabaje en parte con una representación meramente simbólica del lenguaje. Kinstch (2007) señala que este plano supone procesar como si estuviésemos consultando un mapa, aún no en vinculación directa con el mundo real, sino en un nivel que podríamos llamar isomorfo de segundo orden. Resulta muy atractiva su idea de por qué cuando consultamos un mapa no representamos el conocimiento directamente, sino que establecemos la relación entre significados. Por ejemplo, él considera lo que ocurre con algunas medidas físicas que podrían considerarse de primer orden y otras derivadas de ellas que serían de segundo orden. Si medimos la distancia en metros entre dos ciudades tendríamos una medida de primer orden. Si lo hacemos en términos de la velocidad tendríamos una medida derivada, de segundo orden. En el primer caso tenemos una representación de la distancia isomórfica de la realidad, una medida real, sin embargo, cuando decimos que tardamos 3 horas en llegar de una ciudad a otra estamos representando la distancia indirectamente, en términos de la velocidad. Una medida para los físicos muy útil son los años luz, para medir distancias astronómicas, que nos permite comprender la realidad mejor que si hablamos en distancias absolutas. Lowerse (2007) apunta en este sentido que cuando leemos un texto debería sorprendernos la enorme cantidad de palabras que procesamos y de la que no somos conscientes individualmente aunque, sin embargo, en conjunto, tengamos la apariencia de comprender lo que se nos dice. Este procesamiento se antoja muy superficial y automático, sería un procesamiento en el que los símbolos se relacionan entre sí. Sólo durante unos breves intervalos de tiempo parece que cierta información se activa en la mente conscientemente, sabemos de lo que estamos leyendo. Seguramente en el nivel simbólico, el procesar unos símbolos activan inmediatamente otros símbolos (lo que en lsa podrían ser vecinos semánticos) y sólo una porción relevante de esa activación simbólica es lo que finalmente vinculamos con el mundo, lo que se nos hace consciente y en la que los símbolos pasan a un plano más corpóreo, donde en la comprensión actúan otros planos como la creación de conceptos, la creación de imágenes o las emociones. Por supuesto, en este procesamiento simbólico, habría que explicar cómo y por qué se activan determinados conceptos, si se opera en la memoria a corto plazo o en otros sistemas, qué mecanismos hacen que se delimite una determinada información relevante y no otra, cómo opera en el cerebro este procesamiento simbólico, si es o no independiente de las áreas sensoriomotoras, si puede formar parte de un sistema autónomo o está vinculado con otros sistemas, etc. Desde nuestra modesta opinión, únicamente decimos que es posible que procesemos parte de la información a un nivel que puede ser puramente simbólico. Podría ser una cuestión de grado y ni siquiera dos planos de procesamiento (isomórfico de primer y segundo orden), un procesamiento en el que varía la automaticidad y la conciencia, de modo que hay algunos más inconscientes y otros más conscientes y vinculados con el mundo, no lo sabemos, sin embargo no parece una idea muy descabellada pensar que procesamos parte del lenguaje a un nivel simbólico. ¿cuál es entonces nuestra lanza a favor del lsa? Si sospechamos que efectivamente parte de la información verbal la procesamos a un nivel simbólico y dado que el lsa parece simular bien tareas psicológicamente relevantes con la semántica del lenguaje, podríamos decir que el lsa es realmente una buena teoría de la representación del conocimiento. Lógicamente no es una teoría sobre el procesamiento del conocimiento. El conocimiento representado, además, sería a nivel simbólico, únicamente simbólico y resaltamos lo de únicamente porque ya hemos hablado de la insuficiencia e implicaciones de movernos exclusivamente en el plano simbólico. kintsch (2008) ha expuesto también una idea muy reveladora. ¿hasta qué punto el plano simbólico refleja o mimetiza adecuadamente el mundo real? La facultad del lenguaje no sería muy útil si no representase fidedignamente el mundo. Una facultad que evolutivamente ha podido emerger para comunicarnos debería ser un reflejo bastante bueno del mundo que representamos. Cuando kintsch (2008) o lowerse (2007) han comprobado si el plano simbólico se acerca más a lo corpóreo de lo que los críticos proponen (glenberg y robertson, 1999), han visto que la mimetización es mucho mejor de lo que parece. Ambos han utilizado algoritmos adicionales a partir de la representación vectorial del lsa (el algoritmo de predicación de kintsch es el núcleo de sus experimentos; kintsch, 2001). Por ejemplo, lowerse (2007) muestra que los días de la semana contiguos se parecen más en el lsa que días separados, también los meses, o las ciudades cuando las medimos en distancias físicas. La representación simbólica, señala lowerse, es más parecida al mundo de lo que se piensa. Kintsch (2008) muestra que cuando restringimos los contextos de las palabras (para kintsch el espacio semántico del lsa es una representación demasiado libre de contextos), además de tratar adecuadamente el fenómeno de la polisemia, podemos emular efectos de priming semántico. Lo que estos autores han hecho en gran medida es trabajar con la representación simbólica del lsa para luego utilizarla con algoritmos adicionales que procesan esa representación. Han comprobado que los resultados a los que llegan contienen una correspondencia entre lo perceptual y lo simbólico mayor de lo que a priori podría parecer. hay otro asunto sobre el que merece la pena llamar la atención y que podría ser muy revelador. Parece indudable que hay palabras que conocemos únicamente por su lectura (de hecho landauer y dumais (1997) han estimado que las personas aprenden tres cuartas partes del vocabulario a partir de la lectura), palabras que posiblemente nunca las hayamos oído en boca de nadie (o un número de veces escaso) y que sin embargo forman parte de nuestro acervo léxico. Palabras, además, que no hayamos consultado en un diccionario (como tantas otras) y que podemos declarar que conocemos. Probablemente sea difícil imaginarse cómo conocemos esas palabras si no es por el contexto en el que han aparecido. Estas palabras no tienen por qué comprenderse desconectadas del mundo, sino también de forma corpórea y en relación con el mundo, como el resto de las palabras. Si por ejemplo, imaginamos que la palabra cicatero no la hemos escuchado nunca sino solamente leído, su significado puede evocarnos lo mismo que otras palabras similares como ruin o mezquino, palabras que tienen, como las otras, su parte corpórea. Tal vez evoque una imagen de alguien desagradable dentro de una situación concreta o, por qué no, una emoción negativa. Lo importante de esto es que efectivamente, el contexto escrito puede proporcionarnos la base suficiente para aprender el significado de las palabras y en esta ocasión podemos derivar el significado de forma opuesta como cabría pensar con las primeras palabras que aprende un niño: a partir de experiencias perceptuales y con lenguaje oral. El símbolo ahora se ha asentado en el cerebro por la similitud de contextos en lenguaje escrito con otras palabras que ya conocíamos (ruin, mezquino) y acaba presentándose como una palabra que conocemos a un nivel mucho más vinculado con el mundo (imágenes, emociones, etc). Es decir, aprender palabras así supone ir de lo incorpóreo a lo corpóreo. Cicatero la primera vez que la vemos escrito no nos dice nada, pero cuando accedemos a su significado, ya sea por el contexto o por un diccionario, la vinculamos con el mundo y nos provoca situaciones y emociones. La virtud de esto es que no necesitamos únicamente la experiencia directa y real (más allá de lo escrito) para adquirir significados nuevos, sino unos mecanismos que permita generalizar nuestro conocimiento desde un plano simbólico a un plano más corpóreo. por supuesto, resulta lógico esperar que, ontológicamente, el plano simbólico sólo se dé tras un número de experiencias significativas, experiencias vitales de las que el niño se ha beneficiado y no al revés. El niño no nace con símbolos lingí¼ísticos de modo que en una primera instancia los símbolos no derivan en un conocimiento de primer orden o directo del mundo. ¿cómo operan los mecanismos para la adquisición de significado de las palabras? Supongamos que el niño aprende la palabra malo porque ha escuchado muchas veces frases del tipo ¿¡no seas malo!, Eso no se hace¿. Esa palabra el niño la asocia con situaciones negativas, como algo que suscita reacciones negativas en los demás, por ejemplo, en un principio el símbolo lo puede asociar con la imagen de sus familiares enfadados. La relación entre el símbolo y el mundo es de primer orden. El niño, un tiempo después, leerá o escuchará palabras como mezquino o ruin. Las palabras ruin y mezquino pueden aparecer en párrafos que lea el niño o que las escuche en su medio. Irá poco a poco asociando que esas palabras se rodean de situaciones negativas, sabrá que se asocian a un comportamiento inapropiado y que se refieren a una descripción de una persona. Paulatinamente, cabe esperar que los símbolos vayan aproximándose al significado de malo y a otras palabras afines. Veamos cómo emerge el conocimiento de la palabra cicatero. Tenemos que explicar su adquisición a través de la capacidad de inferir el significado, solamente a partir de lenguaje escrito y a través de relaciones indirectas. Al principio leemos la palabra cicatero y no la comprendemos. Un mes más tarde leemos la palabra cicatero nuevamente pero seguimos sin comprenderla. Entretanto, nuestro cerebro en un plano no consciente comienza a ubicar ese símbolo junto con símbolos como ruin o mezquino. De pronto un día, leemos un párrafo en el que aparece la palabra mezquino y desde ese momento sabríamos explicitar lo que significa la palabra cicatero. Hemos aprendido la palabra, tenemos un conocimiento que va más allá de la relación simbólica pues seríamos capaces de pensar en la palabra cicatero si nos preguntan por ella con una determinada imagen dentro de una situación o evocándonos una emoción negativa. A partir de ese momento podríamos definirla como en un diccionario, es decir, la conocemos directamente vinculada con el mundo, tenemos un léxico mental de l

 

Datos académicos de la tesis doctoral «El análisis semántico latente (l.s.a.) ¿es una teoría psicológica o una herramienta de análisis semántico?«

  • Título de la tesis:  El análisis semántico latente (l.s.a.) ¿es una teoría psicológica o una herramienta de análisis semántico?
  • Autor:  Ricardo Olmos Albacete
  • Universidad:  Autónoma de Madrid
  • Fecha de lectura de la tesis:  21/07/2009

 

Dirección y tribunal

  • Director de la tesis
    • José Antonio León Cascón
  • Tribunal
    • Presidente del tribunal: Manuel De vega rodriguez
    • vicente Sanjose lopez (vocal)
    • diana rosario Pérez marín (vocal)
    • José Juan Cañas delgado (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio