Extracción de conocimiento a partir de datos imprecisos. aplicación al diagnóstico precoz de la dislexia.

Tesis doctoral de Ana María Palacios Jiménez

En algunos problemas, y en especial en el tratamiento de la dislexia, la información proporcionada sobre los objetos, en este caso los test aplicados, incluyen incertidumbre, es decir, no tenemos un valor exacto del objeto observado sino que su percepción es imprecisa, lo que denominaremos datos de baja calidad. En el caso más simple, la información puede venir representada por un valor intervalar que proporciona los valores entre los cuales puede estar el valor real del objeto. En general, lo que obtendremos serán conjuntos de valores donde cada uno de ellos contendrá el valor real del objeto con una cierta probabilidad. en la actualidad existen muchos problemas reales donde la información obtenida viene representada por conjuntos de datos imprecisos o de baja calidad. Para el tratamiento de dichos datos se puede optar por sustituir dicha imprecisión por un valor concreto y representativo. Sin embargo, se propone el tratamiento de dichos datos para comprobar, con problemas reales, que la presencia de esta imprecisión puede aportar buenos resultados finales. Para ello, el tratamiento de estos datos se basará en una representación posibilística. Es decir, dada una variable en estudio que no se puede percibir con precisión y de la que no se tendrá un conocimiento completo sobre su distribución de probabilidad, la representación posibilística asume que esta imprecisión vendrá representada por un conjunto borroso, el cual identificaremos con las familias de distribuciones de probabilidades y donde cada alfa-corte, de este conjunto borroso, tiene la probabilidad de contener el valor real del objeto, al menos, con un valor de uno menos el valor del alfa-corte. la obtención de los datos imprecisos o de baja calidad aportados por el experto en el campo de la dislexia implica, como primer objetivo, un análisis exploratorio y exhaustivo de los niños que padecen y no padecen dislexia, así como, un estudio de los distintos test aplicados en las evaluaciones de dichos niños. A partir de dichos datos el objetivo será diseñar un sistema basado en reglas borrosas capaz de soportar datos de baja calidad que pueda ser utilizado por cualquier persona inexperta en el campo de la dislexia, sobre todo padres y profesores, para determinar si un niño es disléxico o no. Los datos aportados contienen imprecisión tanto en los test aplicados a los niños como en el diagnóstico aportado por el experto, esto implica una ampliación del campo en estudio debido a la obtención de datos imprecisos imbalanceados, donde el nivel de imbalanceado viene definido por un valor inexacto. A todo lo anterior se le suma la problemática de trabajar con una matriz de costes asimétrica definida mediante datos imprecisos a la hora de clasificara un niño y obtener el fitness de la función, es decir, con ello, clasificar mal a un niño tendrá distintos niveles de error definidos mediante valores intervalares o etiquetas lingí¼ísticas. Además, en la recolección de los datos se observa la dependencia y relación entre diversos test. Por ello se ha de considerar, como otro objetivo más de la tesis, el análisis de dependencias entre datos de baja calidad centrándonos en la extracción de reglas de asociación difusas.

 

Datos académicos de la tesis doctoral «Extracción de conocimiento a partir de datos imprecisos. aplicación al diagnóstico precoz de la dislexia.«

  • Título de la tesis:  Extracción de conocimiento a partir de datos imprecisos. aplicación al diagnóstico precoz de la dislexia.
  • Autor:  Ana María Palacios Jiménez
  • Universidad:  Oviedo
  • Fecha de lectura de la tesis:  05/05/2011

 

Dirección y tribunal

  • Director de la tesis
    • Ines Couso Blanco
  • Tribunal
    • Presidente del tribunal: Francisco Herrera triguero
    • José Manuel Cadenas figueredo (vocal)
    • Jesús Alcalá fernández (vocal)
    • oscar Cordón García (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio