Análisis del error en redes neuronales: corrección de los datos y distribuciones no balanceadas

Tesis doctoral de Roberto Alejo Eleuterio

En los últimos años el desbalance de las clases se ha reconocido como un problema crucial en áreas como el aprendizaje automático y la minería de datos. Este tipo de problema genera una perdida de efectividad del clasificador, porque generalmente asume que los datos de entrada siguen una distribución relativamente balanceada. el problema del desbalance de las clases aparece cuando existen muchos más elementos de una o algunas clases, que de la otra u otras clases (dos o múltiples clases). Esta desproporción en el tamaño de las diferentes clases en un mismo conjunto de datos, puede ocasionar una disminución en la efectividad del clasificación sobre las clases menos representadas. en el caso específico de las redes neuronales artificiales, el desbalance de las clases ocasiona lentitud en la convergencia de las clases minoritarias, lo que se traduce en una pobre capacidad de generalización del clasificador. en este trabajo se estudia el problema del desbalance de las clases en el ámbito de las redes neuronales artificiales. Para ello se entrena la red con el algoritmo back-propagation con procesamiento por grupos desde tres enfoques distintos.: (1) inclusión de funciones de coste al proceso de entrenamiento para disminuir los efectos del desbalance de las clases. (2) descomposición del problema para simplificar el tratamiento del desbalance de las clases a través del uso de redes neuronales modulares. (3) reducción de la región de solapamiento de las clases menos representadas a partir de técnicas de corrección de los datos, para mejorar la efectividad del clasificador sobre estas clases. en síntesis, este trabajo presenta un estudio empírico comparativo de los efectos y posibles tratamientos del problema del desbalance de las clases sobre tres modelos de red neuronal artificial.

 

Datos académicos de la tesis doctoral «Análisis del error en redes neuronales: corrección de los datos y distribuciones no balanceadas«

  • Título de la tesis:  Análisis del error en redes neuronales: corrección de los datos y distribuciones no balanceadas
  • Autor:  Roberto Alejo Eleuterio
  • Universidad:  Jaume i de castellón
  • Fecha de lectura de la tesis:  15/07/2010

 

Dirección y tribunal

  • Director de la tesis
    • Jose Martinez Sotoca
  • Tribunal
    • Presidente del tribunal: José manuel Iñesta quereda
    • vicente Garcia jimenez (vocal)
    • rosa María Valdovinos rosas (vocal)
    • francesc josep Ferri rabasa (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio