Estructura y esquemas de busqueda por similitud de cadenas de caracteres. una aplicacion para peticiones complejas de localizacion de palabras en archivos documentales.

Tesis doctoral de Margarita Diaz Roca

Este trabajo trata aspectos teoricos y experimentales en torno al problema de la busqueda de las cadenas mas similares a una dada. El concepto de similitud es en el sentido de la distancia de levenshtein, dl. El objetivo que se persigue es la optimizacion de los recursos de tiempo y espacio de los esquemas de busqueda y de la estructura de datos que los soporta. se define una nueva distancia que se ha denominado distancia invariante trasposicional, dit, debido al hecho de que su valor no depende de las operaciones de trasposicion a que pueda ser sometida una cadena. Si bien dit no puede usarse por si sola para la determinacion de las cadenas mas similares, su importancia deviene de la circunstancia de que su valor entre dos cadenas es siempre inferior o igual a la dl entre estas dos mismas cadenas, siendo su coste computacional sensiblemente inferior; lo cual puede ser aplicado para la construccion de un filtro adaptivo dit/dl que tenga por mision reducir el numero de cadenas de la base de datos a las que se les calcula la dl con la cadena de busqueda. se diseña una estructura, s-d, al objeto de compartir las componentes de dit y no tener que calcular completamente la dit de la cadena de busqueda a todas y cada una de las cadenas del diccionario. El esquema de busqueda de las cadenas mas similares que se apoya en esta estructura, recorriendola a traves de las componentes de dit, y que usa este valor como criterio de poda se denomina esquema decreciente. Se estudian nuevas estrategias para un esquema de busqueda creciente, donde el radio de busqueda, en oposicion a la evolucion clasica decreciente, sigue una linea de modificacion creciente. asimismo, se propone un esquema decreciente con radio ascendente tal que en funcion del incremento del radio de busqueda define una familia de esquemas intermedios que conectan a los esquemas creciente y decreciente. prolongando la linea de optimizacion de las realizaciones de los esque

 

Datos académicos de la tesis doctoral «Estructura y esquemas de busqueda por similitud de cadenas de caracteres. una aplicacion para peticiones complejas de localizacion de palabras en archivos documentales.«

  • Título de la tesis:  Estructura y esquemas de busqueda por similitud de cadenas de caracteres. una aplicacion para peticiones complejas de localizacion de palabras en archivos documentales.
  • Autor:  Margarita Diaz Roca
  • Universidad:  Palmas de gran canaria
  • Fecha de lectura de la tesis:  01/01/1993

 

Dirección y tribunal

  • Director de la tesis
    • Octavio Santana Suarez
  • Tribunal
    • Presidente del tribunal: Antonio Nuñez Ordoñez
    • Francisco Sanchis Marco (vocal)
    • Manuel Alvar Ezquerra (vocal)
    • Rodriguez Uria M. Victoria (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio