The omega failure detector in the crash-recovery model

Tesis doctoral de Cristian Martinez Hernandez

El diseño y la verificación de algoritmos y aplicaciones distribuidas tolerantes a fallos son tareas complejas. Para estudiarlas, se han identificado varios problemas estándar. Uno de los más importantes es el consenso, el problema de varios procesos intentando acordar una decisión común. El problema del consenso no puede ser resuelto determinísticamente en sistemas asíncronos donde los procesos pueden fallar. Para salvar esta imposibilidad, chandra y toueg propusieron los detectores no fiables de fallos. en esta tesis estudiamos, por primera vez, el detector no fiable de fallos omega en el modelo de sistema de fallo-y-recuperación (crash-recovery). Más concretamente nos centramos en el diseño de algoritmos que implementan dicho detector de fallos en modelos de sincronía parcial donde los procesos pueden caer y luego recuperarse, para los que se ha demostrado que el consenso se puede resolver. en primer lugar redefinimos el detector de fallos omega para el modelo de fallo-y-recuperación. Definimos los detectores de fallos omegacr1 y omegacr2 para sistemas sin y con memoria estable respectivamente. Seguidamente, proponemos un conjunto de ocho algoritmos distribuidos que funcionan en modelos de sistema de fallo-y-recuperación (ligeramente) diferentes. Respecto a la eficiencia, se han implementado dos algoritmos eficientes en cuanto a comunicación (communication-efficient), uno para omegacr1 y el otro para omegacr2. además, proponemos dos algoritmos que implementan detectores de fallos eventually perfect, <>p. En el modelo de fallo-y-recuperación no es posible implementar un detector de fallos de la clase <>p. Por ello, se han definido e implementado los detectores de fallos <>pcr y <>pk-cr, que satisfacen propiedades más débiles. Los algoritmos están basados en el uso de un servicio de elección de líder, que es proporcionado por el detector de fallos omegacr2. Finalmente, proponemos tres algoritmos de elección de agregador y agregación de datos para redes de sensores inalámbricas, construidos sobre nuestras implementaciones del detector de fallos omegacr2.

 

Datos académicos de la tesis doctoral «The omega failure detector in the crash-recovery model«

  • Título de la tesis:  The omega failure detector in the crash-recovery model
  • Autor:  Cristian Martinez Hernandez
  • Universidad:  País vasco/euskal herriko unibertsitatea
  • Fecha de lectura de la tesis:  04/02/2011

 

Dirección y tribunal

  • Director de la tesis
    • Mikel Larrea Alava
  • Tribunal
    • Presidente del tribunal: sergio Arévalo viñuales
    • Marta Patiño martínez (vocal)
    • Antonio Fernandez anta (vocal)
    • Alberto Lafuente rojo (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio