Radic: a powerful fault-tolerant architecture

Tesis doctoral de Angelo Amancio Duarte

La tolerancia a fallos se ha convertido en un requerimiento importante para los ingenieros informáticos y los desarrolladores de software, debido a que la ocurrencia de fallos aumenta el coste de explotación de un computador paralelo. Por otro lado, las actividades realizadas por el mecanismo de tolerancia de fallo reducen las prestaciones del sistema desde el punto de vista del usuario. esta tesis presenta una arquitectura tolerante a fallos para computadores paralelos, denominada radic (redundant array of distributed fault tolerance controllers,), que es simultáneamente transparente, descentralizada, flexible y escalable. radic es una arquitectura tolerante a fallos que se basa un controlador distribuido para manejar los fallos. Dicho controlador se basa en procesos dedicados, que comparten los recursos del usuario en el computador paralelo. para validar el funcionamiento de la arquitectura radic, se realizó una implementación que sigue el estándar mpi-1 y que contiene los elementos de la arquitectura. Dicha implementación, denominada radicmpi, permite verificar la funcionalidad de radic en situaciones sin fallo o bajo condiciones de fallo. Las pruebas se han realizado utilizando un inyector de fallos, involucrado en el código de radicmpi, de manera que permite todas las condiciones necesarias para validar la operación del controlador distribuido de radic. también se utilizó la misma implementación para estudiar las consecuencias de usar radic en un ambiente real. Esto permitió evaluar la operación de la arquitectura en situaciones prácticas, y estudiar la influencia de los parámetros de radic sobre el funcionamiento del sistema. los resultados probaron que la arquitectura de radic funciona correctamente y que es flexible, escalable, transparente y descentralizada. Además, radic estableció una arquitectura de tolerancia a fallos para sistemas basados en paso de mensajes.

 

Datos académicos de la tesis doctoral «Radic: a powerful fault-tolerant architecture«

  • Título de la tesis:  Radic: a powerful fault-tolerant architecture
  • Autor:  Angelo Amancio Duarte
  • Universidad:  Autónoma de barcelona
  • Fecha de lectura de la tesis:  28/06/2007

 

Dirección y tribunal

  • Director de la tesis
    • Rexachs Del Rosario Dolores Isabel
  • Tribunal
    • Presidente del tribunal: emilio Luque fadon
    • José Cunha (vocal)
    • william D. gropp (vocal)
    • ramon Doallo biempica (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio