Hardware and software support for distributed shared memory in chip multiprocessors

Tesis doctoral de Carlos Villavieja Prados

Esta tesis propone mecanismos hardware y software para permitir la ejecución eficiente de aplicaciones sin acceso a su código fuente (legacy applications) en mullicares que incluyen memorias scratchpad dentro del chip. el bajo consumo y su tiempo de acceso hacen de las memorias scratchpad un candidato idóneo para incluirlas dentro del chip. Sin embargo, las aplicaciones parallelas ya existentes no hacen uso de estas memorias para mejorar su rendimiento porque no se programaron para usarlas. las memorias scratchpad son direccionables y tienen que ser gestionadas por software a diferencia de las memorias cache que son manejadas automaticamente por hardware. esta tesis propone el uso de un espacio único de direcciones global para permitir el acceso a memorias dentro del chip con una simple instrucción load/store. De este modo, no se requiere el uso de extensas librerias (api) para la gestión de estas memorias. Tambien se propone la extensión de las llamadas de gestión de memoria dinámica para permitir al programador, si lo requiere, especificar donde quiere ubicar los datos de su aplicación en el chip. para aplicaciones sin acceso al código fuente, proponemos una serie de mecanismos basados en la migración de páginas denomicados feli (fitting everyhing local in), para automáticamente mover los datos más usados por las aplicaciones a las memorias on-chip. De este modo, promovemos la localidad de las aplicaciones reduciendo el tiempo de acceso medio a memoria entre los mecanismos que propone en esta tesis se ha introducido una serie de contadores en las tlbs de los procesadores para monitorizar el acceso a los datos. Tambien se ha propuesto anadir una cache de nivel o para reducir la caga de accesos y de consumo energético de la mmu. los experimentos desarrollados comparan la propuesta de esta tesis de una arquitectura sin caches y con scratchpads exclusivamente como memorias internas en un multicore contra una arquitectura clásica basada en caches. Nuestros experimentos muestran que podemos conseguir un tiempo de acceso medio similar en ambas arquitecturas y que mediante migracion de paginas, los mecanismos consiguen guardar el 95% de los datos de las aplicaciones en el chip. De esta forma, reducimos considerablemente el consumo energético de las aplicaciones debido al bajo consumo de las memorias usadas. Adicionalmente, hemos extendido los mecanismos para explorar sus resultados en una arquitectura compuesta por varios chips. Los resultados muestran que cuando utilizamos estos mecanismos en una arquitectura mu!Tichip e! Rendimiento de las aplicaciones baja debido al incremento de accesos fuera del chip a otras memorias. finalmente, esta tesis propone una mejora del proceso de sincronizacion de las tlbs de un multicore, conocido como tlb shootdown. en arquitecturas con multiprocesadores nos encontramos con un gran número de situacions donde hay que migrar páginas o cambiar los permisos de una entrada en la tabla de páginas del sistema operativo. Para mantener las tlbs coherentes es necesario una transacción que las invalide. En este sentido, debido a la gran penalización que sufren las aplicaciones en este escenario, hemos propuesto un directorio de segundo nivel, didi (dictionary directory), que almacena en un mapa de bits que procesadores tienen cada entrada de tlb. Además, hemos añadido un mecanismo hardware para evitar el uso de interrupciones entre procesadores en invalidaciones de tlb remotas. Los resultados muestran que usando dichos mecanismos el proceso de tlb shootdown no es tan costoso y podemos mejorar el rendimiento de algunas aplicaciones hasta 3 veces cuando se usan máquinas con un gran numero de procesadores.

 

Datos académicos de la tesis doctoral «Hardware and software support for distributed shared memory in chip multiprocessors«

  • Título de la tesis:  Hardware and software support for distributed shared memory in chip multiprocessors
  • Autor:  Carlos Villavieja Prados
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  09/01/2012

 

Dirección y tribunal

  • Director de la tesis
    • Nacho Navarro Mas
  • Tribunal
    • Presidente del tribunal: yale Patt
    • abraham Mendelson (vocal)
    • xavier Martorell bofill (vocal)
    • dimitris s. Nikolopoulos (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio