Scalable system software for high performance large-scale applications

Tesis doctoral de Alessandro Morari

En las últimas décadas, los sistemas a gran escala de alto rendimiento han sido una herramienta fundamental para el descubrimiento científico y la ingeniería. El crecimiento de las peformance los supercomputadores y la consiguiente reducción de los costes han hecho que esta tecnología sea disponible para un gran número de científicos e ingenieros que trabajan en muchos problemas diferentes . El diseño de la próxima generación de supercomputadoras incluirán requisitos de high perfomance computing (hpc) tradicionales, así como los nuevos requisitos para manejar gran volumen de datos. Las aplicaciones de datos intensivos juegan un papel importante en una variedad de campos, y son el foco actual de varias líneas de investigación en hpc. debido a los retos de escalabilidad y eficiencia, la próxima generación de superordenadores necesita un rediseño de todo lo stack del software. Se espera que el software del sistema va a cambiar drásticamente para adaptarse al próximo hardware y para satisfacer las nuevas necesidades de las aplicaciónes. esta tesis doctoral estudia la escalabilidad del software del sistema. La tesis se inicia en el nivel de sistema operativo: primero estudia un os general-purpose (linux) y luego estudia light-weight kernels ( cnk ). A continuación, la tesi estudia el runtime system: implementamos un runtime system para sistemas de memoria distribuida que incluye muchos de los servicios de sistema requeridos por aplicaciones de próxima generación. Por fin, estudiamo las características hardware que pueden ser explotadas a nivel de usuario para mejorar las applicaciones, y potencialmente incluir estas en nuestro runtime system. las contribuciones de esta tesis son las siguientes : escalabilidad del sistema operativo: proporcionamos un estudio preciso de los problemas de escalabilidad de los sistemas operativos modernos para hpc. Diseñamos y implementamos una metodología donde la información cuantitativa detallada puede ser obtenida para cada evento de os noise. Validamos nuestro enfoque comparándolo con otras técnicas convencionales bien conocidas para analizar el ruido del sistema operativo, tales ftq ( fixed time quantum ) . Evaluación de la gestión de la tlb para un lightweight kernel: proporcionamos una evaluación del tlb handling – asignación de memoria dinámica, la asignación de memoria estática con las entradas de la tlb reemplazables , y asignación de memoria estática con las entradas de la tlb fijas (no tlb misses ) en un sistema ibm blue gene / p. escalabilidad del runtime system : diseñamos e implementamos un runtime system con todas las funciones y el modelo de programación para ejecutar aplicaciones irregulares en un clúster. El runtime system es una libreria llamad global memory and threading ( gmt) y integra un modelo de comunicación pgas y una estructura de programa fork/join. El runtime system usa aggregacion par cubrir la larencia de red. Comparamos gmt con otros modelos pgas , con codigo mpi optimizado a mano y arquitecturas personalizadas ( cray xmt) sobre un conjunto de aplicaciones irregulares a gran escala: breadth first search , random walk y concurrent hashamp. Nuestro runtime es órdenes de magnitud superior a otras soluciones para cluster systems con arquiectura similare. escalabilidad de nivel de usuario explotando características del hardware : mostramos la alta complejidad de las optimizaciones de hardware de bajo nivel como una motivación para incorporar esta lógica en un runtime system. Evaluamos los efectos de mecanismo de hardware-thread priority que controla la velocidad a la que cada hilo de clock decodifica la instrucciónes sobre ibm power5 y power6 . Finalmente, mostramos cómo se puede explotar eficazmente la localidad de caché y de network-on-chip en una arquitectura tilera many-core para mejorar la escalabilidad intra-core.

 

Datos académicos de la tesis doctoral «Scalable system software for high performance large-scale applications«

  • Título de la tesis:  Scalable system software for high performance large-scale applications
  • Autor:  Alessandro Morari
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  27/05/2014

 

Dirección y tribunal

  • Director de la tesis
    • Mateo Valero Cortés
  • Tribunal
    • Presidente del tribunal: georgi Nedeltchev gaydadjiev
    • roberto Georgi (vocal)
    • (vocal)
    • (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio