Análisis y evaluación de arquitecturas heterogéneas basadas en Intel Xeon Phi para problemas científicos basados en patrones de cómputo stencil

  1. Hernandez Hernandez, Mario
Dirigée par:
  1. Juan Manuel Cebrian González Directeur
  2. José María Cecilia Canales Directeur/trice
  3. José Manuel García Carrasco Directeur

Université de défendre: Universidad de Murcia

Fecha de defensa: 29 avril 2016

Jury:
  1. Manuel Ujaldón Martínez President
  2. Domingo Giménez Cánovas Secrétaire
  3. José García Rodríguez Rapporteur
Département:
  1. Ingeniería y Tecnología de Computadores

Type: Thèses

Résumé

Resumen El auge de los campos de investigación basados en la simulación y el modelado,junto con el aumento de las necesidades del sector servicios (web y bases de datos),están poniendo a prueba las capacidades de cómputo de las arquitecturas dealto rendimiento. La tendencia actual es que los supercomputadores basen su diseñoen arquitecturas heterogéneas, donde se unen los tradicionales procesadoresde altas prestaciones con un número importante de aceleradores/coprocesadores.Entre los patrones de cómputo más utilizados por los grandes centros de datosse encuentran los métodos de las diferencias finitas, también conocidos comopatrones Stencil, comúnmente utilizados para resolver ecuaciones en derivadasparciales. Esta Tesis doctoral se centra en el diseño, análisis y evaluación de aplicacionescientíficas sobre plataformas de computación de altas prestaciones basadas enarquitecturas heterogéneas. En concreto, abordamos el desarrollo de códigoscientíficos basados en patrones Stencil sobre una arquitectura heterogénea x86,donde conviven procesadores orientados a latencia y procesadores orientadosa rendimiento (throughput), es decir, procesadores Intel Xeonmultinúcleo contarjetas coprocesadoras Intel Xeon Phi. Hemos evaluado los dos modos de trabajomás importantes que tiene Xeon Phi, el nativo y el de descarga (offload). Para elmodo nativo ofrecemos una guías que permiten optimizar el rendimiento y laeficiencia energética de códigos basados en patrones Stencil a través de tres kernelsde ejemplo (difusión acústica, sísmica y de calor), mostrando cómo vectorizary paralelizar el código, además de otras técnicas sencillas que aumenten elrendimiento. En el modo offload hemos mostrado como ejecutar el código usandodos tarjetas Xeon Phi, lo cual nos ha permitido mejorar las prestaciones delcódigo así como manejar tamaños más grandes de problemas. Para paliar lasobrecarga de las comunicaciones de datos entre las tarjetas y el procesador Xeon,hemos propuesto relajar la precisión de los resultados obtenidos. Finalmente, a lo largo de toda la Tesis hemos tenido como objetivo compararnuestros resultados con los obtenidos en otras dos arquitecturas de altas prestaciones:el Xeonmultinúcleo y la arquitectura CUDA de las tarjetas GPUs deNvidia. Dicha comparación la hemos realizado tanto en tiempo de ejecucióncomo en rendimiento energético.