Análisis y evaluación de arquitecturas heterogéneas basadas en Intel Xeon Phi para problemas científicos basados en patrones de cómputo stencil

  1. Hernandez Hernandez, Mario
Dirigida por:
  1. Juan Manuel Cebrian González Director
  2. José María Cecilia Canales Director/a
  3. José Manuel García Carrasco Director

Universidad de defensa: Universidad de Murcia

Fecha de defensa: 29 de abril de 2016

Tribunal:
  1. Manuel Ujaldón Martínez Presidente/a
  2. Domingo Giménez Cánovas Secretario/a
  3. José García Rodríguez Vocal
Departamento:
  1. Ingeniería y Tecnología de Computadores

Tipo: Tesis

Resumen

Resumen El auge de los campos de investigación basados en la simulación y el modelado,junto con el aumento de las necesidades del sector servicios (web y bases de datos),están poniendo a prueba las capacidades de cómputo de las arquitecturas dealto rendimiento. La tendencia actual es que los supercomputadores basen su diseñoen arquitecturas heterogéneas, donde se unen los tradicionales procesadoresde altas prestaciones con un número importante de aceleradores/coprocesadores.Entre los patrones de cómputo más utilizados por los grandes centros de datosse encuentran los métodos de las diferencias finitas, también conocidos comopatrones Stencil, comúnmente utilizados para resolver ecuaciones en derivadasparciales. Esta Tesis doctoral se centra en el diseño, análisis y evaluación de aplicacionescientíficas sobre plataformas de computación de altas prestaciones basadas enarquitecturas heterogéneas. En concreto, abordamos el desarrollo de códigoscientíficos basados en patrones Stencil sobre una arquitectura heterogénea x86,donde conviven procesadores orientados a latencia y procesadores orientadosa rendimiento (throughput), es decir, procesadores Intel Xeonmultinúcleo contarjetas coprocesadoras Intel Xeon Phi. Hemos evaluado los dos modos de trabajomás importantes que tiene Xeon Phi, el nativo y el de descarga (offload). Para elmodo nativo ofrecemos una guías que permiten optimizar el rendimiento y laeficiencia energética de códigos basados en patrones Stencil a través de tres kernelsde ejemplo (difusión acústica, sísmica y de calor), mostrando cómo vectorizary paralelizar el código, además de otras técnicas sencillas que aumenten elrendimiento. En el modo offload hemos mostrado como ejecutar el código usandodos tarjetas Xeon Phi, lo cual nos ha permitido mejorar las prestaciones delcódigo así como manejar tamaños más grandes de problemas. Para paliar lasobrecarga de las comunicaciones de datos entre las tarjetas y el procesador Xeon,hemos propuesto relajar la precisión de los resultados obtenidos. Finalmente, a lo largo de toda la Tesis hemos tenido como objetivo compararnuestros resultados con los obtenidos en otras dos arquitecturas de altas prestaciones:el Xeonmultinúcleo y la arquitectura CUDA de las tarjetas GPUs deNvidia. Dicha comparación la hemos realizado tanto en tiempo de ejecucióncomo en rendimiento energético.