sábado, 21 de agosto de 2010

The billion one challenge (II)

Varias son las claves que han llevado a nuestro grupo a haber obtenido este logro que está siendo reconocido en los foros científicos. Por supuesto los trabajos previos otros dos grupos de investigación que se deben citar. El grupo de W.C. Chew que desarrolló el método Multilevel Fast Multipole Algorithm, MLFMA y que fue el primero en abrir las puertas de la computación de altas prestaciones (HPC) en la resolución de grandes problemas electromagnéticos. Para nosotros un trabajo que consideramos visionario fue 10 million unknowns: is it that big? . A partir de este trabajo otros investigadores han intentado realizar el esfuerzo de superar cifras para lo que han desarrollado métodos cada vez más eficientes (todos basados en el MLFMA) y con ello han conseguido resolver nuevos problemas que estaban vetados a las soluciones de alta precisión.

El grupo que cogió el testigo de W.C. Chew fue el grupo BILCEM de la Bilkent University dirigido por el profesor Levent Gürel. Este grupo desarrolló en todos los sentidos el MLFMA para que pudiese lograr un gran escalado y por tanto ejecutarse en sistemas HPC avanzados. Han logrado los últimos récords hasta hace un par de años en electromagnetismo computacional. La última conferencia de Levent Gürel a la que he asistido (en un congreso organizado por mi en mayo de este año) han mostrado resultados de más de 300 millones de incógnitas.

Desde que nosotros empezamos a trabajar en el campo de la supercomputación partimos de una premisa: El MLFMA no es un método adecuado para su ejecución con un número elevado de procesadores, es decir, el MLFMA es un método muy poco escalable. Nuestra premisa tiene cierta razón y cierta falta de ella. Levent Gürel ha analizado problemas con MLFMA modelados por más de 300 millones de incógnitas; esto es un indicativo de la cierta falta de razón en nuestras premisas. Nosotros en nuestro primer reto en el mundo de la supercomputación conseguimos analizar un problema muy grande que un año antes hubiese sido el mayor problema jamás analizado; lo conseguimos con un método poco eficiente para grandes problemas pero con una escalabilidad muy buena, el simple FMM. Desarrollando la idea de crear nuevas metodologías que tuviesen una eficiencia comparable o poco inferior al MLFMA, introdujimos el método FMM-FFT y posteriormente el nested-FMM-FFT. Pero al final hemos vuelto al MLFMA desarrollando el MLFMA-FFT con el que hemos conseguido en anterior reto en el LUSITANIA y este del que hablamos. Todos estos nuevos desarrollos están publicados en revistas científicas de prestigio. El último con el que hemos conseguido este último logro es un artículo invitado titulado MLFMA-FFT parallel algorithm for the solution of large-scale problems in electromagnetics.

Otra clave del éxito ha sido el anterior logro en el LUSITANIA del Centro Extremeño de Investigación, Innovación Tecnológica y Supercomputación (CénitS) de la fundación COMPUTAEX situado en Trujillo, Extremadura. El código allí ejecutado, con el que se consiguió resolver un problema de más de 620 millones de incógnitas con aplicaciones a la industria automovilística, es el mismo que se ha ejecutado en el Finis Terrae.

Otra parte del éxito es la arquitectura del Finis Terrae y de LUSITANIA. Ambos supercomputadores están diseñados para porder abarcar grandes proyectos científicos, utilizan procesadores Itanium 2 de intel, y están diseñados por HP.

Tanto al CESGA como a CénitS como a HP queremos agradecerles su apoyo en los grandes retos supercomputacionales que hemos logrado. En este último además a la acción ICTS promovida por el CESGA y el Ministerio de Ciencia e Innovación.

HEMCUVE es un acrónimo de Hierarchic Electromagnetic Code of the Universities of Vigo and Extremadura. Hacemos uso de ese nombre para nombrar al macrogrupo formado por el grupo dirigido por mi en la Universidad de Extremadura y el dirigido por Fernando Obelleiro en la Universidad de Vigo. Hacemos llamar a nuestro código HEMCUVE++ (HEMCUVE más 1). El código es altamente escalable y aprovecha de manera muy eficiente arquitecturas de computación híbridas que usan a la vez memoria compartida y distribuida. Está realizado en C++, y utiliza los estándares OpenMP y MPI.

lunes, 16 de agosto de 2010

The billion one Challenge

El 15 de agosto de 2010 el equipo HEMCUVE formado por científicos de las universidades de Extremadura y Vigo han analizado el mayor problema electromagnético de la historia conteniendo más de un billón de incógnitas. El problema analizado es la sección radar de la NASA Almond a la frecuencia aproximada de 3,5 THz.

El análisis se ha realizado en el supercomputador Finis Terrae (desarrollado por HP) del CESGA utilizando para ello un total de 1024 procesadores Itanium, 4,3 TB de memoria RAM y menos de 24 horas de cómputo total.

El trabajo ha sido llevado a cabo mediante un acceso al CESGA financiado por el Ministerio de Ciencia e Innovación. Esta acción da respuesta a varios de los hitos que el equipo está desarrollando en el proyecto Consolider-Ingenio TERASENSE, donde se desarrollan nuevas metodologías y equipos en el campo de los terahercios y la nanotecnología.

Este récord mundial en el campo del electromagnetismo supera la cifra del billón de incógnitas, considerado como uno de los grandes retos científicos del electromagnetismo computacional del siglo XXI.