Estoy haciendo una diagonalización de Lanczos de una gran matriz dispersa (~ 2 millones de elementos). Casi todos los pasos del algoritmo de Lanzcos se realizan en paralelo en la GPU, excepto la diagonalización de la matriz de Lanczos para verificar la convergencia. Para eso, he estado usando el algoritmo TQLI de Numerical Recipes. ¿Existen métodos para encontrar el sistema propio de una matriz tridiagonal que sean paralelos o fácilmente paralelizables? ¿Existe una versión paralela de TQLI?
11
TQL no puede ser paralelo.
El algoritmo paralelo estándar es el de Cuppen:
JJM Cuppen, Un método de divide y vencerás para el problema propio tridiagonal simétrico, 1980.
http://www.springerlink.com/content/t21365q2gh702714/
ver también:
F. Tisseur, Un algoritmo paralelo de divide y vencerás para el problema simétrico del valor propio en arquitecturas de memoria distribuida, 1999
http://eprints.ma.man.ac.uk/981/01/covered/MIMS_ep2007_225.pdf
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.4109&rep=rep1&type=pdf
http://www14.in.tum.de/konferenzen/Jass09/courses/2/Kleine_Albers_paper.pdf
fuente
fuente