Solwery izogeometryczne dla różnych architektur maszyn równoległych
bazujące na teorii siadów
W pracy zaprezentowano teoretyczne oszacowanie kosztu obliczeniowego dokładnego solwera wielofrontalnego dla izogeometrycznej metody elementów skończonych uruchamianego na maszynach równoległych z pamięcią rozproszoną. Teoretyczne szacowanie zarówno kosztu obliczeniowego jak i kosztu komunikacji solwera dokładnego zostało wykonane dla przypadków 2D oraz 3D, z zachowaniem globalnej ciągłości CP-1 dla rozwiązania izogeometrycznego.
Następnie zaprezentowano wersję równoległą algorytmu zmienno-kierunkowego solwera izogeometrycznego L2 projekcji (ADS) do rozwiązywania problemów
niestacjonarnych zmiennych w czasie. W szczególności pokazano, że dla solwerów izogeometrycznych, dla B- spline-ów wyższych rzędów, znaczącym kosztem przy wykonywaniu sekwencyjnym na CPU jest generacja macierzy frontalnych.
Teoretyczne szacowania dla solwera wielofrontalnego zostały zweryfikowane poprzez wykonanie szeregu eksperymentów z wykorzystaniem trzech równoległych solwerów wielofrontalnych: MUMPS, PaStiX oraz SuperLU, dostępnych w pakiecie obliczeniowym PETIGA, rozszerzającym PETSc. Eksperymenty wykonano na linuxowym klastrze LONESTAR z Texas Advanced Computing Center przy wykorzystaniu 1728 procesorów. Algorytm całkowania został zaimplementowany na kartę graficzną oraz przetestowany na szeregu danych numerycznych. Wszystkie wyniki zostały porównane z oszacowaniami teoretycznymi.
In this thesis we present a theoretical estimation of the computational costs for isogeometric multi-frontal direct solver executed on parallel distributed memory machines. We estimate theoretically both the computational cost and the communication cost of a direct solver for the two- dimensional (2D) case, and for the three-dimensional (3D) case for the CP-1 global continuity of the isogeometric
solution.
Later we present a parallel version of the alternating directions isogeometric L2
projections algorithm (ADS) for solving non-stationary time dependent problems. In particular, we show that isogeometric solvers with higher order B-splines spend significant amount of time for generation of the element frontal matrices when executed sequentially on CPU.
The theoretical estimates for multi-frontal solver are verified with numerical experiments performed with three parallel multi-frontal direct solvers: MUMPS, PaStiX and SuperLU, available through PETIGA toolkit built on top of PETSc. The numerical experiments have been performed on the LONESTAR Linux cluster from Texas Advanced Computing Center, using 1728 processors. The integration algorithm is implemented on GPU and tested on a sequence of numerical examples. All results have been compared with the theoretical estimates.