• Nie Znaleziono Wyników

Index of /rozprawy2/10721

N/A
N/A
Protected

Academic year: 2021

Share "Index of /rozprawy2/10721"

Copied!
2
0
0

Pełen tekst

(1)

Od paru lat obserwujemy dynamiczny rozwój mocy obliczeniowej akceleratorów sprzętowych (karty graficzne oraz układy FPGA) oraz obszar ich stosowania. Wykorzystanie akceleratorów przez długi okres czasu ograniczało się jedynie do specjalizowanych zadań. Od kilku lat trwają intensywne badania nad implementacją algorytmów z zakresu wielu dziedzin nauki w kartach graficznych ogólnego przeznaczenia oraz układach FPGA. Jednym z najistotniejszych zagadnień w przypadku akceleracji obliczeń jest odpowiednie profilowanie badanego oprogramowania w celu sprawdzenia newralgicznych miejsc programu, które najbardziej obciążają czasowo system obliczeniowy, a zarazem są podatne na efektywną implementację w danym akceleratorze. Wiele dostępnych narzędzi profilowania nie ma wystarczającej funkcjonalności, aby skutecznie wychwytywać miejsca w oprogramowaniu nadające się do implementacji w akceleratorach sprzętowych. W pracy opracowano metody analizy aplikacji w celu jej efektywnej adaptacji w akceleratorze sprzętowym. Są to metody analityczne oraz algorytmy oparte na instrumentacji kodu źródłowego aplikacji, a następnie jego profilowaniu. Na podstawie tych metod opracowano prototyp systemu profilującego aplikacje. Opracowany system może wspomagać projektowanie algorytmów w akceleratorach oraz być niezbędnym elementem automatycznej generacji algorytmów w kartach graficznych bądź układach FPGA. W dalszej części pracy znajdują się przykłady implementacji wielu algorytmów przetwarzania danych oraz obliczeń numerycznych w akceleratorach sprzętowych obrazujących możliwości przedstawionych w pracy układów FPGA oraz kart graficznych.

(2)

In recent years we can observe that computional power of hardware accelerators increased significantly. Earlier graphic cards and FPGA circuits were mainly used for specialized algorithms. We can noticed number of trials of adapting lot of numerical and data-mining algorithms in GPU and FPGA in a scientific literature lately. Most important task in adapting and accelerating algorithms on hardware platforms is proper profiling process to extract parts of source code that consumes most of the execution time and its structure that enables efficient implementation of algorithm. Most of the commercial profilers does not offer such functionality. The work presents few methods of analysis of algorithms. The first group of methods are analytical ones, the second group are profiling algorithms based on intrumentation of the source code. Then prototype of profiling system is introduced. The system can be helpful in adapting many algorithms in hardware accelerators or be part of automated source code generation system for GPU and FPGA platforms. The second part of work concentrates on implementation of several numerical and data-mining algorithms.

Cytaty

Powiązane dokumenty

1. Podmiot przetwarzający zobowiązuje się, przy przetwarzaniu powierzonych danych osobowych, do ich zabezpieczenia poprzez stosowanie odpowiednich środków technicznych

Można przyj-ąć, że algorytm J e s t stabilny Jeżeli dla ograniczonych wartości danych wejściowych wyniki wyjściowe również przyjmują wartości ograniczone. Dla

Podstawą wystawienia faktury jest odebranie przez Zamawiającego prawidłowo wykonanej usługi, co potwierdza protokół zdawczo-odbiorczy podpisany przez

5.1 W terminie 7 dni od daty odstąpienia od umowy Wykonawca przy udziale zamawiającego sporządzi szczegółowy protokół inwentaryzacji robót w toku wg stanu na

Obchód normalny (oględziny) toru, przegląd - badanie techniczne toru wraz z pomiarem bezpośrednim toru oraz sprawdzeniem jego stanu technicznej sprawności.

Będziemy obliczali błąd bezwzględny i względny oraz błąd względny wyrażony w procentach dla kolejnych przybliżeń aż do dwóch miejsc po przecinku, a więc do wartości

Osoby będące przedstawicielami Zamawiającego (w tym Komisarze Odbiorczy) występujące w treści niniejszej umowy, realizujące obowiązki wynikające z treści

Dostępne są dwa rodzaje tej struktury: Stacked Sequence Structure (wszystkie ramki w tym samym oknie, a w.. danej chwili pokazana tylko jedna ramka o wybranym numerze) i Flat