• Nie Znaleziono Wyników

1. WSTĘP 1.1 TRENDY W APLIKACJACH Komputer równoległ

N/A
N/A
Protected

Academic year: 2021

Share "1. WSTĘP 1.1 TRENDY W APLIKACJACH Komputer równoległ"

Copied!
8
0
0

Pełen tekst

(1)

1. WSTĘP

1.1 TRENDY W APLIKACJACH

Komputer równoległy jest zbiorem procesorów mających

zdolność współpracy w celu rozwiązywania wspólnych zadań.

Składa się z co najmniej 2 procesorów

Studia nad komputerami równoległymi czasami są uważane za coś egzotycznego, mającego mały związek z praktyką.

Badania pokazują że zwiększania szybkości działania komputerów poprzez zwiększanie szybkości działania elementów napotyka na bariery wynikające z natury zjawisk fizycznych (np. skończona prędkość światła). Stąd rola komputerów równoległych będzie rosła.

Przykłady aplikacji o dużym zapotrzebowaniu na moc obliczeniową:

1. Symulacja pogody i klimatu

2. Modelowanie systemów mechanicznych (budynki, pojazdy) 3. Symulacja reakcji chemicznych

4. Sztuczna rzeczywistość i przetwarzanie obrazów (filmy) 5. Przetwarzanie sygnałów

6. Projektowanie - metoda elementów skończonych 7. Modelowanie struktury białka

8. Analiza i modelowanie sekwencji DNA.

9. Astrofizyka

10. Modelowanie eksplozji jądrowych 11. Projektowanie leków

12. Wyszukiwarki internetowe – GOOGLE, YAHOO, ...

(2)

Miary wydajność komputerów

Wydajność obliczeniową komputerów mierzy się w jednostkach ilości operacji wykonywanych na sekundę. Obecnie używane jednostki miary to :

1. FLOPS - ilość operacji zmiennoprzecinkowych na sekundę w milionach MFLOPS = 10

6

operacji /sek,

bądź miliardach GFLOPS = 10

9

operacji /sek.

2. MIPS - ilość operacji stałoprzecinkowych na sekundę 1 MIPS = 10

6

operacji /sek

Procesory Pentium III zapewniają wydajność od 500 MFLOPS do 1

GFLOPS.

(3)

1.2 TRENDY W KONSTRUKCJI KOMPUTEROW

W ciągu ostatnich 30 lat wzrost mocy przetwarzania osiągano przez:

• Zwiększenie częstotliwości zegara

• Optymalizację wykonywania operacji

• Zastosowanie pamięci podręcznych

Prawo Moor’a mówi że ekonomicznie optymalna liczba tranzystorów w

układzie scalonym podwaja się co 20 miesięcy. Jest ono ekstrapolowane

na moc obliczeniową komputerów. Prawo to nie sprawdza się w

odniesieniu do częstotliwości zegara. Od około roku 2003 obserwuje się

jego stabilizację.

(4)

Prawo Moore’a napotka bariery związane z prawami fizyki:

• Tranzystor nie może być mniejszy od atomu

• Prędkość światła jest ograniczona

Jeżeli dalej chcemy zwiększać szybkość przetwarzania to równoległość jest nieunikniona:

Pamięć 1 TB

Procesor 1 TFlop

0.3 mm

• Dane muszą być dostarczone z pamięci do procesora. Zakładając że 1 słowo danych ma być dostarczane na cykl daje to 10

12

słów na sek.

Biorąc pod uwagę prędkość światła c = 3x10

8

m/sek pamięć oś procesora musi być nie dalej niż 0.3 mm = r < c / 10

12

.

• Aby pomieścić 1 TB w obszarze 0.3 x 0.3 mm na jedno słowo wypadnie 3 Angstremy sześcienne – co stanowi wymiary pojedynczego atomu.

Wydajność komputera zależy od:

1. Czasu wykonania operacji podstawowej

2. Liczby operacji podstawowych które mogą być wykonane w sposób równoległy

Czas wykonania operacji podstawowej zależy od czasu cyklu. Czas cyklu trudno jest znacząco obniżyć.

Gdy czasu cyklu nie daje się obniżyć należy zwiększyć stopień

zrównoleglenia operacji.

(5)

Typy równoległości „automatycznej” wewnątrz procesora:

1. Na poziomie bitów – szersze ścieżki przesyłowe (8,16,32,64 bity) i szerokości wykonywanych operacji arytmetycznych.

2. Na poziomie instrukcji – przewidywanie i równoległe wykonywanie instrukcji, pipelining.

3. Na poziomie wątków - wiele wątków wykonywanych równolegle przez niezależne jednostki wykonawcze.

Zmiany liczby tranzystorów w procesorach w latach 1970-2005 – trzy

poziomy równoległości

(6)

1.3 Rozwój superkomputerów- od Eniac’a do Blue Gene Powszechnie uważa się że pierwszym komputerem był ENIAC -

Electronic Numerical Integrator and Computer – co oznacza w wolnym tłumaczeniu „elektroniczne urządzenie numerycznie całkujące i liczące”.

Wykonywał 50000 operacji na sekundę. ENIAC zbudowany był z około 17 tysięcy lamp i dużej ilości podzespołów biernych.

Rok Superkomputer Prędkość Miejsce instalacji

1944 Flowers Colossus 5 kOPS Post Office Research Station, Dollis Hill

1946 UPenn ENIAC 50 kOPS Aberdeen Proving Ground, Maryland, USA

1954 IBM NORC 67 kOPS U.S. Naval Proving Ground, Dahlgren, Virginia, USA

1956 MIT TX-0 83 kOPS Massachusetts Inst. of Technology, Lexington, Massachusetts, USA 1958 IBM SAGE 400 kOPS 25 U.S. Air Force sites across the

continental USA and 1 site in Canada (52 computers)

1961 IBM 7030

"Stretch"

1.2 MFLOPS Los Alamos National Laboratory, New Mexico, USA

1964 CDC 6600 3 MFLOPS Lawrence Livermore National Laboratory, California, USA 1969 CDC 7600 36 MFLOPS

1975 Burroughs ILLIAC IV

150 MFLOPS NASA Ames Research Center, California, USA

1976 Cray-1 250 MFLOPS Los Alamos National Laboratory, New Mexico, USA (80+ sold worldwide)

1981 CDC Cyber 205 400 MFLOPS (numerous sites worldwide) 1983 Cray X-MP/4 941 MFLOPS Los Alamos National Laboratory;

Lawrence Livermore National Laboratory; Battelle; Boeing 1984 M-13 2.4 GFLOPS Scientific Research Institute of

Computer Complexes, Moscow, USSR

1985 Cray-2/8 3.9 GFLOPS Lawrence Livermore National Laboratory, California, USA

1989 ETA10-G/8 10.3 GFLOPS Florida State University, Florida, USA 1990 NEC SX-3/44R 23.2 GFLOPS NEC Fuchu Plant, Fuchu, Japan 1993 Thinking

Machines CM-

65.5 GFLOPS Los Alamos National Laboratory;

National Security Agency

(7)

1994 Fujitsu Numerical Wind Tunnel

170.40 GFLOPS

National Aerospace Laboratory, Tokyo, Japan

1996 Hitachi

SR2201/1024

220.4 GFLOPS University of Tokyo, Japan Hitachi/Tsukuba

CP-PACS/2048

368.2 GFLOPS Center for Computational Physics, University of Tsukuba, Tsukuba, Japan

1997 Intel ASCI Red/9152

1.338 TFLOPS Sandia National Laboratories, New Mexico, USA

1999 Intel ASCI Red/9632

2.3796 TFLOPS

2000 IBM ASCI White 7.226 TFLOPS Lawrence Livermore National Laboratory, California, USA 2002 NEC Earth

Simulator

35.86 TFLOPS Earth Simulator Center, Yokohama- shi, Japan

2004 SGI Project Columbia

42.7 TFLOPS NASA Advanced Supercomputing facility at NASA Ames Research Center, California, USA

2004 IBM Blue Gene/L 70.72 TFLOPS U.S. Department of Energy/IBM, USA Ewolucja superkomputerów

według:

http://en.wikipedia.org/wiki/ Supercomputer

Blue Gene – superkomputer ogólnego przeznaczenia

Obecnie (2006 rok) najszybszym komputerem jest IBM Blue Gene/L.

Prototypowa instalacja zawiera 65536 procesorów (będących modyfikacją PowerPC) i osiąga moc 135.5 TFLOPS (10

12

FLOP).

Google - superkomputer specjalizowany

Wyszukiwarka Google może być traktowana jako superkomputer

specjalizowany. Jego moc szacuje się na od 126 do 316 TFLOP. Składa

się z 32,000 do 79,000 podwójnych procesorów 2 GHz Xeon.

(8)

1.4 PODSUMOWANIE

Równoległość przestaje być domeną superkomputerów i zaczyna pojawiać się w stacjach roboczych i serwerach.

Będzie to wymagało przystosowania oprogramowania które w większości konstruowane jest dla systemów jednoprocesorowych.

Wniosek I

Współbieżność staje się fundamentalnym wymaganiem co do

algorytmów i programów. Liczba procesorów będzie rosła w trakcie życia systemu oprogramowania.

Wniosek II

Skalowalność staje się fundamentalnym wymaganiem co do oprogramowania.

W dalszej perspektywie głównym motorem wzrostu mocy przetwarzania komputerów będzie zwiększanie stopnia równoległości przetwarzania.

Nie da się jednak tego osiągnąć bez radykalnej zmiany w oprogramowaniu.

Wnioski:

Aby wykorzystać możliwości sprzętu w dziedzinie przetwarzania równoległego należy dostosować do tego oprogramowanie.

Aplikacje będą musiały być projektowane jako w coraz większym

stopniu współbieżne aby wykorzystać ciągle rosnącą moc sprzętu

Cytaty

Powiązane dokumenty

Kryterium preferuje wnioskodawców korzystających z doradztwa Biura LGD w zakresie przygotowania wniosku o przyznanie pomocy.  3 pkt – wnioskodawca korzystał z doradztwa LGD

„x”) jednego celu ogólnego, szczegółowego i przedsięwzięcia oraz wypełnienie przez członka Rady uzasadnienia zgodności lub niezgodności operacji z celami

Ostatnim z kont niezbędnym dla ewidencji według układu rodzajowego jest konto 409, na którym ujmuje się wszystkie Pozostałe koszty, których nie można

Dane pochodzące z licznych przeprowadzonych w czasie wielu lat badań wskazują, że masa ciała do- datnio koreluje z gęstością mineralną kości (BMD, bone mineral density), a

Tryb rzeczywisty: Oryginalny komputer IBM PC był wyposażony w procesor 8088, który przy użyciu 16-bitowych rejestrów wewnętrznych potrafił wykonywać instrukcje 16-bitowe oraz

Jeżeli różnica ta jest mala, to również mala jest liczba wykorzystanych stacji montażowych, lf przeciwnym przypadku liczba wykorzystanych stacji montażowych jest duża

Tytuł: REHABILITACJA

Należy opisać stan przygotowań do podjęcia/rozwijania działalności gospodarczej i jej wykonywania. 2.2), jeśli podmiot ubiegający się o przyznanie pomocy dysponuje