Wstęp do Programowania Obiektowego
Wykład 13
Paradygmaty. Składnia i semantyka.
1
PRZEGLĄD
PODSTAWOWYCH PARADYGMATÓW
2
Cztery podstawowe paradygmaty
1.
Programowanie imperatywne.
2.
Programowanie funkcyjne.
3.
Programowanie logiczne.
4.
Programowanie obiektowe.
3
Ad. 1. Programowanie imperatywne
Obliczenia rozumiemy tu jako
sekwencję poleceń zmieniających krok po kroku stan maszyny, aż do uzyskania oczekiwanego wyniku.
Stan maszyny należy z kolei rozumieć jako zawartość całej pamięci oraz
rejestrów i znaczników procesora.
Jest to ściśle związane z budową
sprzętu komputerowego o architekturze von Neumanna.
4
Architektura von Neumanna
5
Podział komputera na trzy podstawowe części:
procesor (ALU oraz CU)
pamięć komputera (Memory)
urządzenia wejścia/wyjścia (IN/OUT)
Języki wysokiego poziomu — takie jak Fortran, Algol, Pascal, Ada lub C —
posługują się pewnymi abstrakcjami, ale wciąż odpowiadają paradygmatowi
programowania imperatywnego.
Np. instrukcja podstawienia działa na danych pobranych z pamięci i umieszcza wynik w tejże pamięci, zaś abstrakcją
komórek pamięci są zmienne.
6
Przykładowy program
imperatywny (w języku Pascal)
program pierwszy;
var i, n, s: integer;
begin read(n);
s := 1;
for i := 2 to n do s := s * i;
write(s);
end.
7
Ad. 2. Programowanie obiektowe
Program obiektowy to zbiór
porozumiewających się ze sobą
obiektów, czyli jednostek zawierających pewne dane i umiejących wykonywać na nich pewne operacje.
Ważną cechą jest powiązanie danych (czyli stanu) z operacjami na nich (czyli poleceniami) w całość,
stanowiącą odrębną jednostkę — obiekt.
8
W programowaniu obiektowym
wprowadzono szereg mechanizmów ułatwiających programowanie, m.in.
dziedziczenie (możliwość definiowania nowych, bardziej złożonych obiektów, na bazie obiektów już istniejących).
9
paradygmat obiektowy dobrze
odzwierciedla ludzkie (przedmiotowe) postrzeganie rzeczywistości.
programowanie obiektowe zdobyło
ogromną popularność i wypada je uznać za paradygmat obecnie dominujący.
10
Przykładowy program obiektowy (w języku Java)
public class Hello {
public static void main(String[] args) { System.out.println("Hello world!");
} }
11
Ad. 3. Programowanie funkcyjne
Program funkcyjny to po prostu złożona funkcja (w sensie
matematycznym), która otrzymawszy dane wejściowe wylicza pewien wynik.
12
Cechy programowania funkcyjnego
Brak stanu maszyny;
Nie ma (tradycyjnie rozumianych) pętli;
Konstruowanie programów to składanie funkcji, zazwyczaj z wykorzystaniem rekurencji.
Charakterystyczne jest definiowanie funkcji wyższego rzędu, czyli takich, dla których
argumentami i których wynikami mogą być funkcje (a nie tylko „proste” dane jak liczby lub napisy).
13
Przykładowy program funkcyjny (w języku LISP)
(DEFINE (suma m n) (IF (> m n)
0
(+ m (suma (+ m 1) n)) )
)
14
Ad. 4. Programowanie w logice (programowanie logiczne)
Na program składa się zbiór zależności (przesłanki) i pewne stwierdzenie (cel)
Wykonanie programu to próba
udowodnienia celu w oparciu o podane przesłanki.
Obliczenia wykonywane są niejako „przy okazji” dowodzenia celu.
Opisujemy jedynie, co wiemy i co chcemy uzyskać.
15
Przykładowy program logiczny (w języku Prolog)
ojciec(jan, jerzy).
ojciec(jerzy, janusz).
ojciec(jerzy, józef).
dziadek(X, Z) :- ojciec(X, Y), ojciec(Y, Z).
?- dziadek(X, janusz).
16
OGÓLNE WŁASNOŚCI PARADYGMATÓW
17
Istnieje wiele innych
paradygmatów, niektóre się przenikają
Często paradygmaty obejmują tylko
niektóre aspekty programowania,
Programowanie skalarne i macierzowe - rozróżnienie między nimi odnosi się do
tego, czy działamy na pojedynczych wartościach, czy na całych tablicach (macierzach).
Programowanie proceduralne i
programowanie strukturalne można traktować jako odmianę programowania imperatywnego.
18
Istnieją paradygmaty przeciwstawne
19
programowanie sterowane
zdarzeniami to przeciwieństwo klasycznego programowania z własnym wątkiem sterowania
…co nie oznacza, że nie można łączyć
tych dwóch paradygmatów w jednym
programie; tak jest np. w typowych
aplikacjach bazodanowych.
Konkretne język programowania mogą ucieleśniać jeden lub więcej
paradygmatów.
Fortran, Pascal i C to języki imperatywne.
Java i C# to języki typowo obiektowe, w których programowanie imperatywne zostało mocno
ograniczone.
Natomiast C++ jest językiem zarówno obiektowym, jak i imperatywnym.
Można też uznać, że programowanie imperatywne to szczególny przypadek
programowania obiektowego, gdzie wszystko rozgrywa się wewnątrz jednego „superobiektu”.
20
Architektura współczesnych komputerów
Przytłaczająca większość komputerów działa w oparciu o imperatywną architekturę von Neumanna.
Każdy program, który chcemy uruchomić, musi być zatem najpierw przetłumaczony do postaci imperatywnej, czyli do ciągu rozkazów w języku wewnętrznym
konkretnej maszyny.
Mechanizmy z różnych paradygmatów
wymagają niekiedy skomplikowanych metod, by odwzorować je w formie rozkazów
zwykłego komputera; bardzo różna jest też ich efektywność.
21
SKŁADNIA I
SEMANTYKA
22
Składnia
Składnia to zbiór reguł, mówiących jak wygląda poprawny program w
danym języku, czyli np.:
Jak tworzy się polecenia i wyrażenia.
Jaką postać mają struktury sterowania (if, while, for itp.).
Jak zapisuje się deklaracje zmiennych.
23
Semantyka
Semantyka to znaczenie
wspomnianych wyżej form, czyli w jaki sposób działają konkretne zapisy.
24
Przykład składni i semantyki
Typowa instrukcja warunkowa if w języku C\C++.
Składnia:
if "(" <wyrażenie> ")" <instrukcja>
Semantyka jest następująca: „sprawdź wartość logiczną podanego wyrażenia i jeśli jest prawdziwe, to wykonaj
podaną instrukcję, jeżeli nie to przejdź do kolejnej instrukcji.”
25
Intuicyjność semantyki
Najlepiej byłoby, gdyby semantykę dało się łatwo odgadnąć, patrząc na składnię języka.
Dla prostych konstrukcji tak zazwyczaj bywa; bardziej skomplikowane twory są niestety mniej oczywiste.
Stąd potrzebne są ścisłe metody opisu i składni, i semantyki.
26
Jak opisać składnię i semantykę?
Składnię języków będziemy opisywali za pomocą notacji BNF,
odpowiadającej gramatykom bezkontekstowym.
Semantykę rozmaitych konstrukcji
będziemy na ogół opisywali w języku naturalnym.
27
Notacja BNF (Backus Naur Form)
Definicja języka w notacji BNF to zbiór reguł.
Poszczególne reguły mają postać:
<symbol> ::= <definicja symbolu>
Sens takiej reguły jest następujący: symbol
występujący po lewej stronie znaku ::= można zastąpić tym, co pojawia się po prawej stronie.
Symbole pojawiające się po lewej stronie reguł zwane są symbolami nieterminalnymi.
Symbole pojawiające się wyłącznie po prawej stronie to symbole terminalne.
Generalnie symbole terminalne to symbole z alfabetu definiowanego języka, a zatem
„docelowe”; symbole nieterminalne spełniają natomiast rolę pomocniczą przy jego
definiowaniu.
28
Dodatkowe symbole i konwencje (1/2)
Pionowa kreska | oznacza alternatywne warianty reguły, np.
<typ> ::= char | int | float | double
Nawiasy kwadratowe [...] oznaczają opcjonalną część reguły, np.
instr_warunk ::= if wyr_logiczne then instr [ else instr ]
Nawiasy klamrowe {...} oznaczają fragment, który może być powtórzony dowolnie wiele razy (również zero razy, czyli całkowicie pominięty), np.
<lista_arg> ::= <arg> { "," <arg> }
29
Dodatkowe symbole i konwencje (2/2)
Zwykłych nawiasów okrągłych (...) używa się do
grupowania alternatywnych fragmentów definicji, np.
<liczba_ze_znakiem> ::= ("+" | "–") <liczba_bez_znaku>
Jednoznakowe symbole terminalne umieszcza się w cudzysłowie, dla odróżnienia ich od symboli samej notacji BNF.
Symbole terminalne niekiedy pisze się czcionką wytłuszczoną; nie jest wówczas konieczne pisanie nawiasów kątowych wokół symboli nieterminalnych.
30
Powtarzające się elementy
Chcąc opisać powtarzające się elementy, możemy stworzyć definicję rekurencyjną lub wykorzystać nawiasy klamrowe.
Przykład: definicja niepustej listy identyfikatorów, rozdzielonych przecinkami.
Definicja rekurencyjna:
<lista_identyfikatorów> ::= <identyfikator>
| <lista_identyfikatorów> "," <identyfikator>
Definicja z nawiasami klamrowymi:
<lista_identyfikatorów> ::= <identyfikator> { "," <identyfikator> }
31
Klasyczny przykład użycia notacji BNF to sam opis składni notacji BNF:
<składnia> ::= { <reguła> }
<reguła> ::= <identyfikator> "::=" <wyrażenie>
<wyrażenie> ::= <składnik> { "|" <składnik> }
<składnik> ::= <czynnik> { <czynnik> }
<czynnik> ::= <identyfikator>
| <symbol_zacytowany>
| "(" <wyrażenie> ")"
| "[" <wyrażenie> "]"
| "{" <wyrażenie> "}"
<identyfikator> ::= <litera> { <litera> | <cyfra> }
<symbol_zacytowany> ::= """ { <dowolny_znak> } """
32
Niedodefiniowanie – symbole domyślne
Niektóre symbole, formalnie terminalne, są właściwie niedodefiniowanymi symbolami nieterminalnymi.
Gwoli ścisłości powinniśmy zatem dopisać:
<litera> ::= "A" | "B" | "C" | ...
<cyfra> ::= "0" | "1" | ... | "9"
<dowolny_znak> ::= ...
33
PRZETWARZANIE
PROGRAMU NA KOD MASZYNY
34
Program w dowolnym
języku/paradygmacie musi zostać
przetłumaczony na język wewnętrzny
maszyny, na której program zamierzamy uruchomić.
Są trzy zasadnicze sposoby takiego tłumaczenia:
1.
Kompilacja
2.
Interpretacja
3.
Kompilacja do kodu pośredniego
35
Kompilacja a interpretacja
Kompilacja to przetłumaczenie całego programu „za jednym zamachem”. Otrzymujemy kod wynikowy, który (po konsolidacji
zwanej też linkowaniem) wykonuje się bezpośrednio na maszynie docelowej.
Interpretacja to tłumaczenie i
wykonywanie programu instrukcja po instrukcji, za pomocą programu zwanego interpreterem.
36
Rozwiązanie pośrednie
Kompilacja do kodu pośredniego – wstępnie skompilowany kod pośredni jest następnie interpretowany lub
kompilowany ponownie „w ostatniej chwili”.
Przykład: język Java. Daje to dobry kompromis między efektywnością a przenośnością kodu na różne
komputery.
37
Wpływ nieznajomość semantyki na efektywność programu
Rozważmy pozornie identyczne pętle for w Pascalu i w C:
for i := 1 to length(s) do ...
for (i = 1; i <= strlen(s); ++i) ...
Na pierwszy rzut oka pętle te powinny zachowywać się tak samo.
Jest jednak istotna różnica: w Pascalu długość napisu s zostanie policzona tylko raz, a w języku C będzie ona liczona przy każdym obiegu pętli.
To może prowadzić do fatalnego pogorszenia efektywności programu.
Wniosek: trzeba dobrze znać semantykę języka programowania, by tworzyć efektywne programy.
38