Podstawy matematyki
Wykład 2 - Język logika pierwszego rzędu, teoria zbiorów
Oskar Kędzierski 15 marca 2020
Język logiki pierwszego rzędu
Rachunek zdań, tj. system formalny, w którym występują wyłącznie zmienne zdaniowe oraz spójniki logiczne nazywa się czasem
językiem logiki zerowego rzędu. Język logiki pierwszego rzędu stanowi rozszerzenie rachunku zdań o
i) kwantyfikatory,
ii) symbole funkcyjne i relacyjne,
iii) zmienne indywiduowe (lub nazwowe).
Przy ich pomocy można budować formuły, które interpretuje się nad strukturami, to jest zbiorami, przypisując symbolom
Składnia języka logiki pierwszego rzędu
Definicja
Sygnaturę
(lubalfabet
) języka logiki pierwszego rzędu oznaczamy przez Σ. Jest to rodzina przeliczalnych zbiorówΣFn dlan≥0 oraz rodzina przeliczalnych zbiorów ΣR
n dla n≥1, parami rozłącznych. Elementy zbioru ΣF
n to symbole funkcyjne n−argumentowe (symbole funkcyjne 0−argumentowe traktujemy jako stałe) a
elementy zbioru ΣR
n to symbole relacyjne n−argumentowe.
Definicja
Niech X oznacza nieskończony, przeliczalny zbiór zmiennych
indywiduowych (nazwowych). Zwykle elementy zbioru X oznacza
Składnia języka logiki pierwszego rzędu
Uwaga
W formułach języka logiki pierwszego rzędu używa się też dwuargumentowego symbolu równości =, który nie należy do
sygnatury, oraz symboli nawiasów, wskazujących na kolejności wykonywania działań.
Czasem wyklucza się symbol równości lub traktuje się go jako symbol relacyjny 2−argumentowy.
Termy
Definicja
Termem
nazywamyi) symbol zmiennej,
ii) napisf(t1, . . . , tn),gdziet1, . . . , tn są termami af ∈ ΣFn jest symbolem funkcyjnym dla n≥0.
Zbiór wszystkich termów nad sygnaturą Σ oraz zbiorem zmiennych
Zmienne występujące
Definicja
Dla każdego termu t ∈ TΣ(X )definiujemy zbiór FV(t) ⊂ X
zmiennych występujących
w termiet w sposób rekurencyjnyi) FV(x) = {x},
ii) FV(f (t1, . . . , tn)) =Sni=1FV(ti).
W szczególności, gdy n=0 suma pustej rodziny jest zbiorem
pustym, tj. w zbiór zmiennych występujących w termie będącym stałą, to zbiór pusty.
Przykład
Niech f będzie symbolem funkcyjnym 2−argumentowym ag
symbolem funkcyjnym 3−argumentowym. Wtedy
Formuły atomowe
Definicja
Dla ustalonej sygnatury Σ i zmiennych indywiduowych X,
formułą
atomowa
nazywamyi) symbol fałszu ⊥,
ii) napisr(t1, . . . , tn),gdziet1, . . . , tn∈ TΣ(X )są termami a
r ∈ ΣR
n dlan≥1 jest symbolem relacyjnym, iii) napis(t1 = t2), gdziet1, t2 ∈ TΣ(X )są termami.
Uwaga
Niektóre symbole funkcyjne i relacyjne są pisane pomiędzy argumentami zamiast przed argumentami (notacja prefiksowa, także notacja polska). Na przykład, symbol funkcyjny dodawania +
zapisuje się zwykle jako x+ y, a nie +(x, y ), a symbol funkcyjny
„mniejszy lub równy” ≤zapisuje się zwykle jakox ≤ y, a nie ≤ (x, y ).
Notacja infiksowa i prefiksowa
Notację
x+ y , x ≤ y
nazywamy
notacją infiksową
(binarny symbol funkcyjny lub relacyjny stawiamypomiędzy
argumentami) a notację+(x, y ), ≤ (x, y )
nazywamy
notacją prefiksową
lubnotacją polską
(binarny symbol funkcyjny lub relacyjny stawiamyprzed
argumentami). W przeciwieństwie do infiksowej, notacja prefiksowa nie wymaga stosowania nawiasów ale uważa się ją za mniej przejrzystą.Formuły
Definicja
Formułą
języka logiki pierwszego rzędu (nad ustaloną sygnaturą Σi zbiorem zmiennych indywiduowych X) nazywamy:
i) dowolną formułę atomową,
ii) napis(ϕ→ψ), gdzieϕ, ψ są formułami,
iii) napis∀x ϕ, gdziex∈ X jest zmienną indywiduową aϕ
formułą.
Uwaga
Ponieważ każdy z klasycznych logicznych spójników logicznych
¬, ∨, ∧, ↔ można zapisać przy pomocy spójnika→ oraz symbolu
fałszu ⊥, w praktyce stosuje się je także w formułach. Używa się też
Przykład
Niech sygnatura Σbędzie zadana warunkami ΣF
0 = {0,1}, ΣF2 = {+, ·}, ΣR2 = {≤}będzie sygnaturą ciała
uporządkowanego. Wtedy, na przykład, termami są następujące napisy
i) 0,
ii) x,
iii) x+0,
iv) (1· (x +0)) + y .
Przykładowe formuły atomowe to,
i) ⊥,
ii) x ≤0,
iii) (x +1) ≤ (1+ (1+ y )) · z,
iv) (x =1),
Przykład cd.
Przykładowe formuły, to i) ⊥, ii) x ≤0, iii) (x ≤0)→⊥, iv) ∀x (x ≤0)→⊥, v) (x ≤1)→(y ≤0), vi) (x ≤1)→ (∀y (y ≤0)) .Zmienne wolne
Definicję zmiennych występujących w termach można rozszerzyć na zmienne wolne w formułach.
Definicja
Dla dowolnej formuły ϕdefiniujemy zbiór
zmiennych wolnych
występujących w ϕw następujący sposób
i) FV(⊥) = ∅,
ii) FV(r (t1, . . . , tn)) =Sni=1FV(ti), gdziet1, . . . , tn∈ TΣ(X )są termami a r ∈ ΣR
n jestn−agrumentowym symbolem relacyjnym,
iii) FV(t1= t2) = FV (t1) ∪ FV (t2), gdziet1, t2 ∈ TΣ(X )są termami,
iv) FV(ϕ→ψ) = FV (ϕ) ∪ FV (ψ), gdzieϕ, ψ są formułami,
Zmienne wolne – przykłady
Niech sygnatura Σbędzie zadana warunkami ΣF
0 = {0,1}, ΣF2 = {+, ·}, ΣR2 = {≤}będzie sygnaturą ciała
uporządkowanego. Wtedy, na przykład,
i) FV(x ≤0) = {x}, ii) FV((x ≤0)→⊥) = {x}, iii) FV(∀x (x ≤0)→⊥) = ∅, iv) FV(∀x (x ≤ y )) = {y }, v) FV((∀x (x ≤ y )) →(x ≤ z)) = {x, y , z}. Uwaga
Uwaga, w ostatnim przykładzie zmienna x jest związana w
poprzedniku implikacji, ale jest wolna w następniku. Zgodnie z definicją, jest to zmienna wolna w powyższej formule.
Formuły otwarte i zamknięte
Definicja
Jeśli FV(ϕ) = ∅, to formułę nazywamy
zamkniętą
(lubzdaniem
).Jeśli w formule ϕnie występują kwantyfikatory, to nazywamy ją
Siła wiązania spójników logicznych a kwantyfikatory
Największy priorytet w formułach języka logiki pierwszego rzędu (po dopuszczeniu klasycznych spójników logicznych i kwantyfikatora
∃) mają
i) negacja¬,
ii) koniunkcja ∧i alternatywa ∨,
iii) kwantyfikatory ∀, ∃,
iv) implikacja → i równoważność ↔.
Przykład
Formułę logiczną ∀x ¬r (x)→r (x) ∧ s(x, y ) należy interpretować
Semantyka języka logiki pierwszego rzędu
Formuły języka logiki pierwszego rzędu mogą być interpretowane nad strukturą, to jest zbiorem, którego elementy przypisuje się zmiennym indywiduowym.
Definicja
Niech Σbędzie sygnaturą.
Strukturą
Anad sygnaturą Σnazywamy niepusty zbiór Awraz z przypisaniem
i) każdemu symbolowi relacyjnemu r ∈ ΣR
n dla n≥1 relacji
rA
⊂ An,
ii) każdemu symbolowi funkcyjnemu f ∈ ΣR
n dla n≥0 funkcji
fA
: An→ A(w szczególności, dla n=0, przypisanie stałym elementów ze zbioru A).
Uwaga
Gdy jasne jest o jaką strukturę chodzi opuszcza się jej nazwę i zamiastrA
, fA pisze się
Wartościowanie w strukturze
Definicja
Wartościowaniem
w strukturze Anad sygnaturą Σnazywamydowolną funkcję
ρ : X → A,
tj. przypisanie zmiennym indywiduowym ze zbioru X elementów ze
zbioru A. Dla dowolnego wartościowania ρ, zmiennej x∈ X oraz
elementu a∈ Adefiniujemy wartościowanie ρa
x wzorem
ρax(y ) =ρ(y ) x 6= y , a x= y .
Każde wartościowanie w strukturze pozwala przypisać termom elementy zbioru Aa formułom wartości logiczne.
Wartość termu
Definicja
Dla struktury Anad sygnaturą Σz ustalonym wartościowaniem ρ : X → A wartością termut ∈ TΣ(X )nazywamy element JtKAρ ∈ A zdefiniowany rekurencyjne w następujący sposób
i) JxKA ρ = ρ(x) dla x∈ X, ii) Jf (t1, . . . , tn)KAρ = f A (Jt1KA ρ, . . . , JtnK A ρ)dla termów
Spełnianie formuł
Definicja
Mówimy, że formuła ϕjest
spełniona
dla ustalonegowartościowania ρ w strukturze A, i piszemy (A, ρ) |= ϕ,
jeśli
i) nie zachodzi (A, ρ) |= ⊥,
ii) (A, ρ) |= r (t1, . . . , tn)wtedy i tylko wtedy, gdy
(Jt1KA ρ, . . . , JtnK A ρ) ∈ r A (tj. elementy Jt1KA ρ, . . . , JtnK A ρ są ze sobą w relacji rA) dla dowolnego symbolu relacyjnego r ∈ ΣF
n, n ≥1 i dowolnych termówt1, . . . , tn∈ TΣ(X ), iii) (A, ρ) |= (t1 = t2) wtedy i tylko wtedy, gdyJt1KA
ρ = Jt2K A ρ dla dowolnych termówt1, t2∈ TΣ(X ),
Spełnianie formuł cd.
iv) (A, ρ) |= (ϕ→ψ)wtedy i tylko wtedy, gdy nie zachodzi (A, ρ) |= ϕlub zachodzi (A, ρ) |= ψ,
v) (A, ρ) |= (∀x ϕ) wtedy i tylko wtedy, gdy dla dowolnegoa∈ A
zachodzi (A, ρa x) |= ϕ.
Stwierdzenie
Niech Abędzie strukturą nad sygnaturąΣ.Niech ρ, ρ′ będą dwoma wartościowaniami w tej strukturze. Wtedy dla dowolnej formuły ϕ,
jeśliρ|FV(ϕ)= ρ′|FV(ϕ),to
(A, ρ) |= ϕwtedy i tylko wtedy, gdy (A, ρ′
) |= ϕ,
tzn. spełnianie formuły zależy jedynie od wartościowania jej zmiennych wolnych.
Spełnialność
Definicja
Mówimy, że formuła ϕjest
spełnialna w strukturze
A, jeśliistnieje wartościowanie ρ,takie, że (A, ρ) |= ϕ,
(czyli jeśli jest
spełniona
dla pewnego wartościowania w A).Definicja
Mówimy, że formuła ϕnad sygnaturąΣjest
spełnialna
jeśli istniejeSpełnialność – przykłady
Formuła
(x + y = x + z)→(y = z),
jest spełnialna w strukturze Rnad sygnaturą ciał
uporządkowanych. W szczególności jest spełnialna. Formuła
(x + y = x + z) ∧ ¬(x + y = x + z),
Prawdziwość
Definicja
Formuła ϕjest
prawdziwa
w strukturze A, jeśli dla każdegowartościowania ρ zachodzi
(A, ρ) |= ϕ,
(czyli formuła jest spełniona przez wszystkie wartościowania w tej strukturze). W takim przypadku, strukturę Anazywa się
modelem
dla formuły ϕ, co zapisujemy
A|= ϕ.
Jeśli Γjest zbiorem formuł nad sygnaturą Σ, to piszemy A|= Γ,
jeśli dla każdej formuły ϕ ∈ Γ zachodzi A|= ϕ(wszystkie formuły z Γ są prawdziwe w strukturzeA).
Tautologie
Definicja
Formułę ϕnad sygnaturą Σnazywa się
tautologią
, jeśli dladowolnej struktury Anad sygnaturą Σzachodzi A|= ϕ,
(formuła ϕjest prawdziwa w każdej strukturze nad Σ). Piszemy
wtedy
|= ϕ.
Stwierdzenie
Podstawienie dowolnych formuł za zmienne zdaniowe tautologii języka logiki zerowego rzędu daje tautologię języka logiki pierwszego rzędu.
Tautologie cd.
Aby dowieść, że dana formuła jest tautologią, należy wykazać jej prawdziwość w dowolnej strukturze.
Aby dowieść, że dana formuła jest nie tautologią, należy wskazać strukturę, w której nie jest prawdziwa (tzn. wskazać wartościowanie
Tautologie cd.
Stwierdzenie
Następujące formuły są tautologiami języka logiki pierwszego rzędu
i) ∀x (ϕ→ψ) → (∀x ϕ → ∀x ψ), ii) ϕ → ∀x ϕo ilex ∈ FV (ϕ),/ iii) ∀x ϕ → ϕ, iv) ∃x ϕ → ϕo ilex ∈ FV (ϕ),/ v) x = x, vi) (x1 = y1)→((x2= y2)→ . . . →((xn= yn)→(f (x1, . . . , xn) = f(y1, . . . , yn))) . . .),gdzief ∈ ΣFn, n ≥0, vii) (x1 = y1)→((x2= y2)→ . . . →((xn= yn)→(r (x1, . . . , xn)→r (y1, . . . , yn))) . . .),gdzief ∈ ΣRn, n ≥1, viii) ∀x (ϕ ∨ ψ) ↔ ϕ ∨ ∀x ψ o ilex ∈ FV (ϕ),/ ix) ∃x (ϕ ∧ ψ) ↔ ϕ ∧ ∃x ψ o ilex ∈ FV (ϕ),/
Tautologie cd.
x) ∀x (ϕ ∧ ψ) ↔ ∀x ϕ ∧ ∀x ψ,
xi) ∃x (ϕ ∨ ψ) ↔ ∃x ϕ ∨ ∃x ψ,
xii) ¬∃x ϕ↔∀x ¬ϕ,
xiii) ¬∀x ϕ↔∃x ¬ϕ,
xiv) ∀x∀y ϕ↔∀y ∀x ϕ,
xv) ∃x∃y ϕ↔∃y ∃x ϕ,
xvi) ∀x ϕ→∃x ϕ,
xvii) ∃y ∀x ϕ→∀x∃y ϕ,
Tautologie cd.
Dowód.
Dla przykładu udowodnimy iii). Ustalmy strukturęA oraz
wartościowanie ρ. Jeśli(A, ρ) 6|= ∀x ϕ, to(A, ρ) |= ∀x ϕ → ϕ. Jeśli (A, ρ) |= ∀x ϕ, to dla dowolnegoa∈ A
(A, ρax) |= ϕ.
Wtedy dla dowolnego a∈ A
(A, ρax) |= ∀x ϕ → ϕ,
skąd, z dowolności a∈ A,
Równoważność formuł
Definicja
Mówimy, że dwie formuły ϕ, ψ są
logicznie równoważne
, jeśli |= ϕ ↔ ψ,tzn. w dowolnym modelu, przy dowolnym wartościowaniu obie są spełnione lub obie nie są spełnione. Piszemy wtedy
Preneksowa postać normalna
Definicja
Formuła ϕjest w
preneksowej postaci normalnej
, jeśli ϕ = Q1x1Q2x2. . . Qnxnψ,gdzie Qi jest równy∀ lub∃ dlai =1, . . . , n a formuła ψjest otwarta.
Stwierdzenie
Dla dowolnej formuły ϕistnieje równoważna do niej formuła w
Preneksowa postać normalna
Przykład
∀x p(x)→∃y q(y ) ≡ ∃x ¬p(x) ∨ ∃y q(y ) ≡ ∃x∃y ¬p(x) ∨ q(y ).
Przykład
∀x (p(x)→∃y q(x, y )) ≡ ∀x (¬p(x) ∨ ∃y q(x, y )) ≡ ≡ ∀x∃y (¬p(x) ∨ q(x, y )).
Nierozstrzygalność
Twierdzenie
Istnieje
algorytm sprawdzający, czy formuła w języku logikizerowego
rzędu jest tautologią.Dowód.
Jeśli w formule występuje n parami różnych zmiennych, należy
sprawdzić 2n wartościowań.
Twierdzenie (A. Church, A. Turing)
Nie istnieje
algorytm sprawdzający, dla dowolnej sygnatury Σ, czyformuła w języku logiki
pierwszego
rzędu nad Σjest tautologią.Dowód.
Gdyby istniał taki algorytm, to można pokazać, że istnieje także algorytm sprawdzający czy dowolna maszyna Turinga skończy działanie. Taki algorytm nie istnieje.
Entscheidungsproblem
Mówimy, że
nierozstrzygalny
jest problem decyzyjny:System Hilberta dla języka logiki pierwszego rzędu
Definicja
Generalizacją formuły ϕ ∈ FΣ nazywamy każdą formułę postaci
∀x1. . . ∀xnϕ, gdzie x1, . . . , xn są dowolnymi zmiennymi.
Definicja
Systemem Hilberta dla języka logiki pierwszego rzędu nazywamy system dowodzenia formuł nad przeliczalną sygnaturą Σ, w których
występują jedynie spójniki ¬, →, stała ⊥, kwantyfikator ∀oraz
symbole z sygnatury Σwraz z aksjomatami (oraz ich dowolnymi
generalizacjami) A1) ϕ→(ψ→ϕ), A2) (ϕ→(ψ→ϑ))→((ϕ→ψ)→(ϕ→ϑ)), A3) ¬¬ϕ→ϕ, A4) ∀x(ϕ→ψ)→(∀xϕ→∀xψ), A5) ϕ→∀xϕ, jeślix ∈ FV (ϕ)/ ,
System Hilberta dla języka logiki pierwszego rzędu cd.
Definicja A7) (x1 = y1)→((x2= y2)→ . . . →((xn= yn)→(f (x1, . . . , xn) = f(y1, . . . , yn))) . . .),gdzief ∈ ΣFn, n ≥0, A8) (x1 = y1)→((x2= y2)→ . . . →((xn= yn)→(r (x1, . . . , xn)→r (y1, . . . , yn))) . . .),gdzief ∈ ΣRn, n ≥1, gdzie ϕ, ψ, ϑsą dowolnym formułami nad sygnaturąΣ oraz regułądowodzenia
modus ponens
ϕ, ϕ→ψ
ψ .
Uwaga
System Hilberta dla języka logiki pierwszego rzędu cd.
Definicja
Dowodem
w systemie Hilberta nazywamy skończony ciąg formuł, w którym każda formuła jest aksjomatem lub została otrzymana przez zastosowanie reguły odrywania do poprzedzających ją formuł. Formuła ϕma dowód
(lub jesttwierdzeniem systemu
Hilberta
), jeśli istnieje dowód zawierający ϕ, co oznaczamy przez ⊢H ϕ.Formuła ϕma dowód ze zbioru hipotez (przesłanek)∆, gdy posiada
dowód w systemie Hilberta z aksjomatami rozszerzonymi o ∆ ∆ ⊢H ϕ.
System Hilberta dla języka logiki pierwszego rzędu cd.
Twierdzenie
W systemie Hilberta dla języka logiki pierwszego rzędu zachodzi
twierdzenie o dedukcji
, tzn. dla dowolnej formułyϕ ∈ FΣ∆ ∪ {ϕ} ⊢H ψwtedy i tylko wtedy, gdy∆ ⊢H (ϕ→ψ), oraz twierdzenia o poprawności i silne twierdzenie o pełności, tzn. dla dowolnej formuły ϕ ∈ FΣ oraz dowolnego zbioru formuł
∆ ⊂ FΣ
∆ ⊢H ϕwtedy i tylko wtedy, gdy ∆ |= ϕ.
W szczególności, każda tautologia języka logiki pierwszego rzędu posiada dowód.
Dowód.
Efektywna przeliczalność zbioru tautologii
Wniosek
Zbiór wszystkich tautologii nad przeliczalną sygnaturą Σjest
efektywnie przeliczalny
, tzn. w istnieje algorytm wypisujący wszystkie tautologie nad ustaloną, przeliczalną sygnaturą (w nieskończonym czasie).Dowód.
Na podstawie twierdzenia o pełności formuła ϕjest tautologią, jeśli
posiada dowód w systemie Hilberta. Zbiór wszystkich dowodów jest przeliczalny, zatem przeglądając go znajdziemy dowód dla ϕ.
Zbiory
Intuicyjnie zbiór to kolekcja pewnych obiektów. Zbiór pusty, tj. nieposiadający żadnych elementów oznaczamy ∅. Zbiory będziemy
na ogól oznaczać dużymi literamiA, B, C , X , Y , Z. Jeślix jest
elementem zbioru Apiszemy x∈ A. W przeciwnym przypadku
piszemy x∈ A/ . Elementy zbioru można wyliczyć, np. A= {0,2,4,6,8}
(kolejność elementów i liczba ich powtórzeń nie ma znaczenia) lub też podać regułę wyróżniającą elementy zbioru (wśród elementów pewnego większego zbioru), np.
A= {x ∈ N | (∃y ∈Nx=2y) ∧ x ≤8}.
Zapis A= {x ∈ X | P(x)}, gdzie P(x) jest funkcja zdaniową
(predykatem) czytamy „wszystkie x należące doX takie, żeP(x)”. y ∈ {x ∈ X | P(x)}↔P(y )
Zbiory cd.
Elementami zbiorów mogą być też inne zbiory, np.
A= {∅,1, {1}, {{1,2,3}}.
Zbiór A ma 4 elementy: zbiór pusty, 1, zbiór{1} oraz zbiór
jednoelementowy {{1,2,3}}.
Zbiory jednoelementowe nazywa się czasem
singletonami
. Zbiory, które nie mają wspólnych elementów nazywamyrozłącznymi
.Zbiory cd.
Mówimy, że zbiór Ajest podzbiorem zbioruB, jeśli każdy element
zbioru Ajest elementem zbioruB. PiszemyA⊂ B. A⊂ B↔(x ∈ A→x ∈ B)
Mówimy, że dwa zbiory są równe, jeśli mają te same elementy.
Nie istnieje zbiór wszystkich zbiorów
Rozpatrzmy zbiór Z wszystkich zbiorówX, które nie są swoimi
elementami, tj.
Z = {X | X /∈ X }
Zachodzą dwie możliwości:
i) Z ∈ Z, sprzeczność, bo wtedy Z nie spełnia warunku należenia
do Z,
ii) Z ∈ Z/ , sprzeczność, bo wtedy Z spełnia warunek należenia do Z.
Aksjomatyka teorii mnogości
Badania nad współczesną teoria mnogości (czyli teoria zbiorów) zapoczątkowali pod koniec XIX wieku Georg Cantor i Richard Dedekind. Po odkryciu m.in. paradoksu Russela prace nad
aksjomatyzacją
teorii mnogości podjęli Ernst Zermelo i Abraham Fraenkel. Ich celem było uniknięcie paradoksów i otrzymanie teorii nie prowadzącej do sprzeczności.Aksjomaty ZFC
Aksjomaty teorii mnogości Zermelo i Fraenkla w skrócie nazywa się aksjomatami ZF lub aksjomatami ZFC (gdy dołączy sie do nich pewnik wyboru, ang. axiom of choice).
W aksjomatyce ZFC elementy zbiorów są też zbiorami należącymi do pewnego uniwersum zbiorów. Aksjomaty są wyrażone w języku logiki pierwszego rzędu.
Aksjomat ekstensywności
∀x∀y(∀z(z ∈ x↔z ∈ y )→(x = y )), „dwa zbiory są równe jeśli maja takie same elementy”
Aksjomat regularności
∀x(∃y(y ∈ x)→∃y(y ∈ x ∧ ¬(∃zz ∈ y ∧ z ∈ x))) „każdy niepusty zbiór posiada element z nim rozłączny”
Z aksjomatu regularności wynika, że żaden zbiór nie jest swoim elementem, tzn. {x} ∩ x = ∅(z aksjomatu regularności
zastosowanego dla jednoelementowego zbioru {x}). Aksjomat
wyklucza też istnienie nieskończonej rodziny zbiorów xn dla n∈ N takich, że xn+1 ∈ xn (bo wtedyx = {x1, x2, . . .} nie posiada elementu z nim rozłącznego). Istnienie takiego zbioru nie wynika z poprzednich aksjomatów, ale nie jest z nimi sprzeczne.
Aksjomat wyróżniania
∀w1. . . ∀wn∀z∃y∀x(x ∈ y ↔(x ∈ z ∧ ϕ))),
gdzie w1, . . . , wn, x, z są jedynymi zmiennymi, które mogą być wolne w formuleϕ.
„dla każdego zbioru z istnieje jego podzbióry posiadający
dokładnie elementy spełniające formułę ϕ”
Ten aksjomat gwarantuje istnienie zbioru pustego (wyróżniamy elementy spełniające fałszywy warunek). Z aksjomatu
ekstensywności taki zbiór jest dokładnie jeden. Zmiennych
Aksjomat pary
∀x∀y∃z(x ∈ z ∧ y ∈ z)
Aksjomat sumy
∀r∃z∀x(x ∈ z↔∃y(y ∈ r ∧ x ∈ y ))
„dla każdego zbioru r (rodziny zbiorówr) istnieje zbiór będący
Aksjomat zastępowania
∀A∀w1. . . ∀wn(∀x(x ∈ A→∃!yϕ)→∃B(∀x(x ∈ A→∃y(y ∈ B ∧ ϕ))),
gdzie x, y , w1, . . . , wn, Amogą być jedynymi wolnymi zmiennymi w formuleϕ, reprezentującej funkcję f a∃! oznacza „istnieje
dokładnie jeden”
„dla dowolnej funkcji określonej na zbiorze A istnieje zbiórB
Aksjomat nieskończoności
∃x(∅ ∈ x ∧ ∀y(y ∈ x→S(y ) ∈ x)), gdzie S(w ) = w ∪ {w }
Aksjomat zbioru potęgowego
∀x∃y∀z(z ⊂ x→z ∈ y )
Aksjomat wyboru
∀r(∀x(x ∈ r →∃yy∈ x) ∧ ∀x∀y((x ∈ r ∧ y ∈ r ∧ x 6= y )→
→¬(∃zz ∈ x ∧ z ∈ y )))→∃s(∀x(x ∈ r →∃!y(y ∈ x ∧ y ∈ s))) , „dla dowolnej rodziny niepustych, parami rozłącznych zbiorów r
istnieje selektor s, to jest zbiór, który ma dokładnie jeden element
Konsekwencje aksjomatu wyboru
Z aksjomatu wyboru wynika istnienie bazy (maksymalnego zbioru liniowo niezależnego) w dowolnej przestrzeni wektorowej.
Z drugiej strony, konsekwencją aksjomatu wyboru jest rozkład kuli w R3 na skończoną liczbę rozłącznych podzbiorów, z których
można złożyć (przez translacje i obroty) dwie kule o takim samym promieniu jak wyjściowa (paradoks Banacha-Tarskiego).
Z twierdzenia Gödela o niedowoliwości niesprzeczności wynika, ze w ramach ZF(C) nie można dowieść niesprzeczności ZF(C) (jeśli system ZF(C) jest niesprzeczny). Prace Gödela i P. Cohena
wykazały, że aksjomat wyboru jest niezależny od aksjomatów ZF, o ile są one niesprzeczne. Zatem, jeśli system ZF jest niesprzeczny, to niesprzeczny jest także system ZFC oraz ZF¬C.
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela
W celu uniknięcia paradoksu Russela wprowadza się pojęcie klasy. Każdy zbiór jest klasą. Klasa nie może należeć do klasy (ale zbiór może). Istnieje klasa wszystkich zbiorów. Jest to tzw. klasa właściwa, która nie jest zbiorem.
Pozwala to na poprawne zdefiniowanie kategorii wszystkich zbiorów Set oraz kategorii Cat wszystkich małych kategorii (tj. kategorii, których zbiór wszystkich morfizmów tworzy zbiór). Przedstawione poniżej aksjomaty pochodzą od E. Mendelsona, Introduction to Logic, i różnią się od oryginalnych aksjomatów Bernaysa, w których istniały dwa symbole relacyjne ∈orazη, które oznaczały odpowiednio „jest elementem zbioru”
oraz „jest elementem klasy”, zbiory oznaczano małymi literami a klasy dużymi.
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
Aksjomatyka NBG stanowikonserwatywne rozszerzenieaksjomatów ZFC, co z definicji oznacza, że pozwala na dowiedzenie dokładnie tych samych twierdzeń o obiektach oryginalnej teorii. Twierdzenie Shoenfielda mówi, że każde twierdzenie teorii NBG, zawierające jedynie zmienne oznaczające zbiory, jest twierdzeniem teorii ZFC.
Ponieważ teoria NBG nie dopuszcza klasy wszystkich klas, wprowadza się pojęcie konglomeratuwszystkich klas. Istnieją alternatywne teorie zbiorów, np. teoria Morse’a–Kelley’a stanowiąca właściwe rozszerzenie teorii ZFC.
Uogólniona hipoteza continuum (tzn. dla dowolnej liczby kardynalej κnie
istnieje liczba kardynalna λtaka, żeκ < λ <2κ) jest niezależna od ZFC ale implikuje pewnik wyboru. Teoria NBG jest niesprzeczna wtedy i tylko wtedy, gdy teoria ZFC jest niesprzeczna (Novak, Rosser-Wang,
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
Alfabet składa się ze zmiennych X1, X2, . . . ,(oznaczanych dużymi literami dla zgodnosći z teoriami Bernaysa i Gödla) lubX, Y , Z , . . ..
Zmienne oznaczają klasy, czyli pewne kolekcje pewnych elementów. Teoria posiada dwa symbole relacyjny dwuargumentowe∈oraz=.
Pierwszy oznacza „bycie elementem”, drugi równość spełniająca aksjomaty
i) ∀X (X = X ),
ii) X = Y →(ϕ(X , X )→ϕ(X , Y )),
gdzieϕ(X , X )jest dowolną formułą zdaniową, aϕ(X , Y )jest formułą
zdaniowąϕ(X , X ), w której pewne wolne wystąpienia zmiennejX
zastąpiono wolną zmiennąY (w celu uniknięcia np. ∀X (X = X )→∀X (X = Y )).
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
Niech X ∈ Y/ będzie skrótem dla ¬(X ∈ Y ).
NiechX ⊆ Y będzie skrótem dla∀Z (Z ∈ X →Z ∈ Y )(X jest podklasą Y).
NiechX ⊂ Y będzie skrótem dlaX ⊆ Y ∧ X 6= Y (X jest podklasą
właściwąY).
NiechM(X ) (niem. Menge) będzie skrótem dla∃Y (X ∈ Y )(X jest
zbiorem).
NiechPr(X )(ang. proper class) będzie skrótem dla¬M(X )(X jest
klasą właściwą).
Niech∀x ϕ(x)będzie skrótem dla∀X (M(X )→ϕ(X )), gdzieX jest
pierwszą zmienną nie występująca w formuleϕ(dla każdej klasyX
będącej zbiorem).
Niech∃x ϕ(x)będzie skrótem dla∃X (M(X ) ∧ ϕ(X )), gdzieX jest
pierwszą zmienną nie występująca w formuleϕ(istnieje klasaX będąca
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
Pierwsze dwa z poniższych aksjomatów są równoważne aksjomatom dla symbolu relacyjnego=(ale używają skończonej liczby formuł
zdaniowych).
E (∀Z (Z ∈ X ↔Z ∈ Y ))→(X = Y ) (aksjomat ekstensywności),
T (X = Y )→(X ∈ Z ↔Y ∈ Z )(równe klasy należą do tych samych
klas),
P ∀x ∀y ∃z ∀u (u ∈ z↔u = x ∨ u = y, (dla dowolnych zbiorówx, y
istnieje zbiórz, oznaczany{x, y }, którego elementami są jedyniex i y),
N ∃x ∀y (y /∈ x)(aksjomat zbioru pustego, oznaczanego∅,
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
JeśliX lubY jest klasą właściwą, to{X , Y } = ∅. Symbol {X }jest
skrótem dla{X , X }.
Niech (X , Y )będzie skrótem dla {{X }, {X , Y }}(gdyX, Y są zbiorami (X , Y )nazywamy parą uporządkowaną).
Niech(X )będzie skrótem dlaX.
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
Aksjomaty istnienia klas (ang. class existence)
B-1 ∃X ∀u ∀v ((u, v ) ∈ X ↔u ∈ v )(istnienie klasy par wszystkich
zbiorów, tj. relacji∈),
B-2 ∀X ∀Y ∃Z ∀u (u ∈ Z ↔u ∈ X ∧ u ∈ Y )(istnienie klasyZ
oznaczanejX∩ Y),
B-3 ∀X ∃Z ∀u (u ∈ Z ↔u /∈ X )(istnienie klasyZ będącej dopełnieniem
klasyX, oznaczanejZ),
B-4 ∀X ∃Z ∀u (u ∈ Z ↔∃v (u, v ) ∈ X )(istnienie klasyZ będącej
dziedziną relacjiX, oznaczanejD(X )),
B-5 ∀X ∃Z ∀u ∀v ((u, v ) ∈ Z ↔u ∈ X )(istnienie relacji (klasy)Z takiej,
że każdy element (zbiór) klasyX jest w relacji z dowolnym zbiorem),
B-6 ∀X ∃Z ∀u ∀v ∀w ((u, v , w ) ∈ Z ↔(v , w , u) ∈ X ),
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
AksjomatyB-6 orazB-7 pozwalają na utożsamienie iloczynów
kartezjańskich X1× X2× X3 zXf(1)× Xf(2)× Xf(3), dla dowolnej permutacji f ∈ S3, pierwszy dotyczy cyklu, drugi transpozycji, które
generują grupęS3. Powyższe operacje pozwalają jednoznacznie
zdefiniować klasę uniwersalną (dopełnienie zbioru pustego) , dopełnienie klasy, przecięcie, sumę, różnicę klas.
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
Stwierdzenie
Niech ϕ(X1, . . . , Xn, Y1, . . . , Ym)będzie formułą zdaniową, w której występują co najwyżej zmienne X1, . . . , Xn, Y1, . . . , Ym. Niech formułaϕ będzie logicznie równoważna formule, w której jedynie zmienne
oznaczające zbiory nie są wolne. Wtedy
⊢ ∃Z ∀x1 . . . ∀xn(x1, . . . , xn) ∈ Z ↔ϕ(x1, . . . , xn, Y1, . . . , Ym).
Dowód.
Mendelson, Introduction to Mathematical Logic, Proposition 4.4. Dowód polega na indukcji ze względu na liczbę kwantyfikatorów i spójników→
oraz¬w formule zdaniowej, głownie przy pomocy aksjomatów B-1, . . . , B-7.
Jest to odpowiednik aksjomatu wyróżniania z aksjomatyki ZF, udowodniony na podstawie skończonej liczby aksjomatów.
Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.
U ∀x ∃y ∀u (u ∈ y ↔∃v (u ∈ v ∧ v ∈ x)(istnienie zbioruy będącego
sumą rodziny zbiorówx),
W ∀x ∃y ∀u (u ∈ y ↔u ⊆ x)(istnienie zbioru potęgowegoy zbiorux),
S ∀x ∀Y ∃z ∀u (u ∈ z↔u ∈ x ∧ u ∈ Y ) (istnienie zbioruz, który
zawiera elementy zbiorux i klasyY),
R Y jest funkcją→∀x ∃y ∀u (u ∈ y ↔∃v ((v , u) ∈ Y ∧ v ∈ x))(obraz
zbiorux przez funkcjęY jest zbioremy),
I ∃x (∅ ∈ x ∧ ∀u (u ∈ x→uP{u} ∈ x))(istnienie nieskończonego
zbioru{x}),
Reg ∀X (X 6= ∅→∃y ; (y ∈ X ∧ y ∩ X = ∅))(każda niepusta klasaX
zawiera element (zbiór) z nią rozłączny),
C ∀x ∃f (f jest funkcją ∧ ∀y (y 6= ∅ ∧ y ⊆ x)→f (y ) ∈ y ) (pewnik
wyboru)
UFC ∃X f jest funkcją ∧ ∀u (u 6= ∅→X (u) ∈ u)(silny pewnik wyboru,
Część wspólna zbiorów
Ai
BA B
X A∩ B
Suma zbiorów
Ai
BA B
X A∪ B
Dopełnienie zbioru
A X A A′ x∈ A′ ↔x /∈ ARóżnica teoriomnogościowa
Ai
BA B
X A\ B
Różnica symetryczna
Ai
BA B
X A−˙ B
Przykłady
Niech A= {1,2,4,6,8,10}, B = {2,3,6,7,9,10}, X = {1, . . . ,10}, Wtedy A, B ⊂ X , A∩ B = {2,6,10}, A∪ B = {1,2,3,4,6,7,8,9,10}, A′ = {3,5,7,9}, A\ B = {1,4,8}, B\ A = {3,7,9}, A−˙ B = {1,3,4,7,8,9}.Prawa rachunku zbiorów
Ponieważ operacje na zbiorach wyrażone są w języku logiki, tautologie rachunku zdań dają tożsamości rachunku zbiorów (po podstawieniu za zmienne zdaniowe wyrażeń x∈ A, x ∈ B).
Poniższe tożsamości wynikają wprost z definicji:
i) A′
= X \ A,
ii) A\ B = A ∩ B′
,
Prawa identyczności
Dla dowolnego zbioru A⊂ X zachodzą tożsamości
i) A∩ ∅ = ∅,
ii) A∩ X = A,
iii) A∪ ∅ = A,
iv) A∪ X = X.
Dowód.
Podstaw za p wyrażenie x ∈ Ado tautologii
i) p∧ ⊥↔⊥,
ii) p∧ ⊤↔p,
iii) p∨ ⊥↔p,
Klasyczne własności rachunku zbiorów
i) A∩ A = A, ii) A∪ A = A, iii) (A′)′ = A, iv) A∪ A′ = X, v) A∩ A′ = ∅, vi) (A ⊂ B)↔(B′ ⊂ A′ ), vii) A⊂ B↔A ∩ B′ = ∅, viii) A⊂ B↔A′∪ B = X,ix) [(A ⊂ B) ∧ (B ⊂ A)]↔(A = B),
x) A∩ (B ∩ C ) = (A ∩ B) ∩ C ,
Klasyczne własności rachunku zbiorów cd.
xii) A∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C ), xiii) A∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C ), xiv) A′ ⊂ B ∧ A′⊂ B′→A = X , xv) (A ⊂ B ∧ B ⊂ C )→(A ⊂ C ). Dowód.Podstaw do tautologii z poprzedniego wykładu odpowiednio za
Prawa de Morgana rachunku zbiorów
A\ (B ∩ C ) = (A \ B) ∪ (A \ C ), A\ (B ∪ C ) = (A \ B) ∩ (A \ C ).
Dowód pewnej tożsamości
Udowodnimy, że A−˙ B = (A ∪ B) \ (A ∩ B).
x∈ A −˙ B↔(x ∈ A ∧ x /∈ B) ∨ (x ∈ B ∧ x /∈ A)↔
↔(x ∈ A∨x ∈ B)∧(x ∈ A∨x /∈ A)∧(x /∈ B∨x ∈ B)∧(x /∈ B∨x /∈ A)↔ ↔(x ∈ A ∨ x ∈ B) ∧ ¬(x ∈ A ∧ x ∈ B)↔x ∈ (A ∪ B) \ (A ∩ B)