Zajecia

(1)

Podstawy matematyki

Wykład 2 - Język logika pierwszego rzędu, teoria zbiorów

Oskar Kędzierski 15 marca 2020

(2)

Język logiki pierwszego rzędu

Rachunek zdań, tj. system formalny, w którym występują wyłącznie zmienne zdaniowe oraz spójniki logiczne nazywa się czasem

językiem logiki zerowego rzędu. Język logiki pierwszego rzędu stanowi rozszerzenie rachunku zdań o

i) kwantyﬁkatory,

ii) symbole funkcyjne i relacyjne,

iii) zmienne indywiduowe (lub nazwowe).

Przy ich pomocy można budować formuły, które interpretuje się nad strukturami, to jest zbiorami, przypisując symbolom

(3)

Składnia języka logiki pierwszego rzędu

Definicja

Sygnaturę

(lub

alfabet

) języka logiki pierwszego rzędu oznaczamy przez Σ. Jest to rodzina przeliczalnych zbiorówΣF

n dlan≥0 oraz rodzina przeliczalnych zbiorów ΣR

n dla n≥1, parami rozłącznych. Elementy zbioru ΣF

n to symbole funkcyjne n−argumentowe (symbole funkcyjne 0−argumentowe traktujemy jako stałe) a

elementy zbioru ΣR

n to symbole relacyjne n−argumentowe.

Definicja

Niech X oznacza nieskończony, przeliczalny zbiór zmiennych

indywiduowych (nazwowych). Zwykle elementy zbioru X oznacza

(4)

Składnia języka logiki pierwszego rzędu

Uwaga

W formułach języka logiki pierwszego rzędu używa się też dwuargumentowego symbolu równości =, który nie należy do

sygnatury, oraz symboli nawiasów, wskazujących na kolejności wykonywania działań.

Czasem wyklucza się symbol równości lub traktuje się go jako symbol relacyjny 2−argumentowy.

(5)

Termy

Definicja

Termem

nazywamy

i) symbol zmiennej,

ii) napisf(t₁, . . . , tn),gdziet1, . . . , tn są termami af ∈ ΣFn jest symbolem funkcyjnym dla n≥0.

Zbiór wszystkich termów nad sygnaturą Σ oraz zbiorem zmiennych

(6)

Zmienne występujące

Definicja

Dla każdego termu t ∈ TΣ(X )deﬁniujemy zbiór FV(t) ⊂ X

zmiennych występujących

w termiet w sposób rekurencyjny

i) FV(x) = {x},

ii) FV(f (t₁, . . . , tn)) =Sn_i₌₁FV(ti).

W szczególności, gdy n=0 suma pustej rodziny jest zbiorem

pustym, tj. w zbiór zmiennych występujących w termie będącym stałą, to zbiór pusty.

Przykład

Niech f będzie symbolem funkcyjnym 2−argumentowym ag

symbolem funkcyjnym 3−argumentowym. Wtedy

(7)

Formuły atomowe

Definicja

Dla ustalonej sygnatury Σ i zmiennych indywiduowych X,

formułą

atomowa

nazywamy

i) symbol fałszu ⊥,

ii) napisr(t₁, . . . , tn),gdziet1, . . . , tn∈ TΣ(X )są termami a

r ∈ ΣR

n dlan≥1 jest symbolem relacyjnym, iii) napis(t₁ = t₂), gdziet₁, t₂ ∈ TΣ(X )są termami.

Uwaga

Niektóre symbole funkcyjne i relacyjne są pisane pomiędzy argumentami zamiast przed argumentami (notacja preﬁksowa, także notacja polska). Na przykład, symbol funkcyjny dodawania +

zapisuje się zwykle jako x+ y, a nie +(x, y ), a symbol funkcyjny

„mniejszy lub równy” ≤zapisuje się zwykle jakox ≤ y, a nie ≤ (x, y ).

(8)

Notacja inﬁksowa i preﬁksowa

Notację

x+ y , x ≤ y

nazywamy

notacją inﬁksową

(binarny symbol funkcyjny lub relacyjny stawiamy

pomiędzy

argumentami) a notację

+(x, y ), ≤ (x, y )

nazywamy

notacją preﬁksową

lub

notacją polską

(binarny symbol funkcyjny lub relacyjny stawiamy

przed

argumentami). W przeciwieństwie do inﬁksowej, notacja preﬁksowa nie wymaga stosowania nawiasów ale uważa się ją za mniej przejrzystą.

(9)

Formuły

Definicja

Formułą

języka logiki pierwszego rzędu (nad ustaloną sygnaturą Σ

i zbiorem zmiennych indywiduowych X) nazywamy:

i) dowolną formułę atomową,

ii) napis(ϕ→ψ), gdzieϕ, ψ są formułami,

iii) napis∀x ϕ, gdziex∈ X jest zmienną indywiduową aϕ

formułą.

Uwaga

Ponieważ każdy z klasycznych logicznych spójników logicznych

¬, ∨, ∧, ↔ można zapisać przy pomocy spójnika→ oraz symbolu

fałszu ⊥, w praktyce stosuje się je także w formułach. Używa się też

(10)

Przykład

Niech sygnatura Σbędzie zadana warunkami ΣF

0 = {0,1}, ΣF2 = {+, ·}, ΣR2 = {≤}będzie sygnaturą ciała

uporządkowanego. Wtedy, na przykład, termami są następujące napisy

i) 0,

ii) x,

iii) x+0,

iv) (1· (x +0)) + y .

Przykładowe formuły atomowe to,

i) ⊥,

ii) x ≤0,

iii) (x +1) ≤ (1+ (1+ y )) · z,

iv) (x =1),

(11)

Przykład cd.

Przykładowe formuły, to i) ⊥, ii) x ≤0, iii) (x ≤0)→⊥, iv) ∀x (x ≤0)→⊥, v) (x ≤1)→(y ≤0), vi) (x ≤1)→ (∀y (y ≤0)) .

(12)

Zmienne wolne

Deﬁnicję zmiennych występujących w termach można rozszerzyć na zmienne wolne w formułach.

Definicja

Dla dowolnej formuły ϕdeﬁniujemy zbiór

zmiennych wolnych

występujących w ϕw następujący sposób

i) FV(⊥) = ∅,

ii) FV(r (t₁, . . . , tn)) =Sn_i=₁FV(ti), gdziet1, . . . , tn∈ TΣ(X )są termami a r ∈ ΣR

n jestn−agrumentowym symbolem relacyjnym,

iii) FV(t₁= t₂) = FV (t₁) ∪ FV (t₂), gdziet₁, t₂ ∈ TΣ(X )są termami,

iv) FV(ϕ→ψ) = FV (ϕ) ∪ FV (ψ), gdzieϕ, ψ są formułami,

(13)

Zmienne wolne – przykłady

Niech sygnatura Σbędzie zadana warunkami ΣF

0 = {0,1}, ΣF2 = {+, ·}, ΣR2 = {≤}będzie sygnaturą ciała

uporządkowanego. Wtedy, na przykład,

i) FV(x ≤0) = {x}, ii) FV((x ≤0)→⊥) = {x}, iii) FV(∀x (x ≤0)→⊥) = ∅, iv) FV(∀x (x ≤ y )) = {y }, v) FV((∀x (x ≤ y )) →(x ≤ z)) = {x, y , z}. Uwaga

Uwaga, w ostatnim przykładzie zmienna x jest związana w

poprzedniku implikacji, ale jest wolna w następniku. Zgodnie z deﬁnicją, jest to zmienna wolna w powyższej formule.

(14)

Formuły otwarte i zamknięte

Definicja

Jeśli FV(ϕ) = ∅, to formułę nazywamy

zamkniętą

(lub

zdaniem

).

Jeśli w formule ϕnie występują kwantyﬁkatory, to nazywamy ją

(15)

Siła wiązania spójników logicznych a kwantyﬁkatory

Największy priorytet w formułach języka logiki pierwszego rzędu (po dopuszczeniu klasycznych spójników logicznych i kwantyﬁkatora

∃) mają

i) negacja¬,

ii) koniunkcja ∧i alternatywa ∨,

iii) kwantyﬁkatory ∀, ∃,

iv) implikacja → i równoważność ↔.

Przykład

Formułę logiczną ∀x ¬r (x)→r (x) ∧ s(x, y ) należy interpretować

(16)

Semantyka języka logiki pierwszego rzędu

Formuły języka logiki pierwszego rzędu mogą być interpretowane nad strukturą, to jest zbiorem, którego elementy przypisuje się zmiennym indywiduowym.

Definicja

Niech Σbędzie sygnaturą.

Strukturą

Anad sygnaturą _Σ

nazywamy niepusty zbiór Awraz z przypisaniem

i) każdemu symbolowi relacyjnemu r ∈ ΣR

n dla n≥1 relacji

rA

⊂ An_,

ii) każdemu symbolowi funkcyjnemu f ∈ ΣR

n dla n≥0 funkcji

fA

: An_{→ A}(w szczególności, dla _n₌0, przypisanie stałym elementów ze zbioru A).

Uwaga

Gdy jasne jest o jaką strukturę chodzi opuszcza się jej nazwę i zamiastrA

, fA pisze się

(17)

Wartościowanie w strukturze

Definicja

Wartościowaniem

w strukturze Anad sygnaturą _Σnazywamy

dowolną funkcję

ρ : X → A,

tj. przypisanie zmiennym indywiduowym ze zbioru X elementów ze

zbioru A. Dla dowolnego wartościowania ρ, zmiennej x∈ X oraz

elementu a∈ Adeﬁniujemy wartościowanie ρa

x wzorem

ρa_x(y ) =ρ(y ) x 6= y , a x= y .

Każde wartościowanie w strukturze pozwala przypisać termom elementy zbioru Aa formułom wartości logiczne.

(18)

Wartość termu

Definicja

Dla struktury Anad sygnaturą _Σz ustalonym wartościowaniem ρ : X → A wartością termut ∈ TΣ(X )nazywamy element JtKAρ ∈ A zdeﬁniowany rekurencyjne w następujący sposób

i) JxKA ρ = ρ(x) dla x∈ X, ii) Jf (t₁, . . . , tn)KAρ = f A (Jt₁KA ρ, . . . , JtnK A ρ)dla termów

(19)

Spełnianie formuł

Definicja

Mówimy, że formuła ϕjest

spełniona

dla ustalonego

wartościowania ρ w strukturze A, i piszemy (A, ρ) |= ϕ,

jeśli

i) nie zachodzi (A, ρ) |= ⊥,

ii) (A, ρ) |= r (t₁, . . . , tn)wtedy i tylko wtedy, gdy

(Jt₁KA ρ, . . . , JtnK A ρ) ∈ r A (tj. elementy Jt₁KA ρ, . . . , JtnK A ρ są ze sobą w relacji rA) dla dowolnego symbolu relacyjnego r ∈ ΣF

n, n ≥1 i dowolnych termówt1, . . . , tn∈ TΣ(X ), iii) (A, ρ) |= (t₁ = t₂) wtedy i tylko wtedy, gdyJt₁KA

ρ = Jt2K A ρ dla dowolnych termówt₁, t₂∈ TΣ(X ),

(20)

Spełnianie formuł cd.

iv) (A, ρ) |= (ϕ→ψ)wtedy i tylko wtedy, gdy nie zachodzi (A, ρ) |= ϕlub zachodzi (A, ρ) |= ψ,

v) (A, ρ) |= (∀x ϕ) wtedy i tylko wtedy, gdy dla dowolnegoa∈ A

zachodzi (A, ρa x) |= ϕ.

Stwierdzenie

Niech Abędzie strukturą nad sygnaturą_Σ.Niech _{ρ, ρ}′ będą dwoma wartościowaniami w tej strukturze. Wtedy dla dowolnej formuły ϕ,

jeśliρ|FV(ϕ)= ρ′|FV(ϕ),to

(A, ρ) |= ϕwtedy i tylko wtedy, gdy (A, ρ′

) |= ϕ,

tzn. spełnianie formuły zależy jedynie od wartościowania jej zmiennych wolnych.

(21)

Spełnialność

Definicja

Mówimy, że formuła ϕjest

spełnialna w strukturze

A, jeśli

istnieje wartościowanie ρ,takie, że (A, ρ) |= ϕ,

(czyli jeśli jest

spełniona

dla pewnego wartościowania w A).

Definicja

Mówimy, że formuła ϕnad sygnaturąΣjest

spełnialna

jeśli istnieje

(22)

Spełnialność – przykłady

Formuła

(x + y = x + z)→(y = z),

jest spełnialna w strukturze Rnad sygnaturą ciał

uporządkowanych. W szczególności jest spełnialna. Formuła

(x + y = x + z) ∧ ¬(x + y = x + z),

(23)

Prawdziwość

Definicja

Formuła ϕjest

prawdziwa

w strukturze A, jeśli dla każdego

wartościowania ρ zachodzi

(A, ρ) |= ϕ,

(czyli formuła jest spełniona przez wszystkie wartościowania w tej strukturze). W takim przypadku, strukturę Anazywa się

modelem

dla formuły ϕ, co zapisujemy

A_{|= ϕ.}

Jeśli Γjest zbiorem formuł nad sygnaturą Σ, to piszemy A_{|= Γ,}

jeśli dla każdej formuły ϕ ∈ Γ zachodzi A_{|= ϕ}(wszystkie formuły z Γ są prawdziwe w strukturzeA).

(24)

Tautologie

Definicja

Formułę ϕnad sygnaturą Σnazywa się

tautologią

, jeśli dla

dowolnej struktury Anad sygnaturą _Σzachodzi A_{|= ϕ,}

(formuła ϕjest prawdziwa w każdej strukturze nad Σ). Piszemy

wtedy

|= ϕ.

Stwierdzenie

Podstawienie dowolnych formuł za zmienne zdaniowe tautologii języka logiki zerowego rzędu daje tautologię języka logiki pierwszego rzędu.

(25)

Tautologie cd.

Aby dowieść, że dana formuła jest tautologią, należy wykazać jej prawdziwość w dowolnej strukturze.

Aby dowieść, że dana formuła jest nie tautologią, należy wskazać strukturę, w której nie jest prawdziwa (tzn. wskazać wartościowanie

(26)

Tautologie cd.

Stwierdzenie

Następujące formuły są tautologiami języka logiki pierwszego rzędu

i) ∀x (ϕ→ψ) → (∀x ϕ → ∀x ψ), ii) ϕ → ∀x ϕo ilex ∈ FV (ϕ),/ iii) ∀x ϕ → ϕ, iv) ∃x ϕ → ϕo ilex ∈ FV (ϕ),/ v) x = x, vi) (x₁ = y₁)→((x₂= y₂)→ . . . →((xn= yn)→(f (x1, . . . , xn) = f(y₁, . . . , yn))) . . .),gdzief ∈ ΣFn, n ≥0, vii) (x₁ = y₁)→((x₂= y₂)→ . . . →((xn= yn)→(r (x1, . . . , xn)→r (y1, . . . , yn))) . . .),gdzief ∈ ΣRn, n ≥1, viii) ∀x (ϕ ∨ ψ) ↔ ϕ ∨ ∀x ψ o ilex ∈ FV (ϕ),/ ix) ∃x (ϕ ∧ ψ) ↔ ϕ ∧ ∃x ψ o ilex ∈ FV (ϕ),/

(27)

Tautologie cd.

x) ∀x (ϕ ∧ ψ) ↔ ∀x ϕ ∧ ∀x ψ,

xi) ∃x (ϕ ∨ ψ) ↔ ∃x ϕ ∨ ∃x ψ,

xii) ¬∃x ϕ↔∀x ¬ϕ,

xiii) ¬∀x ϕ↔∃x ¬ϕ,

xiv) ∀x∀y ϕ↔∀y ∀x ϕ,

xv) ∃x∃y ϕ↔∃y ∃x ϕ,

xvi) ∀x ϕ→∃x ϕ,

xvii) ∃y ∀x ϕ→∀x∃y ϕ,

(28)

Tautologie cd.

Dowód.

Dla przykładu udowodnimy iii). Ustalmy strukturęA oraz

wartościowanie ρ. Jeśli(A, ρ) 6|= ∀x ϕ, to(A, ρ) |= ∀x ϕ → ϕ. Jeśli (A, ρ) |= ∀x ϕ, to dla dowolnegoa∈ A

(A, ρa_x) |= ϕ.

Wtedy dla dowolnego a∈ A

(A, ρa_x) |= ∀x ϕ → ϕ,

skąd, z dowolności a∈ A,

(29)

Równoważność formuł

Definicja

Mówimy, że dwie formuły ϕ, ψ są

logicznie równoważne

, jeśli |= ϕ ↔ ψ,

tzn. w dowolnym modelu, przy dowolnym wartościowaniu obie są spełnione lub obie nie są spełnione. Piszemy wtedy

(30)

Preneksowa postać normalna

Definicja

Formuła ϕjest w

preneksowej postaci normalnej

, jeśli ϕ = Q₁x₁Q₂x₂. . . Qnxnψ,

gdzie Qi jest równy∀ lub∃ dlai =1, . . . , n a formuła ψjest otwarta.

Stwierdzenie

Dla dowolnej formuły ϕistnieje równoważna do niej formuła w

(31)

Preneksowa postać normalna

Przykład

∀x p(x)→∃y q(y ) ≡ ∃x ¬p(x) ∨ ∃y q(y ) ≡ ∃x∃y ¬p(x) ∨ q(y ).

Przykład

∀x (p(x)→∃y q(x, y )) ≡ ∀x (¬p(x) ∨ ∃y q(x, y )) ≡ ≡ ∀x∃y (¬p(x) ∨ q(x, y )).

(32)

Nierozstrzygalność

Twierdzenie

Istnieje

algorytm sprawdzający, czy formuła w języku logiki

zerowego

rzędu jest tautologią.

Dowód.

Jeśli w formule występuje n parami różnych zmiennych, należy

sprawdzić 2n wartościowań.

Twierdzenie (A. Church, A. Turing)

Nie istnieje

algorytm sprawdzający, dla dowolnej sygnatury Σ, czy

formuła w języku logiki

pierwszego

rzędu nad Σjest tautologią.

Dowód.

Gdyby istniał taki algorytm, to można pokazać, że istnieje także algorytm sprawdzający czy dowolna maszyna Turinga skończy działanie. Taki algorytm nie istnieje.

(33)

Entscheidungsproblem

Mówimy, że

nierozstrzygalny

jest problem decyzyjny:

(34)

System Hilberta dla języka logiki pierwszego rzędu

Definicja

Generalizacją formuły ϕ ∈ FΣ nazywamy każdą formułę postaci

∀x₁. . . ∀xnϕ, gdzie x1, . . . , xn są dowolnymi zmiennymi.

Definicja

Systemem Hilberta dla języka logiki pierwszego rzędu nazywamy system dowodzenia formuł nad przeliczalną sygnaturą Σ, w których

występują jedynie spójniki ¬, →, stała ⊥, kwantyﬁkator ∀oraz

symbole z sygnatury Σwraz z aksjomatami (oraz ich dowolnymi

generalizacjami) A1) ϕ→(ψ→ϕ), A2) (ϕ→(ψ→ϑ))→((ϕ→ψ)→(ϕ→ϑ)), A3) ¬¬ϕ→ϕ, A4) ∀x(ϕ→ψ)→(∀xϕ→∀xψ), A5) ϕ→∀xϕ, jeślix ∈ FV (ϕ)/ ,

(35)

System Hilberta dla języka logiki pierwszego rzędu cd.

Definicja A7) (x₁ = y₁)→((x₂= y₂)→ . . . →((xn= yn)→(f (x1, . . . , xn) = f(y₁, . . . , yn))) . . .),gdzief ∈ ΣFn, n ≥0, A8) (x₁ = y₁)→((x₂= y₂)→ . . . →((xn= yn)→(r (x1, . . . , xn)→r (y1, . . . , yn))) . . .),gdzief ∈ ΣRn, n ≥1, gdzie ϕ, ψ, ϑsą dowolnym formułami nad sygnaturąΣ oraz regułą

dowodzenia

modus ponens

ϕ, ϕ→ψ

ψ .

Uwaga

(36)

System Hilberta dla języka logiki pierwszego rzędu cd.

Definicja

Dowodem

w systemie Hilberta nazywamy skończony ciąg formuł, w którym każda formuła jest aksjomatem lub została otrzymana przez zastosowanie reguły odrywania do poprzedzających ją formuł. Formuła ϕ

ma dowód

(lub jest

twierdzeniem systemu

Hilberta

), jeśli istnieje dowód zawierający ϕ, co oznaczamy przez ⊢H ϕ.

Formuła ϕma dowód ze zbioru hipotez (przesłanek)∆, gdy posiada

dowód w systemie Hilberta z aksjomatami rozszerzonymi o ∆ ∆ ⊢H ϕ.

(37)

System Hilberta dla języka logiki pierwszego rzędu cd.

Twierdzenie

W systemie Hilberta dla języka logiki pierwszego rzędu zachodzi

twierdzenie o dedukcji

, tzn. dla dowolnej formułyϕ ∈ FΣ

∆ ∪ {ϕ} ⊢H ψwtedy i tylko wtedy, gdy∆ ⊢H (ϕ→ψ), oraz twierdzenia o poprawności i silne twierdzenie o pełności, tzn. dla dowolnej formuły ϕ ∈ FΣ oraz dowolnego zbioru formuł

∆ ⊂ FΣ

∆ ⊢H ϕwtedy i tylko wtedy, gdy ∆ |= ϕ.

W szczególności, każda tautologia języka logiki pierwszego rzędu posiada dowód.

Dowód.

(38)

Efektywna przeliczalność zbioru tautologii

Wniosek

Zbiór wszystkich tautologii nad przeliczalną sygnaturą Σjest

efektywnie przeliczalny

, tzn. w istnieje algorytm wypisujący wszystkie tautologie nad ustaloną, przeliczalną sygnaturą (w nieskończonym czasie).

Dowód.

Na podstawie twierdzenia o pełności formuła ϕjest tautologią, jeśli

posiada dowód w systemie Hilberta. Zbiór wszystkich dowodów jest przeliczalny, zatem przeglądając go znajdziemy dowód dla ϕ.

(39)

Zbiory

Intuicyjnie zbiór to kolekcja pewnych obiektów. Zbiór pusty, tj. nieposiadający żadnych elementów oznaczamy ∅. Zbiory będziemy

na ogól oznaczać dużymi literamiA, B, C , X , Y , Z. Jeślix jest

elementem zbioru Apiszemy x∈ A. W przeciwnym przypadku

piszemy x∈ A/ . Elementy zbioru można wyliczyć, np. A= {0,2,4,6,8}

(kolejność elementów i liczba ich powtórzeń nie ma znaczenia) lub też podać regułę wyróżniającą elementy zbioru (wśród elementów pewnego większego zbioru), np.

A= {x ∈ N | (∃y ∈Nx=2y) ∧ x ≤8}.

Zapis A= {x ∈ X | P(x)}, gdzie P(x) jest funkcja zdaniową

(predykatem) czytamy „wszystkie x należące doX takie, żeP(x)”. y ∈ {x ∈ X | P(x)}↔P(y )

(40)

Zbiory cd.

Elementami zbiorów mogą być też inne zbiory, np.

A= {∅,1, {1}, {{1,2,3}}.

Zbiór A ma 4 elementy: zbiór pusty, 1, zbiór{1} oraz zbiór

jednoelementowy {{1,2,3}}.

Zbiory jednoelementowe nazywa się czasem

singletonami

. Zbiory, które nie mają wspólnych elementów nazywamy

rozłącznymi

.

(41)

Zbiory cd.

Mówimy, że zbiór Ajest podzbiorem zbioruB, jeśli każdy element

zbioru Ajest elementem zbioruB. PiszemyA⊂ B. A⊂ B↔(x ∈ A→x ∈ B)

Mówimy, że dwa zbiory są równe, jeśli mają te same elementy.

(42)

Nie istnieje zbiór wszystkich zbiorów

Rozpatrzmy zbiór Z wszystkich zbiorówX, które nie są swoimi

elementami, tj.

Z = {X | X /∈ X }

Zachodzą dwie możliwości:

i) Z ∈ Z, sprzeczność, bo wtedy Z nie spełnia warunku należenia

do Z,

ii) Z ∈ Z/ , sprzeczność, bo wtedy Z spełnia warunek należenia do Z.

(43)

Aksjomatyka teorii mnogości

Badania nad współczesną teoria mnogości (czyli teoria zbiorów) zapoczątkowali pod koniec XIX wieku Georg Cantor i Richard Dedekind. Po odkryciu m.in. paradoksu Russela prace nad

aksjomatyzacją

teorii mnogości podjęli Ernst Zermelo i Abraham Fraenkel. Ich celem było uniknięcie paradoksów i otrzymanie teorii nie prowadzącej do sprzeczności.

(44)

Aksjomaty ZFC

Aksjomaty teorii mnogości Zermelo i Fraenkla w skrócie nazywa się aksjomatami ZF lub aksjomatami ZFC (gdy dołączy sie do nich pewnik wyboru, ang. axiom of choice).

W aksjomatyce ZFC elementy zbiorów są też zbiorami należącymi do pewnego uniwersum zbiorów. Aksjomaty są wyrażone w języku logiki pierwszego rzędu.

(45)

Aksjomat ekstensywności

∀x∀y(∀z(z ∈ x↔z ∈ y )→(x = y )), „dwa zbiory są równe jeśli maja takie same elementy”

(46)

Aksjomat regularności

∀x(∃y(y ∈ x)→∃y(y ∈ x ∧ ¬(∃zz ∈ y ∧ z ∈ x))) „każdy niepusty zbiór posiada element z nim rozłączny”

Z aksjomatu regularności wynika, że żaden zbiór nie jest swoim elementem, tzn. {x} ∩ x = ∅(z aksjomatu regularności

zastosowanego dla jednoelementowego zbioru {x}). Aksjomat

wyklucza też istnienie nieskończonej rodziny zbiorów xn dla n∈ N takich, że xn+1 ∈ xn (bo wtedyx = {x1, x2, . . .} nie posiada elementu z nim rozłącznego). Istnienie takiego zbioru nie wynika z poprzednich aksjomatów, ale nie jest z nimi sprzeczne.

(47)

Aksjomat wyróżniania

∀w1. . . ∀wn∀z∃y∀x(x ∈ y ↔(x ∈ z ∧ ϕ))),

gdzie w₁, . . . , wn, x, z są jedynymi zmiennymi, które mogą być wolne w formuleϕ.

„dla każdego zbioru z istnieje jego podzbióry posiadający

dokładnie elementy spełniające formułę ϕ”

Ten aksjomat gwarantuje istnienie zbioru pustego (wyróżniamy elementy spełniające fałszywy warunek). Z aksjomatu

ekstensywności taki zbiór jest dokładnie jeden. Zmiennych

(48)

Aksjomat pary

∀x∀y∃z(x ∈ z ∧ y ∈ z)

(49)

Aksjomat sumy

∀r∃z∀x(x ∈ z↔∃y(y ∈ r ∧ x ∈ y ))

„dla każdego zbioru r (rodziny zbiorówr) istnieje zbiór będący

(50)

Aksjomat zastępowania

∀A∀w₁. . . ∀wn(∀x(x ∈ A→∃!yϕ)→∃B(∀x(x ∈ A→∃y(y ∈ B ∧ ϕ))),

gdzie x, y , w₁, . . . , wn, Amogą być jedynymi wolnymi zmiennymi w formuleϕ, reprezentującej funkcję f a∃! oznacza „istnieje

dokładnie jeden”

„dla dowolnej funkcji określonej na zbiorze A istnieje zbiórB

(51)

Aksjomat nieskończoności

∃x(∅ ∈ x ∧ ∀y(y ∈ x→S(y ) ∈ x)), gdzie S(w ) = w ∪ {w }

(52)

Aksjomat zbioru potęgowego

∀x∃y∀z(z ⊂ x→z ∈ y )

(53)

Aksjomat wyboru

∀r(∀x(x ∈ r →∃yy∈ x) ∧ ∀x∀y((x ∈ r ∧ y ∈ r ∧ x 6= y )→

→¬(∃zz ∈ x ∧ z ∈ y )))→∃s(∀x(x ∈ r →∃!y(y ∈ x ∧ y ∈ s))) , „dla dowolnej rodziny niepustych, parami rozłącznych zbiorów r

istnieje selektor s, to jest zbiór, który ma dokładnie jeden element

(54)

Konsekwencje aksjomatu wyboru

Z aksjomatu wyboru wynika istnienie bazy (maksymalnego zbioru liniowo niezależnego) w dowolnej przestrzeni wektorowej.

Z drugiej strony, konsekwencją aksjomatu wyboru jest rozkład kuli w R3 na skończoną liczbę rozłącznych podzbiorów, z których

można złożyć (przez translacje i obroty) dwie kule o takim samym promieniu jak wyjściowa (paradoks Banacha-Tarskiego).

Z twierdzenia Gödela o niedowoliwości niesprzeczności wynika, ze w ramach ZF(C) nie można dowieść niesprzeczności ZF(C) (jeśli system ZF(C) jest niesprzeczny). Prace Gödela i P. Cohena

wykazały, że aksjomat wyboru jest niezależny od aksjomatów ZF, o ile są one niesprzeczne. Zatem, jeśli system ZF jest niesprzeczny, to niesprzeczny jest także system ZFC oraz ZF¬C.

(55)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela

W celu uniknięcia paradoksu Russela wprowadza się pojęcie klasy. Każdy zbiór jest klasą. Klasa nie może należeć do klasy (ale zbiór może). Istnieje klasa wszystkich zbiorów. Jest to tzw. klasa właściwa, która nie jest zbiorem.

Pozwala to na poprawne zdeﬁniowanie kategorii wszystkich zbiorów Set oraz kategorii Cat wszystkich małych kategorii (tj. kategorii, których zbiór wszystkich morﬁzmów tworzy zbiór). Przedstawione poniżej aksjomaty pochodzą od E. Mendelsona, Introduction to Logic, i różnią się od oryginalnych aksjomatów Bernaysa, w których istniały dwa symbole relacyjne ∈orazη, które oznaczały odpowiednio „jest elementem zbioru”

oraz „jest elementem klasy”, zbiory oznaczano małymi literami a klasy dużymi.

(56)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

Aksjomatyka NBG stanowikonserwatywne rozszerzenieaksjomatów ZFC, co z deﬁnicji oznacza, że pozwala na dowiedzenie dokładnie tych samych twierdzeń o obiektach oryginalnej teorii. Twierdzenie Shoenﬁelda mówi, że każde twierdzenie teorii NBG, zawierające jedynie zmienne oznaczające zbiory, jest twierdzeniem teorii ZFC.

Ponieważ teoria NBG nie dopuszcza klasy wszystkich klas, wprowadza się pojęcie konglomeratuwszystkich klas. Istnieją alternatywne teorie zbiorów, np. teoria Morse’a–Kelley’a stanowiąca właściwe rozszerzenie teorii ZFC.

Uogólniona hipoteza continuum (tzn. dla dowolnej liczby kardynalej κnie

istnieje liczba kardynalna λtaka, żeκ < λ <2κ) jest niezależna od ZFC ale implikuje pewnik wyboru. Teoria NBG jest niesprzeczna wtedy i tylko wtedy, gdy teoria ZFC jest niesprzeczna (Novak, Rosser-Wang,

(57)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

Alfabet składa się ze zmiennych X₁, X2, . . . ,(oznaczanych dużymi literami dla zgodnosći z teoriami Bernaysa i Gödla) lubX, Y , Z , . . ..

Zmienne oznaczają klasy, czyli pewne kolekcje pewnych elementów. Teoria posiada dwa symbole relacyjny dwuargumentowe∈oraz=.

Pierwszy oznacza „bycie elementem”, drugi równość spełniająca aksjomaty

i) ∀X (X = X ),

ii) X = Y →(ϕ(X , X )→ϕ(X , Y )),

gdzieϕ(X , X )jest dowolną formułą zdaniową, aϕ(X , Y )jest formułą

zdaniowąϕ(X , X ), w której pewne wolne wystąpienia zmiennejX

zastąpiono wolną zmiennąY (w celu uniknięcia np. ∀X (X = X )→∀X (X = Y )).

(58)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

Niech X ∈ Y/ będzie skrótem dla ¬(X ∈ Y ).

NiechX ⊆ Y będzie skrótem dla∀Z (Z ∈ X →Z ∈ Y )(X jest podklasą Y).

NiechX ⊂ Y będzie skrótem dlaX ⊆ Y ∧ X 6= Y (X jest podklasą

właściwąY).

NiechM(X ) (niem. Menge) będzie skrótem dla∃Y (X ∈ Y )(X jest

zbiorem).

NiechPr(X )(ang. proper class) będzie skrótem dla¬M(X )(X jest

klasą właściwą).

Niech∀x ϕ(x)będzie skrótem dla∀X (M(X )→ϕ(X )), gdzieX jest

pierwszą zmienną nie występująca w formuleϕ(dla każdej klasyX

będącej zbiorem).

Niech∃x ϕ(x)będzie skrótem dla∃X (M(X ) ∧ ϕ(X )), gdzieX jest

pierwszą zmienną nie występująca w formuleϕ(istnieje klasaX będąca

(59)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

Pierwsze dwa z poniższych aksjomatów są równoważne aksjomatom dla symbolu relacyjnego=(ale używają skończonej liczby formuł

zdaniowych).

E (∀Z (Z ∈ X ↔Z ∈ Y ))→(X = Y ) (aksjomat ekstensywności),

T (X = Y )→(X ∈ Z ↔Y ∈ Z )(równe klasy należą do tych samych

klas),

P ∀x ∀y ∃z ∀u (u ∈ z↔u = x ∨ u = y, (dla dowolnych zbiorówx, y

istnieje zbiórz, oznaczany{x, y }, którego elementami są jedyniex i y),

N ∃x ∀y (y /∈ x)(aksjomat zbioru pustego, oznaczanego∅,

(60)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

JeśliX lubY jest klasą właściwą, to{X , Y } = ∅. Symbol {X }jest

skrótem dla{X , X }.

Niech (X , Y )będzie skrótem dla {{X }, {X , Y }}(gdyX, Y są zbiorami (X , Y )nazywamy parą uporządkowaną).

Niech(X )będzie skrótem dlaX.

(61)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

Aksjomaty istnienia klas (ang. class existence)

B-1 ∃X ∀u ∀v ((u, v ) ∈ X ↔u ∈ v )(istnienie klasy par wszystkich

zbiorów, tj. relacji∈),

B-2 ∀X ∀Y ∃Z ∀u (u ∈ Z ↔u ∈ X ∧ u ∈ Y )(istnienie klasyZ

oznaczanejX∩ Y),

B-3 ∀X ∃Z ∀u (u ∈ Z ↔u /∈ X )(istnienie klasyZ będącej dopełnieniem

klasyX, oznaczanejZ),

B-4 ∀X ∃Z ∀u (u ∈ Z ↔∃v (u, v ) ∈ X )(istnienie klasyZ będącej

dziedziną relacjiX, oznaczanejD(X )),

B-5 ∀X ∃Z ∀u ∀v ((u, v ) ∈ Z ↔u ∈ X )(istnienie relacji (klasy)Z takiej,

że każdy element (zbiór) klasyX jest w relacji z dowolnym zbiorem),

B-6 ∀X ∃Z ∀u ∀v ∀w ((u, v , w ) ∈ Z ↔(v , w , u) ∈ X ),

(62)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

AksjomatyB-6 orazB-7 pozwalają na utożsamienie iloczynów

kartezjańskich X1× X2× X3 zXf(1)× Xf(2)× Xf(3), dla dowolnej permutacji f ∈ S₃, pierwszy dotyczy cyklu, drugi transpozycji, które

generują grupęS₃. Powyższe operacje pozwalają jednoznacznie

zdeﬁniować klasę uniwersalną (dopełnienie zbioru pustego) , dopełnienie klasy, przecięcie, sumę, różnicę klas.

(63)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

Stwierdzenie

Niech ϕ(X₁, . . . , Xn, Y₁, . . . , Ym)będzie formułą zdaniową, w której występują co najwyżej zmienne X₁, . . . , Xn, Y₁, . . . , Ym. Niech formułaϕ będzie logicznie równoważna formule, w której jedynie zmienne

oznaczające zbiory nie są wolne. Wtedy

⊢ ∃Z ∀x₁ . . . ∀xn(x₁, . . . , xn) ∈ Z ↔ϕ(x₁, . . . , xn, Y₁, . . . , Ym).

Dowód.

Mendelson, Introduction to Mathematical Logic, Proposition 4.4. Dowód polega na indukcji ze względu na liczbę kwantyﬁkatorów i spójników→

oraz¬w formule zdaniowej, głownie przy pomocy aksjomatów B-1, . . . , B-7.

Jest to odpowiednik aksjomatu wyróżniania z aksjomatyki ZF, udowodniony na podstawie skończonej liczby aksjomatów.

(64)

Teoria zbiorów (klas) Von Neumanna–Bernaysa–Gödela cd.

U ∀x ∃y ∀u (u ∈ y ↔∃v (u ∈ v ∧ v ∈ x)(istnienie zbioruy będącego

sumą rodziny zbiorówx),

W ∀x ∃y ∀u (u ∈ y ↔u ⊆ x)(istnienie zbioru potęgowegoy zbiorux),

S ∀x ∀Y ∃z ∀u (u ∈ z↔u ∈ x ∧ u ∈ Y ) (istnienie zbioruz, który

zawiera elementy zbiorux i klasyY),

R Y jest funkcją→∀x ∃y ∀u (u ∈ y ↔∃v ((v , u) ∈ Y ∧ v ∈ x))(obraz

zbiorux przez funkcjęY jest zbioremy),

I ∃x (∅ ∈ x ∧ ∀u (u ∈ x→uP{u} ∈ x))(istnienie nieskończonego

zbioru{x}),

Reg ∀X (X 6= ∅→∃y ; (y ∈ X ∧ y ∩ X = ∅))(każda niepusta klasaX

zawiera element (zbiór) z nią rozłączny),

C ∀x ∃f (f jest funkcją ∧ ∀y (y 6= ∅ ∧ y ⊆ x)→f (y ) ∈ y ) (pewnik

wyboru)

UFC ∃X f jest funkcją ∧ ∀u (u 6= ∅→X (u) ∈ u)(silny pewnik wyboru,

(65)

Część wspólna zbiorów

A

i

B

A B

X A∩ B

(66)

Suma zbiorów

A

i

B

A B

X A∪ B

(67)

Dopełnienie zbioru

A X A A′ x∈ A′ ↔x /∈ A

(68)

Różnica teoriomnogościowa

A

i

B

A B

X A\ B

(69)

Różnica symetryczna

A

i

B

A B

X A−˙ B

(70)

Przykłady

Niech A= {1,2,4,6,8,10}, B = {2,3,6,7,9,10}, X = {1, . . . ,10}, Wtedy A, B ⊂ X , A∩ B = {2,6,10}, A∪ B = {1,2,3,4,6,7,8,9,10}, A′ = {3,5,7,9}, A\ B = {1,4,8}, B\ A = {3,7,9}, A−˙ B = {1,3,4,7,8,9}.

(71)

Prawa rachunku zbiorów

Ponieważ operacje na zbiorach wyrażone są w języku logiki, tautologie rachunku zdań dają tożsamości rachunku zbiorów (po podstawieniu za zmienne zdaniowe wyrażeń x∈ A, x ∈ B).

Poniższe tożsamości wynikają wprost z deﬁnicji:

i) A′

= X \ A,

ii) A\ B = A ∩ B′

,

(72)

Prawa identyczności

Dla dowolnego zbioru A⊂ X zachodzą tożsamości

i) A∩ ∅ = ∅,

ii) A∩ X = A,

iii) A∪ ∅ = A,

iv) A∪ X = X.

Dowód.

Podstaw za p wyrażenie x ∈ Ado tautologii

i) p∧ ⊥↔⊥,

ii) p∧ ⊤↔p,

iii) p∨ ⊥↔p,

(73)

Klasyczne własności rachunku zbiorów

i) A∩ A = A, ii) A∪ A = A, iii) (A′₎′ _{= A}, iv) A∪ A′ _{= X}, v) A∩ A′ _{= ∅,} vi) (A ⊂ B)↔(B′ _{⊂ A}′ ), vii) A⊂ B↔A ∩ B′ = ∅, viii) A⊂ B↔A′_{∪ B = X},

ix) [(A ⊂ B) ∧ (B ⊂ A)]↔(A = B),

x) A∩ (B ∩ C ) = (A ∩ B) ∩ C ,

(74)

Klasyczne własności rachunku zbiorów cd.

xii) A∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C ), xiii) A∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C ), xiv) A′ _{⊂ B ∧ A}′_{⊂ B}′_{→A = X ,} xv) (A ⊂ B ∧ B ⊂ C )→(A ⊂ C ). Dowód.

Podstaw do tautologii z poprzedniego wykładu odpowiednio za

(75)

Prawa de Morgana rachunku zbiorów

A\ (B ∩ C ) = (A \ B) ∪ (A \ C ), A\ (B ∪ C ) = (A \ B) ∩ (A \ C ).

(76)

Dowód pewnej tożsamości

Udowodnimy, że A−˙ B = (A ∪ B) \ (A ∩ B).

x∈ A −˙ B↔(x ∈ A ∧ x /∈ B) ∨ (x ∈ B ∧ x /∈ A)↔

↔(x ∈ A∨x ∈ B)∧(x ∈ A∨x /∈ A)∧(x /∈ B∨x ∈ B)∧(x /∈ B∨x /∈ A)↔ ↔(x ∈ A ∨ x ∈ B) ∧ ¬(x ∈ A ∧ x ∈ B)↔x ∈ (A ∪ B) \ (A ∩ B)