• Nie Znaleziono Wyników

TERMODYNAMIKA Problemy na ćwiczenia

N/A
N/A
Protected

Academic year: 2021

Share "TERMODYNAMIKA Problemy na ćwiczenia"

Copied!
20
0
0

Pełen tekst

(1)

TERMODYNAMIKA Problemy na ćwiczenia

(2)

Terminologia.

• Układ prosty - do pełnego scharakteryzowania jego stanu równowagowego wystar- czają, oprócz liczb moli jego składników, dwie zmienne (np. ciśnienie p i objętość V w przypadku płynów, tj. cieczy i gazów, lub namagnesowanie M i natężenie H0 przyłożonego pola magnetycznego w przypadku magnetyków, itp.).

• Układ osłonięty adiatermicznie - osłonięty tak, że można nad nim wykonywać tylko pracę, także elektryczną, ale niemożliwy jest przekaz energii w formie ciepła przez ściankę osłaniającą.

• Proces adiatermiczny - proces w którym układ nie wymienia ciepła z otoczeniem (niekoniecznie odwracalny, ani nawet quasistatyczny).

• Proces quasistatyczny - układ przechodzi powoli przez ciąg stanów równowago- wych (niekoniecznie odwracalnie).

• Proces odwracalny - infinitezymalna zmiana parametrów odwraca jego kierunek;

musi być quasistatyczny

• Proces adiabatyczny - (wyłącznie u mnie!) adiatermiczny i odwracalny.

Poza tym używam skrótu nTMDL (n = 0, 1, 2, 3) na n-toje naczało tiermodinamiki.

Różne mierzalne koefficienty

kT ≡ −1 V

 ∂V

∂p



T

scisliwosc izotermiczna (κT = kT−1 modul scisliwosci) kad ≡ −1

V

 ∂V

∂p



S

scisliwosc adiatermiczna (κad = k−1ad modul scisliwosci) αp ≡ 1

V

 ∂V

∂T



p

izobaryczna (objetosciowa) rozszerzalnosc termiczna βV ≡ 1

p

 ∂p

∂T



V

preznosc izochoryczna

Ściśliwość adiatermiczna została tu zapisana jako pochodna przy stałej entropii S, ale to zakłada istnienie tejże; w rzeczywistości można zdefiniować tę ściśliwość bez pojęcia entropii, żądając by (roz)prężanie było quasistatyczne i adiatermiczne (zob. Problem T.11).

Pochodne i różne pochodne potworności

Termodynamika niewprawnym kojarzy się przede wszystkim z dziwnym zapisem pochod- nych typu

 ∂S

∂V



T,N

, albo  ∂S

∂V



U,N

,

(3)

itd. i z przekształcaniem takich potworków. Trzeba to opanować.

Najpierw trzeba sobie (studentom) wbić do głowy, że fizyk oznacza tą samą literą różne funkcje, które matematyk by oznaczył inaczej. Np. jeśli X jest funkcją zmiennych A, B i C, to matematyk by napisał

F (A, B, C) = ˜F (A, B, X(A, B, C)) ,

a fizyk spokojnie pisze F (A, B, C) = F (A, B, X(A, B, C)), bo zarówno F jak i ˜F to jest ta sama wielkość fizyczna (np. energia wewnętrzna układu lub entropia). Stąd biorą się dziwnie wyglądające wzory typu

 ∂F

∂A



B,C

= ∂F

∂A



B,X

+ ∂F

∂X



A,B

 ∂X

∂A



B,C

.

(Po prawej stronie matematyk by zamiast F napisał ˜F ).

Typowym przykładem tego jest znajdywanie związku pojemności cieplnej układu przy stałym ciśnieniu i analogicznej pojemności przy stałej objętości. Wyobrażamy sobie, że entropia S zależy od ciśnienia p i temperatury T za pośrednictwem objętości V , która jest (przez równanie stanu) funkcją T i p, czyli S = S(T, V (T, p), n), co prowadzi do wzoru (n jest tu liczbą moli):

 ∂S

∂T



p,n

= ∂S

∂T



V,n

+ ∂S

∂V



T,n

 ∂V

∂T



p,n

.

Jak się tu jeszcze wyrazi pochodną (∂S/∂V )T,n przez pochodne dające się obliczyć z równania stanu, to (po pomnożeniu obu stron przez T ) otrzyma się to, co wszyscy znają.

Teraz należy się zająć sensem tych dziwnych oznaczeń pochodnych cząstkowych. Na początek standardowa tożsamość. Pokażemy, że

 ∂x

∂y



z,t,...

 ∂y

∂z



x,t,...

 ∂z

∂x



y,t,...

= −1 .

Zrobimy to w dwu wariantach. Najpierw wyobraźmy sobie, że jest funkcja f(x, y, z, t, . . .) i warunek

f (x, y, z, t, . . .) = 0 , zdaje w sposób uwikłany funkcje1

x = x(y, z, t, . . .) , y = y(x, z, t, . . .) , z = z(x, y, t, . . .) .

Następnie zastanawiamy się, czym może być (∂x/∂y)z,t,.... Piszemy więc różniczkę zupełną funkcji f(x, y, z, t, . . .) (tj. fizycznie rzecz biorąc wzór na małą zmianę wartości tej funkcji

1Warunki, które muszą być spełnione znamy z Matematyki II; tu zakładamy, że są one spełnione.

(4)

spowodowaną małą zmianą jej argumentów) i przyrównujemy ją do zera (bo pytamy o taką zmianę argumentów, która nie zmienia wartości - tu równej zeru - samej funkcji f)

df = ∂f

∂xdx + ∂f

∂ydy + ∂f

∂z dz +∂f

∂t dt + . . . = 0 .

Skoro zmienne z, t, . . . mają być ustalone, kładziemy ich przyrosty dz, dt, . . . równe zeru;

pochodna (∂x/∂y)z,t,... jest to wtedy po prostu stosunek przyrostów dx i dy, czyli

 ∂x

∂y



z,t,...

≡ −(∂f /∂y) (∂f /∂x). Przy okazji jest jasne, że2

 ∂x

∂y



z,t,...

=

"

 ∂y

∂x



z,t,...

#−1

.

W analogiczny wposób określamy (∂y/∂z)x,t,... oraz (∂z/∂x)y,t,.... Jeśli teraz utworzymy iloczyn trzech tych pochodnych, to jak nic dostaniemy “szokujący” (ten minus!) wzór

 ∂x

∂y



z,t,...

 ∂y

∂z



x,t,...

 ∂z

∂x



y,t,...

= −1 .

Nietrudno też w ten sam sposób dojść do wniosku, ze jeśli f(x1, x2, . . . , xn) = 0, to słuszny jest wzór (r ≤ n)

 ∂x1

∂x2



x3,...,xn

 ∂x2

∂x3



x1,...,xn

· · · ∂xr−1

∂xr



x1,...,xn

= (−1)r.

W wariancie drugim wyobrażamy sobie, że mamy już daną funkcję np. x = x(y, z, t, . . .) i mamy oczywiście w sposób naturalny to, co zwiemy pochodną (∂x/∂y)z,t,..., tj. stosunek przyrostu dx do przyrostu dy przy ustalonych zmiennych z, t, . . . (tj. dz = dt = . . . = 0).

Aby zdefiniować pochodną (∂y/∂z)x,t,... piszemy różniczkę funkcji x = x(y, z, t, . . .) dx = ∂x

∂y dy + ∂x

∂z dz + ∂x

∂t dt + . . .

i ponieważ teraz zmienne x, t, . . . mają być ustalone, kładziemy tu dx = dt = . . . = 0;

pochodna (∂y/∂z)x,t,... jest wtedy znów stosunkiem przyrostów dy i dz, czyli

 ∂y

∂z



x,t,...

= −∂x(y, z, t, . . .)/∂z

∂x(y, z, t, . . .)/∂y.

2Czyli, że (∂x/∂y)z,t,...(∂y/∂x)z,t,...= 1.

(5)

Analogicznie, określając (∂z/∂x)y,t,..., kładziemy w różniczce funkcji x = x(y, z, t, . . .) równe zeru przyrosty dy, dt, . . ., co daje

 ∂z

∂x



y,t,...

= 1

∂x(y, z, t, . . .)/∂z. Znów więc dostajemy

 ∂y

∂z



x,t,...

 ∂x

∂y



z,t,...

 ∂z

∂x



y,t,...

= −(∂x/∂z) (∂x/∂y)

∂x

∂y 1

∂x/∂z = −1 .

Tożsamości tego typu będziemy dalej nazywać “tożsamościami (albo związkami) szokują- cymi”.

Niech teraz będą dane dwie funkcje tych samych zmiennych: f(x, y, z) oraz g(x, y, z).

Chcemy sobie wyjaśnić, sens (i sposób obliczania) pochodnej takiej jak

 ∂f

∂x



g,z

.

Normalnie byśmy obliczali pochodną f po x-ie przy stałych y i z i to by była zwykła pochodna cząstkowa znana z matematyki. A tu takie coś... Ale rozumując jak zdrowy fizyk piszemy różniczki funkcji f i g:

df = ∂f

∂x



y,z

dx + ∂f

∂y



x,z

dy + ∂f

∂z



x,y

dz , dg = ∂g

∂x



y,z

dx + ∂g

∂y



x,z

dy + ∂g

∂z



x,y

dz .

Ponieważ z ma być stałe, kładziemy dz = 0. Następnie chcemy, żeby funkcja g się nie zmieniała. Zatem także dg = 0. Warunek ten koreluje dopuszczalne przyrosty dx i dy:

dy = −(∂g/∂x)y,z

(∂g/∂y)x,z

dx .

Wstawiamy to dy do różniczki funkcji f (w której już położyliśmy dz = 0, jako że chcemy mieć pochodną przy stałym g i stałym z)

df = ∂f

∂x



y,z

dx − ∂f

∂y



x,z

(∂g/∂x)y,z

(∂g/∂y)x,z

dx ,

i teraz określamy interesująca nas pochodną (∂g/∂x)g,z jako iloraz przyrostów df i dx:

 ∂f

∂x



g,z

= ∂f

∂x



y,z

− ∂f

∂y



x,z

 ∂g

∂x



y,z

 ∂g

∂y

−1 x,z

.

(6)

Oczywiście, gdybyśmy umieli wywikłać y z funkcji g, tj. napisać y = y(x, g, z), to moglibyśmy różniczkować bezpośrednio (znów tu korzystamy z tego denerwującego mate- matyków zapisu, w którym dwie różne funkcje - w sensie “maszynki z wejściami i wyjściem”

- są oznaczone tą samą literą)

 ∂f

∂x



g,z

≡ d

dxf (x, y(x, g, z), z) , co dałoby

 ∂f

∂x



g,z

= ∂f

∂x



y,z

+ ∂f

∂y



x,z

 ∂y

∂x



g,z

.

To jest jednak ten sam wzór, który otrzymaliśmy wyżej - jest to zapewione właśnie przez ten “związek szokujący”.

Jakobiany ułatwiają życie

Czasami przy przekształcaniu pochodnych dobrze jest znać metodę Jakobianów. Niech u, v, w, etc. będą funkcjami zmiennych x, y, z, etc. Jakobian jest to wyznacznik

(ux)y,z (uy)x,z (uz)x,y

(vx)y,z (vy)x,z (vz)x,y

(wx)y,z (wy)x,z (wz)x,y

≡ ∂(u, v, w)

∂(x, y, x) .

Zastosowana tu została notacja (ux)y,x ≡ (∂u/∂x)y,x, etc. Samą macierz pochodnych też nazywa się jakobianem (ściślej: macierzą Jacobiego).

Jakobiany mają bardzo przyjemne właściwości:

1. Są antysymetryczne w swoich górnych argumentach (funkcje u, v, w, etc.) i anty- symetryczne w dolnych (zmienne x, y, z, etc.), co wynika ze zwykłych właściwości wyznaczników.

2. Jeśli odwikłamy układ i wyrazimy x, y, z, etc. jako funkcje u, v, w, etc. (ale wic polega na tym, że możemy sobie tylko wyobrazić, że odwikłaliśmy - nie musimy tego jawnie robić!) to odpowiednia macierz jacobiego jest macierzą odwrotną:

∂(x, y, z, . . .)

∂(u, v, w, . . .) = ∂(u, v, w, . . .)

∂(x, y, x, . . .)

−1

.

(oczywiście bedzie ona w ten sposób wyrażona przez zmienne x, y, z, etc., ale czasem to nawet właśnie o to chodzi!). Oznacza to też, że jeden jakobian (wyznacznik) jest odwrotnością drugiego.

3. Mniej znana właściwość Jakobianów polega na tym, że

∂(u, v, w, . . .)

∂(x, v, w, . . .) = ∂u

∂x



v,w,...

.

(7)

(Rozpisać przykład 3 × 3 i przekonać się; ponieważ traktujemy tu jak zmienne niezależne x, v i w, sporo elementów Jakobianu, np. vw, jest z definicji równa zeru, a ww, vv są równe 1).

4. Najużyteczniejszą właściwością Jakobianów jest jednak możliwość “ich rozsuwania i wsuwania pomiędzy podstawek”, tj. jeśli u, v, w, etc. zależą od x, y, z, etc. za pośrednictwem a, b, c, etc., które są funkcjami x, y, z, etc., to wtedy3 prawdziwy jest związek (macierzowy, więc łączący też i ich wyznaczniki, czyli jakobiany)

∂(u, v, w, . . .)

∂(x, y, z, . . .) = ∂(u, v, w, . . .)

∂(a, b, c, . . .) · ∂(a, b, c, . . .)

∂(x, y, z, . . .).

Sprawdźmy ostatni punkt w przypadku dwu funkcji dwu zmiennych. Jawnie prawa strona jest wtedy równa

∂(u, v)

∂(a, b) · ∂(a, b)

∂(x, y) = ∂u

∂a



b

 ∂v

∂b



a

− ∂u

∂b



a

 ∂v

∂a



b

"

 ∂a

∂x



y

 ∂b

∂y



x

− ∂a

∂y



x

 ∂b

∂x



y

# . Wymnażając dostajemy cztery wyrazy. Po lewej stronie zaś mamy

∂(u, v)

∂(x, y) ≡ ∂u

∂x



y

 ∂v

∂y



x

− ∂u

∂y



x

 ∂v

∂x



y

.

Teraz przypominamy sobie, że u i v od x i y zależą poprzez a i b, tj., że u = u(a(x, y), b(x, y)) i v = v(a(x, y), b(x, y)), więc rozpisujemy każdą z czterech pochodnych metodą łańcusz- kową:

∂(u, v)

∂(x, y) =

"

 ∂u

∂a



b

 ∂a

∂x



y

+ ∂u

∂b



a

 ∂b

∂x



y

# ∂v

∂a



b

 ∂a

∂y



x

+ ∂v

∂b



a

 ∂b

∂y



x



− ∂u

∂a



b

 ∂a

∂y



x

+ ∂u

∂b



a

 ∂b

∂y



x

"

 ∂v

∂a



b

 ∂a

∂x



y

+ ∂v

∂b



a

 ∂b

∂x



y

# . Pracowicie wymnażamy. Połowa wyrazów (wyrazy (1 × 1) i (2 × 2) z pierwszej linii z takimiż z linii drugiej) się skraca (czyli redukuje, jak chcą matematycy) i pozostają te same cztery wyrazy, które otrzymuje się wymnażając bezpośrednio prawą stronę.

Zobaczmy, jak metodą Jakobianów możemy odtworzyć znaną już tożsamość szokującą.

 ∂x

∂y



z,t,...

= ∂(x, z, t, . . .)

∂(y, z, t, . . .)

= ∂(x, z, t, . . .)

∂(x, y, t, . . .)· ∂(x, y, t, . . .)

∂(y, z, t, . . .) = − ∂z

∂y



x,t,...

 ∂x

∂z



y,t,...

.

3Jest tak oczywiście dlatego, że pochodna złożenia dwu odwzorowań jest równa macierzowemu iloczy- nowi pochodnych tych odwzorowań.

(8)

co jest tym, co już otrzymaliśmy, tylko inaczej zapisanym.

W podobny sposób możemy przy użyciu Jakobianów odtworzyć drugi nasz wynik

 ∂f

∂x



g,z

= ∂(f, g, z)

∂(x, g, z) = ∂(f, g, z)

∂(x, y, z)· ∂(x, y, z)

∂(x, g, z)

=

"

 ∂f

∂x



y,z

 ∂g

∂y



x,z

− ∂f

∂y



x,z

 ∂g

∂x



y,z

# ∂y

∂g



x,z

.

Ponieważ jednak (∂y/∂g)x,z = [(∂g/∂y)x,z]−1 (już było o tym) wiec otrzymujemy to, co poprzednio.

Przykład użyteczności Jakobianów. Wykażemy związek

 ∂f

∂t



g,x,...

= ∂f

∂t



h,x,...

 ∂g

∂h



f,x,...

"

 ∂g

∂h



t,x,...

#−1

.

Najpierw wykażemy go konwencjonalnie. Wielkość g (nie funkcję tylko własnie wielkość!) wyrazimy na dwa sposoby jako funkcję dwu innych zestawów wielkości

g = g(f, t, x, . . .) ≡ g(f, h(f, t, x, . . .), x, . . .) , g = g(f, t, x, . . .) ≡ g(h(f, t, x, . . .), t, x, . . .) .

(Po prawej stronie pierwszego wzoru matematyk by napisał g1(f , h(f, h, x, . . .), x, . . .), a po prawej stronie drugiego g2(h(f, h, x, . . .), t, x, . . .), ale umówiliśmy się, że jesteśmy fizykami). Możemy więc napisać

 ∂g

∂t



f,x,...

= ∂g

∂h



f,x,...

 ∂h

∂t



f,x,...

,

 ∂g

∂f



t,x,...

= ∂g

∂h



t,x,...

 ∂h

∂f



t,x,...

.

Biorąc następnie stosunek tych dwu równości, dzięki tożsamości szokującej, będziemy mieć po lewej stronie

 ∂g

∂t



f,x,...

"

 ∂g

∂f



t,x,...

#−1

= − ∂f

∂t



g,x,...

,

a po prawej,

 ∂g

∂h



f,x,...

 ∂h

∂t



f,x,...

"

 ∂g

∂h



t,x,...

#−1

 ∂f

∂h



t,x,...

,

iz analogicznej tożsamości, z drugiego i ostatniego czynnika dostaniemy −(∂f/∂t)h,x,..., co kończy dowód. Wygląda on w sumie dość prosto, ale trzeba najpierw wpaść na to, co sobie

(9)

wyobrazić jako funkcję czego. Metodą Jakobianów zaś robi się to zupełnie bezmyślnie:

piszemy (martwych zmiennych x, . . . nie musimy wypisywać)

 ∂f

∂t



g

≡ ∂(f, g)

∂(t, g) = ∂(f, g)

∂(f, h)

∂(f, h)

∂(t, h)

∂(t, h)

∂(t, g) ≡ ∂g

∂h



f

 ∂f

∂t



h

 ∂h

∂g



t

.

I już...

Jedno-formy i ich całkowanie po krzywych

Spora część termodynamiki od strony matematycznej sprowadza się do zabawy z for- mami różniczkowymi, a ściślej, z jedno-formami. Z niewiadomych dla mnie powodów zwie się je tu szumnie formami Pfaffa (pamiętam z młodości, że był taki bramkarz re- prezentacji Belgii, ale on się chyba matematyką nie zajmował...). Jedno-forma ˆω jest to maszynka z dwiema dziurami: w jedną wsadza się wektor, a z drugiej wypada liczba (w termodynamice zawsze rzeczywista). Forma działa liniowo, tj. jeśli v = a w + b u, to

ˆ

ω(v) = a ˆω(w) + b ˆω(u) .

Dzięki temu, jeśli wprowadzimy w przestrzeni wektorowej bazę ei i = 1, 2, . . . , n = dimV , tak iż każdy wektor v można zapisać jako kobinację liniową wektorów bazy, v = eivi, to wystarczy znać działanie formy ˆω na wektory bazy ei. Co więcej, zbiór wszystkich jedno- form działających na wektory z przestrzeni wektorowej V sam ma strukturę przestrzeni wektorowej, zwanej p. dualną - nazwa jak nazwa; matematycy lubią wpędzać w kompleksy szumną terminologią, ale nie przejmujmy się nimi - V (przy czym dimV = dimV , gdy wymiar przestrzeni wektorowej jest skończony). Oznacza to, że w przestrzeni form też można wybrać bazę i każdą formę zapisać jako kombinację liniową form tworzących bazę.

Wynika stąd, że wystarczy znać działanie form bazowych na wektory bazy.4 Formy bazowe najlepiej wybrać tak, żeby było wygodnie, tj. tak by była to baza dualna:5 ˆej(ei) = δji, i, j = 1, . . . , n.

Jeśli w przestrzeni Rn wprowadzimy kartezjańskie6 współrzędne xi, to stowarzyszoną bazą przestrzeni wektorowej są zwykłe wektory ei. Dualne do nich bazowe jednoformy oznacza się dxi (zamiast ˆej). Tak wiec dxj(ei) = δji.

Tak jak na przestrzeni Rn (ogólniej: na rozmaitości) można zadać pole wektorowe V(x1, . . . , xn) = eiVi(x1, . . . , xn), tak też można na niej zadać pole jedno-form ˆω(x1, . . . , xn)

= ωj(x1, . . . , xn)dxj, czyli w każdym punkcie trochę inną formę (taka obwoźna maszynka, która w każdym miejscu działa inaczej). Oczywiście forma w danym punkcie przestrzeni Rn umie działać tylko na wektor przyczepiony w tymże samym punkcie (tzn., jeśli mamy

4Jeśli ktoś czuje potrzebę przypomnienia sobie różnych rzeczy, to zalecam mój skrypt z algebry wiszący gdzieś na tej stronie.

5δji, tzw. delta Kroneckera, jest równa 1, gdy i = j i 0, gdy i 6= j.

6Można to wszystko bardziej zmatematyzować i mówić nie o przestrzeni Rn, tylko o rozmaitości różniczkowej i układzie współrzędnych na niej - zobacz moje notatki do analizy wektorowej też wiszące na tej stronie - ale po co się stresować zawiłościami?

(10)

pole wektorowe, na wartość tego pola w tymże punkcie) ˆ

ω(x1, . . . , xn)(V(x1, . . . , xn)) =X

i

X

j

ωj(x1, . . . , xn)Vi(x1, . . . , xn) dxj(ei)

=X

i

ωi(x1, . . . , xn)Vi(x1, . . . , xn) .

Daje to oczywiście pole skalarne na Rn.

Takie pola form istnieją głównie po to, aby je całkować wzdłuż krzywych w Rn. W każdym punkcie krzywej istnieje styczny do niej wektor: jeśli krzywa biegnąca od puktu A do B jest zadana parametrycznie jako xi = xi(ξ), ξA ≤ ξ ≤ ξB, (gdzie xiA) są współrzędnymi punktu A, a xiB) punktu B), to, jak powinno być oczywiste z kursu mechaniki (pomyślmy, że ξ jest czasem t!), wektorem stycznym do krzywej w punkcie o współrzędnych xi(ξ) jest

v= eivi(ξ) = ei

dxi(ξ) dξ .

Całka z formy ˆω(x) wzdłuż takiej krzywej Γ biegnącej od punktu A do punktu B jest zdefiniowana wzorem

Z

Γ

ˆ ω =

Z ξB

ξA

dξ ωi(x1(ξ), . . . , xn(ξ))dxi(ξ) dξ .

Geometrycznie można to widzieć tak, że dzielimy krzywą na małe ciupki (dzieląc zakres ξ na takie ciupki) i w środku takiego odcineczka znajdujemy wektor styczny do krzywej, działamy nań formą obliczoną w tym samym punkcie, to co wyjdzie mnożymy przez dłu- gość ciupka zmiennej ξ i otrzymane w ten sposób liczby sumujemy. No i potem bierzemy granicę długości ciupków do zera. W notacji bardziej fizycznej zaś można to samo zapisać tak

Z

Γ

ˆ ω =

Z B A

ωi(x1(ξ), . . . , xn(ξ)) dxi,

i widzieć w ten sposób, że dzielimy krzywą Γ na kawałeczki, które przybliżamy przez małe wektorki o składowych równych dxi i każdy taki wektorek mnożymy skalarnie przez odpowiedni wektorek o składowych ωi i sumujemy. Jest więc to dokładnie to, co każdy fizyk rozumie przez całkę z pola wektorowego wzdłuż krzywej i zapisuje jako

Z

Γ

ˆ ω =

Z

Γdl·ω ,

utożsamiając formę ˆω (tzn. jej składowe ωi) z wektorem ω (ze składowymi tego wektora).

Tak jak sugeruje ten zapis, całka z formy wdłuż krzywej Γ od A do B nie zależy od sposobu parametryzacji, tzn. od wyboru parametru ξ.

(11)

Zrobić jakieś proste przykłady. Np. scałkować ˆω = x dy + y2dx w R2 od A = (0, 0) do B = (1, 1), raz po łamanej ACB, gdzie C = (1, 0) - wyjdzie 1, a drugi raz po krzywej x = ξ2, y = ξ (i potem jeszcze raz po tej samej krzywej tylko w prametryzacji x = ξ, y =√

ξ ) - wyjdzie 5/6. Pouczyć, że jak widać wynik zależy od drogi, ale nie od parametryzacji.

Można też scałkować formę ˆω = xyz dx w R3 od A = (1, 0, 1) do B = (0, 1, 1) po ćwiartce okręgu na płaszczyźnie z = 1.

Formy bywają różne (klasyfikacja)

1) Najgrzeczniejsze formy, to tzw. różniczki zupełne, ˆω = df , których współczynniki ωi(x1, . . . , xn) są dane przez składowe gradientu jakiejś funkcji f (x1, . . . , xn):

ωi(x1, . . . , xn) = ∂

∂xi f (x1, . . . , xn) .

Oczywiście funkcja f, jeśli istnieje, jest przez ten warunek wyznaczana z dokładnością do stałej addytywnej. Warunkiem koniecznym, by forma była różniczką zupełną jest, by

∂xi ωj(x1, . . . , xn) = ∂

∂xj ωi(x1, . . . , xn) .

W języku teorii form, mówimy, że taka forma jest zamknięta (closed po ang.) tzn. jej pochodna zewnętrzna (jest taka operacja - nie musimy tu wiedzieć o co chodzi) dˆω = 0 (zero po prawej to ściśle biorąc zerowa dwu-forma). W termodynamice każda forma zamknięta jest różniczką zupełną (tzn., znów w języku teorii form, jest dokładna, exact, po ang., czyli sama jest pochodną zewnętrzną działającą na jakąś zero-formę, czyli jakąś funkcję). I choć matematycy utrzymują, że nie każda forma zamknięta jest dokładna, to “na wzorkach zawsze tak jest” (dla ciekawskich nieco niżej wyjaśniamy, o co chodzi).

Podstawową właściwością form będących różniczkami zupełnymi jest to, że całka z takiej formy od punktu A do punktu B zależy tylko od tych punktów, a nie od drogi Γ je łączącej:

Z

Γ

ˆ ω =

Z

Γdf = f (B) − f(A) .

Takimi jednoformami są w termodynamice różniczki funkcji stanu, czyli wszystkich wiel- kości fizycznych charakteryzujących układy będące w równowadze, jak energia wewnętrzna U, entropia S, temperatura T i inne. Że energia i, powiedzmy, objętość są funkcjami stanu wynika z empirii bezpośrednio. To, że funkcjami stanu są temperatura i entropia wynika także z empirii, ale na drodze bardziej zawiłych rozumowań (które będą na wykładzie).

Podstawową grą, w którą się bawimy, ustaliwszy, że dana forma spełnia warunek ko- nieczny by być różniczką zupełną, jest znalezienie funkcji f (w termodynamice np. chodzi o znalezienie U, gdy się coś wie o współczynnikach formy dU zapisanych w bazie ja- kichś zmiennych, np. T i V ). Są na to dwa standardowe chwyty, które zilustrujemy na przykładzie.

(12)

Niech będzie dana jedno-forma ˆ

ω =



3x2y + 2y x



dx + x3+ 2 ln x dy .

Sprawdzamy, że jest zamknięta. Szukamy zatem takiej funkcji f(x, y), że ˆω = df . W tym celu obieramy na płaszczyźnie jakiś punkt o współrzędnych (x0, y0) i całkujemy jedno- formę ˆω od tego punktu do punktu o współrzędnych (x, y) po dowolnej drodze. Np. po łamanej (x0, y0) −→ (x, y0) −→ (x, y). Albo po łamanej (x0, y0) −→ (x0, y) −→ (x, y).

Sprawdzamy, że choć po drodze wzory wyglądają trochę inaczej, na końcu dostaje się tę samą funkcję

f (x, y) = x3y + 2y ln x − x30y0+ 2y0ln x0 .

Druga metoda, tzw. “chałupnicza”, polega na odcałkowywaniu. Skoro ωx = (∂f /∂x), to f (x, y) =

Z

dx ωx(x, y) = Z

dx



3x2y + 2y x



= x3y + 2y ln x + h(y) .

Stałą całkowania może tu być dowolna funkcja h(y). Funkcję tę następnie wyznaczamy przyrównując (∂f/∂y) do ωy = x3 + 2 ln x. Z tego wychodzi, że tu akurat funkcja h(y) musi być stała.

Jeszcze dla ciekawskich wyjaśnienie, o co chodzi z tym, że nie zawsze forma zamknięta jest dokładna. Weźmy kanoniczny przykład, tj. jedno-formę na R2:

ˆ

ω = ωxdx + ωydy ≡ − y

x2+ y2 dx + x

x2+ y2 dy .

Jest ona zamknięta, tj. ∂ωx/∂y = (y2−x2)/(x2+y2)2 = ∂ωy/∂x, więc oczekujemy, że ˆω = df (x, y) (tj., że istnieje taka funkcja f (x, y), że ∂f /∂x = ωx i ∂f/∂y = ωy). Jeśli jednak obliczymy całkę z tej formy po okręgu KRo środku w punkcie (0, 0) i dowolnym promieniu R (parametryzujemy okrąg standardowo: x = R cos θ, y = R sin θ) to dostaniemy

Z

KR

ˆ ω =

Z

0 dθ = 2π 6= 0 .

Taki sam wynik byśmy otrzymali całkując ˆω po każdej zamkniętej krzywej obiegającej początek układu). Problem polega oczywiście na tym, że forma ˆω (jej współczynniki) jest osobliwa w punkcie (0, 0). Oczywiście “na wzorkach” forma ˆω jest różniczką zupełną:

ω = dθ(x, y) ≡ dˆ  arctgy

x

,

ale funkcja θ(x, y) = arctg(y/x) nie może być określona w punkcie (0, 0) w sposób ciagły (zbieganie do punktu (0, 0) z różnych kierunków daje wynik zależny od kierunku) i w tym to sensie forma ˆω nie jest różniczką zupełną w obszarach otwartych zawierających ten

(13)

punkt. Oczywiście całka z ˆω po każdej zamkniętej krzywej nie obiegającej punktu (0, 0) da zero.

To wszystko to były rzeczy oczywiste. Teraz się zaczną schody.

2) Jedno-forma może nie być różniczką zupełną, ale może być całkowalna. Często się to formułuje tak, że forma ˆω na Rn jest całkowalna, jeśli równanie ˆω = 0 ma rozwiązanie w postaci rodziny n−1 wymiarowych hiperpowierzchni φ(x1, . . . , xn) = const. (Wartość sta- łej numeruje te hiperpowierzchnie). Oczywiście takie mówienie jest bałamutne (typowy brak precyzyjnego wyrażania myśli tak powszechny podręcznikach pisanych przez fizy- ków). Chodzi oczywiście o to, że istnieje taka rodzina hiperpowierzchni, że jedno-forma ˆω daje zero na każdym wektorze stycznym do którejkolwiek z tych powierzchni.7 Czyli, jeśli już coś ma być zerem, to nie sama forma ˆω, tylko forma otrzymana ze zrzutowania tejże na powierzchnię φ(x1, . . . , xn) = const. (Na przykładzie w R3: rozpatrzmy formę, która w sferycznych zmiennych sprowadzi się do ˆω ∝ dr, np. ˆω(x, y, x) = xdx + ydy + zdz. Wtedy rodziną hiperpowierzchni są po prostu sfery x2+ y2+ z2 = R2 = const. Jeśli zrzutujemy tę formę na jedną ze sfer o ustalonym promieniu, czyli będziemy do niej pakować tylko wektory styczne do powierzchni tej sfery, to zawsze dostaniemy zero, czyli ˆω|sfera = ˆ0 - tu ˆ0 oznacza formę zerową). Takie postawienie sprawy jest jednak w termodynamice mało przydatne (jak większość uprawianej przez niektórych - teraz już na szczęście rzadziej się ich spotyka - geometryzacji fizyki...). Znacznie lepszy jest następujący punkt widzenia związany ze sformułowaniem Carathéodory’ego 2TMDL. Zacznijmy spacer z dowolnego punktu przestrzeni (x10, . . . , xn0). Chcemy się z tego punktu przemieścić o (dx1, . . . , dxn).

Dopuszczamy jednak tylko takie przemieszczenia, które (tu już dxi traktujemy nie jak formy, tylko jak takie zdrowe fizycznie, małe liczby) spełniają warunek

ω1(x10, . . . , x20) dx1+ . . . + ωn(x10, . . . , x20) dxn = 0 .

Jak już się w ten sposób znajdziemy w jakimś nowym punkcie (x1′, . . . , xn′), to znów możemy się przemieścić o (dx1, . . . , dxn) skorelowane przez warunek

ω1(x1′, . . . , xn′) dx1+ . . . + ωn(x1′, . . . , xn′) dxn= 0 ,

itd. I teraz forma ˆω jest całkowalna, jeśli okazuje się, że w ten sposób nie możemy dojść w dowolne miejsce: cały czas łazimy tylko po pewnej (hiper)powierzchni. Jeśli zaś forma nie jest całkowalna, to możemy w ten sposób zajść wszędzie (no, może - w sensie miary zbiorów w Rn - prawie wszędzie).

Przykład. Weźmy ˆω = ydx + dy − dz. Wystartujmy z punktu (0, 0, 0) i idźmy wzdłuż osi x, tzn. robimy przemieszczenia o dy = dz = 0. Ponieważ y = 0, można mieć dx 6= 0 i wciąż ˆω = 0. Dochodzimy w ten sposób do punktu (x1, 0, 0). Następnie możemy powędrować po płaszczyźnie x = x1 = const. robiąc przemieszczenia takie, że dy = dz

7Ogólniej, można się pytać, czy istnieją hiperpowierzchnie wymiaru r, gdzie r = 1, . . . , n − 1, takie, że jedno-forma ˆω daje zero na wszystkich wektorach stycznych do nich (np. krzywe takie, tj. hiperpowierzch- nie jednowymiarowe, istnieją zawsze). Widać więc, że można mówić o różnych “stopniach całkowalności”.

Niemniej w termodynamice interesuje nas w zawsze całkowalność najwyższego stopnia.

(14)

(i dx = 0). Docieramy tak do punktu (x1, y1, y1). Z tego punktu idziemy robiąc takie przemieszczenia, że dz = y1dx i dy = 0 (pozostajemy więc na płaszczyźnie y = y1 =const), tzn. wzdłuż prostej spełniającej równanie dz/dx = y1. Docieramy w ten sposób do punktu o współrzędnych (x, y1, y1+ y1(x − x1)). W ten sposób można dojść do punktu o dowolnych współrzędnych (˜x, ˜y, ˜z): wystarczy wziąć x = ˜x, y1 = ˜y i dobrać odpowiednio x1 rozwiązując równanie ˜y + ˜y(˜x − x1) = ˜z. Ma ono jednoznaczne rozwiązanie, jeśli tylko y 6= 0. Skoro więc można dojść do dowolnego punktu (być może z wyjątkiem punktów˜ o ˜y = 0 i ˜z 6= 0) startując z (0, 0, 0), to można przejść z każdego punktu do każdego.

Rozpatrywana forma nie jest więc całkowalna.

3) Forma może nie być różniczką zupełną, ale może mieć czynnik całkujący, tzn. ˆω 6= df, ale istnieje taka jakaś funkcja λ(x1, . . . , xn), że

λ(x1, . . . , xn) ˆω(x1, . . . , xn) = df (x1, . . . , xn) .

Powstają natychmiast dwa pytania: jak orzec, czy dana forma ma czynnik całkujący, a jeśli ma, to czy jest on jednoznaczny? Aby odpowiedzieć na pierwsze pytanie, wypisujemy warunek zamkniętości formy λ ˆω:

∂xi (λ ωj) = ∂

∂xj (λ ωi) ,

w którym i 6= j, i który można przepisać (używając teraz notacji ∂i ≡ ∂/∂xi) w postaci λ (∂jωi− ∂iωj) = ωjiλ − ωijλ .

Trzeba teraz wymanewrować tak, by sie pozbyć λ, bo o tym czynniku nic nie wiemy (nawet nie wiemy, czy istnieje). Napiszmy trzy takie równości z i, j, k (i 6= j, i 6= k i j 6= k), mnożąc każdy z nich przez “to trzecie” ω:

λ (∂jωi− ∂iωj) ωk = ωjωkiλ − ωkωijλ , λ (∂kωj − ∂jωk) ωi = ωkωijλ − ωiωjkλ , λ (∂iωk− ∂kωi) ωj = ωiωjkλ − ωjωkiλ ,

i dodajmy je wszystkie do siebie. Jak łatwo zobaczyć, po prawej dostaniemy okrąglutkie zero, a po lewej coś razy λ. Wynika stąd, że znikanie tego “coś”, czyli

ωk(∂jωi− ∂iωj) + ωi(∂kωj− ∂jωk) + ωj(∂iωk− ∂kωi) = 0 .

dla dowolnych trójek wskaźników i, j, k jest warunkiem koniecznym istnienia czynnika całkującego:8 W przypadku form w R3, jeśli sobie utożsamimy współczynniki formy ˆω ze składowymi wektora ω, można ten warunek zapisać w postaci

ω·(∇×ω) = 0 .

8Jeśli ktoś jest wprawny w teorii form, to rozpozna w tym zapis na składowych warunku ˆω ∧ dˆω = 0.

(15)

Przykłady:

1) Forma ˆω = x dx + z dy + y dz. Zamknięta dˆω = 0. Odcałkować tak lub siak. ˆω = d(12x2+ yz + const.).

2) Forma ˆω = xyz dx. Nie jest zamknięta dˆω 6= 0. Ale ma czynnik całkujący. Np.

λ(x, y, z) = (xyz)−1 (że osobliwy? To co? Poza płaszczyznami x = 0 etc. wszystko jest ok), wtedy f = x + const. A inny by mógł być? A pewnie: np. λ(x, y, z) = (yz)−1, wtedy f = 12x2+ const. Widać, że czynników całkujących może być sporo.

3) Forma ˆω = xdx+xy dy +dz. Zamknięta nie jest: dˆω 6= 0. A czy ma czynnik całkujący?

Stosujemy kryterium. Ponieważ to jest w R3 więc obliczamy (szkolną sztuczką; pochodne działają tylko na dolny rządek wyznacznika)

x xy 1

xyz

x xy 1

= y 6= 0 .

4) Forma ˆω = (yz/x) dx + z dy + y dz. Zamknięta nie jest: dˆω 6= 0. A czy ma czynnik całkujący? Sprawdzamy

yz/x z y

xyz

yz/x z y

= 0 .

Więc ma. Czujny rzut oka: λ(x, y, x) = x jest ok. Odcałkować λˆω = yz dx+ xz dy + xy dz, po łamanych lub chałupniczo, lub po prostu dostrzec, że λˆω = d(xyz + const.).

Teraz ważne fakty. W R1 każda forma jest dokładna - zawsze można napisać ω ≡ ω(x) dx = dˆ

Z x

dξ ω(ξ)

 .

W R2 każda forma ma czynnik całkujący. (Gdyby więc dwa parametry wystarczały do scharakteryzowania równowagowego stanu dowolnego układu termodynamicznego, 2TMDL by była banałem). Warunek ωx(x, y)dx + ωy(x, y)dy = 0 jest bowiem równoważny rów- naniu różniczkowemu

dy

dx = h(x, y) ≡ −ωx(x, y) ωy(x, y),

które można scałkować otrzymując na płaszczyźnie R2 rodzinę krzywych całkowych (roz- różnianych warunkiem początkowym) i na wektorach stycznych do tych krzywych całko- wych forma ˆω daje zero. Równoważnie można całkować układ równań

dx

dξ = ωy(x(ξ), y(ξ)) , dy

dξ = −ωx(x(ξ), y(ξ)) ,

(tu explicite wektor styczny do krzywej całkowej w punkcie (x, y) płaszczyzny R2 ma postać exωy(x, y) − eyωx(x, y) więc jest oczywiste, że forma ˆω na nim da zero). Jak

(16)

już mamy krzywą całkową przechodzącą przez P0 = (x0, y0), albo jako y = φ(x, P0), albo jako x = x(ξ, P0), y = y(ξ, P0) (w tym drugim przyadku eliminujemy ξ, by dostać y = φ(x, P0)), to łatwo jawnie sprawdzić, że f (x, y) = y − φ(x, P0) jest szukaną funkcją:

df (x, y) ≡ d(y − φ(x, P0)) = −dφ

dxdx + dy = ωx(x, y)

ωy(x, y)dx + dy = 1 ωy(x, y)ω .ˆ Czynnik 1/ωy(x, y) jest więc czynnikiem całkującym.

Na koniec, jeśli mamy już jakiś czynnik całkujący, taki że λ(x1, . . . , xn)ˆω(x1, . . . , xn) = df (x1, . . . , xn), to jeśli zamiast funkcji f (wyznaczającej przez równanie f (x1, . . . , xn) = C rodzinę hiperpowierzchni całkowych równania ˆω = 0) weźmiemy φ(f (x1, . . . , xn)), gdzie φ(·) jest jakąkolwiek przyzwoitą funkcją, to dostaniemy

dφ f (x1, . . . , xn) = φ(f (x1, . . . , xn)) λ(x1, . . . , xn) ˆω(x1, . . . , xn) ,

co pokazuje, że φ(f (x1, . . . , xn))λ(x1, . . . , xn) jest też czynnikiem całkującym formy ˆω.

Oczywiście φ(f(x1, . . . , xn)) = φ(C) = ˜C wyznacza tę samą rodzinę hiperpowierzchni.

Zachodzi ważne, choć mniej więcej oczywiste, Pierwsze twierdzenie Carathéodory’ego:

Forma jest całkowalna wtedy i tylko wtedy (czyli jest to twierdzenie “wte i we wte”), gdy ma czynnik całkujący. (Czyli formy całkowalne i mające czynnik całkujący to to samo).

We “wte” to jest oczywiste: jeśli forma ma czynnik całkujący, tzn. λ ˆω = df , to f (x1, . . . , xn) = C jest właśnie rodziną hiperpowierzchni całkowych, o których mowa w definicji formy całkowalnej (df, czyli po szkolnemu gradient, jest prostopadły do wektorów stycznych, czyli df daje zero na wektorach stycznych do tych hiperpowierzchni, a to oznacza, z wyjątkiem punktów, w których λ znika, że zero na stycznych wektorach musi dawać także sama forma ˆω).

W “te”, z kolei też jest to jasne. Niech f(x1, . . . , xn) = C będzie rodziną hiperpo- wierzchni. Są one numerowane wartościami stałej C. Można wtedy wprowadzić nowe (krzywoliniowe) współrzędne w Rn1, . . . , ξn−1, f ) tak, iż ξi są współrzędnymi na hiper- powierzchniach f = const. (wystarczy myśleć o rodzinie sfer w R3 - wtedy zmienne ξi to są kąty sferyczne, a f to promień). Z takim układem współrzędnych związane są wektory styczne do linii wyznaczanych przez zmianę jednego z ξ przy ustalonych pozostałych ξ.

Formę ˆω, której odpowiadają rozpatrywane hiperpowierzchnie, jak i każdą innę formę na Rn, jako obiekt geometryczny (tu się jednak geometria przydaje, byle nie popadać w geo- metryczny mistycyzm) można zapisać w dowolnych zmiennych. W tych nowych mogłaby ona mieć, w ogólności, postać

ˆ

ω = Ωf(f, ξ1, . . . , ξn−1) df + Ωi(f, ξ1, . . . , ξn−1) dξi.

Ale wszystkie Ωi muszą być równe zeru, bo forma ˆω daje zero na wektorach stycznych do rozpatrywanych hiperpowierzchni, a z konstrukcji nowych współrzędnych na takich wektorach df daje zero. Zatem ˆω = Ωf(f, ξ1, . . . , ξn−1)df , czyli Ω−1f (f, ξ1, . . . , ξn−1) ˆω = df i Ω−1f jest czynnikiem całkującym.

(17)

Nieco mniej oczywiste jest Drugie twierdzenie Carathéodory’ego: Forma ˆω jest całko- walna (albo ma czynnik całkujący) jeśli w dowolnym otoczeniu każdego punktu istnieją punkty nieosiągalne na drogach, na których ˆω = 0 (tzn. takich drogach, że forma ˆω dawałaby zero na wektorach stycznych do takich dróg, albo inaczej, bardziej przystępnie, na drogach na których kroczki dxi - teraz znów traktowane jak zwykłe przyrosty dxi - są skorelowane przez równanie ˆω = 0).

Dowód tego jest trochę bardziej żmudny i sprowadza się do pokazania, że jeśli założenie jest spełnione, to można zredukować problem do dwuwymiarowego, a w dwu wymiarach, jak już wiemy, każda forma ma czynnik całkujący, czyli jest całkowalna.

Rozpatrzymy przypadek trójwymiarowy, tj. formę ωx(x, y, z)dx + ωy(x, y, z)dy + ωz(x, y, z)dz. Najpierw ustalamy z i znajdujemy czynnik całkujący formy ωx(x, y, z)dx + ωy(x, y, z)dy, w której z jest ustalonym parametrem. Taki czynnik µ(x, y, z) (zależący pa- rametrycznie od z) istnieje - to już wiemy - czyli istnieją takie funkcje h(x, y, z) i µ(x, y, z), że

ωx(x, y, z) = 1 µ(x, y, z)

∂h(x, y, z)

∂x , ωy(x, y, z) = 1 µ(x, y, z)

∂h(x, y, z)

∂y .

Teraz zapisujemy wyjściowe równanie ωxdx+ωydy +ωzdz = 0 w postaci (możemy przecież różniczkować po zmiennej z, która dotąd była ustalona!)

 ∂h

∂xdx + ∂h

∂y dy + ∂h

∂z dz

 +



µ ωz− ∂h

∂z



dz = 0 .

Pierwszy nawias jest tu różniczką zupełną dh. Najwygodniej jest więc przejść teraz do zmiennych (h, y, z) i powyższe równanie zapisać w postaci

dh − ζ(h, y, z) dz = 0 .

Jeśli więc uda się pokazać, że współczynnik ζ nie może zależeć od y, to będziemy w domu, bo będziemy mieć w istocie formę w dwu tylko zmiennych, h i z, która, jako de facto forma na R2, już będzie mieć czynnik całkujący. Chodzi więc o to, by pokazać, że gdyby czynnik ζ zależał od y, to z jakiegobądź punktu (h0, y0, z0) można by było osiągnąć dowolny punkt w jego otoczeniu. Zatem załóżmy na chwilę, że ζ zależy od y. Z punktu (h0, y0, z0) można bez problemu przejść do (h0, y1, z0) po prostej h = h0, z = z0. Następnie na płaszczyźnie y = y1 przemieszczamy się po krzywej całkowej równania dh/dz = ζ(h, y1, z) do punktu (ϕ(z2, y1), y1, z2), gdzie h = ϕ(z, y1) jest rozwiązaniem tegoż równania z warunkiem po- czątkowym ϕ(z0, y1) = h0 (niezależnie od wartości y1). Potem robimy jeszcze jeden ruch po prostej równoległej do osi y i lądujemy w punkcie (ϕ(z2, y1), y2, z2). Z konstrukcji wynika, że wartości y2 i z2 mogą tu być zupełnie dowolne. W szczególności, jeśli rozpa- trzymy jakiś dowolny punkt (h, y, z) w infinitezymalnym otoczeniu punktu (h0, y0, z0), to zawsze można wziąć y2 = y i z2 = z, przy czym interesuje nas tu sytuacje, gdy y2 i z2

różnią się od wyjściowych y0 i z0 o dowolnie małe epsiloniki, bo to już w każdym dowol- nie małym otoczeniu wyjściowego punktu mają na mocy założenia być nieosiągalne na drogach spełniających warunek ˆω = 0. Pytanie zatem brzmi: czy wartość h2 = ϕ(z2, y1)

(18)

może być równa dowolnemu h różniącemu się od h0 o mały epsilonik: h = h0+ ε? Jeśli współczynnik ζ zależy od y, to wciąż mamy swobodę w manewrowaniu y1. Rozpatrzmy więc y1 różniące się od y0 o małą rzędu ε. Wtedy możemy rozwinąć wzór na h2 w szereg Taylora wokół warunku początkowego:9

h2 = h0 +∂ϕ

∂z (z2− z0) + ∂ϕ

∂y (y1− y0) + O(ε2) .

Pochodne funkcji ϕ(z, y) są tu oczywiście obliczone w punkcie (z0, y0). Gdyby teraz pochodna (∂ϕ/∂y) nie znikała, można by otrzymać dowolne (rzędu ε) odchylenie wartości h2 od h0 balansując wkład drugiego członu po prawej stronie (w którym wszystko jest ustalone, bo pytamy o możliwość dojścia do punktu o ustalonych z2 = z, y2 = y) odpowiednim doborem różnicy (też rzędu ε) y1 − y0. Ale miały przecież w otoczeniu (h0, y0, z0) istnieć punkty nieosiągalne na drogach zgodnych z równaniem ˆω = 0! Zatem funkcja ϕ nie może zależeć od y, a to oznacza, że współczynnik ζ od y nie może już zależeć. Koniec i bomba, kto nie załapał ten trąba.

To właśnie drugie twierdzenie Carathéodory’ego jest wykorzystane w jego owianym nimbem tajemniczości sformułowaniu 2TMDL, które głosi, że w dowolnie bliskim otocze- niu każdego stanu równowagowego dowolnego układu termodynamicznego istnieją stany nieosiągalne w przemianach adiatermicznych. Należy zwrócić tu uwagę na to, że sformuło- waniu tym niema explicite mowy o odwracalnych przemianach adiatermicznych; niemniej jeśli istnieją stany nieosiągalne w rezultacie takich procesów tworzących węższą klasę niż dowolne procesy adiatermiczne, to jedno-forma ciepła d¯Q jest całkowalna (i ma czynniki całkujące, z których jednym wyróżnionym jest odwrotność temperatury bezwzględnej T ) i odpowiednią rodziną hiperpowierzchni są hiperpowierzchnie stałej entropii. Niektóre stany nie leżące na wyjściowej powierzchni stałej entropii można osiągnąć w procesach adiatermicznych nieodwracalnych lub niequasistatycznych, ale wszystkie one muszą le- żeć po tej samej stronie tej hiperpowierzchni. Przez wybór znaku entropii można wtedy sprawić, że są to punkty, w których wartość entropii jest wyższa.

Problemik (Prosta termodynamiczna ilustracja czynnika całkującego)

Forma ciepła d¯Q = dU + p dV (przy stałej liczbie moli) w przypadku gazu o równaniu stanu pV = nRT i stałym cieple właściwym cv ma w zmiennych (T, V ) postać

d¯Q = ncvdT + p dV = ncvdT + nRT V dV .

Nie jest ona różniczką zupełną (bo ∂(ncv)/∂V = 0, a ∂p/∂T = nR/V ) ale, jak każda forma w dwóch wymiarach, ma czynnik całkujący. Jeśli weźmiemy λ = 1/T , to forma d¯Q/T już będzie różniczką zupełną funkcji S(T, V ) (no, wiemy oczywiście, że to entropia):

S = ncvln(T /T0) + nR ln(V /V0) ,

9Przypomnijmy, że ϕ(z0, y1) = h0niezależnie od wartości y1więc w szczególności także, gdy położymy y1równe y0.

(19)

metodą całkowania od (V0, T0) do (V, T ).

Problemik (Mniej trywialna termodynamiczna ilustracja czynnika całkującego)

Cylinder zamknięty z obu końców ruchomymi tłokami jest przedzielony na dwie części ruchomą adiatermiczną przegrodą. W jego lewej części znajduje się n1 moli gazu dosko- nałego o stałym (molowym) cieple właściwym c(1)v , a w prawej części n2 moli innego gazu doskonałego o cieple c(2)v . Każdy z tych gazów z osobna pozostaje w równowadze. Kon- takt między nimi jest wyłącznie mechaniczny (za pośrednictwem ruchomej przegrody).

Sprawdzić, czy forma ciepła tego układu d¯Q = dU1 + p1dV1 + dU2 + p2dV2 ma czynnik całkujący i ewentualnie znaleźć jakiś.

Rozwiązanie: Najpierw ustalamy, że układ ma trzy stopnie swobody: ponieważ prze- groda jest ruchoma, ciśnienia obu gazów muszą być jednakowe. Za trzy niezależne zmienne można więc przyjąć temperatury gazów T1, T2 oraz wspólne ciśnienie p. Ko- rzystając z równań stanu każdego z gazów by wyrazić Vi przez p i Ti (tzn. pisząc dVi = d(niRTi/p) = (niR/p)dTi − (niRTi/p2)dp, i = 1, 2), sprowadzamy formę ciepła do

d¯Q = n1(c(1)v + R) dT1+ n2(cv(2)+ R) dT2− Rn1T1+ n2T2

p dp .

Znów jest oczywiste, że nie jest to różniczka zupełna (pochodne mieszane nie są równe).

Teraz należy zastosować podane kryterium istnienia czynnika całkującego. Ponieważ zmienne są trzy, można zrobić to metodą wyznacznikową (pamiętamy, że pochodne w wyznaczniku działają tylko na dolny rządek)

n1(c(1)v + R) n2(cv(2)+ R) −R(n1T1 + n2T2)/p

∂/∂T1 ∂/∂T2 ∂/∂p

n1(c(1)v + R) n2(cv(2)+ R) −R(n1T1 + n2T2)/p

= n1(c(1)v + R)



−n2R p



− n2(c(2)v + R)



−n1R p

 .

Widać, że - jakby to nie wydawało się dziwne - czynnik całkujący istnieje tylko, gdy gazy mają takie same ciepła właściwe. Ignorując na razie ten dziwny fakt (w końcu dlaczegożby nie można było wpuścić do dwu części cylindra dwu różnych gazów? - przecież istotą matematyki 2TMDL jest to, że forma ciepła każdego układu ma czynnnik całkujący!) znajdźmy czynnik całkujący i funkcję S w przypadku, gdy c(1)v = c(2)v = cv. Forma ciepła ma wtedy postać

d¯Q = (cv+ R)(n1dT1+ n2dT2) − Rn1T1+ n2T2

p dp .

Czujny rzut oka ujawnia natychmiast, że jeśliby podzielić d¯Q przez n1T1+ n2T2, to nowa forma będzie sumą dwu kawałków zależnych jeden tylko od p, da drugi tylko od n1T1 + n2T2. Dla porządku, żeby otrzymana funkcja S była “ekstensywna”, tzn. by skalowała

(20)

się z całkowitą liczbą moli w szafie, tj. układu, weźmy λ = (n1 + n2)/(n1T1 + n2T2).

Otrzymujemy wtedy

S(T1, T2, p) = (n1+ n2) [(cv + R) ln(n1T1+ n2T2) − R ln p] + const.

Dziwny wymóg, by ciepła właściwe obu gazów były jednakowe bierze się tu (zapewne) stąd, że jest to pewna wersja osławionego problemu tłoka adiatermicznego. Układ taki jest o tyle dziwny, że warunek, by jego entropia przyjmowała wartość maksymalną nie wyznacza stanu wzajemnej równowagi dwu gazów; układ rzeczywisty owszem, dochodzi do równowagi, ale jakie wartości przyjmą temperatury gazów zależy od tarcia tłoka, lep- kości gazów itp. (żeby tłok przestał drgać musi być jakieś tarcie, lepkość, innymi słowy musi to być układ rzeczywisty, a nie teoretyczny konstrukt - gaz doskonały i idealna prze- groda poruszająca sie bez oporu). Sama termodynamika równowagowa nie wyznacza tu stanu równowagi i tym samym końcowej entropii (a druga zasada termodynamiki jest, jak się przekonamy, zasadą fizyczną, a nie matematyczną: formy ciepła “matematycznie”

skonstruowanych układów mogą nie mieć czynnika całkującego; 2TMDL orzeka tylko, że formy ciepła rzeczywistych układów fizycznych muszą taki czynnik mieć). Dlatego tu traktujemy ten przykład tylko jak matematyczne ćwiczenie.

Cytaty

Powiązane dokumenty

Dla dodatniej liczby naturalnej n znaleźć wzór na największą potęgę liczby pierwszej p dzielącą n!4. Rozłożyć na czynniki pierwsze

Weźmy algorytm, A, powiedzmy, za każdym razem, gdy porównuje on dwa elementy, to łączymy

4 Optymalny algorytm do znajdowania min i max jednocześnie. Algorytm dziel

Profesor Krzysztof Simon, kierownik Kliniki Chorób Zakaźnych i Hepatologii Uniwersytetu Medycznego we Wrocławiu, przyznaje, że młodzi ludzie w stolicy województwa

13 W przestrzeniach metrycznych można zdefiniować symetralną (jako zbiór tych punk- tów, które są równoodległe od dwóch ustalonych punktów)?. Jak wyglądają symetralne w

zyka niż człowieka, wtedy jednak powoływałoby się do istnienia nową total ­ ność, na gruncie której możliwa byłaby ciągła historia, historia dyskursu jako nauka

5. Losujemy jedną kulę, a następnie wrzucamy ją ponownie do urny dorzucając dodatkowo k kul białych, jeśli była to kula biała lub k kul czarnych, jeśli była czarna.

Rozwiązania należy oddać do piątku 15 lutego do godziny 14.00 koordynatorowi konkursu panu Jarosławowi Szczepaniakowi lub przesłać na adres jareksz@interia.pl do soboty 16 lutego.