• Nie Znaleziono Wyników

(* Dodatek własny 3.1 Teorie z cechowaniem

W dokumencie Kwantowa teoria pola Lewis H. Ryder (Stron 66-76)

Zobacz również tłumaczenie książki pt. Klasyczne pola cechowania – Teorie bozonowe” W. A. Rubakow

Teorie z cechowaniem ( ang. gauge theories ), w szczególności teorie z cechowaniem nieabelowym o symetrii lokalnej stanowią podstawę współczesnego opisu oddziaływań fundamentalnych ( grawitacyjnego, elektrosłabego i silnego ) – ogólnie model standardowy cząstek elementarnych jest oparty właśnie na teorii z cechowaniem.

Teorie z cechowaniem dzielimy na, teorie z symetrią globalną i teorie z symetrią lokalną. ( w niniejszym tekście nazywa się je odpowiednio symetrią cechowania pierwszego i drugiego rodzaju )

Pierwszą teorią z cechowaniem o symetrii lokalnej była maxwellowska teoria pola elektromagnetycznego

( elektrodynamika klasyczna ). W pierwszej kolejności jej inwariantny, względem cechowania charakter przejawia się w możliwości arbitralnego ustalenia poziomu odniesienia dla potencjału elektrycznego. Drugą klasyczną teorią o

cechowaniu lokalnym jest einsteinowska teoria grawitacji. Jej inwariantny względem cechowania charakter przejawia się w możliwości dowolnego wyboru układu współrzędnych.

Zarówno teoria elektromagnetyzmu Maxwella, jak i teoria grawitacji Einsteina swoje piękno w znacznym stopniu zawdzięcza właśnie lokalnej symetrii cechowania.

Uogólnieniem abelowych teorii cechowania jest teoria Yanga-Millsa, która jest teorią nieabelową, tj. jej grupa cechowania jest grupą nieprzemienną ( nie abelową ).

Uwaga ! W fizyce mówimy o teoriach z cechowaniem oraz o polach cechowania ( gauge fields ). Pola cechowania są oczywiście integralnymi składowymi teorii z cechowaniem. ( pola cechowania wprowadzamy po to, aby właśnie zapewnić dla danej teorii jej inwariantność względem cechowania ( gauge inwariance ). Takim polem cechowania jest np. pole EM oraz pole grawitacyjne. Co w jasny sposób podkreślono w powyższym tekście.

Innym przykładem jest przypadek przejścia od globalnej symetrii izospinowej ( symetria izospinowa ustala związek między cząstkami o tym samym spinie np. proton i neutron. ) do lokalnej ( 1954 Yang, Mills ). W pierwotnym podejściu do tej teorii, przejściu takie wymaga wprowadzenia trzech pól cechowania, każdemu takiemu polu odpowiada

bezmasowa cząstka o spinie 1. Później okazało się ,że w wyniku mechanizmu spontanicznego łamania symetrii cząstki te mogą uzyskiwać masę. ( twierdzenie Goldstone’a → mechanizm Higgsa ). Jak się miało okazać dalej

( model Weinberga-Salama ) wymóg lokalnej niezmienniczości izospinowej doprowadził do połączenia sił EM i słabych.

Generalnie, symetrie występujące w przyrodzie możemy podzielić na :

a) symetrie czasoprzestrzenne – niezmienniczość teorii fizycznych ( pól fizycznych ) względem grupy Poincare’go

b) symetrie wewnętrzne – niezmienniczość teorii fizycznych ( pól fizycznych ) względem obrotów w pewnej ustalonej przestrzeni ( np. izotopowej ).

Symetrie te mogą być globalne albo lokalne. Teorie z cechowaniem będą wykorzystywały symetrie lokalne.

c) Supersymetrie – połączone symetrie czasoprzestrzenne i wewnętrzne.

( supersymetria umożliwia „przejście” – symetrię, między cząstkami o różnych spinach tj. przeprowadza fermiony w bozony i na odwrót )

Jak można było zobaczyć w prezentowanym tekście w pełni konsekwentne i formalne podejście do symetrii oparte jest na wykorzystaniu podejścia Lagrange’a ( lub, równoważnie Hamiltona ) i zbadaniu grupy symetrii odpowiednich równań wariacyjnych ( równań Eulera-Lagrange’a ) (3.19). W zasadzie jest to standardowy aparat klasycznej teorii pola – zadając odpowiedni lagranżjan ( działanie ) dokonujemy jego wariacji otrzymując tzw. równania ruchu pola.

Drugim filarem na jakim spoczywa klasyczna teoria pola jest twierdzenie E. Noether, dokładnie jest ich kilka jednakże nie zagłębiając się w temat możemy mówić o jednym – jeżeli lagranżjan (działanie ) danej teorii jest niezmienniczy względem pewnej grupy, to w takiej teorii będą występowały określone wielkości zachowane. Jak widać w tłumaczonym tekście konsekwentnie wykorzystano ten fakt, badając niezmienniczość działania (3.21) względem przekształceń (3.22).

W wyniku tego otrzymano pewien prąd zachowany (3.25) i ładunek zachowany ( prąd i ładunek tego typu nazywa się odpowiednio prądem i ładunkiem Noether ). Badając inwariantność działania względem translacji czaso -przestrzennych i obrotów otrzymujemy odpowiednio prawo zachowania energii, pędu ( ogólnie 4- pędu ) i momentu pędu.

W dalszej kolejności autor stawia pytanie jaką grupę symetrii powiązać z prawem zachowania ładunku znanym z elektrodynamiki klasycznej. Ponieważ wszystkie możliwości jeśli chodzi o symetrie czasoprzestrzenne zostały wykorzystane, wniosek nasuwa się jeden – musimy wykorzystać symetrie wewnętrzną. Jeśli tak , to pole musimy rozważyć pole skalarne o więcej niż jednej składowej – najprostszym jest pole skalarne o dwóch składowych, które z kolei jest równoważne jednemu polu zespolonemu (3.50), (3.51).

Dla takiego pola zakładamy lagranżjan (3.52), który jest inwariantny względem przekształceń (3.55). Przekształcenia takie stanowią klasyczny przypadek transformacji cechowania.

Transformacja cechowania polega ( w ogólności ) na przemnożeniu funkcji pola przez czynnik fazowy : ( w mechanice kwantowej mówimy, że faza początkowa funkcji falowej może być dowolna )

Φ(x) → e-iφ Φ(x)

Rozróżniamy transformacje cechowania globalne – czynnik fazowy nie zależy od punktu w przestrzeni

( czasoprzestrzeni, przestrzeni konfiguracyjnej itp. ), oraz transformacje cechowania lokalne – czynnik fazowy jest zależny od punktu ( od współrzędnych punktu ) :

Φ(x) → e-iφ(x) Φ(x)

Badają własności lagranżjanu (3.52) względem przekształcenia cechowania (3.55) ( równoważne przekształcenia cechowania to przekształcenia postaci (2.226) ) dochodzimy do prądu zachowanego (3.59) i odpowiadającego mu ładunku zachowanego (3.62) który to chcielibyśmy utożsamić z „standardowym“ ładunkiem elektrycznym.

Badając własności „geometryczne” przekształcenia (3.55) dochodzimy do wniosku, że jest to obrót w dwuwymiarowej przestrzeni, a odpowiednią grupą jest O(2). W dalszej kolejności dochodzimy do równoważności grup O(2) i U(1).

W następnym kroku wprowadzamy przekształcenie lokalne cechowania Λ(xµ ) ( xµ – są oczywiście współrzędnymi czasoprzestrzennymi ). Po takiej zmianie widać, że do wzorów na przekształcenia wchodzi teraz dodatkowy człon z ∂µΛ.

Okazuje się dalej, że w związku z tym faktem działanie nie jest już inwariantne względem lokalnemu przekształceniu cechowania. Aby sprawić ponownie, aby takim się stało musimy wprowadzić dodatkowe pole wektorowe Aµ. Pole to wnosi dodatkowe wkłady do lagranżjanu o postaci (3.73), (3.78) i (3.82). Jak się okazuje pole to jest niczym innym jak polem odpowiadającym polu EM

(lagranżjan (3.82) jest klasycznym lagranżjanem znanym z elektrodynamiki klasycznej, ponadto lagranżjan (3.83) przy wariowaniu względem potencjału wektorowego Aµ daje nam równania Maxwella )

Wniosek – pole EM pojawia się w naturalny sposób w celu zapewnienia inwariantności działania pola skalarnego względem transformacji cechowania, której grupa to U(1) ≈ O(2). Ponadto okazuje się, że postać dodatkowego członu związanego z polem EM musi być taki, aby pole EM było polem bezmasowym.

Porównując lagranżjany (3.83) i (3.52) widać, że wielkości ∂µφ zamienione są na wielkości ( ∂µ + ieAµ )φ.

§ 3.4 Topologia i próżnia : efekt Aharonova-Bohma.

W fizyce klasycznej siła, działająca na cząstkę naładowaną o ładunku e, znajdującą się w polu EM zadana jest wzorem Lorentza :

F = eE + ev × B (3.93)

Gdzie : E, B – pole elektryczne I indukcja magnetyczna, związane z potencjałem wektorowym A i potencjałem skalarnym φ poprzez zależność (2.218) :

E = - ∂A∂t – ∇∇∇∇φ , B = rot A

Jaki widzieliśmy w poprzednim paragrafie, wielkości A I φ nie są określone jednoznacznie. Mogą one zmieniać się przy przekształceniach cechowania (2.225) [ lub, co równoważne (3.74) ] , względem których E i B są inwariantne. W związku z tym twierdzi się, że jedynym oddziaływaniem fizycznym pola EM na ładunek jest siła Lorentza (3.93), przy czym siła ta działa tylko w tych obszarach, gdzie E lub B są różne od zera. Efekt Aharonova-Bohma pokazuje, że w MQ nie jest tak do końca – efekty fizyczne istnieją w obszarach gdzie E i B są równe zeru, ale potencjał Aµ jest różny od zera. Zatem potencjał wektorowy posiada głębszy sens fizyczny, niż uważano wcześniej.

Omawiany efekt odnosi się do dobrze znanemu myślowemu doświadczeniu kwantowo-mechanicznemu z elektronami przechodzącymi przez dwie szczeliny ( rys. 3.6 )

Rys. 3.6 Schemat doświadczenia z dwoma szczelinami i interferencją elektronów (* opis na rysunku – trajektoria 1, trajektoria 2 *)

Na mocy falowej natury elektronów, póki tego nie ustalimy, przez każdą szczelinę przechodzą elektrony dając na ekranie charakterystyczny obraz interferencyjny. Jeśli długość fali elektronu jest równa λ , to różnica faz fali, przychodzących od elektronów z obu szczelin, jest równa :

δ = 2πa/ λ = a/λC

przy x << L mamy a = (x/L)d, tak, że :

δ = (x/L) (d/λC ) ; x = (LλC/d ) δ (3.94)

W punktach, gdzie δ = 2nπ, otrzymujemy maksima, a w punktach, gdzie δ = ( 2n + )π – otrzymujemy minimum tj. wzór ten opisuje w istocie obraz interferencyjny.

Idea Aharonova-Bohma [10] polega na tym, aby umieścić za przesłoną ze szczelinami, pomiędzy nimi małego solenoidu (rys. 3.7 )

Rys. 3.7 Efekt Aharonova-Bohma Rys. 3.8 Potencjał wektorowy A i indukcja magnetyczna B w solenoidzie.

Między dwoma szczelinami umieszczono Niewielki solenoid.

Wewnątrz solenoidu istnieją linie indukcji magnetycznej B, jednak poza nim ich nie ma. Zatem, jeśli solenoid jest wystarczająco mały, to wszystkie elektrony poruszają się w obszarze w którym pole magnetyczne nie występuje.

Łatwo jest znaleźć postać potencjału wektorowego A, który daje pole magnetyczne omawianego solenoidu ( rys. 3.8 ) We współrzędnych cylindrycznych różna od zera jest tylko ta składowa potencjału A, która odpowiada kątowi azymutalnemu φ, ma ona postać :

Wewnątrz solenoidu : Ar = Az = 0 , Aφ = ½ Br (3.95)

Na zewnątrz solenoidu : Ar = Az = 0 , Aφ = BR2 /2r (3.96)

Gdzie : R – promień solenoidu.

Ponieważ : B = ∇∇∇∇ × A, we współrzędnych cylindrycznych otrzymujemy : Bz = (1/r) [ ∂(rAφ )/∂r – (∂Ar /∂φ) ]

Oraz analogiczne wzory dla Br i Bφ. Daje nam to :

Wewnątrz solenoidu : Br = Bφ = 0 , Bz = B (3.97)

Na zewnątrz solenoidu : B = 0 (3.98) Co właśnie twierdziliśmy.

Zobaczmy teraz, jak działa pole solenoidu na poruszający się elektron. Funkcja falowa elektronu w przestrzeni swobodnej od pola ma postać :

ψ = | ψ | exp[ (i/ħ ) pr ≡ | ψ | exp(iα ) (3.99)

W przypadku obecności pola EM pęd p elektronu zmienia się zgodnie ze wzorem (3.86) : p p – eA

gdzie : e – jest ( ujemnym ) ładunkiem elektronu.

Przy tym faza α, funkcji falowej zmienia się następująco :

α → α – (e/ħ ) Ar (3.100)

a zmiana fazy fali wzdłuż całej trajektorii jest równa :

∆ = - (e/ħ )

A dr (3.101)

Zatem zmiana różnicy faz δ jest równa :

∆δ = ∆α1 – ∆α2 = (e/ħ )

A dr = (e/ħ )

rot A dA = (e/ħ )

B dS = (e/ħ ) Φ (3.102) 2-1 2-1

gdzie : Φ - strumień magnetyczny przepływający przez solenoid.

W wyniku tego obraz interferencyjny zmienia się o wielkość :

∆x = (Lλ/d) ∆δ = (LλC /d ) (e/ħ ) Φ (3.103)

Zatem, końcowy wynik jest taki : przy obecności solenoidu obraz interferencyjny przesuwa się, chociaż elektrony poruszają się tylko w obszarze w którym pole magnetyczne nie występuje.

Takie doświadczenie nie jest łatwo wykonać, ponieważ solenoid powinien być bardzo mały. W pierwszym

doświadczeniu Chambersa [11] w którym obserwowano omawiany efekt i w którym potwierdzono zgodność wyniku doświadczenia z teorią, wykorzystano namagnesowany monokryształ żelaza ( 1960 r. ). Później wspomniany efekt został potwierdzony w szeregu innych eksperymentów.

Sens tego efektu polega na tym, że w teorii kwantowej potencjał wektorowy A działa na elektron nawet wtedy, kiedy ruch elektronu ograniczony jest do obszarów w których B = 0. Jednocześnie z zależności (3.103) i (3.102) wynika, że efekty fizyczne zależne są tylko od rot A. Należy więc wyprowadzić wniosek, że na elektron działają pola, które są różne od zera tylko w obszarach niedostępnych dla niego. Bardziej formalnie stwierdzenie to jest równoważne nielokalnemu charakterowi całki

A dr .

Jak pokażemy dalej, efekt Aharonova-Bohma powodowany jest przez nietrywialną topologią próżni i tym, że elektrodynamika jest teorią z cechowaniem. W ostatnich latach stało się jasne, że próżnia w teoriach z cechowaniem posiada bogatą strukturę matematyczną z wynikającymi z tego faktu następstwami fizycznymi, które to rozpatrzymy dokładniej w następnych rozdziałach. Efekt Aharonova-Bohma jest prostą ilustracją roli jaką odgrywa topologia w teoriach z cechowaniem.

Na zewnątrz solenoidu mamy E = 0, B = 0 tak, że gęstość energii pola EM U = 0, tj. znajdujemy się w stanie próżni.

Jednak ponieważ A ≠ 0, to próżnia ta posiada pewną „strukturę”. Na podstawie tego, ze rot A = 0, możemy napisać A = ∇∇∇∇χ , gdzie : χ - pewna funkcja, którą możemy znaleźć zauważając, że zgodnie ze wzorem (3.95) mamy : Aφ = (1/r) ∂χ/∂φ = BR2 /2r

Skąd wynika wyrażenie :

χ = ½ BR2φ (3.104)

w którym opuściliśmy dowolną stałą całkowania.

Funkcja χ nie jest określona jednoznacznie, wzrasta ona o wielkość πR2B przy zamianie φ → φ+ 2π. W istocie bowiem z (3.102) wynika :

∆δ = ∆α = (e/ħ )

A dr = (e/ħ )

∇χ dr = (e/ħ ) [ χ ] φ+2πφ=0 = (e/ħ ) πR2B = (e/ħ ) Φ (3.105) Jednakże regularne niejednoznaczne funkcje mogą istnieć tylko w przestrzeniach niejednospójnych.

Przestrzeń jednospójna to taka przestrzeń w której dowolną zamkniętą krzywą możemy w sposób ciągły ściągnąć do punktu. Przestrzenie niejednospójne, to takie przestrzenie w których nie wszystkie krzywe mogą być w sposób ciągły ściągnięte do punktu. W naszym przypadku mamy do czynienia z przestrzenią próżni tj. z przestrzenią na zewnątrz solenoidu i jest ona zatem niejednospójna. Opis ten zilustrowano na rysunku 3.9.

Rys. 3.9 Przestrzeń swobodna od pola w efekcie Aharonova-Bohma nie jest jednospójna.

Krzywa c1 może być ściągnięta do punktu, a krzywa c2 – nie. Oprócz tego, krzywa obchodząca solenoid n razy nie może być przedeformowana do krzywej obchodzącej solenoid m ( ≠n )razy.

Zatem funkcja χ jest wieloznaczna i jest to możliwe dzięki temu, że jest ona określona w przestrzeni niejednospójnej.

Temu stwierdzeniu równoważne jest stwierdzenie odwrotne – jeśli funkcja χ jest jednoznaczna to wszędzie spełnione są równości B = rot A = rot grad χ ≡ 0 i strumień magnetyczny nie występowałby.

Zatem, warunkiem koniecznym istnienia efektu Aharonova-Bohma jest niejednospójność przestrzeni konfiguracyjnej próżni. W zależności (3.104) funkcja χ zadana jest w przestrzeni grupowej grupy cechowania U(1) :

Aµ = ∂µ χ (3.106)

W rzeczywistości Aµ jest przekształceniem cechowania próżni „właściwej” Aµ = 0. Odpowiednie przekształcenia cechowania dla cząstki naładowanej maja postać e-ieχ , (* należy pamiętać , że e jest zarówno symbolem ładunku elektronu jak i podstawą logarytmu naturalnego *) tj. jest elementem grupy U(1). Jak już zauważyliśmy wcześniej [ zobacz uwagi po wzorze (3.66) ], przestrzenią dla grupy U(1) jest okrąg, który oznaczymy przez S1.

Taka przestrzeń grupowa jest niejednospójna, ponieważ drogi obchodzącej okrąg dwa razy nie można w sposób ciągły przedeformować ( nie wychodząc poza okrąg ) w krzywą, która obchodzi okrąg tylko raz. W rzeczywistości w

przestrzeni grupowej nieskończona liczba nie równoważnych dróg. Zdefiniujemy teraz takie pojęcie bardziej formalnie.

(* Zobacz również tekst pt. „Elementy topologii rozmaitości i teorii homotopii” *)

Drogę a w przestrzeni X określimy jako funkcje ciągłą a(s) parametru rzeczywistego s, w taki sposób, że każda wartość s zawarta w odcinku 0 ≤ s ≤ 1, odpowiada punktowi a(s) w przestrzeni X. Jeśli droga a łączy punkty P i Q to mamy a(0) = P , a(1) = Q. Jeśli a(0) = a(1) = P, to mamy drogę zamkniętą ( tj. pętle ) w punkcie P.

Rozpatrzmy teraz dwie zamknięte drogi a(s), b(s) i załóżmy, że istnieje funkcja L(t, s) taka, że L(0, s) = a(s), L(1, s) = b(s). W tym przypadku drogi a i b są homotopiczne , co zapisujemy jako a ~ b.

Drogę odwrotną względem drogi a, oznaczamy jako a-1 i definiujemy zależnością :

a-1(s) = a( 1 – s ) (3.107)

Zatem, odpowiada ona drodze pierwotnej ale obchodzonej w kierunku przeciwnym. Jeśli punkt końcowy drogi a pokrywa się w punktem początkowym drogi b, tak że a(1) = b(0), to możemy określić iloczyn dróg c = ab poprzez zależność :

c(s) = { a(2s) przy 0 ≤ s ≤ ½ (3.108)

{ b(2s – 1 ) przy ½ ≤ s ≤ 1

Droga zerowa przedstawia sobą jeden punkt. Jeśli a ~ b, to droga ab-1 jest homotopiczna drodze zerowej.

Teraz możemy zbudować grupę, wprowadzając klasę dróg, homotopicznych drodze a. Taką klasę oznaczymy przez [a].

Oczywiście, że takie drogi powinny mieć pokrywające się punkty końcowe. Klasy homotopii można mnożyć przez siebie według prawa iloczynu, który określony jest w następujący sposób :

[a] [b] = [ab] (3.109)

Łatwo pokazać, że poprzez takie prawo mnożenia określona zostaje grupa, którą nazywamy grupą fundamentalną lub pierwszą grupą homotopii przestrzeni X, oznaczamy ją przez π1(X ). Grupa ta została wprowadzona przez Poincarego w 1895 roku, nazwa „pierwsza grupa homotopii przestrzeni X” ma odróżniać ją od wyższych grup homotopii przestrzeni X, które zostały wprowadzone przez Hurewicza w 1935 roku. Nam wystarczy sprawdzenie czy spełnione są prawa grupy : 1. Zamkniętość – jeśli [a] ∈ π1(X ) i [b] ∈ π1(X ), to z uwzględnieniem (3.109) również [a][b] = [ab] ∈ π1(X ).

2. Łączność – ponieważ (ab)c ~ a(bc), to mamy ( [a][b])[c] = [a]( [b][c] ).

3. Element jednostkowy – jest to klasa, zawierająca drogę zerową [1], ponieważ [a][1] = [a]

4. Element odwrotny – [ a-1][a] = 1, co pociąga [a]-1 = [ a-1].

Zatem, wnioskujemy, że pierwsza grupa homotopii U(1) jest izomorficzna grupie wszystkich liczb całkowitych ze względu na dodawanie ( liczba całkowita n odpowiada drodze zamkniętej, która przechodzi n razy wokół okręgu S1 w przestrzeni grupowej ). Grupę tą oznaczamy jako Z. Jest to nieskończona grupa abelowa. Mamy zatem :

π1(U1) = Z (3.110)

Innymi słowy, efekt Aharonova-Bohma powodowany jest przez to, że grupa cechowania elektrodynamiki U1 nie jest grupą jednospójną. ( Przestrzeń X nazywamy jednospójną, jeśli dowolna droga zamknięta zawarta w X jest

homotopiczna drodze zerowej, tak wiec π1(X ) = 1 )

Przestrzeń konfiguracyjna w doświadczeniu Aharonova-Bohma reprezentuje sobą płaszczyznę R2 ( która symbolizuje zbiór par liczb rzeczywistych ) z dziurką. Topologicznie jest to równoważne iloczynowi prostemu prostej R1 i okręgu S1 : R1 × S1. Prostą możemy sparametryzować np. poprzez zmienną r, a okrąg – przez zmienną φ.

Funkcja cechowania χ jest odwzorowaniem przestrzeni grupowej G na przestrzeń konfiguracyjną X :

χ : G → X (3.111)

W naszym przypadku G pokrywa się z S1, a X z R1 × S1. Wszystkie funkcje odwzorowujące S1na R można przedeformować w stałą, tak że nietrywialna część funkcji χ ma postać :

χ : S1 → S1 (3.112)

W naszym zagadnieniu jest to faktycznie pełna forma odwzorowania χ ponieważ nie zależy ono od r ). Tym samym otrzymujemy sposób określenia grup homotopii.

Niech [ X, Y ] – będzie zbiorem wszystkich klas homotopii dla odwzorowań ciągłych X na Y. Ogólnie mówiąc, tworzą one grupę. Odpowiednio, zbiór :

[ S1, Y ] = π1(Y ) (3.113)

jest pierwszą grupą homotopii dla Y, tj. „grupą fundamentalną” w sensie Poincarego. Analogicznie zbiór :

[ Sn, Y ] = πn(Y ) (3.114)

jest n-tą grupą homotopii dla Y i przedstawia sobą grupę abelową w przypadku n ≥ 2 ( Pierwsza grupa homotopii nie zawsze jest abelowa, jednakże we wszystkich fizycznie interesujących przypadkach jest to grupa abelowa ).

Z (3.112) wynika, że funkcje cechowania χ dzielą się na osobne klasy, generujące grupę :

[ S1, S1 ] = π1(S1 ) = Z (3.115)

Po tym matematycznym wstępnie możemy dokonać pewnego podsumowania. W eksperymencie Aharonova-Bohma przechodzą po obu stronach solenoidu w obszarze zerowego pola, tym niemniej obecność solenoidu wpływa na położenie prążków interferencyjnych. Z matematycznego punktu widzenia przyczyną tego faktu jest to, że przestrzeń konfiguracyjna, odpowiadająca polu zerowemu ( próżni ), przedstawia sobą płaszczyznę z dziurką tj. R1 × S1.

Potencjał wektorowy Aµ budowany jest za pomocą funkcji cechowania χ, która odwzorowuje przestrzeń cechowania na przestrzeń konfiguracyjną. Takie odwzorowania dzielą się na oddzielne klasy i na skutek tego, że :

[ S1, U1 ] = π1(S1 ) = Z

nie można ich przedeformować w stałą funkcje cechowania χ = const. ( która, oczywiście prowadziłaby do równości Aµ = 0 przy braku efektu Aharonova-Bohma ). W przypadku, kiedy grupą cechowania jest grupa spójna, podobna do SU(2) :

π1( SU(2) ) = 1 (3.116)

wszystkie odwzorowania można przedeformować w odwzorowanie stałe i efekt Aharonova-Bohma nie wystąpi.

§ 3.5 Pole Yanga-Millsa.

Uogólnimy teraz wyniki paragrafu 3.3 na przypadek, kiedy lagranżjan posiada symetrię wyższą niż O(2) lub U(1).

Najprostszym uogólnieniem tej symetrii jest grupa SU(2). Dana grupa, podobnie jak i bardziej złożone grupy rozpatrywane w fizyce, jest nieabelową, tj. teraz będziemy rozpatrywali teorię nieabelowych pól cechowania.

Pole skalarne, które rozpatrywaliśmy w paragrafie 3.3 posiadało dwie składowe, które były związane między sobą poprzez obroty na płaszczyźnie. Oczywisty sposób uogólnienia tego przypadku polega na tym, aby rozpatrzyć pole φ, posiadające trzy składowe φ = ( φx , φy , φz ) w przestrzeni „wewnętrznej”, a przekształcenia cechowania ( pierwszego rodzaju ), przedstawiają obroty w tej przestrzeni. W wyniku tego będziemy mieli w miejsce ładunku zachowanego zachowaną wielkość „wektorową”, która jest analogiczna do izospinu.

Hipoteza o tym, że symetria izospinowa jest symetrią lokalną, została po raz pierwszy postawiona przez Yanga i Millsa [17] w 1954 roku. W przeciągu wielu lat ich pracę przyjmowano jako bez perspektywiczną, chociaż interesującą, wiązało się to z tym, że – jak powiedziano wcześniej – nie było świadectw tego, ze izospin związany jest z symetrią cechowania.

W ostatnich latach idea Yanga i Millsa została reaktywowana w zastosowaniu do teorii oddziaływań silnych miedzy kwarkami ( kolorowa symetria cechowania ), oraz do jednolitej teorii oddziaływań słabych i EM( symetria cechowania słabego izospinu i hiperładunku ). Tym niemniej dalej będziemy nazywali zachowaną wielkość wektorową izospinem, a przestrzeń wewnętrzną związaną z taką symetrią – przestrzenią izospinu. Czytelnik jednak powinien być świadomy, ze terminy te należy rozumieć w ogólniejszym sensie.

Powróćmy teraz na chwilkę do rysunku 3.4 i rozpatrzmy obroty na płaszczyźnie ( 1- 2 ) jako obroty wokół 3-ciej osi, innymi słowy jako obroty o kąt Λ3 ( rys. 3.10 )

Rys. 3.10 Obrót wokół 3-ciej osi w przestrzeni symetrii wewnętrznej.

Zatem, z zależności (3.66) wynika :

φ’1 = φ1cos(Λ3 ) + φ2 sin(Λ3 ) (3.117)

φ’2 = - φ1sin(Λ3 ) + φ2 cos(Λ3 ) (3.117)

φ’3 = φ3 (3.117)

W przypadku nieskończenie małego Λ3 mamy :

φ’1 = φ1 + φ2 Λ3 (3.118)

φ’2 = - φ1Λ3 + φ2 (3.118)

φ’3 = φ3 (3.118)

co reprezentuje sobą 3-cią składową zależności :

φ → φ’ = φ – ΛΛΛΛ × φ (3.119)

która, oczywiście odpowiada obrotowi wokół dowolnej osi o kąt ΛΛΛ. Sens tej zależności polega na tym, że wielkość | ΛΛ ΛΛ | Λ jest kątem obrotu , a wektor ΛΛΛΛ/ | ΛΛΛΛ | zadaje kierunek osi obrotu. Zatem :

δφ = - ΛΛΛΛ × φ (3.120)

Jest to przekształcenie cechowania pierwszego rodzaju, analogiczne do dwóch przekształceń (3.67) i (3.69).

Oczywiście, że zależność (3.120) faktycznie przedstawia sobą trzy zależności.

Nasza strategia polegać będzie teraz na tym, aby na tyle, na ile jest to możliwe przeprowadzić analogię do

elektrodynamiki. Zobaczymy jednak, że dany przypadek jest bardziej złożony, ponieważ teraz obroty tworzą nieabelową grupę O(3). Na mocy nieabelowego charakteru tej grupy mamy a × b = - b × a , tj. iloczyn wektorowy nie jest

przemienny. Wkrótce zobaczymy na ile ten fakt utrudnia zbudowanie odpowiedniej teorii. Utrudnienia te mają oczywiście następstwa fizyczne.

Na początku zauważmy, że zależność (3.120) przedstawia sobą opis dokonania obrotu w przestrzeni wewnętrznej zmiennej φ o jeden i ten sam kąt ΛΛΛΛ we wszystkich punktach czasoprzestrzeni. Zamienimy go jednak na bardziej umiarkowany wymóg, aby wielkość ΛΛΛ zależała od xµ. Wtedy otrzymamy : Λ

µφ → ∂µφ’ = µφ – ∂µΛΛΛΛ × φ – ΛΛΛ × ∂Λ µφ lub

δ(∂µφ ) = – ΛΛΛΛ × ∂µφ – ∂µΛΛ × φ ΛΛ (3.121)

Inaczej mówiąc, wielkość ∂µφ nie przekształca się kowariantnie, tj. tak jak φ. Powinniśmy zatem zbudować „pochodną kowariantną” analogiczną do (3.84). Przy tym wprowadzimy potencjał cechowania analogiczny do Aµ. Pochodna kowariantną zapiszemy w postaci :

Dµφ = µφ + g Wµ × φ (3.122)

Wielkość Wµ jest potencjałem cechowania, analogicznym do Aµ. Zauważmy, że jest on wektorem w przestrzeni wewnętrznej, podczas gdy Aµ posiada tylko jedną składową. Wielkość g jest stałą sprzężenia, analogiczną do ładunku elektrycznego e. Na drodze porównania ze wzorem (3.120) dochodzimy do następującego warunku :

δ( Dµφ) = – ΛΛ ×ΛΛ ( Dµφ ) (3.123)

W jaki sposób powinien przekształcać się potencjał Wµ , aby spełniać ten wymóg ? Możemy wypisać następujące fakty :

Po pierwsze Wµ jest ( wewnętrznym ) wektorem i dlatego analogicznie do (3.120) wzór przekształcenia dla tej wielkości powinien zawierać człon ΛΛΛΛ × Wµ , po drugie – ponieważ wzór przekształcenia dla Aµ zawiera człon z (1/e)∂µΛΛΛΛ [ wzór (3.74) ], to odpowiedni wzór dla Wµ powinien zawierać człon z (1/g)∂µΛΛ. W wyniku tych faktów zapiszemy : ΛΛ

Wµ – ΛΛΛΛ × Wµ + (1/g ) ∂µΛΛ ΛΛ

Lub

δWµ = – ΛΛΛΛ × Wµ + (1/g ) ∂µΛΛ ΛΛ (3.124)

Z uwzględnieniem wzorów (3.120) – (3.122) otrzymujemy z tego :

I dalej z tożsamości wektorowej :

( A × B ) × C + ( B × C ) × A + ( C × A ) × B = 0 po przestawieniu wynika następująca zależność :

( A × B ) × C + B × ( A × C ) = A × ( B × C ) (3.126)

Stosując to wyrażenie do wyrażenia stojącego w nawiasie kwadratowym wzoru (3.125) otrzymamy :

δWµ = – ΛΛΛΛ × ( ∂µφ + g Wµ × φ ) = – ΛΛΛΛ × Dµφ (3.127) co właśnie było przez nas oczekiwane tj. zasadę przekształcenia kowariantnego.

Nasze założenie o postaci pochodnej kowariantnej okazało się być prawidłowe – jeśli bowiem wprowadzimy potencjał

Nasze założenie o postaci pochodnej kowariantnej okazało się być prawidłowe – jeśli bowiem wprowadzimy potencjał

W dokumencie Kwantowa teoria pola Lewis H. Ryder (Stron 66-76)