Geometria różniczkowa w fizyce

CZĘŚĆ I : Wektory i krzywe

1 Wektory styczne
1.1 Definicja. Euklidesowa n-przestrzeń Rn jest określana jako zbiór uporządkowanych n-krotek p = (p1,...,pn), gdzie pi ∈ R, dla każdego i = 1,...,n
Mając dane dwie n-krotki p = (p1n), q = (q1,...,qn) i liczbę rzeczywistą c, definiujemy dwa działania:
(1.1)   p + q = (p1 + q1),...,q1 + qn
cp = (cp1,...,cpn)
Z sumą i mnożeniem skalarnym uporządkowanych n-krotek zdefiniowanych w ten sposób, przestrzeż Euklidesowa uzyskuje strukturę przestrzeni wektorowej n-wymiarowej.
1.2 Definicja Niech xi będą funkcjami rzeczywistymi w Rn takimi ,że xi(p) = pi dla dowolnego punktu p = (p1,...,pn). Funkcje xi są wtedy nazywane naturalnymi współrzędnymi punktu p. Kiedy wymiar przestrzeni wynosi n = 3, często piszemy x1 = x, x2 = y a x3 = z.
1.3 Definicja Funkcja rzeczywista w Rn jest klasą Cr jeśli wszystkie pochodne cząstkowe funkcji aż do r istnieją i są ciągłe. Przestrzeń nieskończenie różniczkowalna (gładka) funkcji będzie oznaczana przez C(Rn)
W rachunku zaawansowanym, do wektorów odnosimy się jak do strzałek charakteryzowanych przez kierunek i długość. Wektory są zatem rozpatrywane jako niezależne od swojego położenia w przestrzeni. Z powodów matematycznych i fizycznych korzystne jest wprowadzenie notacji wektorów które zależą od położenia. Na przykład jeśli wektor przedstawia siłę działającą na ciało sztywne, wtedy wynikowe równanie ruchu będzie oczywiście zależało od punktu w którym siła jest stosowana. Później rozważymy również wektory w przestrzeni które są krzywymi. W tych przypadkach, pozycja wektorów jest kluczowa. Na przykład wektor jednostkowy wskazujący północ na równiku, nie jest taki sam jak wektor jednostkowy wskazujący północ na Zwrotniku Koziorożca. Ten przykład wskazuje poniższą definicję.
1.4 Definicja Wektor styczny Xp w Rn jest uporządkowaną parą (X,p). Możemy uważać X za zwykły wektor różniczkowy a p jest pozycją wektora przy stopie strzałki
Zbiór wszystkich wektorów stycznych przy punkcie p ∈ Rn jest nazywany przestrzenią styczną przy p i będzie oznaczana przez Tp(Rn) . Przy danych dwóch wektorach stycznych Xp, Yp i stałej c ,możemy zdefiniować nowe wektory styczne przy p przez (X | Y)p = Xp | Yp i (cX)p = cXp. Z tej definicji widać ,że dla każdego punktu p, odpowiedniej przestrzeni stycznej TpRn w tym punkcie ma strukturę przestrzeni wektorowej. Z drugiej strony, nie ma naturalnego sposobu dodania dwóch wektorów stycznych w różnych punktach. Niech U będzie otwartym podzbiorem Rn. Zbiór T(U) składający z sumy wszystkich wektorów stycznych przy wszystkich punktach w U jest nazywany wiązką stycznych. Ten obiekt nie jest przestrzenią wektorową, ale ma strukturę inną niż tylko zbiór
1.5 Definicja Pole wektorowe X w U ∈ Rn jest funkcją gładką z U do T(U)
Możemy myśleć o polu wektorowym jako gładkim przypisaniu wektora stycznego Xp do każdego punktu w U. Przy danych dwóch polach wektorów X i Y i funkcji gładkiej f, możemy określić nowe pole wektorowe X + Y i fX przez
(1.2)   (X+Y)p = Xp + Yp
f(X)p = fXp
Uwaga Ponieważ przestrzeń funkcji gładkiej nie jest polem ale tylko pierścieniem, powyższe działania dają przestrzeń pól wektorów o strukturze modułu pierścienia .Zapis indeksu Xp wskazujące położenie wektora stycznego jest czasami niewygodne. Przy ryzyku wprowadzenia pomyłki, opuścimy indeks dla oznaczania wektora stycznego. Szczęśliwie, wynika to z kontekstu, czy odnosimy się do wektora czy pola wektorowego. Pola wektorowe są szczególnymi obiektami w zastosowaniach fizycznych. Jeśli rozważymy przepływ cieczy w obszarze, szybkość pola wektorowego wskazuje prędkość i kierunek przepływu cieczy w tym punkcie. Inne przykłady pól wektorowych w fizyce klasycznej to pola elektryczne, magnetyczne i grawitacyjne.
1.6 Definicja Niech Xp będzie wektorem stycznym w otwartym otoczeniu U punktu p ∈ Rni niech f będzie funkcją C w U. Pochodna kierunkowa z f w punkcie p, w kierunku Xp jest zdefiniowana przez
(1.3)


gdzie f(p) jest gradientem funkcji f w punkcie p. Zapis
Xp(f) = ∇x(f)(p)
jest również często używany. Możemy myśleć o wektorze stycznym w punkcie jako operatorze w przestrzeni funkcji gładkich w otoczeniu tego punktu. Operator przypisuje do funkcji pochodną kierunkową funkcji w kierunku wektora. Łatwo jest uogólnić zapis pochodnej kierunkowej pól wektorowych przez zdefiniowanie X(f)(p) = Xp(f).
1.7 Twierdzenie Jeśli f,g ∈ CRn , a,b ∈ R a X jest polem wektorowym , wtedy
(1.4)     X(af + bg) = aX(f) + bX(g) ; X(fg) = fX(g) + gX(f)
Dowód tego twierdzenie wynika z fundamentalnych właściwości gradientu. Ilość w przestrzeni Euklidesowej która spełnia związek (1.4) jest nazywana pochodną liniową w przestrzeni funkcji gładkich. Słowo liniowa jest używane tu w zwykłym tego słowa znaczeniu liniowego operatora w algebrze liniowej, a słowo pochodna oznacza ,że operator spełnia zasadę Leibniza. Twierdzenie to jest ważne ponieważ charakteryzuje pola wektorowe we współrzędnych w sposób niezależny.
1.8 Twierdzenie. Liniowa pochodna w C(Rn) jest polem wektorowym.
Ten wynik pozwala nam zidentyfikować pola wektorowe z pochodnymi liniowymi. Ten krok jest sporym odejściem od zwykłego pojęcia wektora "rachunku". Dla geometry różniczkowego, wektor jest operatorem liniowym którego wejściem są funkcje. W każdym punkcie, wyjściem operatora jest pochodna kierunkowa funkcji w kierunku X. Niech p ∈ U będzie punktem i niech xi będzie współrzędną funkcji w U. Załóżmy ,że Xp = (X,p) gdzie składowe wektora euklidesowego X to a1,...,an. wtedy ,dla dowolnej funkcji f, wektor styczny Xp działa na f zgodnie ze wzorem
(1.5)


Jest więc naturalne zidentyfikowanie wektora stycznego Xp z operatorem różniczkowym
(1.6)


Będziemy używali konwencji Einsteina w celu powstrzymania się od symbolu sumowania kiedy wyrażenie zawiera powtarzające się indeksy. Zatem na przykład, powyższe równanie można zapisać
(1.7)


To równanie implikuje ,że działanie wektora Xp, działa na współrzędnych funkcji xi dając składni ai wektora. W podstawowym traktowaniu, wektory są często identyfikowane za pomocą składowych wektora, co może powodować pewne zamieszenie. Różnica między wektorem stycznym a polem wektorowym jest taka ,że w ostatnim przypadku, współczynniki ai są funkcjami gładkimi xi.Ilości


tworzą podstawę dla przestrzeni wektorowej Tp(Rn) w punkcie p, a dowolny wektor styczny może być zapisane jako liniowe połączenie tych wektorów podstawowych. Jednostki ai są nazywane kontrwariantnymi składowym wektora stycznego. Zatem ,na przykład , wektor euklidesowy w R3
X = 3i + 4j -3k
umieszczony w punkcie p, będzie odpowiadał wektorowi stycznemu



2. Krzywe w R3
1.9 Definicja Krzywa α(t) w R3 jest odwzorowaniem C z otwartego podzbioru R do R3. Krzywa przypisuje do każdej wartości parametru t ∈ R, punkt (x1(t), x2(t),x1(t)) w R3



Można myśleć o parametrze t jako reprezentacji czasu, a o krzywej α jako trajektorii cząstek ruchomych punktu.
1.10 Przykład
Niech
α(t) = (a1t + b1, a2t + b2, a3t + b3 )
To równanie przedstawia linię prostą prze punkt p = (b1,b2,b2) w kierunku wektora v = (a1,a2,a3)
1.11 Przykład Niech
α(t) = (acosωt, asinωt,bt)
ta krzywa jest nazywana linią śrubową zwyczajna. Geometrycznie, możemy pokazać krzywą jako ścieżkę opisaną przez przeciwprostokątną trójkąta z nachyleniem b, która jest zawinięta wokół cylindra kołowego o promieniu a. Rzut linii śrubowej na płaszczyznę xy jest okręgiem, a krzywa rośnie w stałym tempie w kierunku z. Od czasu do czasu wracamy do zapisu pozycji wektora
(1.8)   x(t) = (x1(t), x2(t),x3(t))
co jest bardziej rozpowszechnione w rachunku wektorowym i fizyce elementarnej. Oczywiście to co ta notacja rzeczywiście oznacza to
(1.9)   xit = (xi o α)(t)
gdzie xi są współrzędnymi funkcji gniazda w otwartym zbiorze R3.
1.12 Definicja Pochodna α′(t) krzywej jest nazywana prędkością wektora a druga pochodna α″(t) jest nazywana przyspieszeniem. Długość v = ||α′(t)|| prędkości wektora jest nazwana szybkością krzywej. Składowe prędkości wektora są po prostu dane przez
(1.10)   


a szybkość
(1.11)   


Różniczka dx klasycznej pozycji wektora jest dana przez
(1.12)   


i jest nazywana nieskończenie małym wektorem stycznym, a norma ||dx|| nieskończenie małego wektora stycznego jest nazywana różniczką długości łuku ds. Mamy
(1.13)   ds = ||dx|| vdt
Jak zobaczymy później, pojęcie nieskończenie małych obiektów musi być traktowane w bardziej rygorystycznie matematyczny sposób. W tym samym czasie, nie możemy odrzucić wielkiej intuicyjnej wartości tego pojęcia, jak wyobrażali sobie to mistrzowie , którzy wymyślili Rachunek. Zatem, w ten sposób w tym sensie , w nowoczesnej geometrii różniczkowej, prędkość wektora jest rzeczywiście wektorem stycznym a zatem powinna być widoczna jako pochodna liniowa w przestrzeni funkcji. Jest to pomocne przy odnoszeniu się do dx jako wektora tradycyjnego, który na poziomie nieskończenie małym, daje liniowe przybliżenie krzywej. jeśli f jest funkcją gładką w R3, formalnie definiujemy α′(t) we współrzędnych lokalnych wzorem
(1.14)   


Nowoczesny zapis jest bardziej dokładny, ponieważ bierze pod uwagę ,że prędkość ma część wektora jak również punkt przyłożenia. Przy danym punkcie na krzywej, prędkość krzywej działa na funkcję , uzyskując pochodną kierunkową tej funkcji w kierunku stycznym do krzywej w danym punkcie. Poniższy diagram dostarcza bardziej geometrycznej interpretacji wzoru (1.14) prędkości wektora. Odwzorowanie α(t) z R do R3 indukuje odwzorowanie α* z przestrzeni stycznej R do przestrzeni stycznej R3. Obraz α*(d/dt) w TR3 wektora stycznego d/dt jest tym co nazywamy α′(t)
α*(d/dt) = α′(t).
Ponieważ α′(t) jest wektorem stycznym w R3, działa na funkcjach w R3. Działanie α′(t) na funkcję f na R3 jest takie samo jak działanie d/dt na złożenie f o α .W szczególności, jeśli zastosujemy α′(t) do współrzędnych funkcji xi, uzyskali składowe wektora stycznego
(1.15)   


Odwzorowanie α* na przestrzeni stycznej indukowaną przez krzywą α jest nazywane posunięciem naprzód. Wiele osób używa zapisu dα dla oznaczenia posunięcia naprzód, ale my będziemy unikać takiego zapisu ponieważ nie wszyscy są zaznajomienia z interpretacją różniczek jako liniowym izomorfizmem w przestrzeni stycznej.
1.13 Definicja
Jeśli t = t(s) jest gładką funkcją rzeczywistą ,a α(t) jest krzywą w R3, mówimy ,że krzywa β = α(t(s)) jest reparametryzacją α. Wspólna reparametryzacja krzywej jest uzyskiwana przez zastosowanie długości łuku jako parametru. Używając tej reparametryzacji jest całkiem naturalne, ponieważ znamy z podstaw fizyki ,ze współczynnik zmian długości łuku jest tym co nazywamy szybkością
(1.16)   v = ds/ dt = ||α′(t)||.
Długość łuku jest uzyskiwana przez całowanie poniższego wzoru
(1.17)   


W praktyce jest to typowa trudność w znalezieniu wyraźnie sparametrezyowanej długości łuku krzywej ponieważ nie tylko musimy obliczyć całkę, ale również musimy móc znaleźć odwrotność funkcji t biorąc pod uwagę s .Z drugiej strony, z teoretycznego punktu widzenia, parametryzacje długości łańcucha są ideałami ponieważ dowolna krzywa jaką parametryzujemy, ma jednostkę szybkości. Powód tego faktu jest prostym zastosowaniem zasady łańcucha i twierdzenia o odwrotności funkcji
β′(s) = ]α(t(s))]′ =
α′(t(s)t′(s))=
α′(t(s))*1/s′(t(s)) =
α′(t(s)) / ||α′(t(s))||
a dowolny wektor podzielony przez swoją długoś jest jednostką wektora. Leibniz zapisał to ewidentniej


1.14 Przykład
Niech α(t) = (a cosωt, a sin&omegat, bt). Wtedy


Jednostka szybkości linii śrubowej jest dana przez
β(s) = (a cos ωs/c, a sin ωs/c,b ωs/c)
Trójścian Freneta
Niech β(s) będzie krzywą sparameryzowaną przez długość łuku i niech T(s) będzie wektorem
(1.18   ) T(s) = β′(s)
Wektor T(s) jest stycznym do krzywej i ma długość jednostkową. Dalej, będziemy nazywać T jednostką wektora stycznego. Różniczkując związek
(1.19)    T * T = 1
uzyskamy
(1.20)    2T * T′ = 0
więc możemy skonkludować ,że wektor T′ jest ortogonalna do T. Niech N będzie wektorem jednostkowym ortogonalnym do T i niech K będzie skalarem takim ,że
(1.21)   T′(s) = KN(s)
Nazywamy N jednostką prostopadłą di krzywej , a K krzywizną. Biorąc długość obu stron ostatniego równania, przypomnijmy sobie ,że N ma długość jednostkową ,stąd dedukujemy ,że
(1.22)   K = ||T′(s)||
Ma sens wywołanie krzywizny K ponieważ jeśli T jest wektorem jednostkowym, wtedy T′ jest niezerowy tylko jeśli kierunek T jest zmieniany. Szybkość zmian kierunku wektora stycznego jest właśnie tym czego możemy oczekiwać mierząc jak krzywa jest krzywizną. W szczególności, T′ = 0 przy określonym punkcie, oczekujemy ,że przy tym punkcie, krzywa jest lokalnie dobrze aproksymowana do linii prostej. Teraz wprowadzimy trzeci wektor
(1.23)   B = T x N
który będzie nazywany wektorem binormalnym. Trójka wektorów (T,N,B) formuje zbiór ortogonalny; to znaczy
T*T = N*N = B*B = 1
T*N = T*B = N*B = 0
Jeśli zróżniczkujemy relację B*B = 1, odkryjemy ,że B*B′ = 0 ,zatem B′ jest ortogonalny do B. Różniczkując równanie T*B=0, otrzymujemy
B′*T + B*T′ = 0
przepisując ostatnie równanie
B′*T = -T′*B = -KN*B = 0
również stwierdzamy ,że B&primel musi być również ortogonalne do T. To może się wydarzyć tylko jeśli B′ jest ortogonalne do płaszczyzny TB, więc B′ musi być proporcjonalne do N. Innymi słowy musimy mieć
B′(s) = -τN(s)
dla pewnej jednostki τ, którą nazywamy skręceniem. Torsja jest podobna do krzywizny w tym sensie ,że mierzy szybkość zmian binormalnych. Ponieważ binromalne również maja długość jednostkową, jedyny sposób aby mieć niezerową pochodną jest to czy B zmienia kierunki. Jednostka B′ mierzy wtedy szybkość zmian w kierunku góra dół obserwatora który porusza się po krzywej zawsze do przodu w kierunku wektora stycznego. Zbiór podstawowych wektorów {T,N,B} jest nazywana trójścianem Freneta. Zaletą tego jest to ,że trójścian Freneta jest naturalnie adoptowany do krzywej. Rozprzestrzenia się wraz z krzywą z wektora stycznego zawsze wskazując w kierunku ruchu, podczas gdy wektory normalne i binormalne wskazują w kierunku w którym krzywa ma tendencję do zakrzywiania. W szczególności, całkowity opis jak krzywa jest zakrzywiana można uzyskać przez obliczenie szybkości zmian rami w odniesieniu do samej ramki.
1.15 Twierdzenie Niech β(s) b będzie szybkością jednostkową krzywej z krzywizną K i torsją τ Wtedy


Dowód: Musimy tylko ustanowić równanie dl N′ Różniczkując równanie N*N = 1, uzyskamy 2N*N′ = 0 więc N&primel jest ortogonalne do N. Zatem, n′ musi być liniowym połączeniem T i B.
N′ = aT +bB
Biorąc iloczyn skalarny ostatniego równania z T i B, odpowiednio, widzimy ,że
a = N&primel*T i b = N′ * B
Z drugiej strony, różniczkując równania N*T=0 i N*B = 0, odkryjemy ,że
N′*T = -N*T′ = -N*(KN) = -K
N′ * B = -N *B′ = -N*(-τN) = τ
Konkludujmey ,że a = -K , b = τ a zatem
N&primel = -KT + τB
Równania trójścianu Freneta (1.26) ,mogą być również zapisane w formie macierzy
(1.27)   


Pojawienie się antysymetrycznej macierzy w równaniach Freneta nie jest całkiem przypadkowe. Poniższe twierdzenie dostarcza metod obliczeniowych do obliczenia krzywizny i torsji bezpośrednio z równania danej szybkości jednostkowej krzywej.
1.16 Twierdzenie Niech β(s) będzie szybkością jednostkową krzywej z krzywizną K > 0 i torsji τ Wtedy
(1.28)    p align="left">
Dowód: Jeśli β(s) jest szybkością jednostkową krzywej, mamy β′(s) = T, Wtedy


1.17 Przykład Rozważmy okrąg o promieniu r , którego równanie jest dane przez
α(t) = (r cost, r sint,0)
Wtedy


Dlatego też ds/dt = r a s = rt, co możemy rozpoznać jako wzór na długość łuku okręgu o promieniu t, osadzonego przez kąt środkowy , którego miarą jest t radianów. Konkludujemy ,że
β(s) = (-r sin*s/r, r cos s/r, 0 )
jest reparametryzowaną jednością szybkości. Krzywizna okręgu może być teraz łatwo wyliczona


Jest to bardzo prostym ale bardzo ważnym przykładem. Fakt ,że dla okręgu o promieniu r krzywizna to K = /r może nie być bardziej intuicyjna. mały okrąg ma dużą krzywiznę a duży okrąg ma małą krzywiznę. Ponieważ promień okręgu dąży do nieskończoności, okrąg lokalnie wygląda coraz bardziej jak linia prosta ,a krzywizna dąży do zera. Gdybyśmy spacerowali wzdłuż dużego koła na bardzo dużej kuli (jak Ziemia) postrzegane przestrzenie byłyby lokalnie płaskie.
1.18 Twierdzenie Niech α(t) będzie krzywą prędkości V, przyspieszenia A, prędkości b i krzywizny K, wtedy
(1.29) V = vT ; A = dv/dt * T + v2KN
Dowód: Niech s(t) będzie długością łuku i niech β(s) będzie reparametryzowaną jednostkową szybkością. Wtedy α(t) = β(s(t)) i z zasady łańcucha


Równanie 1.29 jest ważne w fizyce. Równanie stanowi ,że cząsteczki przesuwają się wzdłuż krzywej w w przestrzeni czują się składową przyspieszenia wzdłuż kierunku ruchu, gdy następuje zmiana prędkości i przyspieszenia dośrodkowego w kierunku prostopadłym , kiedy zmienia się kierunek. Przyspieszenie dośrodkowe i dowolny punkt to
a = v3K = v2/r
gdzie r jest promieniem okręgu który ma maksymalny styczny kontakt z krzywą w dowolnym punkcie. Ten styczny okrąg jest nazywany kołem krzywizny ,Koło krzywizny może być przewidziany przez proces graniczny podobny do tego ze styczną do krzywej w rachunku różniczkowym. Niech p będzie punktem na krzywej, i niech q1 i q2 dwoma pobliskimi punktami. Te trzy punkty określają jednoznaczny okrąg. Ten okrąg jest "siecznym" przybliżeniem di stycznego okręgu. Ponieważ q1 i q1 podchodzą do punktu p, "sieczny" okrąg podchodzi pod koło krzywizny. Koło krzywizny zawsze leży na płaszczyźnie TN, która ,przez analogię, jest nazywana płaszczyzną krzywizny.
1.19 Przykład (Linia śrubowa)


Upraszczając ostatni przykład i zastępując wartości c, mamy


Zauważ ,że jeśli b = 0 linia śrubowa rozwija się do okręgu na płaszczyźnie xy. W tym przypadku powyższe wzory redukują się do K = 1/a i τ = 0. Współczynnik k/τ = aω/b jest szczególnym uproszczeniem. Dowolna krzywa gdzie K/τ = stała, jest nazywana linią śrubową, której linia śrubowa zwyczajna jest specjalny przypadkiem.
1.20 Przykład (Krzywe płaskie) Niech α(t) = (x(t),y(t),0) Wtedy
α′ = (x′,y′-,0)


1.21 Przykład (Spirala Cornu) Niech &beta(s) = (x(s),y(s),0), gdzie


Wtedy używając fundamentalnego twierdzenia rachunku, mamy


Ponieważ ||β′ = v = 1||, krzywa jest jednostkową szybkością, a s jest rzeczywiście długością łuku. Krzywizna jest spiralą Cornu daną przez


Całki (1.30) definiujące współrzędne spirali Cornu są klasycznymi całkami Fresnela. Funkcje te ,jak również sama spirala powstaje w obliczeniu dyfrakcji spójnej wiązki światła przez prosty brzeg. w przypadku gdy dana krzywa α(t) nie jest szybkością jednostkową, poniższe twierdzenie dostarcza wzorów do obliczania krzywizn i skręceń w odniesieniu do α
1.22 Twierdzenie Jeśli α(t) jest krzywą regularną w R3 wtedy
(1.31, 1.32)
gdzie (α′ ,α″ , α''' ) w iloczynie trzech wektorów [&alpha';x x &alpha′]*α'''
Dowód:


Jak widać α' x α′ jest proporcjonalne do B



3.Fundamentalne twierdzenie o krzywych
Pewien geometryczny wgląd w znaczenie krzywizn i skręceń można uzyskać przez rozważenie rozwinięcia szeregu Taylora dowolnej krzywej o jednostkowej szybkości β(s) o s = 0
(1.33)   


Ponieważ zakładamy ,że s jest parametrem długości łuku


Utrzymując tylko najniższe wyrazy w składowych T,N i B, otrzymujemy pierwsze przybliżenie Freneta do krzywej
(1.34)   


Pierwsze dwa wyrazy przedstawiają liniowe przybliżenie do krzywej. Pierwsze trzy wyrazy aproksymują krzywą przez parabolę która leży na płaszczyźnie krzywizny (płaszczyzna TN). Jeśli K0 wtedy lokalnie krzywa wygląda jak linia prosta. Jeśli &tao;0, wtedy lokalnie krzywa jest krzywą płaską która leży na płaszczyźnie krzywizny. W tym sensie, krzywiznę mierzymy odchyleniem krzywej od linii prostej a skręcenie (znane również jako druga krzywizna) mierzy odchyleniem krzywej od krzywej płaskiej.
1.23 Twierdzenie (Fundamentalne twierdzenie o krzywych) Niech K(s) i τ(s), (s > 0) będą dwoma funkcjami analitycznymi. Wtedy istnieją jednoznaczne krzywe (jednoznaczne do swoich pozycji w R3) dla tych s jest długością łuku , k(s) ich krzywizną a τ(s) ich skręceniami.
Dowód: Wybierz punkt w R3. Przez odpowiednie przekształcenia afiniczne możemy założyć ,że ten punkt jest początkowy wybieramy układ ortogonalny {T,N B}. Krzywa jest wtedy określona jednoznacznie przez jej rozwinięcie taylorowskie w trójścianie Freneta jak w równaniu (1.34)
1.24 Uwaga. Możliwe jest udowodnienie tego twierdzenia zakładając tylko że K(s) i τ(s) są ciągłe. Dowód jednak staje się dużo trudniejszy.
1.25 Twierdzenie Krzywa z K = ) jest częścią linii prostej.
1.26 Twierdzenie Krzywa α(t) z τ = 0 jest krzywą płaską.
Dowód: Jeśli τ = 0, wtedy (α′α″α''') = 0 Oznacza to ,że te trzy wektory α′, α″ ,α''' są liniowo zależne a zatem istnieją funkcje a1(s), a2(s) i a3(s) takie ,że
a3α''' + a2α'' + a1α' = 0
To liniowo jednorodne równanie będzie miało rozwiązanie w postaci
α = c1(s)α1 + c2α2 + c3, ci(s) = stałe wektory
Ta krzywa leży na płaszczyźnie
(x - c3)*n = 0 , gdzie n = c1 x c2

CZĘŚĆ II : Formy różniczkowe

1.1-Formy
Jednym z najbardziej zagadkowych pomysłów w rachunku elementarnym jest idea różniczek. W zwykłej definicji, różniczka zmiennej zależnej y =f(x), jest dana w odniesieniu do różniczki zmiennej niezależnej dy = f′(x)dx. Problem jest z jednostką dx. Co oznacza dx? Jaka jest różnica między Δx a dx? O ile "mniejsze" niż Δx musi być dx? Nie ma trywialnych rozwiązań w tej kwestii. Większość tekstów traktuje dx jako arbitralnie małą jednostkę, lub przez proste odniesienie do dx jako nieskończenie małej (termin wprowadzony przez Newtona dla idei, która nie może być wyraźnie zdefiniowana w danym czasie.). W tej części wprowadzimy narzędzia liniowo algebraiczne, które pozwolą nam na interpretację różniczek w odniesieniu do operatorów liniowych
2.1 Definicja Niech p ∈ Rn, i niech Tp(Rn) będą przestrzeniami stycznymi przy p. 1-forma przy p jest liniowym odwzorowaniem Φ z Tp(Rn) do R. Przypomnijmy ,że takie odwzorowanie musi spełniać następujące właściwości
(2.1)   Φ(Xp) ∈ R, ∀Xp ∈ Rn , Φ(aXp + bYp) = aΦ(Xp) + bΦ(Yp), ∀a,b ∈ R, Xp, Yp ∈ Tp(Rn
1-forma jest gładkim wyborem liniowego odwzorowania Φ jak powyżej dla każdego punktu w przestrzeni.
2.2 Definicja Niech f:Rn → R będzie funkcją rzeczywistą C. Zdefiniujemy różniczkę df funkcji jako 1-formę taką ,że
(2.2)   df(X) = X(f)
dla każdego pola wektorowego w X w Rn. Innymi słowami , przy dowolnym punkcie p , różniczka df funkcji jest operatorem który przypisuje do wektora stycznego Xp, pochodną kierunkową funkcji w kierunku tego wektora
(2.3)    df(X)(p) = Xp(f) = f(p) * Xp
W szczególności, jeśli stosujemy różniczkowanie współrzędnych funkcji xi do podstawowych pól wektorowych, otrzymamy
(2.4)   


Zbiór wszystkich liniowych funkcjonalności na przestrzeni wektorowej jest nazywany sprzężoną przestrzenią wektorową. Jest standardowe twierdzenie w algebrze liniowej, że sprzężona przestrzeń wektorowa jest również przestrzenia wektorową tego samego wymiaru. Zatem, przestrzeń Tp*Rn wszystkich 1-form przy p jest przestrzenią wektorową która jest sprzężoną przestrzenią styczną TpRn. Przestrzeń Tp*Rn jest nazywana przestrzenią kostyczną Rn1)p,...,(dxn)p} konstytuuje podstawę przestrzeni kostycznej która jest sprzężona ze standardową podstawą {(∂/∂x1)p,...,(∂/∂xn)p} przestrzeni stycznej. Suma wszystkich przestrzeni kostycznych jako zakresy p wszystkich punktów w Rn jest nazywana wiązką kostyczną T*(Rn).
2.3 Twierdzenie Niech f będzie funkcją gładką w Rn i niech {x1,...,xn} będą współrzędnymi funkcji w otoczeniu U punktu p. Wtedy różniczka df jest dana lokalnie przez wyrażenie
(2.5)   


Dowód: Różniczka df jest z definicji 1-formą, więc przy każdym punkcie, musi być wyrażona jako liniowe połączenie podstawowych elementów {(dx1)p,...,(dxn)p}. dlatego dla udowodnienia tego twierdzenia wystarczy wykazać ,że wyrażenie 2.5 stosuje sie do dowolnego wektora stycznego, pokrywająca się definicją 2.2. Aby to zobaczyć, rozważmy wektor stycznych Xp = aj(∂/∂xj)p i stosujemy powyższe wyrażenie
(2.6)    


Definicja różniczek jako funkcjonałów liniowych na przestrzeni pól wektorowych jest o wiele bardziej satysfakcjonująca niż pojęcie nieskończenie małych ,ponieważ definicja jest oparta na ścisłych mechanizmach algebry liniowej. Jeśli α jest dowolną 1-formą, wtedy lokalnie
(2.7) α = a1(x)dx1 + ,...,+ an(x)dxn
gdzie współczynniki ai są funkcjami C. 1-forma jest również nazywana tensorem kowariantnym stopnia 1, lub po prostu kowektorem. Współczynniki (a1,...,an) są nazywane składowymi kowariantnymi kowektora z przypisem dolnym. Fizycy często odnoszą się do składowej kowariantnej 1-formy jako wektora kowariantnego a to powoduje pewne zamieszanie o pozycję wskaźnika. Podkreślmy ,że nie wszystkie 1-formy są uzyskiwane przez różniczkowanie funkcji. Jeśli istnieje funkcja f, taka ,że α - df, wtedy 1-forms α jest nazywana zupełną. W rachunku wektorowym i fizyce elementarnej. formy zupełne są istotne dla zrozumienia drogi niezależnej linii całek konserwatywnych pół wektorowych. Jak już zauważyliśmy, przestrzeń kostyczna T*p(Rn) 1-formy przy punkcie p ma strukturę naturalnej przestrzenie wektorowej. Łatwo możemy rozszerzyć działania dodawania i mnożenia skalarnego na przestrzeń wszystkich 1-form przez zdefiniowanie
(2.8)   (α+β)(X) = α(X) + β(X) , (fα)(X) = fα(X)
dla wszystkich pól wektorowych X i wszystkich funkcji gładkich f.

2.Tensory i formy wyższego stopnia
Jak wspomnieliśmy wcześniej, zapis różniczki dx nie jest dość precyzyjny w elementarnym podejściu rachunku, więc w konsekwencji, obszar różniczkowalny dxdy w R2, jak również różniczkowalny obszar powierzchniowy w R3 również musi być przedstawiony w sposób bardziej rygorystyczny. Do tego celu , wprowadzimy nowy typ mnożenia między formami które nie tylko oddaje istotę różniczkowania powierzchni i objętości ,ale również dostarcza bogatej algebraicznej i geometrycznej struktury, która jest rozległym uogólnieniem iloczynu wektorowego (który ma tylko sens w R3) w przestrzeni euklidesowej wszystkich wymiarów.
2.4 Definicja Przekształcenie ΦLT(Rn) x T(Rn) → R jest nazywane bilineranym przekształceniem na przestrzenie stycznej , jeśli jest liniowe w każdym gnieździe. Tzn.


Iloczyn tensorowy
2.5 Definicja Niech α i β będą 1-formami. Iloczyn tensorowy α i β jest określony jako bilinearne przekształcenie α ⊗ β takie ,że
(2.9)    (α ⊗ β)(X,Y) = α(X)β(Y)
dla wszystkich pól wektorowych X i Y. Zatem na przykład, jeśli α = aidxi a βjdxj, wtedy


Forma T = Tijdxi⊗dxj jest nazywana tensorem kowariantnym stopnia 2 i możemy myśleć o zbiorze {dxi ⊗ dxj} jako podstawie dla wszystkich takich tensorów. Ale musimy uważać czytając, ponieważ istnieje możliwość pomyłki przy położeniu indeksów, ponieważ fizycy często odnoszą się do składowej Tij jako tensora kowariantnego. W podobny sposób można zdefiniować iloczyn tensorowy wektorów X i Y jako bilinearne przekształcenie X ⊗ Y takie ,że
(2.10)   (X ⊗ Y)(f,g) = X(f)Y(g)
dla dowolnej pary funkcji f i g
Jeśli X = ai ∂/∂xi i Y = bj ∂/∂xj, wtedy składowe X ⊗ Y w podstawie ∂/∂xi ⊗ ∂/∂xj są po prostu dane przez aibj. Bilinerane przekształcenie postaci
(2.11)   T = Tij ∂/∂xi ⊗ ∂/∂xj
jest nazywane tensorem kontrawariantnym stopnia 2 w Rn. Zapis iloczynu tensorowego może być łatwo uogólniony na wyższy stopień i faktycznie można mieć tensory o mieszanych stopniach. Na przykład, tensor kontrwariantny stopnia 2 i kowariantny stopnia 1 w Rn jest przedstawiany w lokalnych współrzędnych przez wyrażenie w postaci
T = Tijk∂/∂xj ⊗∂/∂xj ⊗dxk
Taki obiekt jest również nazywany tensorem typu T2,1. Zatem możemy myśleć o tensorze typu T2,1 jako przekształceniu z trzema wejściowymi gniazdami. Przekształcenie oczekuje dwóch funkcji w pierwszych dwóch gniazdach i wektora w trzecim. Działanie przekształcenia jest bilinearne na tych dwóch funkcjach i liniowe na wektorze. Daną wyjściową jest liczba rzeczywista. Przypisanie tensora do każdego punktu w Rn jest nazywane polem tensorowym.
Iloczyn skalarny
Niech X = ai ∂/∂xi i Y = bj ∂/∂xj będą dwoma polami wektorowymi i niech
(2.12)   g(X,Y) = δijaij
Jednostka g(X,Y) jest przykładem przekształcenia bilinearnego które można rozpoznać jako zwykły iloczyn skalarny.
2.6 Definicja Przekształcenie bilinearne g(X,Y) na przestrzeni stycznej jest nazywane wektorowym iloczynem skalarnym jeśli
1. g(X,Y) = g(Y,X)
2. g(X,Y) ≥ 0, ∀X
3. g(X,Y) = o , jeśli X = 0
Ponieważ zakładamy g(X,Y) jako bilinerane, iloczyn skalarny jest całkowicie określony przez działanie na uporządkowanej parze podstawowych wektorów. Składowe gij iloczynu skalarnego są zatem dane przez
(2.13)   g(∂/∂xi),∂/∂xj) = gij
gdzie gij jest symetryczną macierzą n x x, gdzie można założyć ,że będzie nieosobliwą. Z liniowości łatwo zauważyć ,że jeśli X = ai ∂/∂xi i Y = bj ∂/∂xj są dwoma arbitralnymi wektorami, wtedy
g(X,Y) = gijaibj
W tym sensie, iloczyn skalarny może być widziany jako uogólnienie iloczynu wektorowego. Standardowy euklidesowy iloczyn skalarny jest uzyskiwany jeśli weźmiemy gij = δij. W tym przypadku jednostka g(X,X) = ||X||2 dając kwadrat długości wektorów. Z tego powodu gij jest również nazywane metryką a hg tensorem metrycznym. Inna interpretacja iloczynu skalarnego może być widoczna jeśli zamiast jednego rozpatrzymy wektor X = ai ∂/∂xi i 1-formę α = bjdxj. Działanie 1-formy na wektor daje


Jeśli teraz zdefiniujemy
(2.14)   bi = gijbj
zobaczymy ,że powyższe równanie można przepisać jako
aibj = gijaibj
i odkryć wyrażenia na iloczyn skalarny
Równanie (2.14) pokazuje ,że metryka może być użyta jako mechanizm dla niższych indeksów, zatem przekształcenia składowych kontrwariantnych wektora do kowariantnych. Jeśli gij będzie odwrotnością macierzy gij to znaczy
(2.15)   gikgkj = δij
możemy również podnieść indeksy kowariantne przez równanie
(2.16)   bi = gijbj
Wspomnieliśmy ,że przestrzeń styczna i kostyczna przestrzeni euklidesowej przy określonym punkcie są izomorficzne. Ze względu na powyższe omówienie, widzimy ,że metryka akceptuje podwójną interpretację; jedną jako bilinearne parowanie dwóch wektorów
g:T(Rn) T(Rn) → R
i drugą jako liniowy izomorfizm
g:T*(Rn) → T(Rn)
który przekształca wektory do kowektorów i vice-versa. W podstawowych zabiegach rachunku, autorzy często ignorują subtelności różniczkowania 1-formy i iloczynu tensorowego i definiują różniczkę długości łuku jako
ds2 ≡ gijdxidxj,
chociaż, to co naprawdę rozumie się przez takie wyrażenie to
(2.17)   ds2 ≡ gijdxi ⊗dxj
2.7 Przykład We współrzędnych cylindrycznych, różniczka długości łuku to
(2.18)    ds2 = dr2 + r22 + dz2
W tym przypadku, tensor metryczny ma składowe
(2.19)   


2.8 Przykład We współrzędnych sferycznych
(2.20)   x = ρsinθcosφ , y = ρsinθsinφ , z = ρcosθ
różniczka długości łuku jest dana przez
(2.21)   ds2 = dρ2 + ρ22 + ρ2sin2θdφ2
W tym przypadku tensor metryczny ma składowe
(2.22)   


Przestrzeń Minkowskiego
Ważnym obiektem w fizyce matematycznej jest tak zwana przestrzeń Minkowskiego, która może być zdefiniowana jako para. Niech (M1,3,g) będzie parą , gdzie
(2.23)   M(1,3) = {(t,x1, x2, x3) | t,xi ∈ R}
a g jest przekształceniem bilineranym takim ,że
(2.24)   g(X,X) = -t2 + (x1)2 + (x2)2 + (x3)2
Macierz przedstawiająca metrykę Minkowskiego g jest dana przez
g = diag(-1,1,1,1)
w przypadku której, różniczka długości łuku jest dana przez
(2.25)   


Uwaga: Z technicznego punktu widzenia, metryka Minkowskiego nie jest w rzeczywistości metryką , ponieważ g(X,X) = 0 nie implikuje ,że X = 0. Wektory niezerowe z długością zero są nazywane wektorami świetlnymi i są powiązane z cząsteczkami które podróżują z prędkością światła (które możemy ustawić na 1 w naszym systemie jednostek). Metryka Minkowskiego gμv i jej macierz odwrotna gμv są również używane do podnoszenia i opuszczania indeksów w przestrzeni w sposób całkowicie analogiczny do Rn. Zatem ,na przykład, jeśli A jest wektorem kowariantnym ze składowymi
Aμ = (ρ,A1,A2,A3)
wtedy składowe kontrwariantne A to
Aμ = gμvAv = (-ρ.A1,A2,A3)
Iloczyn klinowy i n-Formy
2.9 Definicja Przekształcenie Φ:T(Rn) x T(Rn) → R jest nazywane naprzemiennym jeśli
Φ(X,Y) = - Φ(Y,X)
Właściwość naprzemienności jest reminiscencją wyznaczników macierzy kwadratowych, które zmieniają znak jeśli dowolne dwie kolumny wektorów są przełączone. Faktycznie, wyznacznik funkcji jest doskonałym przykładem naprzemiennego bilinearnego przekształcenia w przestrzeni M2x2 macierzy dwa na dwa. Oczywiście, dla stosowania powyższej definicji musimy widzieć M2x jako przestrzeń wektorów kolumnowych
2.10 Definicja 2-forma Φ jest przekształceniem Φ:T(Rn) x T(Rn) → R danym równaniem
(2.26)    (α ∧ β)(X,Y) = α(X)β(Y) - α(Y)β(X)
2.12 Twierdzenie Jeśli α i β są 1-formami, wtedy α ∧ β to 2-forma.
Dowód: Podzielimy dowód na dwa lematy
2.13 Lemat Iloczyn klinowy dwóch 1-form jest naprzemienny
Dowód: Niech α i β będą 1-formami w Rn i niech X i Y będą dowolnymi dwoma polami wektorowymi, wtedy


2.14 Lemat Iloczyn klinowy dwóch 1-form jest bilinearny
Dowód: Rozważmy 1-formy ,αβ, pola wektorowe X1,X2,Y i funkcje f1, F2. Wtedy, ponieważ 1-formy są liniowo funkcjonalne, uzyskujemy


Dowód liniowości drugiego gniazda jest całkiem podobny
2.15 Następstwo Jeśli α i β są 1-formami, wtedy
(2.27)   α ∧ β = -β∧α
Ten ostatni wynik mówi nam ,że iloczyny klinowe maja charakterystyki podobne do iloczynu wektorowego wektorów w tym sensie ,że oba te iloczyny są anty-przemienne. Oznacza to ,że musimy być ostrożni przy wprowadzaniu znaku minus za każdym razem kiedy zmieniamy kolejność działań. Zatem na przykład, mamy
dxi ∧ dxj = -dxj ∧ dxi
jeśli i ≠ j, podczas gdy
dxi ∧ dxi = -dxi ∧ dxi = 0
ponieważ dowolna jednostka która jest równa własnej wartości ujemnej musi zniknąć. Podobieństwo między iloczynami klinowymi jest nawet bardziej uderzające w kolejnych twierdzeniach ale zaakcentujemy ponownie ,że iloczyny klinowe są o wiele silniejsze niż iloczyny wektorowe ponieważ iloczyny klinowe mogą by wyliczane w dowolnym wymiarze.
2.16 Twierdzenie Niech α = Aidxi i β=Bidxi będą dwoma 1-formami w Rn Wtedy
(2.28)   α ∧ β = (AiBj)dxij
Dowód: Niech X i Y będą dowolnymi polami wektorowymi. Wtedy


Z powodu antysymetrii iloczynu klinowego ostatnie równanie może być również zapisane jako


W szczególności ,jeśli n = 3, wtedy współczynniki iloczynu klinowego są składowymi iloczynu wektorowego A = A1i + A2j + A3k i B = B1i + B2j + B3k
2.17 Przykład Niech α = x2dx - y2dy i β = dx + dy - 2xydx. Wtedy


2.18 Przykład Niech x = r cos θ i y = r sin θ .Wtedy
(2.29)   


2.19 Uwagi
1.Wynik ostatniego przykładu pozwala na zapoznanie z różniczkowanie obszaru we współrzędnych biegunowych
2.Różniczkpowanie obszaru we współrzędnych biegunowych jest specjalnym przykładem twierdzenia zmiany współrzędnych dla wielokrotnych całek. Łatwo jest ustanowić ,że jeśli x = f1(u,v) i y =f2(u,v), wtedy dx ∧ dy = det|J| du ∧ dv, gdzie det|J| jest wyznacznikiem transformacji Jacobiego
3.Jednostki takie jak dxdy i dydz które często pojawiają się w rachunku różniczkowym, nie są dobrze zdefiniowane. W większości przypadków należy przez to rozumieć jednostki które są iloczynami klinowymi 1-form
4.Ustalimy (bez dowodu) ,że wszystkie 2-formy Φ w Rn mogą być wyrażone jako liniowe połączenia iloczynów klinowych różniczek takie jak
(2.30) Φ=Fijdxi ∧ dxj
W bardziej elementarnym podejściu do tego tematu możemy po prostu zdefiniować 2-formy wyglądające jak te jednostki w równaniu (2.30)
2.20 Definicja 3-forma Φ w Rn jest obiektem następującego typu
(2.31) Φ = Aijkdxi ∧ dxj ∧ dxk
gdzie zakładamy ,że iloczyn klinowy trzech 1-form jest łączny ale jeszcze naprzemienny w tym sensie ,że jeśli przełączamy dwie różniczki, wtedy całe wyrażenie zmienia znak na minus. Niech czytelnik wymyśli ścisłą definicję 3-form (lub n-form) bardziej w duchu wieloliniowego przekształcenia. Nie ma nic złego w użyciu 3-form. A teraz trochę kombinatoryki. Policzmy kilka form różniczkowych w przestrzeni euklidesowej. Chcemy zliczyć wymiary przestrzeni k-form w Rn w sensie przestrzeni wektorowej. Myślimy o 0-formach jako podstawowych funkcjach. Ponieważ funkcje są "skalarami", przestrzeń 0-form jako przestrzeń wektorowa ma wymiar 1


3 Pochodne zewnętrzne
W tej części wprowadzimy operator różniczkowania , który uogólnia operatory gradinetu, rotacji i rozbieżności. Oznaczmy przez ∧m(p)(Rn) przestrzeń m-form przy p ∈ Rn. Ta przestrzeń wektorowa ma wymiar
dim∧m(p)(Rn) = n!/m!(n-m)!
dla m ≤ n i wymiaru 0 jeśli m > n. Zidentyfikujemy ∧0(p) (Rn) z przestrzeni funkcji C przy p. Również nazwiemy ∧m(Rn) sumy wszystkich ∧m(p)(Rn) przy zakresie p przechodzący przez wszystkie punkty w Rn. Innymi słowy ,mamy


Jeśli α ∈(Rn),wtedy α może być zapisane w postaci
(2.32)   α = Ai1,...,im(x)dxi1 ∧... dxim
2.21 Definicja Niech α będzie m-formą (zapisaną we współrzędnych jak w równaniu (2.32)). Pochodna zewnętrzna z α jest to (m+1-forma)dα daną przez
(2.33)   


W specjalnym przypadku, kiedy α jest 0-formą, czyli funkcją , zapisujemy
df=∂f/∂xi * dxi
2.2 Twierdzenie
(2.34)   


Dowód:
a) Oczywisty z równania (2.32)
b) Najpierw udowodnimy twierdzenie dla α = f ∈∧0. Mamy


Teraz załóżmy ,że α przedstawia lokalnie jak w równaniu (2.32). Wynika z (2.33) ,że
d(dα) = d(dAi1,...,im) ∧ dxi0 ∧ dxi1...dxim = 0
c) Niech α ∈ ∧p, β ∈ ∧q. Wtedy możemy zapisać
(2.35)   


Z definicji
α ∧ β = Ai1...ipBj1...jq(dxi1 ∧ ... ∧ dxip) ∧ (dxj1 ∧ ... ∧ dxjq)
Teraz bierzemy pochodną zewnętrzną z ostatniego równanie biorąc pod uwagę ,że d(fg) = fdg + gdf dla dowolnych funkcji f i g. Uzyskujemy
(2.36)   


Współczynnik (-1)p dołącza ponieważ przekazuje wyraz dBj1...jp przez p 1-form typu dxi, musi wykonać p transpozycji
2.23 Przykład Niech α = P(x,y)dx + Q(x,y)dβ Wtedy
(2.37)


Przykład ten jest powiązany z twierdzeniem Greena w R2
2.24 Przykład Niech α = M(x,y)dx + N(x,y)dy, i załóżmy ,że dα = 0. wtedy, z poprzedniego przykładu


Zatem, dα = 0 jeśli Nx = My co implikuje ,że N = fyM a Mx dla pewnej funkcji C1 f(x,y). Zatem
α = fxdx + fydf = df
Czytelnik powinien również być zapoznany z tym przykładem w kontekście dokładnych równań różniczkowych pierwszego rzędu.
2.25 Definicja Forma różniczkowa α jest nazywana dokładną jeśli dα = 0
2.26 Definicja Forma różniczkowa α jest nazywana zamkniętą jeśli istnieje forma β taka ,że α = dβ. Ponieważ d o d = 0, jasne jest ,że forma zamknięta jest również dokładna
2.27 Lemat Poincare W prostej przestrzeni spójnej (takiej ka Rn), jeśli różniczka jest dokładna wtedy jest zamknięta.
Hipoteza zakładająca , że przestrzeń musi być po prostu spójna jest nieco subtelna. Warunek jest przypomnienie twierdzenia o całkach Cauchy′ego dla funkcji zmiennych zespolonych, które stanowi ,że jeśli f(z) jest funkcją holomorficzną a C jest prostą krzywą zamkniętą, wtedy


To twierdzenie się nie sprawdza jeśli region ograniczony przez krzywą C nie jest po prostu spójny. Standardowym przykładem jest całkowanie zespolonej 1-formy ω = (1/z)dz wokół koła jednostkowego C ograniczonego dyskiem z usuniętymi punktami. W tym przypadku


4.Operator Hodge′a *
Jedną z ważniejszych rzeczy w algebrze liniowej jest to ,że wszystkie przestrzenie wektorowe skończonego wymiaru n są izomorficzne względem siebie. Zatem na przykład, przestrzeń P3 wszystkich rzeczywistych wielomianów w x stopnia 3 i przestrzeń M2x2 rzeczywistych macierzy 2 na 3, zasadniczo nie różnią się od euklidesowej przestrzeni wektorowej R4 w odniesieniu do właściwości ich przestrzeni wektorowych. Dobrym przykładem tego jest przestrzeń styczna TpR3. Część "wektorowa" a1∂/∂x + a2∂/∂y + a3∂/∂z może być przekształcona do wektora regularnego rachunku różniczkowego i całkowego a1i + a2j + a3ik, przez zastąpienie ∂/∂x przez i, ∂/∂y przez j i ∂/∂z przez k. Oczywiście, nie wolno nam mylić wektora stycznego który jest liniowym operatorem z wektorem euklidesowym który jest tylko uporządkowaną trójką, ale o ile ich właściwości przestrzeni wektorowej, zasadniczo nie ma żądnej różnicy. Zaobserwowaliśmy również ,że przestrzeń styczna TpRn jest izomorficzna do przestrzeni kostycznej Tp*RN/ W tym przypadku , izomorfizm przestrzeni wektorowej przekształca standardowe podstawowe wektory {∂/∂x1} do ich dualności {dxi}. Ten izomorfizm potem przekształca wektor kontrwariantny do wektora kowariantnego. Innego ciekawego przykładu dostarczają przestrzenie ∧p1(R3) i ∧p2(R3) , oba o wymiarze 3. Wynika z tego ,że te dwie przestrzenie muszą być izomorficzne. W tym przypadku, izomorfizm jest dana przez przekształcenie
(2.38)   dx → dy ∧ dz , dy → -dx ∧ dz , dz → dx ∧ dy
Genialniej, widzimy ,że wymiar przestrzeni m-form w Rn jest dany przez współczynniki binomialne

.Ponieważ


to musi być przypadek ,że
(2.39)   ∧p>m(Rn)≅ ∧p>m(Rn-m)
Dla opisu izomorfizmu między tymi dwoma przestrzeniami, najpierw musimy wprowadzić całkowitą antysymetryczną permutację Levi-Civita, symbol, który jest definiowany jak poniżej
(2.40)   


W wymiarze 3, jest tylko 3 (3!=6)nieznikające składowe z εi,j,k w
(2.41)   


Symbole permutacji są przydatne w teorii wyznaczników. Faktycznie, jeśli A = (aji) jest macierzą 3x3, wtedy używając równania (2.41), czytelnik łatwo może sprawdzić ,że
(2.42)   detA = |A| = εi1i2i3a1i1a2i2a3i3
Ten wzór na wyznaczniki rozszerza się w oczywisty sposób na macierze n x n. W Rn, symbol Levi-Civita z pewnymi lub wszystkimi wskaźnikami górnymi jest liczbowo równy symbolowi permutacji wszystkich wskaźników dolnych


ponieważ metryka euklidesowa używana do podnoszenia i opuszczania wskaźników to δij. Z drugiej strony, w przestrzeni Minkowskiego, podniesienie wskaźnika z wartością 0 kosztuje znak minus, ponieważ g00 = g00 = -1. Zatem w calM(1,3)


ponieważ dowolna permutacja {0,1,2,3} musi zawierać 0.
2.28 Definicja Operator Hodge′a * jest liniowym przekształceniem liniowym *:∧pm(Rn) → ∧pm(Rn-m) zdefiniowanym w standardowych lokalnych współrzędnych przez równanie
(2.43)


Ponieważ postać dxi1 ∧ ... ∧dxim konstytuuje podstawową przestrzeń wektorową ∧pm(Rn) i operator * jest liniowym przekształceniem, równanie (2.43) całkowicie określa przekształcenie dla wszystkich m-form.
2.29 Przykład Rozważmy wymiar n = 3.Wtedy


Wyniki to
(2.44)   


(2.45)   


i
(2.46)    


W szczególności, jeśli f:R3 → R jest dowolną 0-formą (funkcją), wtedy
(2.47)   


gdzie dV jest różniczkowalną objętością , również nazywaną formą objętościową
2.30 PrzykładNiech


Wtedy
(2.48)   


Poprzednie przykłady dostarczyły pewnego spojrzenia na działanie operatorów ∧ i * .Jeśli pomyślimy ,że jednostki dx1, dx2 i dx3 odgrywają rolę i^,j^ i k^, wtedy powinno być jasne że równania (2.44) są różniczkowalnymi wersjami geometrycznymi dobrze znanych relacji
i = j x k
j = -i x k
k = i x j
Jest to nawet bardziej ewidentne po sprawdzenie równania (2.48), które łączy operator ∧ z kartezjańskim iloczynem wektorowym.
2.31 Przykład W przestrzeni Minkowskiego zbiór wszystkich 2-form ma wymiar . Operator Hodge′a * w tym przypadku dzieli ∧2(M1,3) na dwie 3-wymiarowe subprzestrzenie ∧±2, takie ,że


Ogólniej, ∧+2 jest ustawiany przez formy {dx0 ∧ dx1 ∧ dx2, dx0 ∧ dx3 } a ∧-2 jest ustawiane przez formy {dx2 ∧ dx3, -dx1 ∧ dx3, dx1 ∧ dx2}. Działanie * na ∧+2 to


a na ∧-2


Przy sprawdzaniu powyższych równań, przypomnijmy sobie ,że symbole Levi-Civita , które zawierają indeks z wartością 0 w górnej pozycji mają dodatkowy znak minus jako wynik podnoszenia indeksu z g00. Jeśli F ∈ ∧2(M), formalnie zapiszemy F = F+ + F-, gdzie F± ∈ ⩓±2. Zauważmy ,że działania na operatorze dualny, na ∧2(M) jest takie ,że *∧2(M) → ∧2(M), a *2 = -1. zatem, operator jest liniową inwolucją przestrzeni i rzeczywiście, ∧2± są podprzestrzeniami własnymi odpowiadającymi dwóm podprzestrzeniom własnym tej inwolucji. Warto również wyliczyć dualności 1-form w M1,3. Wyniki to
(2.49)    


Gradient, rotacja i zbieżność
Klasyczne operatory różniczkowe z twierdzenia Green′a i Stokes′a są lepiej rozumiane jako specjalne przejawy różniczek zewnętrznych i operatorów Hodge′a w R3. Oto dokładnie jak działają:
1.Niech f:R3 & rarr; R będzie funkcją C .Wtedy
(2.50)   


2. Niech α = Aidxi będą 1-formą w R3. Wtedy
(2.51)   


3.Niech α = B1dx2 ∧ dx3 + B2dx3 ∧ dx1 + B3dx1 ∧ dx2 będzie 2-formą w R3.Wtedy
(2.52)   


4.Niech α = Bidxi, wtedy
(2.53)    *d*a = ∇ ⋅ B
Możliwe jest również zdefiniowanie i manipulowanie wzorami klasycznego rachunku wektorowego używając symboli permutacji. Na przykład , niech A = (A1,A2,A3) i B = (B1,B2,B3) będą dwoma wektorami euklidesowymi. Wtedy łatwo zobaczymy ,że
(A x B)k = εijkAiBj
i
(∇ x B)k = εij ⋅∂Ai/∂xj
Aby wywieść wiele klasycznych tożsamości wektorowych w tym formalizmie, koniecznej ejst najpierw ustanowienie poniższej tożsamości
(2.54)   εijmεklm = δikδjl - δilδjk
2.32 Przykład


lub przepisując w formie wektorowej
(2.55)    A x (B x C) = B(A ⋅ C) - C(A ⋅ B)
Równania Maxwella
Klasyczne równania Maxwella opisujące zjawisko elektromagnetyzmu to
(2.56)   


Chcemy je sformułować w języku form różniczkowych. Niech xμ = (t,x1,x2,x3) będzie lokalną współrzędną w przestrzeni Minkowskiego M1,3. Definiujemy 2-formy Maxwella F przez równanie
(2.57)   


gdzie
(2.58)   


Zapisane szczegółowiej ,2-formy Maxwella są dane przez
(2.59)   


Definiujemy również 1-formę źródła prądu
(2.60)


2.33 Twierdzenie Równania Maxwella 2.56 są odpowiednikiem równań
(2.61) dF = 0, d * F = 4π * J
Dowód: Bezpośrednie wyliczenie przy użyciu definicji zewnętrznej pochodnej i operatora Hodge′a


Zbierając wyrazy i używając antysymetrycznego operatora klina, otrzymujemy


Dlatego też , dF = 0 jeśli


co oznacza to samo co ∇ ⋅ B = 0
a


oznacza ,że
-∇ x E - ∂B/∂t = 0
Aby sprawdzić drugi zbiór równań Maxwella, najpierw obliczymy dulaność gęstości prądu 1-formy (2.60) używając wyników z ćwiczenia 2.4. Otrzymujemy
(2.63)   


Możemy przejść do obliczenia d *F , ale być może bardziej elegancko zapisać ,że F ∈ *and;2(M), a więc zgodnie z przykładem (2.4) , F dzieli się na F+ + F-. Faktycznie, widzimy z (2.58) ,że składowe F+ są tymi z -E a składowe z F- konstytuują wektor pola magnetycznego B. Używając wyników z przykładu (2.4), możemy bezpośrednio zapisać składowe *F
(2.64)   


lub
(2.65)   


Ponieważ efekt podwójnego operatora prowadzi do wymiany
E → -B
B → +E
możemy wywnioskować z równań(2.62) i (2.63) ,że
∇ ⋅ E = 4πρ
i ∇ x B - ∂E/∂/t = 4πJ

CZĘŚĆ III : Koneksje

3.Układy
Jak wspominaliśmy w Części I, teoria krzywych w R3 może być elegancko sformułowana przez wprowadzenie ortonormalnych trójek wektorów, które nazywamy trójścianem Freneta .Wektory Freneta są adaptowane jako krzywe w taki sposób ,że współczynnik zmiany układu daje informacje o krzywiźnie krzywej. W tej części zbadamy właściwości arbitralnych układów i ich odpowiednich współczynników zmian w kierunkach różnych wektorów w układzie. Te pojęcia będą później wykorzystane do specjalnych układów stosowanych do powierzchni.
3.1 Definicja Współrzędną układu w Rn jest n-krotka pól wektorowych {e1,...,en}, które są liniowo niezależne w każdym punkcie p w przestrzeni. W lokalnych współrzędnych x1,...,xn, zawsze możemy wyrazić układ wektorów jako liniowe połączenie standardowych podstawowych wektorów
(3.1)   ei = ∂Aij
gdzie ∂j = ∂/∂x1. Zakładamy ,że macierz A = (Aij) będzie nieosobliwa w każdym punkcie. W algebrze liniowej, to pojęcie jest określane jako zmiana podstawy, różnica będzie taka w naszym przypadku ,że przekształcenie macierzy A zależy od pozycji. Pole układu jest nazywane ortonormalnym jeśli każdy punkt
(3.2)    < ei, ej > = δij
My będziemy zakładać ,że wszystkie pola układu są ortonormalne. Chociaż to ograniczenie nie jest konieczne, jest bardzo wygodne, ponieważ upraszcza znacznie wzory do obliczania składowych arbitralnego wektora w układzie.
3.2 Twierdzenie Jeśli {e1,..., en} jest układem ortonormalnym, wtedy macierz przekształcana jest ortogonalna (tj. AAT = I)
Dowód: Niech ei = ∂jAij. Wtedy


Przy danym układzie wektorów ei, możemy również wprowadzić odpowiedni dualny koukład form θi wymagający
(3.3)    θi(ej)= δji
ponieważ dualny koukład jest zbiorem 1-form, one muszą być wyrażone w lokalnych współrzędnych jako liniowe połączenie
θi = Bikdxk.
Z równania (3.3) wynika ,że


Dlatego konkludujemy ,że BA = I , więc B = A-2 = AT/ Innymi słowy, kiedy układy są ortonormalne mamy>br> (3.4)    ei = ∂kAik , θi = Akidxk
3.4 Przykład Rozważmy transformację z kartezjańskich do cylindrycznych współrzędnych
x = r cos θ
y = r sin θ
z = z
Używając wzoru na pochodna funkcji złożonej dla pochodnych cząstkowych, mamy


Z tych równań łatwo sprawdzimy ,że jednostki


są trójką wzajemnie ortogonalnych jednostek wektorowych a zatem tworzą układ ortonormalny
3.4 Przykład Dla współrzędnych sferycznych (2.20)
x = ρ sin θ cos Φ
y = ρ sin θ sin Φ
z = ρ cos θ
wzór na pochodną funkcji złożonej prowadzi do


W tym przypadku, wektory
(3.5)   


również tworzą układ ortonormalny. Fakt ,że wzór na pochodną funkcji złożonej w tych dwóch sytuacjach powyższych prowadzi do układów ortonormalnych nie jest przypadkowy. Wynik są powiązane z ortogonalnością poziomu powierzchni xi = stała. Ponieważ poziomy powierzchni są ortogonalne kiedykolwiek się przecinają ,oczekujemy że gradienty powierzchni również będą ortogonalne. Przekształcenia tego typu są nazywane systemami potrójnie ortogonalnymi
4.Współrzędne krzywoliniowe
Transformacje ortogonalne, takie jak współrzędne sferyczne i cylindryczne są wszechobecne w fizyce matematycznej ponieważ problemy geometrii dużych liczb w tym obszarze wykazują symetrię względem osi lub początku układu współrzędnych. W takich sytuacjach, przekształcenie do właściwego układu współrzędnych często powodują znaczne uproszczenie równań pola zaangażowanego w problem. Wykazano ,że operator Laplace′a, który wchodzi w skład trzech głównych klasycznych pól, równań potencjału, ciepła i fali , można wyodrębnić w 12 układach współrzędnych. Prosta i wydajna metoda obliczania operatora Laplace′a we współrzędnych ortogonalnych może być zaimplementowana za pomocą form różniczkowych
3.3 Przykład We współrzędnych sferycznych różniczka długości łuku jest dana przez
ds2 = dρ2 + ρ22 + ρ2sin2θdΦ2
Niech
(3.6) θ1 = dρ , θ2 = ρdθ , θ3 = ρ sinθdΦ
Zauważmy ,że te trzy 1-formy określają dualny koukład do układu ortonormalnego który jest pochodną w równaniu (3.5). Rozważmy pole skalarne f = f(ρ, θ ,Φ).Teraz obliczymy operator Lapalce′a z f we współrzędnych sferycznych. Aby to zrobić, najpierw obliczymy różniczkę df i wyrazimy wynik w kategorii koukładu


Składowa df w koukładzie przedstawia gradient we współrzędnych sferycznych. .Najpierw zastosujemy operator Hodge′a *. Wtedy przepiszemy wynikową 2-formę z punktu widzenia klinowych współrzędnych różniczkowych aby można było zastosować definicję pochodnych zewnętrznych


W końcu przepisujemy różniczki z powrotem w odniesieniu do koukładu uzyskując


Tak więc operator Laplace′a jest dany przez
(3.7)   


Znajdowanie pochodnej wyrażenia dla sferycznego operatora Laplace′a przez użycie form różniczkowych jest eleganckie i prowadzi naturalnie do operatora w formie Sturma Liouville′a. Proces powyższy można również odnieść dla ogólnych transformacji ortogonalnych. Zmiana współrzędnych xi = xi(uk) prowadzi do przekształcenia ortogonalnego jeśli w nowym układzie współrzędnych uk, linia metryczna
(3.8)   


ma tylko wejścia przekątne. W tym przypadku , wybieramy koukład


Jednostki {h1,h2,h3} są klasycznie nazywane wagami. Proszę zauważyć ,że w ciekawym połączeniu klasycznej terminologii wymieniliśmy dwa indeksy na jedne a to będzie powodowało małe rozbieżności w konwencji sumowania indeksów. Powróćmy do używania symboli sumowania kiedy wystąpią te rozbieżności. Aby spełnić warunek dualności &Thetai(ej) δji , musimy wybrać odpowiedni układ wektorów ei zgodnie z


Gradient Niech f = f(xi) i xi = xi(uk).Wtedy


Jak oczekiwaliśmy, składowe gradientu w koukładzie θi są tylko układem wektorów
(3.9)   


Rotacja Niech F = (F1, F2 ,F3) będzie klasycznym polem wektorowym. Zbudujemy odpowiadającą 1-formę F = Fiθi w koukładzie. Wyliczymy rotację używając dualnej pochodnej zewnętrznej


Zatem składowe rotacji to
(3.10)   


Zbieżność Jak przedtem, niech F =Fiθi i przypomnijmy sobie ,że ∇ ⋅ F = *d * F. Obliczenie prowadzi do


Dlatego też
(3.11)   


Pochodna kowariantna
W tej części wprowadzimy uogólnienie pochodnych kierunkowych. Pochodna kierunkowa mierzy tempo zmian funkcji w kierunku wektora. To czego chcemy to ilość ,która mierzy tempo zmian pola wektorowego w kierunku innego
3.6 Definicja Niech L będzie arbitralnym polem wektorowym w Rn. Przekształcenie


jest nazywane połączeniem Koszula jeśli spełnia poniższe właściwości


dla wszystkich pól wektorowych X,X1,X2,Y,Y1,Y2 ∈ T(Rn) i wszystkich funkcji gładkich. Definicja stanowi ,że przekształcenie jest liniowe na X ale zachowuje się jak liniowa pochodna na Y. Z tego powodu, jednostka jest nazywana pochodną kowariantną Y w kierunku X .
3.7 Twierdzenie Niech Y = fi ∂/∂xi będzie polem wektorowym w Rn, a x innym polem wektorowym C. Wtedy operator dany przez
(3.12)   


definiuje połączenie Koszula. Dowód wymaga tylko sprawdzenie czy cztery właściwości powyższe są spełnione. Operator zdefiniowany w tym twierdzeniu jest nazywany standardową koneksją kompatybilną ze standardową metryką euklidesową. Działanie tej koneksji na pole wektorowe Y daje nowe pole wektorowe którego składowe są pochodnymi kierunkowymi składowych Y
3.8 Przykład Niech
X = x∂/∂x + xz∂/∂y , Y = x2∂/∂x + xy2∂/∂y
Wtedy


3.9 Definicja Koneksja Koszula jest kompatybilna z metryką g(Y,Z) = jeśli
(3.13)   


W przestrzeni euklidesowej, składowe standardowego układu wektorów są stałe, a zatem ich tempo zmian w dowolnym kierunku zanika. Niech εi będzie arbitralny polem układu z formami dulanym θi. Pochodne kowariantne układu wektorów w kierunkach wektora X , będą generalnie dawały nowe wektory. Te nowe wektory muszą być liniowymi połączenia z wektorami bazowymi
(3.14)   


Te współczynniki mogą być bardziej treściwie wyrażone przy zastosowaniu notacji indeksów zwartych
(3.15)   


Wynika bezpośrednio z tego ,że
(3.16)   


Równoważnie można przyjąć iloczyn skalarny po obu stronach równania (3.15) jako ek, uzyskując


Zatem
(3.17)   


Lewa strona ostatniego równania jest iloczynem skalarnym dwóch wektorów, więc wyrażenie przedstawia tablicę funkcji. W konsekwencji, prawa strona również przedstawia tablicę funkcji. Dodatkowo, oba wyrażenia są liniowe na X, ponieważ z definicji jest liniowe na X. Skonkludujemy ,że prawa strona może być interpretowana jako macierz w której każdy wyraz jest 1-formą działając na wektor X dając funkcję. Ilości wartościowe macierzy ωij są nazywane formami koneksji.
3.10 Definicja Niech będzie koneksją Koszula i niech {ei} będzie układem. Symbole Christoffela powiązany z tą koneksją w danym układzie są funkcjami Γkij danymi przez
(3.18)   


Symbole Christoffela są współczynnikami, które dają reprezentację tempa zmian układu wektorów w kierunku samego układu wektorów .Wielu fizyków odnosi się do symboli Christoffela jako koneksji powodując możliwość pomyłki. Dokładny związek między symbolami Christoffela a koneksją 1-formy jest podana przez równanie
(3.19)   ωki(ej) = &Gammakij
lub równoważnie
(3.20)   ωki = &Gammakijθj
W układzie ogólny, w Rn jest n2 wejść w koneksji 1-form i n3 symboli Christoffela. Liczba niezależnych składowych jest redukowana jeśli założymy ,że układ jest ortonormalny.
3.11 Twierdzenie Niech εi będzie układem ortonormalnym a będzie koneksją Koszula kompatybilną z metryką. Wtedy
(3.21)   ωji = -ωij
Dowód: Ponieważ < εi, ej > = δij, mamy


zatem udowodniliśmy mże ω jest rzeczywiście asymetryczne.
3.12 Następstwo Symbole Christoffela koneksji Koszula w układzie ortonormalnym są na indeksach dolnych; to znaczy
(3.22)   Γjik = - Γijk
Konkludujemy, że w układzie ortonormalnym w Rn liczba niezależnych współczynników koneksji 1-form to (1/2)n(n-1) ponieważ przez asymetrię, przekątne wejścia są zerami, a jedynie musimy zliczyć liczbę wejść w górnej części trójkątnej macierzy n x n ωij. Podobnie, liczba niezależnych symboli Christoffela jest redukowana do (1/2)n2(n-1). W przypadku układu ortonormalnego w R3, gdzie gij jest diagonalne, ωij jest również asymetryczne, więc równanie koneksji staje się
(3.23)   


Porównując równanie trójścianu Freneta (1.27) , zauważmy oczywiste podobieństwo do powyższych równań ogólnego układu. Wyraźnie, trójścian Freneta jest specjalnym przypadkiem w którym podstawowe wektory zostały zaadaptowane do krzywej kończącej prostszą koneksję w której pewne współczynniki zanikają. Dalsze uproszczenia wystąpią w trójścianie Freneta ponieważ równania przedstawiają tempo zmian układu tylko w kierunku krzywej zamiast arbitralnego kierunku wektora X
5. Równania Cartana
Być może najważniejszym wkładem dla rozwoju geometrii różniczkowej jest praca Cartan o sławnych równania struktury, które teraz omówimy.
Pierwsze równanie struktury
3.13 Twierdzenie Niech {ei} będzie układem z koneksją ωji i dualnym koukładem θi. Wtedy
(3.24)   Θi ≡ dθi + ωji ∧ θj = 0
Dowód: Niech ei = ∂jAij
będzie układem, i niech θi będzie odpowiednim koukładem. Ponieważ θi(ej), mamy
θi = (A-1)ijdxj
Niech X będzie arbitralnym polem wektorowym. Wtedy


Zatem
ωki = (A-1)kjd(Aji)
lub w notacji macierzowej
(3.25)   ω = A-1dA
Z drugiej strony, biorąc zewnętrzną pochodną θi,znajdujemy


Ale ponieważ A-1A = I, mamy d(A-1)A = -A-1dA = -ω. zatem
(3.26)   dθ = -ω ∧ θ
Innymi słowy
i + ωji ∧ θj = 0.
Drugie równanie struktury
Niech θi będzie koukładem w Rnij. Biorąc zewnętrzną pochodną z pierwszego równania struktury i przypominając sobie właściwości (2.34) uzyskujemy


Zastępując rekurencyjnie z pierwszego równania struktury , mamy


Teraz wprowadźmy następującą definicję
3.14 Definicja Krzywizna Ω koneksji ω jest macierzą wartości 2-formy
(3.27)   Ωji ≡ dωji + ωki ∧ ωjk
3.15 Twierdzenie Niech θ będzie koukładem z koneksją ω w Rn. Zanikając a forma krzywizny
(3.28)   Ω = dω + ω ∧ ω = 0-1dx i ω = A-1dA, mamy
dω = d(A-1) ∧ dA
Z drugiej strony


Dlatego też, dΩ = -ω ∧ ω
Zmiana podstaw
Krótko zbadamy zachowania jednostek Θi i Ωi przy zmianie podstawy. Niech ei będzie układem z formami dualnymi θi i niech e^i będzie innym układem powiązanym z pierwszym układem przez odwracalną transformację
(3.29)   e^i = ejBji
która będzie zapisana w notacji macierzy jako e^ = eB. Odnosząc się ponownie do definicji koneksji (3.15), wprowadzimy różniczkę kowariantną przez wzór
(3.30)   


gdzie ponownie, uprościliśmy równanie przez użycie notacji macierzy. Ta definicja jest elegancka ponieważ niewyraźnie pokazuje zależności od X w koneksji (3.15). Idea przełączania od pochodnych do różniczek pochodzi z podstaw rachunku, ale powinniśmy wskazać ,że w obecnym kontekście, sytuacja jest bardziej subtelna. Operator przekształca pole wektorowe do tensora macierzy wartości stopnia T1,1. Innym sposobem podglądu różniczek kowariantnych, jest myślenie o jako operatorze takim ,że jeśli e jest układem, a X polem wektorowym, wtedy . Jeśli f jest funkcją, wtedy , tak więc . Innymi słowy, zachowuje się jak pochodna kowariantna na wektorach, ale jak różniczka na funkcjach. wymagamy aby zachowywała się jak znajdowanie pochodnych na iloczynie tensorowym
(3.31)   


Biorąc zewnętrzną pochodną z (3.29) i używając (3.30) rekurencyjnie, otrzymujemy


pod warunkiem ,że koneksja ω^ w nowym układzie e^ jest powiązana z koneksją &omega przez prawo transformacji
(3.32)   ω^ = B-1ωB + B-1dB
Powinniśmy zwrócić uwagę ,że jeśli e jest układem standardowym ei = ∂i w Rn, wtedy , tak więc ω = 0. W tym przypadku, wzór powyższy redukuje się do ω^ = B-1dB, pokazują ,że zasada przekształcenia jest zgodna z równaniem (3.25)

CZĘŚĆ IV : Powierzchnie w R3

4. Rozmaitości
4.1 Definicja Współrzędna wykresu C jest przekształceniem C x z otwartego podzbioru R2 do R3
(4.1)   


Zawsze zakładamy ,że wyznacznik Jacobiego przekształcenia ma zawsze maksymalny rząd. W lokalnych współrzędnych, współrzędne wykresu są przedstawiane przez trzy równania z dwiema zmiennymi
(4.2)   xi = fi(uα), gdzie i = 1,2,3, α = 1,2
Lokalne współrzędne przedstawiają zawsze nam zastosowanie formalizm indeksu tensora wprowadzony we wcześniejszych częściach. Założenie ,że wyznacznik Jacobiego J = (∂xi / ∂uα) będzie maksymalnego rzędu, pozwala wywołać ukryte twierdzenie funkcji. Zatem, w zasadzie, można lokalnie rozwiązać dla jednej współrzędnej, powiedzmy x3 w odniesieniu do pozostałych dwóch
(4.3)   x3 = f(x1,x2)
Miejsce geometryczne punktów w R3 spełniające równania xi = fi(uα), może również być lokalnie przedstawione jako wyraźnie w postaci
(4.4)   F(x1,x2,x3)=0
4.2 Definicja Niech x(u1,u2) : U → R3 i y(v1,v2) : V → R3 będą dwoma współrzędnymi wykresów z niepustą częścią wspólną (x(U) ∩ y(V)) ≠ ∅. Te dwa wykresy będą równoważne C jeśli odwzorowanie Φ = y-1x a jego odwrotność Φ-1 są nieskończenie różniczkowalne. Jaśniej mówiąc, definicja stanowi ,że dwa równoważne wykresy x(uα) i y(vβ) przedstawiają różne reparamteryzacje dla tego samego zbioru punktów w R3
4.3 Definicja Różniczkowalna powierzchnia gładka w R3 jest zbiorem punktów M w R3 takich ,że
1. Jeśli p ∈ M wtedy p należy do wykresu C
2. Jeśli p ∈ M należy do dwóch różnych wykresów x i y, wtedy te dwa wykresy są równoważne C
Intuicyjnie możemy myśleć o powierzchni jako składającej się lokalnie z kilku łatek "naszywanych" na siebie tak aby utworzyć kołdrę z globalnej perspektywy. Pierwzy warunek w definicji mówi ,że każe lokalne poprawki wygląda jak fragment R2, podczas gdy drugi różniczkowalny warunek wskazuje ,że poprawki są gładko łączone razem. Innym sposobem stanowienia tej idei jest powiedzenie ,że powierzchnia przestrzeni która jest lokalna euklidesowo i ma różniczkowalną strukturę tak więc notacja różniczkowalna ma sens. Jeśli przestrzeń euklidesowa jest wymiaru n, "powierzchnia" jest nazywana rozmaitością n-wymiarową
4.4 Przykład Rozważmy lokalną współrzędną wykresu
x(u,v) = (sin u cos v, sin u sin v, cos v)
Równanie wektora jest równoważne trzem funkcjom skalarnym dwóch zmiennych
(4.5)    x = sin u cos v, y = sin u cos v,z = cos u
Powierzchnia reprezentowana przez ten wykres jest częścią kuli x2+y2+x2 = 1 .Wykres nie może przedstawiać całej kuli ponieważ, chociaż kula jest lokalnie euklidesowa (Ziemia jest lokalnie plaska) jest z pewnością topologiczna różnica między kulą a płaszczyzną. Rzeczywiście, jeśli ktoś przeanalizuje dokładnie współrzędne wykresu można zauważyć, że biegun północny (u=0, z =1), współrzędne stają się osobliwe. Dzieje się tak ponieważ u = 0 implikuje ,że x = y = 0 bez względu na wartości v, tak więc biegun północny ma nieskończoną liczbę etykiet. Fakt ,że wymagane jest posiadanie dwóch parametrów do opisania poprawki na powierzchni R3 jest przejawem 2 -wymiarowej natury powierzchni. Jeśli mamy jedne z parametrów jako stały, różniący się od pozostałych, otrzymamy równanie 1-parmetrowe opisane krzywą na powierzchni. Zatem, na przykład, ustalając u = stała w równaniu (4.5) otrzymamy równanie południka wielkiego okręgu.
4.5 Notacja Biorąc pod uwagę parametryzację powierzchni w lokalnym wykresie x(u,v) = x(u1, u2) = x(uα), będziemy oznaczać częściowe pochodne przez następujące zapisy


5. Pierwsza fundamentalna forma
Niech xi(uα) będzie lokalną parametryzacja powierzchni. Wtedy euklidesowy iloczyn skalarny w R3 wywołuje iloczyn skalarny w przestrzeni wektorów stycznych w punkcie na powierzchni. Ta metryka na powierzchni jest uzyskiwana jak następuje



Zatem
(4.6)   


gdzie
(4.7)   


Konkludujemy ,że ta powierzchnia, ze względu na osadzenie w R3, dziedziczy naturalną metrykę (4.6) którą będziemy nazywać metryką indukowaną. Para {M,g}, gdzie M jest rozmaitością a g = gαβduα ⊗ duβ jest metryka jest nazywana rozmaitością riemanowską, jeśli uznajemy ją za jednostkę w niej samej, a podrozmaitością riemannowską Rn jeśli rozpatrywana jest jako obiekt osadzony w przestrzeni euklidesowej. Równoważną wersję metryki (4.6) można uzyskać przez zastosowanie bardziej tradycyjnej notacji rachunkowej


Możemy przepisać ostatni wynik jako
(4.8)   ds2 = Edu2 + 2Fdudv + Gdv2
gdzie


To znaczy
gαβ = xα ⋅ xβ = < xα , xβ >
Element długości łuku
(4.9)   ds2 = gαβduα ⊗ duβ
jest również nazywany pierwszą fundamentalną formą. Czytając to musimy być ostrożni ponieważ nie jest to forma w sensie geometrii różniczkowej ponieważ ds2 wywołuje symetryczny iloczyn tensorowy zamiast iloczynu klinowego. Pierwsza fundamentalna forma odgrywa tak kluczową rolę w teorii powierzchni ,że będzie wygodniej wprowadzić jeszcze trzecią, bardziej nowoczesną wersję. Postępując w ten sam sposób co przy teorii krzywych, rozważymy powierzchnię M zdefiniowaną lokalnie przez funkcję (u1,u2 ) → α(u1,u2). Mówimy ,że jednostka Xp jest wektorem stycznym w punkcie p ∈ M , jeśli Xp jest liniową pochodną na przestrzeni C funkcji rzeczywistej {f|f:M → R} na powierzchni. Zbiór wszystkich wektorów stycznych w punkcie p ∈ M jest nazywany przestrzenią styczną TpM. Jak przedtem, pole wektorowe X na powierzchni jest wyborem gładkim wektora stycznego w każdym punkcie na powierzchni a suma wszystkich przestrzeni stycznych jest nazywana wiązką styczną TM. Odwzorowanie współrzędnych wykresu α:R2 → M ∈ R3
indukując odwzorowanie w przód α*:TR2 → TM
określone przez


Jak w przypadku krzywych, kiedy wracamy do klasycznej notacji dla opisania powierzchni jako xi(uα), to co rzeczywiści oznacza to (xi o α)(uα), gdzie x1 są współrzędnymi funkcji w R3. Szczególne przykłady wektorów stycznych na M są dane przez posuwające w przód standardowej podstawy TR2. Te wektory styczne które wcześniej nazywaliśmy xα są zdefiniowane przez
(4.10)   


Przy tym formalizmie, pierwsza fundamentalna forma I jest tylko symetrycznym bilinearnym tensorem definiowanym przez indukowaną metrykę
I(X,Y) = g(X,Y) = < X, Y >
gdzie X i Y są dowolną parą pól wektorowych w TM
Ortogonalne krzywe parametryczne
Niech V i W będą wektorami stycznym do powierzchni α) .Ponieważ te wektory xalpha; obejmują przestrzeń styczną M przy każdym punkcie, wektory V i W mogą być zapisane jako liniowe połączenie
V = Vαxα
W = Wαxα
Funkcje Vα i Wα są nazywane współrzędnymi krzywoliniowymi wektorów. Możemy obliczyć długoś i iloczyn skalarny wektorów używając indukowanej metryki riemannowskiej


Kąt θ tworzony przez wektory v i W jest dany przez równanie
(4.11)   


Niech uα = Φalpha;(t) i uα = Ψuα(t) będą dwoma krzywymi na powierzchni. Wtedy różniczki całkowite


reprezentują nieskończenie małe wektory styczne (1.12) do krzywych .Zatem, kąt między dwoma nieskończenie małymi wektorami stycznymi do dwóch przecinających się krzywych na powierzchni spełnia
(4.12)   


W szczególności, jeśli te dwie krzywe wydają się być krzywymi parametrycznymi, u1 = stała i u2 = stała wtedy wzdłuż jednej krzywej mamy du1 = 0 , du2 arbitralnej, a wzdłuż drugiej mamy δu1 arbitralnie a δu2 = 0. w tym przypadku, cosinus kąta zawartego przez nieskończenie małe wektory styczne redukuje się do
(4.13)   


4.7 TwierdzenieLinie parametryczne są ortogonalne jeśli F = 0
4.8 Przykłady
a) Kula


b) Powierzchnia obrotowa


c) Pseudosfera


d) Torus


e) Helikoida


f) Katenoida


6. Druga fundamentalna forma
Niech x=x(uα) będzie współrzędną poprawki na powierzchni M. Ponieważ xu i xv są stycznymi do powierzchni możemy zbudować jednostkę prostopadłą n do powierzchni przez wzięcie
(4.14)   


Teraz rozważmy krzywą na powierzchni , daną przez uα = uα(s). Bez gubienia ogólności, założymy ,że ta krzywa jest sparametryzowana przez długość łuku s tak więc ta krzywa ma prędkość jednostkową. Używając wzoru na pochodną funkcji złożonej, widzimy ,że jednostkowy wektor styczny T do krzywej jest dany przez
(4.15)   


Ponieważ kryzwa leży na powierzchni a wektor T jest styczny do krzywej, jasne jest ,że T jest również styczny do powierzchni. Z drugiej strony, wektor T′ = dT/ds nie ma generalnie tej właściwości, więc to co robimy jest dekompozycją T′ do jej normalnych i stycznych składowych
(4.16)   T′ = Kn + Kg = κnn + Kg
gdzie κ = ||Kn|| = < T′,n > . Jednostka skalarna κn jest nazywana krzywizną normalną krzywej a Kg jest nazywane krzywizną geodezyjną wektora. Krzywizna normalna mierzy krzywiznę x(uα(s)) wynikającą z ograniczenia krzywej leżącej na powierzchni. Krzywizna geodezyjna wektora , mierzy "boczny" komponent krzywizny w płaszczyźnie stycznej do powierzchni .Zatem, jeśli rysujemy linię prostą na płaskim arkuszu papieru a potem płynnie zegniemy papier na powierzchni, wtedy linia prosta uzyska jakąś krzywiznę. Ponieważ linia byłą pierwotnie prosta, nie ma komponentów bocznych krzywizny więc Kg = 0 w tym przypadku. Oznacza to ,że cały wkład do krzywizny pochodzi z komponentu normalnego, odzwierciedlającego fakt ,że jedynym powodem krzywizny jest zgięcie na samej powierzchni. Podobnie ,jeśli określimy punkt p ∈ M i kierunek wektora Xp ∈ TpM, można geometrycznie przewidzieć krzywiznę normalną przez rozważenie klasy równoważności wszystkich jednostkowych szybkości krzywych w M które zawierają punkt p a których wektory styczne ustawiają się z kierunkiem X. Oczywiście, jest nieskończenie wiele takich krzywych, ale przy nieskończenie małym poziomie, wszystkie te krzywe można będzie uzyskać przez przecięcie powierzchni "pionowymi" płaszczyznami zawierającymi wektor X i prostopadła do M. wszystkie krzywe w tej klasie równoważności mają tą samą normalną krzywiznę a ich krzywizna geodezyjna zanika. W tym sensie, krzywizna naturalna jest bardziej należąca do kierunku na powierzchni w punkcie, podczas gdy krzywizna geodezyjna rzeczywiście zależy od samej krzywej. Dla znalezienie wyraźnego wzoru dla krzywizny normalnej, najpierw różniczkujemy równanie (4.15)


Biorąc iloczyn skalarny z ostatniego równania z prostopadłą i notując ,że < xα, n > = 0 ,otrzymujemy
(4.17)   


gdzie (4.18)   


4.19 Definicja Wyrażenie
II = bαβduα ⊗ duβ
jest nazywane drugą fundamentalną formą
4.10 Twierdzenie Druga fundamentalna forma jest symetryczna
Dowód: W klasycznym opracowaniu drugiej fundamentalnej formy dowód jest trywialny. Mamy bαβ = bβα ponieważ dla C poprawka x(uα), mamy xαβ = xβα ponieważ pochodne cząstkowe są przemienne. Oznaczmy współczynniki drugiej fundamentalnej formy przez


więc równanie (4.19) może być zapisane jako
(4.20)   II = edu2 + 2fdudv + gdv2
a równanie (4.17)
(4.21)   


Jednocześnie pragniemy podkreślić ,że podobnie jak pierwsza fundamentalna forma może być przedstawiona jako
I = < dx ,dx >
możemy również przedstawić drugą fundamentalną formę jako
II = - < dx,dn >
Aby to zobaczyć , wystarczy zauważyć ,że zróżniczkowanie tożsamości < xα, n > = 0 implikuje ,że
< xαβ > = - < xα,nβ >.
Dlatego też


Z obliczeniowego punktu widzenia, bardziej użytecznym wzorem dla współczynników drugiej fundamentalnej formy mogą być uzyskane przez pierwsze zastosowanie klasycznej tożsamości wektora
(4.22)   


dla obliczenia
(4.23)   


W konsekwencji, wektor normalny może być zapisany jako


Zatem możemy zapisać współczynniki bαβ bezpośrednio jako trójkę iloczynów obejmujących pochodne z (x). Wyrażenia dla tych współczynników to
(4.24)   


Pierwsza fundamentalna forma na powierzchni mierzy (kwadrat) odległość między dwoma nieskończenie małych oddzielonym punktami. Jest podobna interpretacja drugiej fundamentalnej formy jak pokazano poniżej. Druga fundamentalna forma mierzy odległość od punktu na powierzchni do płaszczyzny stycznej przy drugim nieskończenie małym oddzielonym punkcie. Aby to zobaczyć, rozważmy punkt x0 = x(uα) ∈ M i bliski punkt x(uα + duα). Rozwijając w szereg Taylora otrzymujemy


Przypomnijmy ,że wzór na odległość od punktu x do płaszczyzny która zawiera x0 jest tylko skalarną projekcją z (x - x0) na normalną. Ponieważ normalna do płaszczyzny przy x0 jest taka sama jak jednostka normalna do powierzchni a < xα, n > = 0 , odkrywamy ,że odległość D to


Pierwsza fundamentalna forma (lub raczej jej wyznaczniki) również pojawia się w rachunku różniczkowym w kontekście obliczeniowego obszaru powierzchni sparametryzowanej. Powód jest taki ,że jeśli rozważamy równoległobok stworzony przez wektory xudu i xvdv, wtedy różniczka obszaru powierzchni jest dana przez długość iloczynu wektorowego tych dwóch nieskończenie małych wektorów stycznych. To znaczy


Druga fundamentalna forma zawiera informacje o kształcie powierzchni w punkcie. Na przykład, powyższe omówienie wskazuje ,że jeśli b = |bαβ| = eg -f2 > 0 wtedy wszystkie sąsiednie punkty leżą po tej samej stronie płaszczyzny stycznej, a zatem powierzchnia jest wklęsła w jednym kierunku. Jeśli w punkcie na powierzchni b > 0m, ten punkt jest nazywany punktem eliptycznym, jeśli b < 0, punkt jest nazywany punktem hiperbolicznym lub siodłowym, a jeśli b = 0, punkt jest nazywany parabolicznym
7. Krzywizna
Krzywizna i wszystkie powiązane kwestie związane z krzywizną , konstytuują centralny obiekt badań geometrii różniczkowej. Chciałoby się móc odpowiedzieć na pytanie takie jak , jakie ilości pozostają niezmienione jeśli jedna powierzchnia płynnie zmienia się w inna? Jest to z pewnością zupełnie coś innego od stożka, który może być zbudowany z płaskiego kawałka papieru i kuli. Co sprawiło ,że te dwie powierzchnie są różne? Jak wyliczyć najkrótszą drogę między dwoma obiektami kiedy ścieżka jest ograniczona do bycia na powierzchni? Te i wiele innych pytań podobnego typu mogą być rozwiązane ilościowo poprzez badanie krzywizny. Nie możemy nie doceniać ważności tego tematu; być może wystarczy powiedzieć ,ze bez jasnego zrozumienia krzywizny, nie byłoby ogólnej teorii względności, koncepcji czarnych dziur a nawet Star Trek. badanie krzywizny hiperpowierzchni w Rn (wymiar n-1 powierzchni)zaczniemy od spróbowania zrozumienia pochodnych kowariantnych normalnych do powierzchni. Powód jest prosty. Jeśli normalna do powierzchni jest stała, wtedy powierzchnia jest płaską hiperpłaszczyzną. Zatem ,jest wariacja w normalnej, wskazująca obecność krzywizny. Dla uproszczenia, ograniczymy nasz omówienie do powierzchni w R3 ,ale formalizm jaki stosujemy jest stosowalny do dowolnego wymiaru. Wprowadzimy również w tej części nowoczesną wersję drugiej fundamentalnej formy
4.11 Definicja Niech X będzie polem wektorowym na powierzchni M w R3, i niech N będzie normalnym wektorem. Odwzorowanie L dane przez
(4.25)   


jest nazywane przekształceniem Gaussa. W tej definicji będziemy ostrożni przy różniczkowaniu między operatorami które znajdują się na powierzchni a operatorami w przestrzenią otaczającą. Przyjmiemy konwencję linii nad obiektami znajdujące się w przestrzeni otaczającej, operator jest przykładem takiego obiektu. Przekształceni Gaussa jest dobrym miejscem do startu, ponieważ jest tempem zmian normalnej w arbitralnym kierunku jaki życzymy sobie skwantyfikować.
4.12 Definicja Nawiasy Lie [X,Y] dwóch pól wektorowych X i Y na powierzchni M jest definiowany jako komutator
(4.26)[X,Y] = XY = YX
oznaczający ,że jeśli f jest funkcją na M wtedy [X,Y]f = X(Y(f)) - Y(X(f))
4.13 Twierdzenie Nawias Lie dwóch wektorów X,Y ∈ T (calM) jest innym wektorem w T(M).
Dowód: Wystarczy udowodnić ,że nawias jest liniowym znajdowaniem pochodnych na przestrzeni funkcji C. Rozważmy wektory X,Y,X ∈ T(calM) i funkcje gładkie f.g w M. Wtedy


więc nawias jest liniowy w każdym gnieździe. Co więcej



więc nawias działa jak znajdowanie pochodnych funkcji
4.14 Twierdzenie Przekształcenie Gaussa jest liniową transformacją na T(M)
Dowód: Liniowość wynika z liniowości , więc wystarczy wykazać ,że L:X → LX odwzorowuje X ∈ T(M) do wektora LX ∈ T(M).Ponieważ N jest jednostką normalnej do powierzchni < N, N> = 1, tak więc dowolna pochodna z < N , N > jest 0. Zakładające ,ze koneksja jest kompatybilna z metryka


Dlatego też ,LX jest ortogonalne do N a zatem leży w T(M). Przypomnijmy w tym miejscu ,że w poprzedniej części podaliśmy dwie równorzędne definicje < dx,dx > i < X,Y > pierwszej fundamentalnej formy. teraz zrobimy to dla drugiej fundamentalnej formy
4.15 Definicja Drga fundamentalna forma jest przekształceniem bilineranym
(4.27)   II(X,Y) = < LX,Y >
4.16 Uwaga Powinniśmy odnotować ,że dwie definicje drugiej fundamentalnej formy są jednolite. Łatwo to zauważyć jeśli wybierzemy X mając składową xα i Y mając składową xβ. Przy takich wyborach, LVX ma składową -nα a II(X,Y) staje się bαβ = -< xα , nβ > Również odnotujmy ,że jest trzecia fundamentalna forma zdefiniowana przez
(4.28)   III(X,Y) = < LX,LY > = < L2 X,Y >
W klasycznej notacji, trzecia fundamentalna forma byłaby oznaczona przez < dn , dn >. Jak można oczekiwać, trzecia fundamentalna forma zawiera szereg Taylora trzeciego rzędu, informacje o powierzchni.
4.17 Definicja Torsją koneksji jest operator T taki ,że ∀X,Y
(4.29)   


Koneksja jest nazywana swobodną torsją jeśli T(X,Y) = 0. w tym przypadku


4.18 Twierdzenie Przekształcenia Gaussa jest samosprzężonym operatorem na TM
Dowód: Wykazaliśmy już że L:TM → TM jest przekształceniem liniowym. Przypomnijmy ,że operator L na liniowej przestrzeni jest samosprzężony jeśli < LX, Y > = < X, LY >,. tak więc to twierdzenie jest równoważne dowodowi na to ,że druga fundamentalna forma jest symetryczna (II [X,Y] = II[Y,X]). Obliczając różnicę tych dwóch jednostek otrzymujemy


Ponieważ < X,N > = < Y,N > = 0 a koneksja jest kompatybilna z metryką , wiemy ,że


jednym z najważniejszych tematów we wprowadzeniu do algebry liniowej jest działania ze spektrum samosprzężonych operatorów. Główny wynik stanowi ,że jeśli rozważamy wartość własną równania
(4.30)   LX = κX
wtedy wartości własne są zawsze rzeczywiste a wektory własne odpowiadające różnym wartościom własnym są ortogonalne. W aktualnej sytuacji, przestrzenie wektorowe są przestrzeniami stycznymi w każdym punkcie powierzchni w R3, więc wymiar to 2. Zatem, oczekujemy dwóch wartości własnych i dwóch wektorów własnych
(4.31)   LX1 = κ1X1
(4.32)   LX2 = κ1X2
4.19 Definicja Wartości własne κ1 i κ2 przekształcenia Gaussa L są nazywane krzywiznami głównymi a ich wektory własne X1 i X2 są nazywane kierunkami głównym, Kilka możliwych sytuacji może wystąpić w zależności od klasyfikacji wartości własnych przy każdym punkcie p na powierzchni:
1.Jeśli κ1 ≠ κ2 i obie wartości własne są dodatnie, wtedy p jest nazywane punktem eliptycznym
2.Jeśli κ1κ2 < 0 , wtedy p jest nazywane punktem hiperbolicznym
3.Jeśli κ1 = κ2 ≠ 0 , wtedy p jest nazywane punktem umblikalnym
4.Jeśli κ1κ2 = 0 , wtedy p jest nazywane punktem parabolicznym
Znamy z algebry liniowej, że wyznaczniki i ślad samosprzężonego operatora są jedynie niezmiennicze według podobieństwem. Te niezmienniczości są ważne w przypadku operatora L i zasługują na nadanie specjalnych nazw.
4.20 Definicja Wyznacznik K = det(L) jest nazywany krzywizną gaussowską z M a H = (1/2)Tr(L) jest nazywana krzywizną średnią.
Ponieważ dowolny samosprzężony operator jest diagonalizowalny i w oparciu o przekątną, macierz przedstawiająca L to diag(κ12), wynika bezpośrednio że
(4.33)    K= κ1κ2 , H = 1/2(κ1 + κ2)
4.21 Twierdzenie Nich X i Y będą dowolnymi niezależnymi liniowymi wektorami w T(M).Wtedy
(4.34)    


Dowód: Ponieważ LX, LY ∈ T(M) , mogą być wyrażone jako liniowe połączenia podstawowych wektorów X i Y
LX = a1X + b1Y
LY = a2X + b2Y
obliczając iloczyn wektorowy , mamy


Podobnie


4.22 Twierdzenie
(4.35)


Dowód: Zaczynając od równań (4.34) bierzemy iloczyn skalarny obu stron z X x Y i używamy tożsamości wektora (4.22). Bezpośrednio mamy


Wynik wynika przez wzięcie X = xu i Y = xv
4.23 Twierdzenie (Euler) Niech X1 i X2 będą jednostkowymi wektorami własnymi L i niech X = (cosθ)X1 + (sinθ)X2. Wtedy
(4.36)   


Dowód: Łatwy. Obliczamy II(X,X) = < LX,X >, używając faktu ,że LX1 = κ1X1 ,LX2 = κ2X2 i tego ,że wektory własne są ortogonalne .Uzyskujemy