Zwięzłe wprowadzenie do teorii liczb

CZĘŚĆ I : Wprowadzenie

Gauss i teoria liczb

Bez wątpienia teoria liczb była ulubionym tematem Gaussa. Rzeczywiście, twierdził ,że Matematyla jest królową nauk a Teoria Liczb jest królową Matematyki Ponadto, we wprowadzenie do Mathematische Abhandlungen Eisensteina′a, Gauss napisał "Wyższa Arytmetyka daje nam niewyczerpane pokłady ciekawych prawd - prawd które nie są odosobnione ale stoją w najbliższym stosunku do siebie , i pomiędzy którymi, przy każdym postępie nauki, stale odkrywamy nowe i czasami całkowicie nieoczekiwane punkty kontaktowe. Większa część teorii arytmetycznych czerpie dodatkowy urok z osobliwości, do których łatwo docieramy poprzez indukcje ważnych propozycji mających pieczęć prostoty na sobie,; ale demonstracja leży ukryta tak głęboko ,że może być odkryta dopiero po wielu bezowocnych wysiłkach; i nawet wtedy uzyskuje się jak przez żmudny i sztuczny proce, podczas gdy prostsze metody dowodu pozostają ukryte przed nami." Wszystko to dobrze ilustruje, być może najlepsza publikacja Gaussa, mianowicie "Disquistiones arithmeticae". Została ona opisana jako Magna Carta Teorii Liczb, a głębokość i oryginalność myśli manifestowana w tej pracy jest szczególnie godna uwagi biorać pdo uwagę, że Gauss napisał ją mając zaledwie osiemnaście lat. Oczywiście, jak powiedział sam Gauss, nie wszystkie tematy były nowe w czasie jej pisania, i Gauss uznawał zasługi wcześniejszych badaczy, takich jak Fermat, Uler. Lagrange i Legendre. Ale "Disquistiones arithmeticae" była pierwszym systematycznym traktem o Arytmetyce Wyższej i dostarczała podstaw, stymulując wielką liczbę kolejnych badań, kontynuowanych do dnia dzisiejszego. Znaczenie pracy została docenione szybko, po opublikowaniu w 1801 roku a pierwsze badanie szybko okazało się niedostępne; wielu badaczy musiało uciekać się do przepisywanych ręcznie kopii. Powszechnie uważana była za pracę nieprzeniknioną i nie była zbyt szeroko rozumiana; być może formalny ,łaciński styl przyczynił się do tego. Teraz , po wielu przeformułowania, większość materiału jest bardzo dobrze znana, a jej wczesne sekcje obejmują coi najmniej podstawowy kurs teorii liczb.
Tekst zaczyna się od definicji kongruencji, mianowicie dwie liczby są uważane za przystające modulo n , jeżeli ich różnica jest podzielna przez n. Jest to relacją równoważności w dobrze znanej terminologii. Gauss przechodzi od dyskusji o kongruencjach liniowych i pokazuje ,że faktycznie mogą być traktowane nieco analogicznie do równań liniowych. Potem zwraca swoją uwagą na potęgi reszt i wprowadza, między innymi pojęcie pierwiastka pierwotnego i indeksów; zauważa , w szczególności, podobieństwa między nimi a zwykłymi logarytmami Poniżej przedstawia wykład o kongruencjach kwadratowych, i tu spotykamy słynne prawo wzajemności reszt kwadratowych; zakłada ono ,że jeśli p i q są liczbami pierwszymi, nie przystające 3 (mod 4), wtedy p jest resztą lub nie-resztą 9 w zależności czy q jest resztą czy nie-resztą z p, podczas gdy w pozostałych przypadkach występuje przeciwieństwo. Jak wiadomo, Gauss spędził wiel czasu nad tym wynikiem i podał kilka demonstracji, które zastymulowały znacznie jakość badań naukowych. W szczególności, prace Jacobie′go, Eisensteina i Kummera, Hilbert podniósł to jako dziewiąty ze swoich słynnych problemów, przedstawionych na Kongresie w Paryżu w 1900 roku.
Zdecydowanie najwięcej części "Disquistiones arithmeticae" dotyczy binarnych forma kwadratowych. Tu Gauss opisuje jak formy kwadratowe z danym wyróżnikiem mogą być podzielone na klasy tak ,że dwie formy należą do tej samej klasy jeśli i tylko jeśli istnieje całkowe unimodularne zastąpienie powiązane z nimi, i jak klasy mogą być podzielone na rodzaje, tak ,że dwie formy są tego samego rodzaju jeśli i tylko jeśli są równoważne racjonalnie. Przechodzi do stosowania tych pojęć, na przykład, rzucając światło na trudne pytanie przedstawiania liczb całkowitych w postaci binarnej. Jest to niezwykła i piękna teoria z wieloma ważnymi konsekwencjami. Rzeczywiście, po ponownej interpretacji w kategoriach pól kwadratowych, okazało się ,że może być stosowana szerzej, a w szczególności może być zastosowana do całej algebraicznej teorii liczb. Termin pole Gaussa, oznaczające pole generowane przez wymierności i ,jest pozostałością po pionierskiej pracy Gaussa w tej dziedzinie. Pozostała część "Disquistiones arithmeticae" zawiera wyniki o różnym charakterze, związane na przykład , z budową wielokąta siedemnastobocznego, co było wyraźnym odwołaniem do Gaussa, i tego co obecnie nazywamy polem cyklotomicznym, to znaczy polem generowanym przez pierwiastek pierwotny jedności. Szczególnie godne uwagi jest omówienie pewnych sum związanych z pierwiastkami jedności, obecnie określanych jako sumy Gaussa, które odgrywają fundamentalną rolę w analitycznej teorii liczb.
I.Podzielność

1.Podstawy
Zbiór 1,2,3,.. wszystkich liczb naturalnych będzie oznaczony przez N. Nie ma potrzeby aby tu wchodzić w filozoficzne pytania o istnienie N. Wystarczy aby założyć ,że jest dany zbiór w którym są spełnione aksjomaty Peano. Sugerują one ,że dodawanie i mnożenie mogą być zdefiniowane w T tak ,że są ważne prawa przemienności, łączności i rozdzielności. Ponadto, uporządkowanie w N może być wprowadzone tak ,że albo m < n lub n , m dla odrębnych elementów n ,m w N. Co więcej, jak wynika z aksjomatów, że zasada indukcji matematycznej jest utrzymana i ,ze każdy niepusty podzbiór N ma najmniejszy składnik. Jak zwykle będziemy oznaczali przez Z zbiór liczb całkowitych 0, ±1,±2,..., i przez Q zbiór liczb wymiernych, to znaczy liczb p/q, przy p w Z i q w N. Budowanie, począwszy od N ,Z ,Q ,m a potem liczb rzeczywistych i zespolonych R i C stanowi podstawę Analizy Matematycznej.
2 Algorytm podzielności
Załóżmy ,że a, b są elementami N. Mówi to ,że b dzieli się przez a (zapisujemy b|a) jeśli istniej element c w B , taki ,że a = bc. W tym przypadku do odnosimy się jako do dzielnika a , a a jest nazywane wielokrotnością b. Związek ba jest zwrotny i przechodni ale nie symetryczny); faktycznie jeśli b|a i a|b. wtedy a = b. Również jeśli b\a wtedy b ≤ a więc liczba naturalna ,a tylko skończenie wiele dzielników. Koncepcja podzielności jest łatwo rozszerzalna na Z; jeśli a,b są elementami Z, przy b ≠ 0, wtedy mówimy ,że b jest podzielne przez a jeśli istnieje takie c w Z , że a - bc. Będziemy się często odwoływali do algorytmu podzielności. Zakłada on ,że dla dowolnego a,b w Z, przy b > 0, istnieje q, r w Z ,takie ,że a = bq+r a 0 ≤ r < b. Dowód jest prosty; rzeczywiście jeśli bq jest największą wielokrotnością b, która nie przekracza a, wtedy liczba całkowita r = a-bq jest z pewnością nie ujemna, a ponieważ b(q+1) > a, mamy r < b. Wynik wyraźnie pozostaje poprawny dla dowolnej liczby całkowitej b ≠ 0 pod warunkiem ,że granica r < b jest zastąpiona przez r < |b|
3 Największy wspólny dzielnik
Przez największy wspólny dzielnik liczb naturalnych a,b rozumiemy element d z N , taki ,że d|a , d|b i każdy wspólny dzielnik a i b są podzielne przez d. Przejdziemy do dowodu ,że liczba d z tymi właściwościami istnieje; wyraźnie będzie unikalna, dla dowolnej innej takiej liczby d′ dzieli się przez a,b i również d, a ponieważ podobnie d|d′ mamy d = d′ .W związku z powyższym rozpatrzmy zbiór liczb naturalnych w postaci ax+by z x,y w Z. Zbiór nie jest pusty ponieważ, na przykład, zawiera a i b; zatem jest co najmniej składowa d. Teraz d = ax+ by dla pewnych liczb całkowitych x,y, skąd każdy wspólny dzielnik a i b z pewnością dzieli się przez d. Co więcej, z algorytmu dzielenia, mamy a = dq + r dla pewnych q i r w Z przy 0 ≤ r < d; daje to r = ax′ + by′ , gdzie x′ = 1 - qx a y&prime = -qy. Zatem, z minimalnej właściwości d, wynika ,że r = 0 skąd d|a. Podobnie mamy d|b. Jest w zwyczaju oznaczanie największego wspólnego dzielnika a i b przez (a,b). Oczywiście dla każdego n w N , równanie ax+by = n jest rozwiązywalne w liczbach całkowitych x,y jeśli i tylko jeśli (a,b) dzieli sie przez n. W przypadku (a,b) = 1 mówimy ,że a i b sa względnie pierwsze (lub ,że a jest pierwsze do b). Wtedy równanie ax+by = n jest zawsze rozwiązywalne. Oczywiście możemy to rozszerzyć na więcej niż dwie liczby. Faktycznie można wykazać ,że dowolne elementy a1...am z N ma największy wspólny dzielnik d = (a1...am) taki ,że d =a1x1+...+amxm dla pewnych liczb całkowitych x1,...,xm . Jeśli d = 1, mówimy ,że a1,...am ,są względnie pierwsze a wtedy równanie a1x1+...+amxm = n jest zawsze rozwiązywalne.
4.Algorytm Euklidesa
Metoda znajdowania największego wspólnego dzielnika d z a,b, został opisany przez Euklidesa. Z algortymu dzielenia istnieją liczby całkowite q1, r1 takie ,że a = bq1 + r1 i 0 ≤ r1 < . Jeśli r1 ≠ 0 wtedy istnieją liczby całkowite q2, r2 takie ,że b = r1q2 + r2 i 0 ≤ r2 < r1. Jeśli r2 ≠ 0 wtedy istnieją liczby całkowite q3,r3 takie ,że r1 = 2q3 + r3 i 0 ≤ r3 < r2 .Kontynuując, uzyskujemy malejącą sekwencję r1,r2, spełniająca rj-2 = rj-1qj + rj.Sekwencja kończy się kiedy rk+1 = 0 dla pewengo k, to znaczy ,kiedy rk-1 = rkqk+1. Łatwo sprawdzić ,że d = rk. Rzeczywiście wynika z równania ,ze każdy wspólny dzielnik a i b dzieli się przez r1,r2,...,rk; co więcej oglądając równanie w odwrotnym porządku, jasne jest ,że rk dzieli się przez każde rj a więc również przez b i a. Algortym Euklidesa dostarcza innego dowodu istnienia liczb całkowitych x,y spełniających d= ax + by, i co więcej dołącza te x,y dla wyraźnego obliczenia. Mając d = rk i rj = rj-2 - rj-1qj, zatem wymagane wartości mogą być uzyskane przez kolejne podstawienia. Weźmy na przykład a = 187 i b = 35. Wedle Euklidesa mamy
187 = 35*5+12, 35 = 12 * 2 + 11, 12 = 11 * 1 + 1
Zatem widzimy ,że (187,35) = 1 i co więcej
1 - 12-11*1 = 12 - (35-12*2) = 3(187-35*5)-35
Zatem rozwiązaniem równania 187x + 35y = 1 w liczbach całkowitych x,y jest x=3 i y = -16. Istnieje ścisły związek między algorytmem Euklidesa a teorią ułamków ciągłych.
5. Podstawowe twierdzenie
Liczba naturalna, inna niż 1, jest nazywana liczbą pierwszą jeśli jest podzielna przez samą siebie i 1. Najmniejsze liczby pierwsze to 2,3,5,7,11,... .Niech n będzie liczbą naturalną inną niż 1. Najmniejszy dzielnik n, który przekracza 1 jest po prostu liczbą pierwszą , powiedzmy p1. Jeśli n ≠ p1, wtedy, podobnie, jest liczba pierwsza p2 podzielna przez n/p1. Jeśli n ≠ p1p2 wtedy istnieje liczba p3, podzielna przez n/p1p2 itd. Po skończonej liczbie kroków uzyskujemy n = p1 ... pm; a przez pogrupowanie razem uzyskujemy standardową faktoryzację (lub dekompozycję kanoniczną) n = p1j1 ... pk1jk, gdzie p1,..., pk oznaczają różne liczby pierwsze a j1,...jk są elementami N. Podstawowe twierdzenie arytmetyczne zakłada ,że powyższy rozkład jest jednoznaczny z wyjątkiem porządku współczynników. Aby udowodnić wynik, trzeba pamiętać po pierwsze, że jeśli liczba pierwsza p dzieli się przez iloczyn mn liczb naturalnych wtedy p albo dzieli się przez m albo p dzieli się przez n. Rzeczywiście ,jeśli p nie dzieli się przez m, wtedy (p,m) = 1 , z czego wynika istnienie liczb całkowitych x,y, takich ,że px+my = 1; zatem mamy pnx + mny = n a zatem p dzieli się przez n. Bardziej ogólnie konkludujemy ,że jeśli p dzieli się przez n1n2...nk , wtedy p dzieli się przez nl dla pewnego l. Teraz przypuśćmy ,że ,że oprócz rozkładu n = p1j1 ... pk1jk, istniej inna dekompozycja i ,że p′ jest jedną z liczb pierwszych w tym występującą. Z poprzedniej konkluzji uzyskujemy p′ = pl dla pewnego l. Zatem dedukujemy ,że jeśli standardowa faktoryzacja dla n/p′ jest jednoznaczna, wtedy również jest dla n. Prosto jest wyrazić największy wspólny dzielnik (a,b) elementów a,b z N w odniesieniu do liczb pierwszych występujących w ich dekompozycjach. Faktycznie możemy zapisać a = p1α1 ... pkαk a b = p1β1 ... pkβk, gdzie p1, ... pk są różnymi liczbami pierwszymi a α i β są nie ujemnymi liczbami całkowitymi; wtedy (a,b) = p1γ1 ... pkγk gdzie γl = min (αl, βl). Przy tej notacji, najmniejsza wspólna wielokrotność a,b jest definiowana przez {a,b} = p1δ1 ... pkδk gdzie δl = max (αll). Tożsamość (a,b){a,b} = ab jest łatwa do weryfikacji.
6.Właściwości liczb pierwszych
Istnieje nieskończenie wiele liczb pierwszych, bo jeśli p1,...,pn jest skończonym zbiorem liczb pierwszych, wtedy p1,...,pn + 1 jest podzielne przez liczbę pierwszą różną od p1,...,pn; argument wynika z Euklidesa. Wynika z tego ,że jeśli pn jest n-tą liczba pierwszą w porządku rosnących wielkości, wtedy pm dzieli się przez p1,...,pn+1 dla pewnych m ≥ n+1; z tego dedukujemy przez indukcję, że pn < 22n. W rzeczywistości jest znany dużo mocniejszy wynik; rzeczywiście pn ∼ n log n jeśli n → ∞ Wynik jest równoznaczny z twierdzeniem ,że liczba π(x) liczb pierwszych p ≤ x spełnia π(x) ∼ x/log x przy x → ∞ . Jest to nazywane twierdzeniem liczb pierwszych i zostało udowodnione niezależnie w 1896 roku przez Hadamara i de la Vallee Poussina. Ich dowody były oparte na właściwości funkcji zeta Riemanna. W 1737 roku Euler udowodnił że szereg &Sigma 1/pn jest rozbieżny i odnotował ,że daje to inną demonstrację istnienia nieskończenie wielu liczb pierwszych. Faktycznie można wykazać przez elementarną argumentację ,że pewnej liczby c,

Fermat przypuszczał ,że liczby 22n + 1 (n=1,2...) wszystkie są pierwsze; jest to prawda dla n = 1,2,3 i 4 ,ale fałszywe dla n = 5, co udowodnił Euler. Faktycznie 641 dzieli się przez 232 + 1. Liczby powyższej postaci, które są pierwsze, są nazywane liczbami Fermata. Są one blisko związane z istnieniem konstrukcji płaszczyzny wielokąta foremnego za pomocą cyrkla i linijki. Faktycznie płaszczyzna wielokąta foremnego z p bokami, gdzie p jest liczbą pierwszą, jest możliwa do zbudowania jeśli i tylko jeśli p jest liczbą pierwszą Fermata. nie wiadomo jednak czy liczb pierwszych Fermata jest skończona czy nieskończona liczba. Liczby w postaci 2n - 1 ,które są liczbami pierwszymi są nazywane liczbami Mersenne′a. W tym przypadku n jest liczbą pierwszą, wtedy 2m-1 dzieli się przez 2n - 1 jeśli m dzieli się przez n. Liczby pierwsze Mersenne′a są szczególnie interesujące w udowadnianiu przykładów dużych liczb pierwszych; na przykład wiadomo , że 244497 - 1 jest 27-mą liczbą pierwszą Mersenne′a, liczbą z 13 395 cyframi. Łatwo zobaczyć ,że żaden wielomian f(n) z całkowitymi współczynnikami nie może być pierwszy dla wszystkich n w N, lub nawet dla wystarczająco dużych n, chyba ,że f jest stałe. Rzeczywiście z twierdzenia Taylora , f(mf(n) + n) jest podzielne przez f(n) dla wszystkich m w N.Z drugiej strony, godny uwagi wielomian n2 - n + 41 jest pierwszy dla n = 1,2,...40. Ponadto można zapisać wielomian f(n1,...,nk) z taką właściwością , która , jak n, prowadzi przez elementy N, zbiór wartości dodatnich założonych przez f jest dokładnie sekwencją liczb pierwszych. Liczby pierwsze są również dobrze rozmieszczone w tym sensie ,że dla każdego n > 1, jest zawsze liczba pierwsza między n a 2n. Taki wynik, ogólnie znany jako postulat Bertranda, może być uważany za prekursora obszernych badań na temat różnic pn+1 - pn kolejnych liczb pierwszych. W rzeczywistości określanie postaci pn+1 - pn = O(pnK) są znane z wartościami tylko trochę większymi niż 1/2; ale z drugiej strony, różnica z pewnością nie jest ograniczona, ponieważ kolejne liczby całkowite n!+m z m = 2,3,...,n są wszystkie złożone. Sławne twierdzenie Dirichleta zakłada ,że dowolny postęp arytmetyczny a, a+q,a+2q,...,. gdzie (a,q) = 1,zawiera nieskończenie wiele liczb pierwszych. Niektóre specjalne przypadki, na przykład istnienie nieskończenie wielu liczb pierwszych postaci 4n+3, może być wydedukowane przez zmodyfikowanie argumentu Euklidesowego podanego na początku, ale wynik ogólny leży całkiem głęboko. Rzeczywiście dowód Dirichleta obejmował, między innymi, pojęcia charakteru i L-funkcji, oraz liczby klas form kwadratowych. Dwa notorycznie nie rozwiązane problemy teorii liczb pierwszych to przypuszczenie Goldbacha, wspomniane w liście do Eulera z 1742 roku, takie ,że każda nawet parzysta liczba całkowita ( > 2) jest sumą dwóch liczb pierwszych, i przypuszczenie o liczbach pierwszych bliźniaczych, które mówi ,że istnieje nieskończenie wiele par liczb pierwszych takich jak 3,5 i 17,19, które różnią się o 2. Przez pomysłową prace metodą sita, Chen, w 1974 roku wykazał ,że te przypuszczenia są poprawne jeśli jedna z liczb pierwszych jest zastąpiona liczbą z co najwyżej dwoma czynnikami pierwszymi (zakładając, w przypadku Goldbacha, że parzysta liczba całkowita jest wystarczająco duża). Najstarsze znane sito jest dziełem Eratostenesa. Zauważył on ,że jeśli usuwa się ,ze zbioru liczb całkowitych 2,3,...,n, najpierw wszystkie wielokrotności 2, potem wszystkie wielokrotności 3 itd, aż do największej liczby całkowitej nie przekraczającej √n, wtedy pozostają tylko liczby pierwsze. Badania nad przypuszczeniem Goldbacha doprowadziły do metody analizy kołowej Hardy′ego - Littlewooda i, w szczególności, do słynnego twierdzenia Winogradowa , że każda dostatecznie duża liczba nieparzysta całkowita jest sumą trzech liczb pierwszych.
7. Ćwiczenia
a) Znajdź liczby całkowite x,y takie ,że 95x+432y = 1
b) Znajdź liczby całkowite x,y,z takie ,że 35x+55y+77z = 1
c) Udowodnij ,że 1+1/2 + ... + 1/n nie jest liczbą całkowitą dla n > 1
d) Udowodnij ,że
({a,b},{b,c},{c,a}) = {(a,b),(b,c),(c,a)}
e) Udowodnij ,że jeśli g1,g2,... są liczbami całkowitymi > 1 , wtedy każda liczba naturalna może być wyrażona jednoznacznie w postaci a0 + a1g1 + a2g1g2+...+akg1 ...gk , gdzie aj są liczbami całkowitymi spełniającymi 0 ≤ aj < gj+1
f) Wykaż ,że istnieje nieskończenie wiele liczb pierwszych postaci 4n+3
g) Wykaż ,że jeśli 2n + 1 jest liczbą pierwszą, wtedy jest faktycznie liczbą pierwszą Fermata
h) Wykaż ,że jeśli m > n, wtedy 22n + 1 dzieli się przez 22m - 1 a więc (22m + 1,22n + 1) = 1
i) Wywnioskuj ,że pn+1 ≤ 22n + 1, w następstwie czego π(x) ≥ log log x dla x ≥ 2

CZĘŚĆ II : Funkcje arytmetyczne

1. Funkcja [x]
Dla dowolnej liczby rzeczywistej x, oznaczamy przez [x] największą liczbę całkowitą ≤ x, która jest jednoznaczną liczbą całkowitą taką ,że x- < [x] ≤ x . Funkcja jest nazywana "całkowitą częścią x". Łatwo jest zweryfikować ,że [x+y] ≥ [x]+[y] i ,że, dla dowolnej liczby całkowitej n, [x+n] = [x] + n i [x/n] = [[x]/n]. Różnica x-[x] jest nazywana "ułamkową częścią x"; jest zapisywana {x} i spełnia 0 ≤ {x} < 1. Niech teraz p będzie liczbą pierwszą,. Największa liczba całkowita l taka ,że pl dzieli się przez n! może być zgrabnie wyrażona w powyższej funkcji. Faktycznie zauważmy ,że [n/p] liczb 1,2,...,n są podzielne przez p, [n/p2] są podzielne przez p2 itd., uzyskujemy

Wynika stąd ,że l ≤ [n/(p-1)]; dla drugiej sumy jest co najmniej n(1/p+1/p2+....). Wynik również pokazuje jednocześnie ,że współczynnik dwumianowy

jest liczbą całkowitą; mamy
[m/pj] ≥ [n/pj] +[(m-n)/pj]
Rzeczywiście, bardziej ogólnie, jeśli n1,...,nk są liczbami całkowitymi takimi ,że n1+...+nk = m wtedy wyrażenie m!/(n1!...nk!) jest liczbą całkowitą
2. Funkcje multiplikatywne
Funkcja rzeczywista f zdefiniowana na dodatnich liczbach całkowitych ,mówi ,że będzie multiplikatywna jeśli f(m)f(n) = f(mn) dla wszystkich m, n z (m,n) = 1. Napotykamy wiele przykładów. Wyraźnie ,jeśli f jest multiplikatywne i nie znika tożsamościowo, wtedy f(1) = 1 .Dalej, jeśli n = p1j1 ... pkjk w standardowej postaci wtedy
f(n) = f(p1j1) .... f(pkjk)
Dlatego do oceny f wystarczy do obliczenia jej wartości na potęgach pierwszych; będziemy się odwoływali do tej właściwości często Będziemy również korzystać z faktu ,że jeśli f jest multiplikatywne i jeśli

gdzie suma jest ponad wszystkimi dzielnikami d z n, wtedy g jest funkcją multiplikatywną. Rzeczywiście, jeśli (m,n) = 1, mamy


3. Funkcja Φ(n) (totient) Eulera
Przez Φ(n) określamy liczbę liczb 1,2,...,n , które są względnie pierwsze do n. Zatem, w szczególności, Φ(1) = Φ(2) = 1 a Φ(3) = Φ(4) = 2. Pokażemy , w kolejnej części, z właściwości kongruencji, że Φ jest multiplikatywna. Teraz, jak łatwo zweryfikować, Φ(pj) = pj - pj-1 dla wszystkich potęg liczb pierwszych pj. Wynika jednocześnie ,że


Przechodzimy do ustalenia tego wzoru bezpośrednio ,bez zakładania ,że Φ jest multiplikatywne. Faktycznie, wzór dostarcza innego dowodu tej właściwości. Niech p1,...,pk będą różnymi czynnikami pierwszymi z n. Wtedy wystarczy wykazać ,że Φ(n) jest podane przez


Ale n/p jest liczbą liczb 1,2,...,n, które są podzielne przez pr, n/(prps) jest liczbą która jest podzielna przez prps ,itd. Zatem powyższe wyrażenie to


gdzie l = l(m) jest liczbą liczb pierwszych p1,...,pk , które dzielą się przez m. Teraz składnik sumy z prawej strony to (1-1)l = 0 jeśli l > 0, i jest 1 jeśli l = 0. Oczekiwane wyniki są następujące. Demonstracja i szczególny przykład argumentu mamy od Sylvestra. Jest to prosta konsekwencja właściwości multiplikatywnej Φ takiej


Faktycznie, wyrażenie po lewej jest multiplikatywny i kiedy n = pj, staje się


4.Funkcja μ(n) Möbiusa
Jest to określone, dla dowolnej liczby dodatniej całkowitej n, jako 0 jeśli n zawiera czynnik kwadratowy, i jako (-1)k jeśli n = p1...pk jako iloczyn k różnych liczb pierwszych. Dalej, przez konwencję, μ(1) = 1. Jasne jest ,że μ jest multiplikatywna. Zatem funkcja


jest również multiplikatywna. Teraz dla wszystkich potęg pierwszych pj przy j > 0, mamy v(pj) = μ(1) + μ(p) = 0. Stąd uzyskujemy podstawową właściwość, mianowicie v(n) = 0 dla n > 1 i v(1) = 1. Wykorzystamy tej właściwości dla ustalenia odwróconej formuły Möbiusa. Niech f będzie funkcją arytmetyczną, która jest funkcją zdefiniowaną na liczbach dodatnich całkowitych i niech


Wtedy mamy


Faktycznie prawa strona to


a wynik podąża do v(n/d′) = 0 , chyba ,że d&prime = n. Posiada również odwrotność, możemy zapisać drugie równanie w postaci


a wtedy


Ponownie mamy v(n/d′) = 0 chyba ,że d′ = n, stą wyrażenie po prawej to g(n). Funkcje Eulera i Möbiusa są powiązane równaniem


Można to zobaczyć bezpośrednio z formuły dla Φ w punkcie 3, i wynika od razu z inwersji Möbiusa z właściwości Φ z końca punktu 3. Rzeczywiście związek jest wyraźny z właściwości multiplikatywnej Φ i μ. Jest analogiczna inwersja Möbiusa dla funkcji zdefiniowanych przez liczby rzeczywiste, mianowicie jeśli


wtedy


Faktycznie, ostatnia suma to


a w wyniku następuje v(l) = 0 dla l > 1
5.Funkcje τ(n) i σ(n)
Dla dowolnej liczby całkowitej n, oznaczamy przez τ(n) liczbę dzielników z n. Przez &sigma(n) oznaczamy sumę dzielników n. Zatem


Oczywiste jest ,że zarówno τ(n) i σ(n) są multiplikatywne .Dalej, dla dowolnej potęgi liczby pierwszej pj mamy τ(pj)=j+1 i
σ(pj) = 1 + p + ... + pj = (pj+1 - 1)/(p-1)
Zatem jeśli pj jest najwyższą potęgą p, która dzieli się przez n wtedy


Łatwo jest dać przybliżone szacunki dotyczących wielkości τ(n) i σ(n). Rzeczywiście mamy τ(n) < cnδ dla dowolnego δ > 0, gdzie c jest liczbą zależną tylko do δ ;funkcja f(n) = τ(n)/nδ jest multiplikatywna i spełnia f(pj) = (j+1)/p < 1 dla wszystkich ale skończonej liczby wartości p i j, wyjątki są ograniczone do δ. Dalej mamy


Ostatni szacunek implikuje ,że Φ(n) > 1/4n / log n dla n > 1. Faktycznie funkcja f(n) = σ(n)Φ(n)/n2 jest multiplikatywna i dla dowolnej potęgi liczby pierwszej pj mamy
f(pj)=1-p-j-1 ≥ 1 -1 /p2;
zatem


wynika ,że σ(n)Φ(n) ≥ 1/2n2 a to razem z σ(n) < 2n log n dla n > 2 daje szacunek dla Φ
6.Średnia kolejność
Czasami ciekawe jest określenie wielkości "średniej" funkcji arytmetycznych f, to znaczy, znajdowanie szacunkowych sum w postaci
Σf(n) przy n ≤ x, gdzie x jest duża liczba rzeczywista. Uzyskujemy takie szacunki kiedy f jest to τ, σ i Φ. Najpierw zaobserwujemy ,że


Teraz mamy


a stąd


Implikuje to ,że (1/x)Στ(n)∼log x jeśli x → ∞. Argument może być udoskonalany aby dać


gdzie γ jest stałą Eulera .Zauważmy ,że chociaż można powiedzieć ,że "średnia kolejność" τ(n) jest log n (ponieważ Σ log n ∼ x log x) nie jest prawdą ,że "prawie wszystkie" liczby maja około log n dzielników; tu mówimy ,że prawie wszystkie liczby mają pewną własności jeśli proporcja ≤ x nie posiada tej własności jest to o(x). Faktycznie, "prawie wszystkie" liczby mają około (log n)log2 dzielników, to znaczy, dla dowolnego ε > 0 i dla prawie wszystkich n, funkcja τ(n)/(log n)log 2 leży między (log n)ε a (log n). Określając średnią kolejność σ(n) zauważmy ,że


Ostatnia suma to
1/2[x/d]([x/d]+1) = 1/2(x/d)2 + O(x/d).
Teraz


a zatem uzyskujemy


Implikuje to ,że "średnia kolejność" σ(n) to 1/6 π2n (ponieważ Σ n ∼ 1/2 x2). W końcu, wyprowadzamy średni szacunek dla Φ .Mamy


Ostatnie suma to
1/2(x/d)2 + O(x/d)
Teraz


a nieskończony szereg tu ma sumę 6/π2. Stąd uzyskujemy


Implikuje to ,że "średnia kolejność" Φ(n) to 6n/π2. Co więcej wynik pokazuje ,że prawdopodobieństwo ,że dwie liczby całkowite będą względnie pierwsze to 6/π2. Jest 1/2 n(n+1) par liczb całkowitych p, q przy 1 ≤ p ≤ q ≤ n, a dokładniej Φ(1) + ... + Φ(n) odpowiednich ułamków p/q są w najniższym zakresie.
7.Liczby doskonałe
Liczba naturalna n jest doskonała jeśli σ(n) = 2n, to znaczy jeśli jest równa sumie swoich dzielników innych niż ona sama. Zatem, na przykład, 6 i 28 są liczbami doskonałymi. Czy istnieją nieparzyste liczb doskonałe to notorycznie nierozwiązany problem .W przeciwieństwie jednak , nawet doskonałe liczby mogą być określone precyzyjnie. Rzeczywiście liczba parzysta jest doskonała jeśli i tylko jeśli ma postać 2p-1(2p -1), gdzie p i 2p-1 są liczbami pierwszymi. Wystarczy udowodnić potrzebę, ponieważ łatwo jest sprawdzić ,że liczby tej postaci są z pewnością doskonałe. Załóżmy zatem że σ(n) = 2n i ,że n = 2km, gdzie k i m są liczbami całkowitymi dodatnimi z nieparzystym m. Mamy (2k+1 -1)σ(m) = 2k+1m a stąd σ(m) = 2k+1l a m = (2k+1-1)l dla pewnej dodatniej liczby całkowitej l. Jeśli teraz l będzie większe niż 1 wtedy m będzie miało różne dzielniki l,m i 1, w następstwie czego będziemy mieli σ(m) ≥ l+m+1. Ale l+m=2k+1l = σ(m) a to daje sprzeczność. Zatem l = 1 i σ(m) = m+1, co implikuje ,że m jest liczbą pierwszą .Faktycznie m jest liczbą pierwszą Mersenne′a a stąd k=1 jest liczbą pierwszą p. To pokazuje ,że n ma wymaganą postać
8.Funkcja zeta Riemanna
Riemann wykazał ,że pytania dotyczące rozkładu liczb pierwszych są ściśle związane z właściwościami funkcji zeta


gdzie s oznacza zmienną zespoloną. Jasne jest ,że szereg jest zbieżny bezwzględnie do σ > 1, gdzie s = σ +it, z σ , t rzeczywistymi, i rzeczywiście jest zbieżne jednostajnie dla σ > 1 + δ dla dowolnego δ > 0. Riemann wykazał ,że ζ(s) może być ciągła analitycznie przez płaszczyznę zespoloną i że jest tam regularna z wyjątkiem prostego bieguna przy s = 1 z resztą 1. Wykazał prócz tego ,że spełnia równanie funkcjonalne


gdzie


Fundamentalne połączenie między funkcją zeta a liczbami pierwszymi jest dane przez iloczyn Eulera


poprawny dla σ > 1. Związek jest łatwo weryfikowalny; faktycznie jasne jest ,że dla dowolnej dodatniej liczby całkowitej N,


gdzie m przebiega wszystkie dodatnie liczby całkowite, które są podzielne tylko przez liczby pierwsze ≤ N i


Iloczyn Eulera pokazuje ,że ζ(s) nie ma zer dla σ > 1. Ze względu na równanie funkcyjne wynika ,że ζ(s) nie ma zer dla σ < 0 z wyjątkiem punktów s= -2,-4,-6,....; Te określane są jako "zera trywialne". Wszystkie zera &zeta(s) musza leżeć w "krytycznym przedziale" danym przez 0 ≤ &sigma ≤ 1, Riemann przypuszczał ,że leżą one na linii σ = 1/2. Jest to słynna hipoteza Riemanna, i pozostała nieudowodniona do dnia dzisiejszego. Jest wiele dowodów na rzecz tej hipotezy; w szczególności Hardy w 1915 roku udowodnił ,że nieskończenie wiele zer ζ(s) leży na krytycznej linii, a rozległe obliczenia potwierdzając ,że co najmniej pierwsze trzy miliony zer powyżej osi rzeczywistej tak robi. Wykazano ,że jeśli hipoteza jest prawdziwa, wtedym na przykład, jest eleganckie twierdzenie o liczbach pierwszych o tym ,że


i ,że różnica między kolejnymi liczbami pierwszymi spełnia


Faktycznie wykazano ,że istnieje wąski region wolny od zer dla ζ(s) na lewo od linii σ = 1 a to implikuje ,że wyniki powyższe są rzeczywiści poprawne ale słabsze pod względem błędów. Wiadomo również ,że hipoteza Riemanna jest równoznaczna z twierdzeniem, że dla dowolnego ε > 0


Podstawowy związek między funkcją Möbiusa a funkcją zeta Riemanna jest dany przez


Jest to oczywiście ważne dl σ > 1 ponieważ iloczyn szeregów po prawej z Σ1/ns to Σv(n)/ns. Faktycznie, jeśli hipoteza Riemanna się utrzyma, wtedy równanie pozostaje prawdziwe dla σ > 1/2. Jest podobne równanie dla funkcji Eulera, poprawne dla σ > 2, mianowicie


, Podobnie mamy równania dla τ(n) i σ(n), poprawne odpowiednio dla σ > 1 i σ > 2 , mianowicie


Ćwiczenia
a) Oszacuje Σd|n μ(d)σ(d) w odniesieniu do różnych czynników pierwszych n
b) Niech Λ(n) = log p jeśli n jest potęgą liczby pierwszej p i niech Λ(n) = 0 w przeciwnym razie (Λ jest nazywana funkcją Mangoldta). Oszacuj Σd|n Λ(d).Wyraź Σ&Lambda(n)/ns w odniesieniu do ζ(s)
c) Niech a przebiega przez wszystkie liczby całkowite z 1 ≤ a ≤ n i (a,n) = 1 >Wykaż ,że f(n) = (1/n) Σ a spełnia Σd|nf(d) = 1/2(n+1). Zatem udowodnij ,że f(n) = 1/2 Φ(n) dla n > 1
d) Niech a przebiega przez liczby całkowite jak w c). Udowodnij ,że (1/n3)Σa3 = 1/4Φ(n)(1+(-1)kp1...pk/n2), gdzie p1...pk są różnymi czynnikami pierwszymi n (>1)
e) Wykaż ,że iloczyn wszystkich liczb całkowitych a w c) jest dany przez nΦ(n)Πd|n(dl/dd)μ(n/d)
f) Wykaż ,że &Sigman≤xμ(n)[x/n]=1 .Zatem udowodnij ,że |Σn≤xμ(n)/n| ≤1
g) Niech m,n będą dodatnimi liczbami całkowitymi i niech d przebiega przez wszystkie dzielniki (m,n). Udowodnij ,że Σdμ(n/d) = μ(n/(m,n))Φ(n) / Φ(n/(m,n)) (Suam ta jest nazywana suma Ramanujana)
h) Udowodnij ,że


Szereg tego rodzaju nazywamy szeregiem Lamberta
i)Udowodnij ,że Σn≤x Φ(n)/n = (6/π2)x+O(log x)

CZĘŚĆ III : Kongruencje

1.Definicje
Załóżmy ,że a,b są liczbami całkowitymi i ,że n jest liczbą naturalną. Przez a ≡ b (mod n) oznaczamy n dzielone przez b-a; mówimy ,że a jest przystające do b modulo n. Jeśli 0 ≤ b < n wtedy odnosimy się do b jako reszty a (mod n). Łatwo jest sprawdzić ,że relacja kongruencji jest relacją równoważności; klasy są równoważności są nazywane klasami reszt lub klasami kongruencji. Zbiór reszt (mod n) oznacza zbiór n liczb całkowitych po jednej z każdej klasy reszt (mod n). Jasne jest , że jeśli a ≡ a′ (mod n) i b ≡ (mod n) wtedy a+b ≡ a′ + b′ a a-b ≡ a′ - b′ (mod n). Dalej mamy ab ≡ a′b′ (mod n), ponieważ n dzieli się przez (a-a′)b + a′(b-b′). Co więcej, jeśli f(x) jest wielomianem z całkowitymi współczynnikami, wtedy f(a) ≡ f(a′) (mod n). Zauważy również ,że jeśli ka ≡ ka′ (mod n) dla pewnej liczby naturalnej k przy (k,n) = 1 wtedy a ≡ a′ (mod n): zatem jeśli a1,..., an jest całkowitym zbiorem reszt (mod n) wtedy to jest ka1,...,kan .Generalnie, jeśli k jest dowolną liczbą naturalną taką ,że ka ≡ ka′ (mod n) wtedy a ≡ a′ (mod n/(k,n)), ponieważ oczywiście k/(k,n) i n/(k,n) są względnymi liczbami pierwszymi
2.Chińskie twierdzenie o resztach
Niech a,n będą liczbami naturalnymi i niech b będzie dowolną liczbą całkowitą. Udowodnimy najpierw ,że kongruencja liniowa ax ≡ b (mod n) jest rozwiązywalne dla pewnej liczby całkowitej x jeśli i tylko jeśli (a,n) dzieli się przez b. Warunkiem koniecznym jest ,że (a,n) dzieli się zarówno przez a i n. Aby udowodnić wystarczalność ,załóżmy ,że d = (a,n) podzielone przez b. Umieszczamy a′ = a/d, b′ = b/d i n′ = n/d. Wtedy wystarczy rozwiązać a′x ≡ b′(mod n′). Ale ma to dokładnie jedno rozwiązanie (mod n′), ponieważ (a′n′) = 1 a więc a′x przebiega przez skończony zbiór reszt (mod n′) ponieważ x przebiega przez taki zbiór. Jasne jest ,że jeśli x′ jest dowolnym rozwiązaniem a′x′ ≡ b′ (mod n′) wtedy zbiór zupełny rozwiązań (mod n) ax ≡ b (mod n) jest podany przez x = x′ + mn′ , gdzie m = 1,2,...,d. Zatem, kiedy d dzieli się przez b, kongruencja ax ≡ b (mod n)ma dokładnie d rozwiązań (mod n). Wynika z ostatniego wyniku ,że jeśli p jest liczbą pierwszą i jeśli a jest nie podzielne przez p wtedy kongruencja ax ≡ b (mod p) jest zawsze rozwiązywalna; faktycznie jest jednoznaczne rozwiązanie (mod p). Implikuje to ,że reszty 0,1,...,p-1 formują pole pod dodawaniem i mnożeniem (mod p). Zwykle jest to pole oznaczane przez Zp .Zwrócimy się teraz do równoległej kongruencji liniowej i udowodnimy chińskie twierdzenie o resztach; wynik był podobno znany Chińczykom ponoć 1500 lat temu. Niech n1,...,nk będą liczbami naturalnymi i załóżmy ,że są one względnie pierwszymi w parach, to znaczy (ni,nj) = 1 dla i ≠ j. Twierdzenie zakłada ,że dla dowolnych liczb całkowitych c1,...,ck, kongruencja x ≡ cj (mod nj), przy 1 ≤ j ≤ k, są rozwiązywalne równolegle dla pewnej liczby całkowitej x; faktycznie jest jednoznaczne rozwiązanie modulo n = n1...nk. Dla dowodu, niech mj = nj (1 ≤ j ≤ k). Wtedy (mj,nj) = 1 a zatem jest liczba całkowita xj taka ,że m1xj &equiv cj (mod nj). Teraz łatwo zobaczyć ,że x = m1x1+...+mkxk spełniające x ≡ cj (mod nj). co jest wymagane. Jednoznaczność jest jasna, jeśli x,y są dwoma rozwiązaniami wtedy x = y (mod nj) dla 1 ≤ j ≤ k ,ponieważ nj są liczbami względnie pierwszymi, mamy x ≡ y (mod n). Wyraźnie, chińskie twierdzenie o resztach razem z pierwszym wynikiem tej sekcji implikuje ,że jeśli n1,...,nk są liczbami względnie pierwszymi w parach wtedy kongruencja ajx ≡ bj(mod nj), przy 1 ≤ j ≤ k, są rozwiązywalne równolegle jeśli i tylko jeśli (aj,nj) dzieli się przez bj dla wszystkich j. Jako przykład rozważmy kongruencję x &equiv 2 (mod 5), x ≡ 3 (mod 7), x ≡ 4 (mod 11). W tym przypadku rozwiązanie jest podane przez x = 77x1 + 55x2 + 35x3, gdzie x1,x2,x3 spełniają 2x1 &equiv 2 (mod 5), 6x2 ≡ 3 (mod 7), 2x3 ≡ 4 (mod 11). Zatem możemy przyjąć x1 = 1, x2 = 4,x3=2 a to daje nam x = 367. Całkowitym rozwiązaniem jest x ≡ -18 (mod 385).
3.Twierdzenia Fermata i Eulera
Najpierw wprowadzimy pojęcie zbioru zredukowanego reszt (mod n). Należy przez to rozumieć zbiór liczb Φ(n) po jednej z każdej klasy resztkowej Φ(n), które składają się z liczb względnie pierwszych z n. W szczególności, liczby a przy 1 ≤ a ≤ n i (a,n) = 1 formują zbiór redukowalny reszt (mod n). Przechodzimy teraz d ustalenia właściwości multiplikatywnych Φ, używając powyższej koncepcji. Zatem nie h n, n′ będą liczbami naturalnymi przy (n,n′) = 1. Dalej niech a i a′ przechodzą zbiór redukowalny reszt (mod n) i (mod n′) odpowiednio. Wtedy wystarczy udowodnić ,że an′ + a′n przechodzą zbiór redukowalny reszt (mod nn′); implikuje to ,że Φ(n)Φ(n′) = Φ(nn′) .Teraz wyraźnie, ponieważ (a,n) = 1 i (a′, n′) = 1 , liczba an′ + a′n jest wzglednie pierwsza do n i do n′ a więc i nn′. Ponadto dowolne dwie liczby różnych postaci są niekongruentne (mod nn′).Zatem mamy tylko udowodnić ,że jeśli (b,nn′) = 1 wtedy b ≡ an′ + a′n (mod nn′) dla pewnego a, a′ jak powyżej. Ale ponieważ (n,n′) = 1 istnieją liczby całkowite m,m&primel spełniają mn′ + m′n = 1. Wyraźnie (bm,n) =1 a więc a &equiv bm (mod n) dla pewnego a; podobnie a&prime ≡ bm′ (mod n′) dla pewnego a′, a teraz łatwo jest zobacyzć ,że a,a′ mają wymaganą właściwość. Twierdzenie Fermata stanowi ,że jeśli a jest dowolną liczbą naturalną i jeśli p jest dowolną liczbą pierwszą ,wtedy ap ≡ a (mod p). W szczególności, jeśli (a,p) = 1, wtedy ap-1 ≡ 1 (mod p). Twierdzenie zostało ogłoszone przez Fermata w 1640 roku, ale bez dowodu. Euler podał pierwszą demonstrację cały wiek później, w 1760 roku, szacują bardziej ogólny wynik, w ten sposób ,że jeśli a,n są liczbami naturalnymi przy (a,n) = 1, wtedy aΦ(n) ≡ 1 (mod n). Dla udowodnienia twierdzenia Eulera, zauważmy po prostu ,że ponieważ x przechodzi zbiór redukowalny reszt (mod n) więc również ax przebiega ten zbiór. Zatem Π(ax) ≡ Π(x) (mod n), gdzie iloczyny przyjmują wszystkie x w zbiorze redukowalnym, a twierdzenie wynika z anulowania Π(x) z obu stron
4.Twierdzenie Wilsona
Zakładamy ,że (p-1)! ≡ -1 (mod p) dla dowolnej liczby pierwszej p. Choć wynik jest przypisywany Wilsonowi, twierdzenie zostało pierwotnie opublikowane prze Waringa w jego Meditationes algebraicae w 1770 roku a dowód został podany przez Lagrangea. Dla demonstracji wystarczy założyć ,że p jest nieparzyste. Teraz, dla każdej liczby całkowitej a przy 0 < a < p jest jednoznaczna liczba całkowita a′ przy 0 < a′ < p taka ,że aa′ ≡ 1 (mod p). Co więcej jeśli a = a′ wtedy a2 ≡ 1 (mod p), w następstwie czego a = 1 lub a = p-1 .Zatem zbiór 2,3,..,p-2 może być podzielony na 1/2(p-3) par a, a′ prz aa′ ≡ 1 (mod p). Zatem mamy 2*3...(p-2) ≡ 1 (mod p), a więc (p-1)! ≡ p-1 ≡ -1 (mod p). Twierdzenie Wilsona przyjmuje konwersję i daje kryterium dla liczb pierwszych. Rzeczywiście liczba całkowita n > 1 jest liczbą pierwszą jeśli i tylko jeśli (n-1)! ≡ -1(mod n). Aby zweryfikować wystarczalność zauważmy ,że dowolny dzielnik z n ,inny niż ona sama, musi być podzielny prze (n-1)!. Bezpośrednio dedukując z twierdzenia Wilsona widzimy ,że jeśli p jest liczbą pierwszą przy p ≡ 1 (mod 4) wtedy kongruencja x2 ≡ -1 (mod p) ma rozwiązanie x = ±(r!), gdzie r = 1/2(p-1). Wynika to z zastąpienia a+r w (p-1)! przez kongruentną liczbę całkowitą a-r-1 dla każdego a przy 1 ≤ a ≤ r/ Zauważ ,że kongruencja nie ma rozwiązań kiedy p &equiv 3 (mod 4),w przeciwnym razie mielibyśmy xp-1 = x2r ≡ (-1)r = -1 (mod p) w przeciwieństwie do twierdzenia Fermata
5.Twierdzenie Lagrangea
Niech f(x) będzie wielomianem z całkowitymi współczynnikami i stopniu n. Załóżmy ,że p jest liczbą pierwszą i ,że początkowy współczynnik f, którym jest współczynnik xn , nie jest podzielny przez p. Twierdzenie Lagrangea stanowi ,że kongruencja f(x) ≡ 0 (mod p) ma co najmniej n rozwiązań (mod p). Twierdzenie z pewnością odnosi się do n=1 przez pierwszy wynik w części 2. Zakładamy ,że jest to poprawne dla wielomianów ze stopniami n-1 i postępujemy indukcyjnie dla udowodnienia twierdzenia dla wielomianów stopnia n. Teraz dla dowolnej liczby całkowitej a mamy f(x - f(a) = (x-a)g(x), gdzie g jest wielomianem, stopnia n-1, z całkowitymi współczynnikami i tym samym początkowym współczynnikiem f. Zatem jeśli f(x) ≡ 0 (mod p) ma rozwiązanie x = a wtedy wszystkie rozwiązania kongruencji spełniającej (x-a)g(x) ≡ 0 (mod p). Ale, przez hipotezę indukcyjną, kongruencja g(x) ≡ 0 (mod p) ma co najmniej n-1 rozwiązań (mod p). Jest w zwyczaju pisać f(x) ≡ g(x) (mod p) oznacza ,że współczynniki potęg x w wielomianach f,g są kongruentne (mod p); i jasne jest ,że jeśli kongruencja f(x) ≡ 0 (mod p) ma swoje pełne uzupełnienie a1,...,an rozwiązań (mod p) wtedy
f(x) ≡ c(x-a1)...(x-an)(mod p), gdzie c jest wiodącym współczynnikiem f. W szczególności, z twierdzenia Fermata, mamy
xp-1 ≡ (x-1)...(x-p+1)(mod p),
i porównując stałe wpółczynniki, uzyskujemy inny dowód twierdzenia Wilsona. Wyraźnie, zamiast mówienia o kongruencjach, możemy wyrazić powyższe zwięźle w postaci wielomianów zdefiniowanych przez Zp. Zatem twierdzenie Lagrange′a twierdzi ,że liczba zer w Zp wielomianów zdefiniowanych prze to pole nie może wykraczać poza jego stopień. W następstwie możemy wydedukować ,że jeśli d dzieli się przez p-1 wtedy wielomian xd -1 ,ma dokładnie d zer w Zp .Mamy xp-1 = (xd -1)g(x), gdzie g ma stopień p-1-d. Ale, z twierdzenia xp-1 - 1 ma p-1 zer z Zp a więc xd - 1 ma co najmniej (p-1)-(p-1-d) = d zer w Zp . Twierdzenie Lagrange′a nie jest prawdziwe dla złożonych modułów. Faktycznie, łatwo jest zweryfikować z chińskiego twierdzenia o resztach ,że jeśli m1,...mk są względnymi liczbami naturalnymi w parach, jeśli f(x) jest wielomianem z całkowitymi współczynnikami i jeśli kongruencja f(x) ≡ 0 (mod mj) ma sj rozwiązań (mod mj), wtedy kongruencja f(x) ≡ 0 (mod m), gdzie m = m1...mk, ma s = s1...sk rozwiązań (mod m). Twierdzenie Lagrange′a jest fałszywe dla modułów potęg liczb pierwszych; na przykład x2 ≡ 1 (mod 8) ma cztery rozwiązania. Ale jeśli liczba pierwsza p nie dzieli się przez wyznacznik f wtedy twierdzenie jest prawdziwe dla wszystkich potęg pj; rzeczywiście liczba rozwiązań f(x) ≡ 0 (mod pj) jest , w tym przypadku, taka sama jak liczba rozwiązań f(x) ≡ 0 (mod p). Może to być widoczne jednocześnie kiedym na przykład , f(x) = x2 - a; jeśli p jest dowolną nieparzystą liczbą pierwszą, która nie jest podzielna przez a, wtedy z rozwiązania y z f(y) ≡ 0 (mod pj) uzyskujemy rozwiązanie x = y + pjz d f(x) ≡ 0 (mod pj+1) przez rozwiązanie kongruencji 2yz+f(y)/pj ≡ 0 (mod p) dla z ,co jest możliwe ponieważ (2y,p) = 1.
6.Pierwiastki pierwotne
Niech a,n będą liczbami naturalnymi z (a,n) = 1. Najmniejsza liczba naturalna d taka ,że ad ≡ 1 (mod n) jest nazywana rzędem a (mod n), i mówimy ,że a należy do d (mod n). Z twierdzenia Eulera, rząd d istnieje i dzieli się przez Φ(n). Faktycznie, d dzieli się przez każdą liczbę całkowitą k taką, że ak ≡ 1 (mod n) , z algorytmu podzielności, k = dq + r przy 0 ≤ r > d, skąd ar ≡ 1 (mod n) a więc r = 0. Pierwiastek pierwotny (mod n) oznacza liczbę ,która należy do Φ(n) (mod n). Przejdziemy do udowodnienia tego dla każdej liczby pierwszej nieparzystej p istnieje Φ(p-1) pierwiastków pierwotnych (mod p). Teraz każda z liczb 1,2,...,p-1 należy (mod p) do pewnego dzielnika d z p-1; niech Ψ(d) będzie liczbą która należy do d (mod p) tak więc


Wystarczy udowodnić ,że jeśli Ψ(d) ≠ 0 wtedy Ψ(d) = Φ(d). Z sekcji 3 części 2 mamy


skąd Ψ(d) ≠ 0 dla wszystkich d a więc Ψ(p-1) = Φ(p-1) są wymagane. Aby zweryfikować twierdzenie dotyczące Ψ, załóżmy ,że Ψ(d) ≠ 0 i niech a będzie liczbą należącą do d (mod p). Wtedy, a , a2,...,ad są wzajemnie inkongruentnymi rozwiązaniami xd ≡ 1 (mod p) a zatem, z twierdzenia Lagrange′a , przedstawiają one wszystkie rozwiązania. Teraz łatwo zauważyć ,że liczby am przy 1 ≤ m ≤ d i (m,d) = 1 przedstawiają wszystkie liczby które należą do d (mod p); rzeczywiście każda ma rząd d, jeśli amd ≡ 1 wtedy d|d′ i jeśli b jest dowolną liczbą , która należy do d (mod p) wtedy b ≡ am dla pewnych m przy 1 ≤ m ≤ d, i mamy (m,d) = 1 ponieważ bd/(m,d) ≡ (ad)m/(m,d) ≡ 1 (mod p).Daje to Ψ(d) = Φ(d). Niech g będzie pierwiastkiem pierwotnym (mod p). Udowodnimy teraz ,że istnieje liczba całkowita x taka ,że g′ = g + px jest pierwiastkiem pierwotnym (mod pj) dla wszystkich potęg liczb pierwszych pj .Mamy gp-1 = 1 +py dla pewnej liczby całkowitej y a więc, z twierdzenia binomialnego, g′p-1 = 1 + pz, gdzie
z≡ y + (p-1)gp-2 x(mod p)
Współczynnik x nie jest podzielny przez p a więc możemy wybrać x takie ,że (z,p) = 1. Wtedy g′ ma wymaganą właściwość. Przypuśćmy ,że g′ należy do d (mod pj) .Wtedy d dzieli się Φ(pj) = pj-1(p-1). Ale g′ jest pierwiastkiem pierwotnym (mod p) a zatem p-1 dzieli się przez d. Zatem d = pk(p-1) dla pewnego k < j. Dalej, ponieważ p jest nieparzyste, mamy
(1+pz)pk = 1 + pk+1zks,
gdzie (zks, p) = 1 .Teraz ponieważ g′d ≡ 1 (mod pj) wynika ,że j = k+1 i daje to d = Φ(pj), co było wymagane. W końcu, dedukujemy ,że dla dowolnej liczby naturalnej n , istnieje pierwiastek pierwotny (mod n) jeśli i tylko jeśli n ma postać 2,4,pj lub 2pj, gdzie p jest nieparzystą liczbą pierwszą. Wyraźnie 1 i 3 ą pierwiastkami pierwotnymi (mod 2) i (mod 4) .Dalej, jeśli g jest pierwiastek pierwotny (mod pj) wtedy nieparzysty element pary g, g&primel + pj jest pierwiastkiem pierwotnym (mod 2pj), ponieważ Φ(2pj) = Φ(pj). Zatem pozostaje tylko udowodnić konieczność twierdzenia. Teraz, jeśli n = n1n2, gdzie(n1,n2) = 1 i n1 > 2, n2 > 2, wtedy nie ma pierwiastka pierwotnego (mod n). Dla Φ(n1) i Φ(n2) są parzyste a zatem dla dowolnej liczby naturalnej a mamy
a1/2Φ(n) = (aΦ(n1))1/2Φ(n2) ≡ 1 (mod n)
podobnie a1/2Φ(n) ≡ 1 (mod n2), skąd a1/2Φ(n) ≡ 1 (mod n). Nie ma pierwiastków pierwotnych (mod 2j) dla j > 2, ponieważ, przez indukcję, mamy a2j-2 ≡ 1 (mod 2j ) dla wszystkich nieparzystych liczb a .To udowadnia to twierdzenie.
7.Wskaźniki
Niech g będzie pierwiastkiem pierwotnym (mod n). Liczby gl przy l = 0,1,...,Φ(n) -1 formują zbiór redukowalny reszt (mod n). Zatem , dla każdej liczby całkowitej a przy (a,n) = 1 jest jednoznaczne l takie ,że gl ≡ a (mod n) .Wykładnik l jest nazywany indeksem a w nawiązaniu do g i jest oznaczone przez ind a. Wyraźnie mamy
ind a + ind b ≡ ind (ab)(mod Φ(n))
a ind1 = 0, ind g = 1 .Dalej, dla każdej liczby naturalnej m mamy ind(am) ≡ m ind a (mod Φ(n)). Te właściwości indeksu są analogiczne do właściwości logarytmów. Również mamy ind(-1) = 1/2Φ(n) dla n > 2 ponieważ g2 ind(-1) ≡ 1 (mod n) i 2 ind(-1) < 2Φ(n). Jako przykład wykorzystania wskaźników rozważmy kongruencję xn ≡ a (mod p), gdzie p jest liczbą pierwszą. Mamy n ind x ≡ ind a (mod (p-1)) a zatem jeśli (n,p-1) = 1 wtedy jest tylko jedno rozwiązanie. rozważmy, w szczególności, x5 ≡ 2 (mod 7). Łatwo jest sprawdzić ,że 3 jest pierwiastkiem pierwotnym (mod 7 i mamy 32) = 2 (mod 7). Zatem 5 ind x ≡ 2 (mod 6), co daje ind x = 4 a x ≡ 34 ≡ 4 (mod 7). Zauważ ,że chociaż nie ma pierwiastków pierwotnych (mod 2j) dla j > 2, liczba 5 należy do 2j-2 (mod 2j) a każda nieparzysta liczba całkowita a jest kongruentna (mod 2j) do jednej liczby całkowitej postaci (-1)l5m, gdzie l = 0, 1 i m = 0,1,...2j1. Para l,m ma podobne właściwości do indeksów zdefiniowanych powyżej.
Ćwiczenia
a) Znajdź liczbę całkowitą x taką, że 2x ≡ 1 (mod 3), 3x ≡ 1 (mod 5), 5x ≡ 1 (mod 7)
b) Udowodnij ,że dla dowolnych liczb dodatnich całkowitych a,n przy (a,n) = 1, Σ{a,x/n}= 1/2Φ(n), gdzie składniki sumy jest dla wszystkich x w zbiorze redukowalnym reszt (mod n)
c) Liczby całkowite a i n > 1 spełniają an-1 ≡ 1 (mod n) ale am ≡ 1 (mod n) dla każdego dzielnika m z n-1, innego niż one same. Udowodnij ,że n jest liczbą pierwszą.
d) Wykaż ,że kongruencja xp-1 - 1 ≡ 0 (mod pj) ma tylko p-1 rozwiązań (mod pj) dla każdej potęgi pierwszej pj
e) Udowodnij ,że dla każdej liczby naturalnej n, albo nie ma pierwiastków pierwotnych (mod n) albo jest Φ(Φ(n)) pierwiastków pierwotnych (mod n)
f) Udowodnij ,że , dla dowolnej liczby pierwszej p , suma wszystkich różnych pierwiastków pierwotnych (mod p) jest kongruentna do μ(p-1) (mod p)
g) Określ wszystkie rozwiązania kongruencji y2 ≡ 5x3 (mod 7) w liczbach x,y
h) Udowodnij ,że jeśli p jest liczbą pierwszą > 3 wtedy licznik 1+1/2+...+1/(p-1) jest podzielny przez p2 (twierdzenie Wolstenholme′a)

CZĘŚĆ IV : Residuum Kwadratowe

1.Symbol Legendre′a
W ostatniej części omawialiśmy liniową kongruencję ax ≡ b (mod n) .Tu przestudiujemy kongruencję kwadratowe x2 ≡ a (mod n); faktycznie sprowadza się do badania ogólnej kongruencji kwadratowej ax2 + bx + c ≡ 0 (mod n), ponieważ zapisujemy d = b2 - 4ac i y = 2ax+b, to ostatnie daje y2 ≡ d (mod 4an). Niech a będzie dowolną liczbą całkowitą, niech n będzie liczbą naturalną i załóżmy ,że (a,n) = 1. Wtedy a jest nazywane residuum kwadratowym (mod n) jeśli kongruencja x2 ≡ a (mod n) jest rozwiązywalne; w przeciwnym razie jest nazywane kwadratową nie resztą. Symbol Legenfre′a


gdzie p jest liczbą pierwszą a (a,p) = 1 , jest zdefiniowany jako 1 jeśli a jest residuum kwadratowym (mod p) a jako -1 jeśli a jest nieresztą kwadratową (mod p). Jasno, jeśli a ≡ a′ (mod p) mamy


2.Kryterium Eulera
Stanowi ono ,że jeśli p jest liczbą nieparzystą pierwszą wtedy
(a/p) ≡ a1/2(p-1)(mod p).
Dla dowodu zapiszemy, dla zwięzłości , r = 1/2(p-1) i zauważmy najpierw ,że jeśli a jest resztą kwadratową (mod p) wtedy dla pewnego x w N mamy x2 ≡ a (mod p), skąd, z twierdzenia Fermata, ar ≡ xp-1 ≡ 1 (mod p). Zatem wystarczy wykazać ,że jeśli a jest nieresztą kwadratową (mod p ) wtedy ar ≡ -1 (mod p). Teraz w zbiorze redukowalnym (mod p) jest r reszt kwadratowych (mod p) i r niereszt kwadratowych (mod p); liczby 12, 22,...,r2 są wzajemnie nie kongruentne (mod p), dla dowolnej liczby całkowitej k, (p-k)2 ≡ k2 (mod p), liczby przedstawiają wszystkie reszty kwadratowe (mod p). Każda z liczb spełnia xr ≡ 1 (mod p), a z twierdzenia Lagrange′a, kongruencja ma najwyżej r rozwiązań (mod p). Zatem jeśli a jest nieresztą kwadratową (mod p) wtedy a nie jest rozwiązaniem kongruencji. Ale, z twierdzenia Fermata, ap-1 ≡ 1 (mod p), skąd ar ≡ ±1 (mod p). Zauważ ,że można dowodzić alternatywnie z punktu widzenia pierwiastka pierwotnego (mod p), powiedzmy g; rzeczywiście jasne jest ,że reszty kwadratowe (mod p) są dane prze 1,g2,...,g2r. Jako bezpośrednie następstwo kryterium Eulera mamy własność multiplikatywną symbolu Legendre′a, mianowicie
(a/p)(b/p) = (ab/p)
dla wszystkich liczb całkowitych a,b nie podzielnych przez p; tu równość się utrzymuje ponieważ obie strony są ± 1. Podobnie mamy
(-1/p) = (-1)1/2(p-1)
innymi słowy, -1 jest resztą kwadratową wszystkich liczb pierwszych ≡ 1 (mod 4) i nie reszt kwadratowych wszystkich liczb pierwszych ≡3 (mod 4). Z sekcji 4 części III, wynika ,że kiedy p ≡ 1 (mod 4) rozwiązania x2 ≡ -1 (mod p) są dane przez x = ±(r!)
3.Lemat Gaussa
Dla dowolnej liczby całkowitej a i dowolnej liczby naturalnej n definiujemy numerycznie najmniejszą resztę a (mod n), jako liczbę całkowitą a′ dla której a ≡ (mod n) i (-1/2)n < a′ ≤ (1/2)n. Niech teraz p będzie nieparzystą liczbą pierwszą i załóżmy ,że (a,p) = 1. Dalej niech aj będzie numerycznie najmniejszą resztą aj (mod p) dla j = 1,2,... Lemat Gaussa stanowi ,że
(a/p) = (-1)l;
gdzie l jest liczbą j ≤ 1/2(p-1) dla której aj < 0. Zaobserwujmy ,że liczby |aj| przy 1 ≤ j ≤ r, gdzie r = 1/2(p-1) są po prostu liczbami 1,2,...,r w pewnym porządku. Z pewnością mamy 1 ≤ |aj| ≤ r, a |aj| są różne ponieważ aj = -ak, przy k ≤ r, da a(j+k) ≡ 0 (mod p) przy 0 < j+k < p, co jest niemożliwe, a aj = ak daje aj ≡ ak (mod p), skąd j = k. Zatem mamy a1...ar = (-1)lrl. Ale aj ≡ aj(mod p) a więc a1...ar ≡ arrl (mod p).Zatem ar ≡ (-1)l (mod p), a wynik wynika z kryterium Eulera. Uzyskujemy


to znaczy 2 jest resztą kwadratową wszystkich liczb pierwszych ≡ ±1 (mod 8) i nieresztą kwadratową wszystkich liczb pierwszych ≡ ±3 (mod 8).Aby sprawdzić ten wynik, zauważ ,że kiedy a = 2, mamy aj = 2j dla 1 ≤ j ≤ [(1/4)p] i aj = 2j-p dla [(1/4)p] < j ≤ 1/2(p-1).Zatem w tym przypadku l = 1/2(p-1)-[(1/4)p], i łatwo sprawdzić ,że l ≡ 1/8 (p2 -1) (mod 2)
4.Prawo wzajemności reszt kwadratowych
Dochodzimy teraz do słynnego twierdzenia podanego przez Eulera w 1783 roku i udowodnionego przez Gaussa w 1796. Najwyraźniej, Euler, Legendre i Gauss, a Gauss pracował nad nim intensywnie przez rok przed ustaleniem wyniku; podał potem nie mniej niż osiem demonstracji. Prawo wzajemności reszt kwadratowych zakłada ,że jeśli p,q są różnymi nieparzystymi liczbami pierwszymi, wtedy
(p/q)(q/p) = (-1)(1/4)(p-1)(q-1). Zatem jeśli p,q nie są obie kongruentne 3 (mod 4) wtedy
(p/q) = (q/p)
a w wyjątkowych przypadkach
(p/q) = -(q/p). Dla dowodu ,zauważmy, że z lematu Gaussa (p/q) = (-1)l, gdzie l jest liczba punktów kratowych (x,y) (to znaczy parą liczb całkowitych) spełniających 0 < x < 1/2q i -1/2q < px - qy < 0. Teraz te nierówności dają y < (px/q) + 1/2 >< 1/2 (p+1). Zatem, ponieważ y jest liczbą całkowitą, widzimy ,że l jest liczbą punktów kraty w prostokącie R zdefiniowanym przez 0 < x < 1/2 q, 0 < y < 1/2 p, spełniających -1/2 q < px=qy < 0 . Podobnie
(p/q) = (-1)m
gdzie m jest liczbą punktów kratowych w R spełniających -1/2 p < qy - px < 0. Teraz wystarczy udowodnić ,że 1/4 (p-1)(q-1) - (l+m) jest parzyste. Ale 1/4(p-1)(q-1) jest tylko liczbą punktów kratowych w R ,a zatem ostatnie wyrażenie jest liczbą punktów kratowych w R spełniających albo px-qy ≤ -1/2q lub qy-px ≤ -1/2p. Regiony w R definiowane przez te nierówności są rozłączne i zawierają tą samą liczbę punktów kratowych, ponieważ łatwo zweryfikować zastąpienie
x=1/2(q+1) - x′ , y = 1/2 (p+1) - y′


dostarcza przyporządkowania jeden do jednego między nimi. Prawo wzajemności reszt kwadratowych jest przydatne w obliczaniu symbolu Legendre′a Na przykład mamy
(15/71) = (3/71)(5/71) = -(71/3)(71/5) = -(2/3)(1/5) = 1
Dalej na przykład uzyskujemy
(-3/p) = (-1/p)(3/p) = (-1)l(p-1)(3/p) = (p/3)
skąd -3 jest resztą kwadratową wszystkich liczb pierwszych ≡ 1 (mod 6) i resztą niekwadratową wszystkich liczb pierwszych ≡ -1 (mod 6)
5.Symbol Jacobi′ehgo
Jest to uogólnienie symbolu Legendre′a .Nich n będzie dodatnią nieparzystą liczbą całkowitą i załóżmy ,że n = p1pn...pk jako iloczy liczb pierwszych, nie koniecznie różnych. Wtedy, dla dowolnej liczby całkowitej a przy (a,n) = 1, symbol Jacobi′ego jest definiowany przez
(a/n) = (a/p1)...(a/pk)
gdzie współczynniki po prawej stronie są symbolami Legendre′a. Kiedy n = 1 symbol Jacobi′ego jest definiowany jako 1 a kiedy (a,n) > 1 jest definiowany jako 0. Jeśli a ≡ a′ (mod n) wtedy
(a/n) = (a′/n)
Należy od razu zauważyć ,że
(a/n) = 1
nie implikuje ,że a jest resztą kwadratową (mod n). Rzeczywiście a jest resztą kwadratową (mod n) jeśli i tylko jeśli a jest resztą kwadratową (mod p) dla każdego dzielnika pierwszego p z n. Ale (a/n) = -1 implikuje ,że a jest nieresztą kwadratową (mod n).Zatem, na przykład, ponieważ
(6/35) = (6/5)(6/7)=(1/5)(-1/7) = -1
konkludujemy ,że 6 jest nieresztą kwadratową (mod 35) .Symbol Jacobi′ego jest multiplikatywny, tak jak symbol Legendre′a; to znaczy
(ab/b) = (a/n)(b/n)
dla wszystkich liczb całkowitych a,b względnie pierwszych do n. Dalej, jeśli m, n są nieparzyste i (a,mn) = 1 wtedy
(a/mn) = (a/m)(a,n)
Co więcej ,mamy


a analogiczne prawo wzajemności reszt kwadratowych mówi, mianowicie jeśli m,n są nieparzyste a (m,n) = 1 wtedy


Wynik te są łatwe do zweryfikowania odpowiednimi twierdzeniami dla symbolu Legendre′a, zauważamy ,że jeśli n = n1n2, wtedy
(1/2)(n-1) ≡ (1/2)(n1 - 1) + (1/2)(n2 - 1)(mod 2),
ponieważ 1/2(n1-1)(n2 -1) ≡ 0 (mod 2), i że podobną kongruencję otrzymujemy dla (1/8)(n2 - 1). Symbol Jacobie′ego może być używany w celu ułatwienia obliczania symboli Legendre′a. Mamy na przykład
(335/2999) = -(2999/335) = -(-16/335)= - (-1/335) = 1
skąd, ponieważ 2999 jest liczbą pierwszą, wynika ,że 335 jest resztą kwadratową (mod 2999)
6.Ćwiczenia
a) Określ liczby pierwsze p dla których 5 jest residuum kwadratowym (mod p)
b) Wykaż, że jeśli p jest liczbą pierwszą ≡ 3 (mod 4) i jeśli p′ = 2p +1 jest liczbą pierwszą wtedy 2n ≡ 1 (mod p′). Wydedukuj ,że 2251 - 1 nie jest liczbą pierwszą Mersenne′a
c) Wykaż ,że jeśli p jest liczbą pierwszą nieparzystą wtedy iloczyn P wszystkich reszt kwadratowych (mod p) spełnia P ≡ (-1)1/2(p+1) (mod p)
d) Udowodnij ,że jeśli p jest liczbą pierwszą ≡ 1 (mod 4) wtedy Σ r = 1/4p(p-1), gdzie składniki sumy jest nad wszystkimi resztami kwadratowymi r przy 1 ≤ r ≤ p-1
e) Wylicz symbol Jacobi′ego (123/917)
f) Wykaż ,że dla dowolnej liczby całkowitej d i dowolnej liczby pierwszej nieparzystej p, liczba rozwiązań kongruencji x2 ≡ d (mod p) to 1+(d/p)
g) Niech f(x) = ax2+bx+c, gdzie a,b,c są liczbami całkowitymi i niech p będzie liczbą pierwszą nieparzystą która nie jest podzielna przez a Dalej, niech d = b2 - 4ac. Wykaż ,że jeśli p nie jest podzielne przez d, wtedy


Wylicz sumę kiedy p dzieli się przez d
h) Udowodnij ,że jeśli p′ ≡ 1 (mod 4) i jeśli p = 2p′+1 jest liczbą pierwszą wtedy 2 jest pierwiastkiem pierwotnym (mod p). Dla których liczb pierwszych p′ z liczbą pierwszą 2p′+1 , 5 jest pierwiastkiem pierwotnym (mod p)?
i) Wykaż ,że jeśli p jest liczbą pierwszą a a,b,c są liczbami całkowitymi nie podzielnymi przez p wtedy istnieją liczby całkowite x,y takie ,że ax2+by2 ≡ c (mod p)
j)Niech f = f(x1,...,xn) będzie wielomianem ze współczynnikami całkowitymi , i niech p będzie liczbą pierwszą .Udowodnij ,że jeśli kongruencja f ≡ 0 (mod p) ma tylko trywialne rozwiązanie wtedy wielomian
1-fp-1 - (1- x1p-1)...(1- xnp-1)
jest podzielny przez p dla wszystkich liczb całkowitych x1....xn. Wydedukuj ,że jeśli f ma całkowity stopień mniejszy niż n wtedy kongruencja f ≡ 0 (mod p) ma rozwiązanie nietrywialne (twierdzenie Chevalley′a)
k) Udowodnij ,że jeśli f = f(x1...xn) jest formą kwadratową z całkowitymi współczynnikami, jeśli n ≥ 3 i jeśli p jest liczbą pierwszą, wtedy kongruencja f ≡ 0 (mod p) ma nietrywialne rozwiązania.

CZĘŚĆ V : Formy Kwadratowe

1.Równoważność
Rozważmy binarną formę kwadratową
f(x,y) - ax2+bxy+cy2
gdzie a,b,c są liczbami całkowitymi. Przez wyznacznik f rozumiemy liczbę d = b2 - 4qc. d≡ 0 (mod 4) jeśli b jest parzyste a d ≡ 1 (mod 4) jeśli b jest nieparzyste. Forma x2 - 1/2 dy2 dla d ≡ 0 (mod 4) o x2 + xy + 1/4 (1-d)y2 dla d ≡ 1 (mod 4) są nazywane formami głównymi z wyznacznikiem d. Mamy
4af(x,y) = (2ax+by)2 - dy2, skąd jeśli d < 0 wartości pobierane przez f są wszystkie tego samego znaku (lub zerem); f jest nazywane dodatnio lub ujemnie oznaczone , odpowiednio. Jeśli d > 0 wtedy f pobiera wartości obu znaków i jest nazywane jako nieoznaczona. Mówimy ,że dwie formy kwadratowe są równoważne jeśli jedna może być przekształcona w drugą przez unimodularne całkowe zastąpienie, czyli zastąpienie w postaci
x = px′ + qy′ , y = rx′ + sy′ ,
gdzie p,q,r,s są liczbami całkowitymi z ps - qr = 1. Łatwo zweryfikować ,że ta relacja jest zwrotna, symetryczna i przechodnia. Dalej ,jasne jest ,że zbiór wartości przyjmowanych przez formy równoważne jak x,y przebiegają przez liczby całkowite jest taki sam i rzeczywiście przyjmuje ten sam zbiór wartości jak para x,y przebiegającą przez wszystkie liczby całkowite względnie pierwsze; dla (x,y) = 1 jeśli i tylko jeśli (x′ , y′) = 1. Co więcej formy równoważne mają ten sam wyznaczniki. Dla zastąpienia f
f(x′, y′) = a′x′2 + b′x′y′ + c′y′2 , gdzie
a′ = f(p,r), b′ = 2apq + b(ps+qr) + 2crs, c′ =f(q,s) i łatwo jest sprawdzić ,że b′2 - 4a′c′ = d(ps-qr)2. Alternatywnie , w notacji macierzy, możemy zapisać f jako XTFX a zastąpienie jako X = UX′, gdzie


wtedy f jest transformowane do X′TF′X′, gdzie F′ = UTFU, i, ponieważ wyznacznik U to 1, wynika ,że wyznaczniki F i F′ są równe
2.Redukcja
Istnieje elegancka teoria redukcji powiązana z dodatnim określeniem form kwadratowych które teraz opiszemy. Zatem przyjmujemy, że odtąd d < 0 i ,że a > 0; wtedy mamy również c > 0. Zaczniemy od zaobserwowania ,że przez skończoną sekwencję unimodularnych podstawień postaci x = y′, y = -x′ i x = x′ ± y′ , y = y′ , f moze być przekształcone do innej binarnej formy dla której |b| ≤ a ≤ c. Dla pierwszego z tych zastąpień wymieniamy a i c, co pozwala zastąpić a > c przez a < c;a drugi ma wpływ na zmianę b na b ± 2a pozostawiając niezmienione a, z czego , przez skończenie wiele zastosowań , pozwala na zastąpienie |b| > a przez |b| ≤ a .Ten proce musi się zakończyć ponieważ gdy pierwsza substytucja jest stosowana, skutkuje to mniejszą wartością a .Faktycznie możemy przekształcić f na formę binarną dla której albo
-a < b ≤ a < c albo 0 ≤ b ≤a = c
Kiedy b = -a wtedy druga z powyższych substytucji pozwala na b = a, pozostawiając c niezmienionym, i jeśli a = c wtedy pierwsza substytucja pozwala na 0 ≤ b. Forma binarna posiadająca jeden lub drugi z powyższych warunków na a,b,c ,mówimy ,że jest zredukowana . Jest tylko skończenie wiele form zredukowanych przy danym wyznaczniku d; jeśli f jest zredukowane wtedy -d = 4ac-b2 ≥ 3ac, z czego a,c i |b| nie mogą przekroczyć 1/3 |d|. Liczba zredukowanych form z wyznacznikiem d jest nazywana numerem klasy i jest oznaczana przez h(d). Dla wyliczenia numeru klasy kiedy d = -4, na przykład, zauważmy ,że nierówność 3ac ≤ 4 daje a =c = 1, skąd b = 0 a h(-4). Liczba h(d) jest w rzeczywistości liczba klas nierówności binarnej formy kwadratowej z wyznacznikiem d, jak udowodnimy, dowolne dwie formy zredukowane nie są równoważne. Nich f(x,y) będzie formą zredukowaną. Wtedy jeśli x,y są niezerowymi liczbami całkowitymi i |x| ≥ |y| mamy
f(x,y) ≥ |x| (a|x| - |by|) + c|y|2
         ≥|x|2(a-|b|) + c|y|2 ≥ a - |b| + c.
Podobnie, jeśli |y| ≥ |x| mamy f(x,y) &ge a - |b| + c. Zatem najmniejsza wartość zakładana przez f dla względnie pierwszych liczb całkowitych x,y to a, c i a-|b|+ c, w tym porządku; te wartości są brane przy (1,0),(0,1) i albo (1,1) albo (1,-1). Teraz sekwencje wartości zakładane przez formy równoważne dla liczb pierwszych względnych x,y są takie same, z wyjątkiem zmiany rozkładu, a zatem jeślli f′ jest formą, równoważną f, i jeśli również f′ jest redukowalna, wtedy a = a′, c = c′ a b = ± b′ Pozostaje udowodnić ,z jeśli b = -b′ wtedy rzeczywiście b = 0.Możemy tu założyć ,że -a < b < a < c, ponieważ f′ jest redukowalna, mamy =a < -b i jeśli a = c wtedy mamy b ≥ 0, - b ≥ 0, skąd b = 0. Wynika stąd ,że f(x,y) ≥ a -|b|+c > c > a dla wszystkich niezerowych liczb całkowitych x ,y. Ale przy notacji z sekcji 1 dla zastąpienia f na f&prime, mamy a = f(p,r). Zatem p = ±1, r = 0 i z ps-qr = 1 uzyskujemy s = ± .Dalej, mamy c = f(q,s) skąd q = 0. Zatem tylko zastąpienia f na f′ to x = x7prime; , y = y′ i x = -x′ , y = -y′ .Daje to b = 0 co było do wykazania
3.Reprezentacja form binarnych
Liczba n jest właściwie reprezentowana w formie binarnej f jeśli n = f(x,y) dla pewnych liczb całkowitych x,y przy (x,y) = 1. Jest to przydatne kryterium w połączeniu z taką reprezentacją, mianowicie n jest właściwie reprezentowana przez pewną formę binarną z wyznacznikiem d jeśli i tylko jeśli kongruencja x2 ≡ d (mod 4n) jest rozwiązywalna. Dla udowodnienia załóżmy najpierw ,że kongruencja jest rozwiązywalna i niech x = b będzie rozwiązaniem. Definiujemy c przez b2 - 4nc = d i wstawiamy a = n. Wtedy forma f, ma wyznacznik d i właściwą reprezentację n, faktycznie f(1,0) = n. Odwrotnie załóżmy ,że f ma wyznaczniki d i ,że n = f(p,r) dla pewnych liczb całkowitych p,r przy (p,r) = 1. Wtedy istnieją liczby całkowite r,s z ps-qr = 1 a f jest równoważna formie f′ ,jak w sekcji 1 prze a′ = n. Ale f i f′ mają ten sam wyznacznik a więc b′2 - 4nc′ = d .Zatem kongruencja x2 ≡ d (mod 4n) ma rozwiązanie x = b′ Ten pomysł może być rozwijany, w przypadku (n,d) = 1 , liczba właściwych reprezentacji n przez wszystkie formy zredukowane z danym wyznacznikiem d. Rzeczywiście ilość ta jest podana prze ws ,gdzie s jest liczbą rozwiązań kongruencji x2 d (mod 4n) przy 0 ≤ x < 2n a w jest liczbą automorfizmów formy zredukowanej; przez automorfizm f rozumiemy całkowite unimodularne zastąpienie , które pobiera f na nią samą. Liczba w jest powiązana z rozwiązaniem równania Pella; jest podana przez 2 dla d < -4, przez 4 dla d = -4 i przez 6 dla d = -3. Faktycznie tylko automorfizm dla d < -4, to x = x′ y = y′ i x = -x′, y = -y′
4.Sumy dwóch kwadratów
Niech n będzie liczbą naturalną. Przejdziemy do udowodnienia ,że n może być wyrażone w postaci x2 + y2 dla pewnych liczb całkowitych x,y jeśli i tylko jeśli każdy pierwszy dzielnik p z n przy p ≡ 3 (mod 4) występują dla parzystych potęg w standardowym rozkładzie na czynniki n. Wynik datuje się od fermata i Eulera. Dla potrzeby łatwej weryfikacji ,załóżmy ,że n = x2 + y2 i że n jest podzielne przez liczbę pierwszą p ≡ 3 (mod 4). Wtedy x2 ≡ -y2 (mod p) a ponieważ -1 jest niereszta kwadratową (mod p), widzimy ,że p dzieli się przez x i y. Zatem mamy (x/p)2 + (y/p)2 = n/p2 , i wynika z indukcji ,że p dzieli się przez n na parzyste potęgi .Aby udowodnić odwrotność, wystarczy założyć ,że n jest wolnym kwadratem i wykazać ,ze jeśli każdy nieparzysty dzielnik pierwszy p z n spełnia p≡ 1 (mod 4) wtedy n może być przedstawione przez x2 + y2; dla jasności ,jeśli n = x2 + y2 wtedy nm2 = (xm)2 + (ym)2. Teraz forma kwadratowa x2 + y2 jest formą zredukowaną z wyznacznikiem -4, a udowodniliśmy w sekcji 2 ,że h(-4) = 1 .Zatem jest to jedyna taka forma zredukowana. Wynika z sekcji 3 ,że n jest właściwą reprezentacją x2 + y2 jeśli i tylko jeśli kongruencja x2 ≡ -4 (mod 4n) jest rozwiązywalne. Ale zgodnie z hipotezą, -1 jest resztą kwadratową (mod p) dla każdego pierwszego dzielnika p z n.Zatem -1 jest resztą kwadratową (mod n). Zauważmy ,że argument wiąże się z chińskim twierdzeniem o resztach, ale można tego uniknąć poprzez odwołanie się do tożsamości
(x2 + y2)(x′2 + y′2) = (xx′ + yy′)2 + (xy′ - yx′)2
która pozwala brać pod uwagę tylko pierwsze wartości n .Faktycznie jest znany dowód twierdzenia w oparciu o tą samą tożsamość. Ta demonstracja może być udoskonalona przez dostarczenie reprezentacji liczby n jako x2 + y2. Liczba ta jest podana przez
4Σ(-1/m) gdzie sumujemy wszystkie nieparzyste dzielniki m z n. Zatem, na przykład, każda liczba pierwsza p ≡ 1 (mod 4) może być wyrażona precyzyjnie na osiem sposobów jako suma dwóch kwadratów.
5.Suma czterech kwadratów
Udowodnimy teraz słynne twierdzenie ustanowione przez Bacheta w 1621 roku i pierwszy raz zademonstrowane przez Lagrange′a w 1770 roku, w ten sposób ,że każda liczba naturalna może być wyrażona przez sumę czterech kwadratów liczb całkowitych. Nasz dowód będzie oparty o tożsamość


, która jest powiązana z twierdzeniem kwaternionów. Ze względu na tożsamość i trywialna reprezentację 2 = 12 + 12 + 02 + 02, wystarczy udowodnić twierdzenie dla liczb pierwszych nieparzystych p. Teraz liczby x2 przy 0 ≤ x ≤ 1/2(p-1) są wzajemnie niekongruentne (mod p) i to samo utrzymuje się dla liczb -1-y2 przy 0 ≤ y ≤ 1/2(p-1) .Zatem mamy x2 ≡ -1-y2 (mod p) dla pewnych x,y spełniających x2+y2 + 1 < 1 + 2(1/2 p)2 < p2 .Stąd uzyskujemy mp = x2+y2 + 1 dla pewnych liczb całkowitych m przy 0 < m < p. Niech l będzie najmniejszą dodatnią liczbą całkowitą taką,że lp = x2 + y2 + z2 + w2 dla pewnych licbz całkowitych x,y,z,w. Wtedy lp ≤ m < p . Dalej, l jest nieparzyste, jeśli jest parzyste wtedy liczba parzysta z x,y,z,w byłaby nieparzysta i możemy założyć ,że x+y, x-y, z+w , z-w są parzyste; ale


a jest to niezgodne z minimalnym wyborem l. Aby udowodnić to twierdzenie musimy wykazać ,że l = 1; w związku z tym założymy ,że l > 1 i uzyskamy sprzeczność. Niech x′, y′ ,z′ ,w′ będą numerycznie najmniejszymi resztami x,y,z,w (mod l) i wstawiamy
n = x′2 + y′2 + z′2 + w′2
Wtedy n ≡ 0 (mod l) i mamy n > 0, w przeciwnym razie l będzie podzielne przez p. Ponieważ l jest nieparzyste, mamy n < 4(1/2 l)2 = l2. Zatem n = kl dla pewnego całkowitego k przy 0 < k < l. Teraz z tożsamości widzimy ,że (kl)(lp) jest w postaci sumy czterech kwadratów liczby całkowitej, a ponadto jest oczywiste ,że każdy z tych kwadratów jest podzielny przez l2 .Zatem kp jest wyrażone jako suma czterech kwadratów liczb całkowitych. Ale jest to sprzeczne z definicją l . Argumentem jest tu ilustracja metody Fermata nieskończonego pochodzenia. Wynik datuje się od Legendre′a i Gaussa, o tym ,że liczba naturalna jest sumą trzech kwadratów jesli i tylko jeśli nie jest w postaci 4(8k+7), z j,k jako nieujemnymi liczbami całkowitymi. Jest o oczywiste ponieważ kwadrat jest kongruentny do 0,1, lub 4 (mod 8) ale dostateczność zależy od twierdzenia trójskładnikowych form kwadratowych. Waring przypuszczał w 1770 roku ,że każda liczba naturalna może być przedstawiona jako suma czterech kwadratów, dziewięciu sześcianów, dziewiętnastu dwukwadratów, itd. Ostatnia interpretacja oznacza ,że dla każdej liczby całkowitej k ≥ 2 istnieje liczba całkowita s = s(k) taka ,że każda liczba naturalna n może być wyrażona w postaci x1k+...+xsk przy x1,...,xs jako nieujemnych liczbach całkowitych; i zwyczajowo oznacza się co najmniej takie s przez g(k). Zatem may g(2) = 4. Przypuszczenie Waringa zostało udowodnione przez Hilberta w 1909 roku,Inny, całkiem różny dowód podali Hardy i Littlewood w 1920 roku, i to właśnie tam jest po raz pierwszy słynna "metoda koła". Praca zależy od tożsamości


gdzie r(n) oznacza liczbę reprezentacji n w wymaganej formie i f(z) = 1+z1k + z1k +... .Zatem mamy


dla odpowiedniego konturu C. Teraz argument obejmuje delikatny podział konturu na "duże" i "małe" łuki, a analiza prowadzi do wyrażenia asymptotycznego dla t(n) i dokładnych danych dla g(k)
6.Ćwiczenia
a) Udowodnij ,że h(d) = 1 kiedy d = -3,-4,-7,-8,-11,-19,-43,-67 i -163
b) Określ wszystkie nieparzyste liczby pierwsze , które mogą być wyrażone w postaci x2 + xy + 5y2
c)Określ wszystkie dodatnie liczby całkowite , które mogą być wyrażone w postaci x2 + 2y2
d)Określ wszystkie dodatnie liczby całkowite , które mogą być wyrażone w postaci x2 - y2
e) Wykaż ,że istnieją dokładnie dwie formy zredukowane z wyznacznikiem -20. Udowodnij zatem ,ze liczby pierwsze , które mogą być reprezentowane prze x2+5y2 to 5 i kongruentne do 1 lub 9 (mod 20)
f) Oblicz h(-31)
g) Znajdź najmniejszą liczbę dodatnią całkowitą ,która może być reprezentowana przez 4x2 + 17sy + 20y2
h) Udowodnij, że n i 2n , gdzie n jest dowolną liczbą dodatnią całkowitą, ma tą samą liczbę reprezentacji jak suma dwóch kwadratów
i) Znajdź najmniejszą liczbę całkowitą s ,taką ,że n = x1k + ... + xsk , gdzie n = 2k[(3/2)k] - 1 , a x1,...,xs są dodatnimi liczbami całkowitymi

CZĘŚĆ VI : Aproksymacja diofantyczna

1.Twierdzenie Dirichleta
Aproksymacja diofantyczna dotyczy rozwiązywalności nierówności w liczbach całkowitych, Najprostszy wynik na tym polu osiągnął Dirichlet w 1842 roku. Wykazał ,że dla dowolnej liczby rzeczywistej θ i dowolnej liczby całkowitej Q > 1 istnieją liczby całkowite p,q przy 0 < q < Q takie ,że |qθ - p| ≤ 1/Q. Wynik może być uzyskany opd razu z tzw. "pola" lub "zasady szufladkowej". Zakłada one ,że jeśli jest n szufladek zawierających n+1 przedmiotów, wtedy muszą być co najmniej dwa przedmioty w jednej szufladce. Rozważmy fakt ,że Q+1 liczb 0,1,{θ}, {2θ},... {(Q-1)θ}, gdzie {x} oznacza część ułamkową z, jak w Części II. Liczby te wszystkie leżą w przedziale[0,1] i jeśli jedna dzieli się przez drugą,jak wyraźnie można, na Q rozłącznych sub-przedziałów, każdy o długości 1?Q, wtedy wynika z tego ,że dwa z tych Q+1 liczb musi leżeć w jednym z Q sup-przedziałów. Różnica między tymi dwoma liczbami ma postać qθ-p, gdzie p,q są liczbami całkowitymi przy 0 < q < Q, i ma |qθ - p| ≤ 1/Q. Twierdzenie Dirichleta jest bardziej ogólne dla liczb rzeczywistych Q > 1; wynika dla niecałkowitego Q wynika z twierdzenia właśnie ustanowionego z Q zastąpionym przez [Q] + 1. Jasne jest ,że liczby całkowite p,q do jakich odnosi się twierdzenie mogą być wybranej jako względnie pierwsze. Kiedy θ jest niewymierna mamy ważne następstwo ,że istnieje nieskończenie wiele związków p/q (q > 0) takich ,że |θ - p/q| < 1/q2. Rzeczywiście, dla Q > 1, jest wymierne p/q przy |θ-p/q| ≤ 1/(Qq) < 1/q2; co więcej, jeśli &theta jest niewymierna wtedy dla dowolnego Q′ przekraczamy 1/|qθ-p|, wymierny odpowiednik Q′ będzie różnił się od p/q. Zauważ ,że następstwo nie pozostaje poprawne dla wymiernego θ w razie θ = a/b przy a,b jako liczbach całkowitych i b > 0, wtedy, kiedy θ ≠ p/q, mamy |θ - p/q| ≥ 1/(qb) a więc jest tylko skończenie wiele wymiernych p/q takich ,że |θ - p/q| < 1/q2
2.Ułamki łańcuchowe
Algorytm ułamków łańcuchowych ustanawia przyporządkowania jeden na jeden między wszystkimi wymiernymi θ i wszystkimi nieskończonymi zbiorami liczb całkowitych a0,a1,a2,... z dodatnimi a1,a1... Ustanawia również przyporządkowanie jedne na jeden między wszystkimi wymiernymi θ i wszystkimi skończonymi zbiorami liczb całkowitych a0,a1,a2,...,an, z dodatnimi a0,a1,a2,...,an-1 i z an ≥ 2. Opisując ten algorytm, niech θ będzie dowolną liczbą rzeczywistą. Wstawiamy a0 = [θ]. Jeśli a0 ≠ θ zapisujemy θ = a0 + 1/θ1, tak aby θ1 > 1 i wstawiamy a1 = [θ1]. Jeśli a1 ≠ θ1 zapisujemy θ1 = a1 + 1/θ2, tak aby θ2 > 1, i wstawiamy a2 = [θ2]. Ten proces jest kontynuowany nieskończenie, chyba ,że an = θn dla pewnego n. Jasne jest ,że ostatnie wystąpi kiedy θ jest wymierne; faktycznie mamy


I odwrotnie, będzie to jasne za chwilę, jeśli θ jest wymierne wtedy proces się kończy. Powyższe wyrażenie jest nazywane ułamkiem łańcuchowym dla θ Jest zwyczajem aby zapisywać takie równanie krótko jako


lub krócej jako
θ = [a0,a1,a2,...,an].
Jeśli an ≠ θn dla wszystkich n, tak aby proces się nie zakończył, wtedy θ jest niewymierna. Przejdziemy do pokazania ,że można wtedy zapisać


lub krócej


Liczby całkowite a0,a1,a2... są znane jako ilorazy częściowe θ; liczby θ12 są nazywane ilorazami zupełnymi θ Udowodnimy ,że wymierności
pn/qn = [a0,a1,...,an]
gdzie pn qn oznaczają liczby całkowite względnie pierwsze, zmierzają do θ jeśli n → ∞ ; są faktycznie znane jako zbieżne do θ. Najpierw wykażemy ,że pn/qn są generowane rekurencyjnie przez równania
pn = anpn-1+pn-2 , qn = anqn-1+qn-2
p0 = a0, q0 = 1 i p1 = a0a1 + 1 , q1 = a1 .Rekurencje po prostu otrzymujemy dla n = 2; zakładamy ,że otrzymują dla n = m-1 ≥ 2 i przechodzimy do ich sprawdzania dla n = m. Definiujemy względnie pierwsze liczby całkowite p′j, q′j (j=0,1,...) przez
p′j/q′j = [a1,a2,...,aj+1]
i stosujemy rekurencję do p′m-1, q′m-1; daj one
p′m-1 = amp′m-2 + p′m-3,q′m-1 = amq′m-2 + q′m-3.
Ale mamy pj/qj = a0 + q′j-1/p′j-1. skąd
pj = a0p′j-1 + q′j-1, qm-1 = p′j-1
Zatem, biorąc j = m, uzyskujemy


i biorąc j = m-1 i j=m-2, wynika
pm = ampm-1 + pm-2, qm = amqm-1 + qm-2
Teraz z definicji θ1, θ2... mamy
θ = [a0,a1,...,ann+1
gdzie 0 < 1/θn+1 ≤ 1/an+1 , zatem &theta leży między pn/qn a pn+1/qn+1. Łatwo zobaczyć przez indukcję , że powyższe rekurencję dają
pnqn+1 - pn+1qn = (-1)n+1, a zatem mamy
|pn/qn - pn+1/qn+1| = 1/(qnqn+1). Wynika stąd, że konwergencja pn/ qn do θ spełnia
|θ - pn/ qn| ≤ 1/(qnqn+1), i z pewnością pn/ qn → θ ponieważ n → ∞ . Jest teraz jasne ,że kiedy θ jest wymierna, kończy się przetwarzanie ułamka łańcuchowego. Rzeczywiście dla wymiernego θ, proces jest ściśle związany z algorytmem Euklidesa jak opisano w Części I. Faktycznie, jeśli z notacją z sekcji 4 Części I, weźmiemy θ = a/b i aj = qj+1 (0 ≤ j ≤ k) wtedy mamy
θ = [a0,a1,...,ak]
zatem , na przykład 187/35 = [5,2,1,11]
3.Aproskymacje wymierne
Wynika z wyników sekcji 2 ,że , dla dowolnej liczby rzeczywistej θ, każda zbieżność p/q spełnia |θ - p/q| < 1 /q2. Zaobserwujemy teraz ,że z dowolnych dwóch kolejne zbieżności, powiedzmy pn/qn i pn+1/qn+1, jedna co najmniej spełnia |θ-p/q| < 1/(2q2).Rzeczywiście, ponieważ θ-pn/qn i θ-pn+1/qn+1 mają przeciwne znaki, mamy
|θ-pn/qn| + |θ-pn+1/qn+1| = |pn/qn - pn+1/qn+1| = 1/(qnqn+1); ale dla dowolnej liczby rzeczywistej α, β, przy α ≠ β , mamy αβ < 1/2(α2 + β2), skąd
1/(qnqn+1) < 1/(2q2n) + 1/(2q2n+1) ,
i daje to żądany rezultat. Zaobserwujmy dalej ,że dla dowolnych kolejne trzech zbieżności, powiedzmy pn/qn , pn+1/qn+1 i pn+2/qn+2, przynajmniej jedna spełnia |θ-p/q| < 1/(√5q2). Faktycznie, jeśli wynik był fałszywy, wtedy powyższe równania dają
1/(√5qn2)+ 1/(√5qn+12) ≤ 1/qnqn+1, to znaczy, λ + 1/λ ≤ √5 , gdzie λ = qn+1/qn . Ponieważ λ jest wymierna wynika strikte nierówność a więc
(λ -1/2(1+√5)) (λ -1/2(1-√5)) < 0
skąd λ < 1/2(1+√5). Podobnie, pisząc μ = qn+2/qn+1, mamy μ < 1/2(1+√5).Ale ,z sekcji 2, mamy qn+2 = an+2qn+1 + qn a zatem μ ≥ 1 + 1/λ to daje sprzeczność bo jeśli λ < 1/2(1+√5) wtedy 1/λ > 1/2(-1+√5). Ostatni wynik potwierdza twierdzenie Hurwitza w ten sposób ,że , dla dowolnej liczby niewymiernej θ, istnieje nieskończenie wiele wymiernych p/q takich ,że |θ - p/q| < 1/(√5q2). Stała 1/√5 jest najlepszą z możliwych, jak można sprawdzić (zobacz sekcja 5) biorąc
θ = 1/2(1+√5) = [1,1,1,...]
Jednak jeśli wyodrębnimy wszystkie niewymierne odpowiedniki θ, to znaczy te których ułamki łańcuchowe mają skończenie wiele ilorazów cząstkowych równych 1, wtedy mamy twierdzenie Hurwitza z 1/√8 w miejsce 1/√5, i jest to znowu najlepsza z możliwości. Jest nieskończona sekwencja takich wyników, ze stałymi skłaniającymi się ku 1/3, i stanowiącymi tzw. łańcuch Markowa. Zauważmy następnie ,że zbieżności dają kolejne bliższe przybliżenia do θ. Faktycznie mamy mocniejszy wynik z malejącym |qnθ - pn| przy rosnącym n. Aby to sprawdzić ,zaobserwujmy ,że rekurencje w sekcji 2 utrzymują siędla dowolnych nieoznaczoności a0, a1,..., skąd , dla n ≥ 1 , mamy
θ = pnθn+1 + pn-1 / qnθn+1 + qn-1
zatem uzyskujemy
|qnθ - pn| = 1/(qnθn+1 + qn-1),
i twierdzenie ma zastosowanie ,ponieważ dla n > 1 , mianownik po prawej przekracza
qn+qn-1 = (an + 1)qn-1 + qn-2 > qn-1θn + qn-2
i dla n = 1 , przekracza &theta1. Argument pokazuje tu ,że zbieżności do θ spełniają


Te zbieżności są rzeczywiście najlepszymi przybliżeniami do θ w tym sensie ,że jeśli p,q są liczbami całkowitymi przy 0 < q < qn+1 wtedy |qθ - p| ≥ |qn&teta - pn|. Bo jeśli zdefiniujemy liczby całkowite u,v przez
p = upn + vpn+1, q = uqn+vqn+1, wtedy łatwo zauważyć ,że u ≠ 0 i ,ze , jeśli v ≠ 0, wtedy u , v mają przeciwne znaki; zatem, ponieważ qnθ - pn i qn+1θ - pn+1 mają przeciwne znaki, uzyskujemy
|qθ - p| = |u(qnθ - pn) +v(qn+1θ - pn+1)| ≥ |qnθ - pn|
Dedukujemy ,że jeśli wymierne p/q spełnia |θ - p/q| < 1/(2q2) wtedy jest zbieżne do θ .Faktycznie mamy p/q = pn/qn gdzie qn & le; q ≤ qn+1 ; dla jasności
i dla n = 1 , przekracza &theta1. Argument pokazuje tu ,że zbieżności do θ spełniają


i, ponieważ q ≥ qn i |qθ - p| < 1/(2q), liczba po prawej jest mniejsza niż 1/(qqn); zatem liczba po lewej zanika. Konkludując tą sekcję, dla prawie wszystkich liczb rzeczywistych θ w sensie miary Lebesgue, nierówność |θ - p/q| < 1/(q2 log q) ma nieskończenie wiele rozwiązań wymiernych p/q; faktycznie ro samo stosuje się do nierówności |θ - p/q| < f(q)/q, gdzie f jest monotonicznie rosnąca funkcją taką ,że Σ f(q) jest rozbieżna. Jednakże, prawie żadna θ nie ma tej właściwości jeśli &Sigma f(q) jest zbieżna , na przykład jeśli f(q) = 1/(q(log q)1+δ) z δ > 0
4.Niewymierności kwadratowe
Przez niewymierności kwadratowe rozumiemy zera wielomianu ax2 + bx + c, gdzie a,b,c są liczbami całkowitymi a wyróżnik d=b2-4ac jest dodatni a nie doskonałym kwadratem. Jednym z najznamienitszych wyników w teorii liczb, od czasów Lagrange′a, jest to ,że ułamki łańcuchowe przedstawiają niewymierności kwadratowe jeśli i tylko jeśli jest ostatecznie okresowa, to znaczy, jeśli i tylko jeśli ilorazy cząstkowe a0,a1,... spełniają am+n = an dla pewnej dodatniej liczby całkowitej m i dla wszystkich wystarczająco dużych n. Zatem, ułamek łańcuchowy θ jest niewymiernością kwadratową jeśli i tylko jeśli ma postać
θ = ]a0,a1,...,ak-1,ak^,...,ak+m-1^],
gdzie oznaczone wyrazy wskazują ,że blok ilorazów cząstkowych jest powtarzana nieskończenie. Jako przykłady , mamy √2 = [1,2^] i 1/3(3+√3) = [1,1,1^,2^] .Łatwo jest zobaczyć ,że jeśli ułamek łańcuchowy dla θ ma powyższą postać wtedy θ jest niewymiernością kwadratową. Dla liczby
Φ =[ak,...ak+m-1]^ jest ilorazem całkowitym θ a więc, z sekcji 3, mamy dla k ≥ 2,
θ = pk-1Φ + pk-2 / qk-1Φ + qk-2
gdzie pn/qn (n = 0,1,...) są zbieżne do θ ;dalej mamy dla m ≥ 2
Φ = p′m-1Φ + p′m-2 / q′m-1Φ + q′m-2
gdzie p′n / q′n (n=0,1,...) są zbieżne do Φ Jasne jest z ostatniego równania ,że Φ jest kwadratowe a zatem, z poprzedzającego równania, również i θ; a to wyraźnie pozostaje poprawne dla k = 0 i 1, i dla m = 1. Ponieważ ułamek łańcuchowy dla &theta nie kończy się, wynika ,że θ jest niewymiernością kwadratową. Aby udowodnić odwrotność, załóżmy ,że θ jest niewymiernością kwadratową taką ,że θ spełnia równanie ax2 + bx + c = 0, gdzie a,b,c są liczbami całkowitymi przy d=b2 - 4ac > 0. Rozważmy formę binarną f(x,y) = ax2 + b0yx + cy2. Zastąpienie
x = pnx′ + pn-1y′ , y = qnx′ + qn-1y′
gdzie pn / qn (n=0,1,...) oznacza zbieżność do &theta, ma wyróżnik
pnqn-1 - pn-1qn = (-1)n-1 , a więc, jak w sekcji 1 części V, widzimy ,że przybiera f w postaci binarnej
fn(x,y) = anx2 + bnxz + cny2
z tym samym wyróżnikiem d jak f. Dalej mamy an = f(pn,qn) i cn = an-1. Teraz f(θ,1) = 0 , a więc


Z sekcji 2 mamy |θ - | < 1 /qn2 , z czego
2 - (pn/qn)2| < |θ + (pn/qn)|/qn2 < (2|θ)| + 1 )/ qn2
Zatem widzimy ,że
|an| < (2|θ| + 1)|a| + |b| , to znaczy, an jest ograniczone niezależnie od n. Ponieważ cn = an-1 i bn2 - 4ancn = d, wynika z tego ,że bn i cn są podobnie ograniczone. Ale dla n ≥ 1 ,mamy
θ = pnθn-1 + pn-1 / qnθn+1 + qn-1
gdzie θ1, θ2,.... oznacza całkowity iloraz θ, a więc fnn+1,1) = 0. Implikuje to ,że jest tylko skończenie wiele możliwości dla θ1, θ2,..., skąd θl+m = θl, dla pewnych dodatnich l, m. Zatem ułamek łańcuchowy dla θ jest ostatecznie okresowy. Ułamek łańcuchowy niewymierności kwadratowej θ będzie czysto okresowy jeśli k = 0 w wyrażeniu wskazanym powyżej. Łatwo jest wykazać ,że wystąpi to jeśli i tylko jeśli θ > 1 i sprzężenie θ′ z θ, to znaczy , inny pierwiastek równania kwadratowego definiującego θ spełniającego -1 < θ′ < 0. Rzeczywiście jeśli θ > 1 i -1 < θ′ < 0 wtedy łatwo sprawdzić ,przez indukcję ,że sprzężenie θ′n ilorazu całkowitego θn (n= 1,2,...) z &theta, podobnie spełnia -1 < θ′n <0; musimy odnosić się tylko do związku θ′n = an +1 / θ′n, gdzie θ = [a0,a1,...], razem z faktem ,że an ≥ 1 dla wszystkich n włączając n = 0. Nierówność -1 < θ′n < 0 pokazuje ,że an = [-1/θ′n] .Ponieważ teraz θ jest niewymiernością kwadratową mamy θm = θm dla pewnych różnych m ,n; ale daje to 1/θ′m = 1/θ′n , skąd, am-1 = an-1 .Wynika stąd ,że θm-1 = θn-1, a powtarzalność tego wniosku daje θ = θn-m zakładając, że n > m. Zatem θ jest czysto okresowa. Odwrotnie, jeśli θ jest czysto okresowa, wtedy θ > a0 ≥ 1. Dalej dla pewnego n ≥ 1, mamy
θ = pnθ + pn-1 / qnθ + qn-1
gdzie pn / qn (n=1,2...) oznacza zbieżność do θ a zatem θ spełnia równanie
qnx2 + (qn1 - pn)x - pn-1 = 0.
Teraz kwadrat po lewej stronie ma wartość -pn-1 < 0 dla x = 0, i ma wartość pn + qn - (pn-1 + qn-1) > 0 dla x = -1. Zatem sprzężenie θ′ z θ spełnia -1 < θ′ < 0. Widzimy ,że ułamki łańcuchowe z √d + [√d] i 1/(√d - [√d]) są czysto okresowe, gdzie d jest dowolną liczbą całkowitą dodatnią, a nie doskonałym kwadratem. Co więcej, implikuje to ,że ułamek łańcuchowy z √d jest prawie czysty okresowo w tym sensie ,że , tu, k =1. Zbieżności do √d , nawiasem mówiąc, są ściśle powiązane z rozwiązaniem równania Pella.
5.Twierdzenie Liouville′a
Sekcja 4 wykazała, że każda niewymierność kwadratowa θma ograniczenie ilorazami cząstkowymi. Z wyniku sekcji 3 wynika ,że istnieje liczba c = c(θ) taka ,że nierówność |θ -p/q| > c/q2 spełniona jest dla wszystkich liczb wymiernych p/q (q>0). Liouville udowodnił w 1844 roku ,że twierdzenie tego ostatniego rodzaju jest poprawne generalnie dla dowolnej niewymierności algebraicznej ,a jego odkrycie prowadziło do pierwszej demonstracji istnienia liczb przestępnych . Liczby rzeczywiste lub zespolone będą algebraiczne jeśli jest wielomian zerowy
P(x)= a0xn + a1xn-1 + ... + am
gdzie a0,a1,...,anoznaczają liczby całkowite, nie wszystkie 0.Dlakażdejliczbyalgebraicznejα jest wielomian P jak powyżej, z najmniejszym stopniem,taki,że P(α)= 0 a P jest jednoznaczne jeśli założymy,że a0 0 i ,że a0,a1,...,an są względnymi liczbami pierwszymi; oczywiście P jest nierozkładalny w liczbach wymiernych, i jest nazywany wielomianem minimalnym dla α. Stopień α jest definiowany jako stopień P. Twierdzenie Liouville′a stanowi ,że dla dowolnej liczby algebraicznej α o stopniu n > 1 istnieje liczba c = c(α) > 0 taka ,że nierówność |α - p/q| > c / qn jest spełniona dla wszystkich liczb wymiernych p/q (q>0). Dla udowodnienia ,założymy ,że α jest liczbą rzeczywistą, i zastosujemy twierdzenie o wartości średniej do P, wielomian minimalny wielomian dla α. Mamy dla liczby wymiernej p/q(q>0)
P(α) - P(p/q) = (α - p/q) P′(ξ)
gdzie P′(x) oznacza pochodną P, a ξ leży między α a p/q. Teraz mamy P(α) = 0 i ponieważ P jest nierozkładalny mamy również P(p/q) ≠ 0. Ale qnP(p/q) jest liczbą całkowitą a więc |P(p/q)| ≥ 1/qn . Możemy założyć ,że |α - p/q| < 1, wtedy mamy |ξ| > |α| + 1 a więc |P′(ξ)| < C dla C = C(α). To daje |α = p/q| > c/qn, gdzie c = 1/C. dowód pozwala na określenie wartości dla c stopnia P i jego współczynników. Użyjmy tej obserwacji do potwierdzenia twierdzenia z sekcji 3 ,że α = 1/2 (1+√5). W tym przypadku mamy P(x) = x2 - x - 1i również P′(x) = 2x-1. Niech p/q (q > 0) będzie liczbą wymierną i niech δ = |α - p/q| . Wtedy |P(p/q)| ≤ δ|P′(ξ)| dla pewnego ξ między α i p/q .Teraz jasno |ξ| ≤ α + δ a więc
}P′(ξ)| ≤ 2(α + δ) - 1 = 2δ + √5
Ale |P(p/q)| ≥ 1/q2, skąd δ(2δ+√5) ≥ 1/Q2. Implikuje to ,że dla dowolnego c′ przy c′ < 1/√5 i dla wszystkich wystarczająco dużego q mamy δ > c′/q2. Zatem twierdzenie Hurwitza jest najlepszym z możliwych. Liczba rzeczywista lub zespolona , która nie jest algebraiczna będzie przestępna. Łatwo jest podać przykład; rozważmy szereg
θ 2-1! + 2-2! + 2-3!+...
Jeśli wstawimy pj = 2j!(2-1! + 2-2! + ... + 2-j!),
qj = 2j! (j = 1,2,...)
wtedy pj, qj są liczbami całkowitymi, i mamy
|θ - pj/qj | = 21(j+1)! + 21(j+2)! + ...
Ale suma po prawej stronie jest co najwyżej
2-(j+1)!(1+2-1+2-2+...) = 2-(j+1)! + 1 < qj-j
i wynika z twierdzenia Liouville′a ,że θ jest przestępne. Rzeczywiście dowolna liczba rzeczywista θ dla której istnieje nieskończona sekwencja różnych liczb wymiernych pj / qj spełniających |θ - pj / qj| < 1/qj&omegaj, gdzie ωj → ∞ jka j → ∞, będących przestępnymi. Na przykład, zdarzy się to nieskończenie po przecinku, kiedy występuje wystarczający duży blok zer lub w ułamku łańcuchowym w którym ilorazy cząstkowe zwiększają się wystarczająco szybko. Było kilka znaczących poprawek do twierdzenia Liouville&pime;a, poczynając od słynnej pacy Thue w 1909 oku. Wykazał ,że dla dowolnej liczby algebraicznej α o stopniu n > 1 i dla dowolnego K > 1/2 (n+1) istnieje c = c(α K) > 0 takie ,że |α - p/q| > c/qK dla wszystkich liczb wymiernych p/q (q > 0). Warunek dla K został złagodzony przez Siegela w 1921 roku do K > 2√n a dalej przez Dysona i Gelfonda, niezależnie, w 1947 roku do K > √(2n). W końcu Roth udowodnił w 1955 roku ,że wystarczające jest aby wziąć K > 2, i jest to najlepsze z możliwych. Istnieje ścisły związek między takimi wynikami a równaniami diofantycznymi. W tum kontekście ważne jest aby wiedzieć , czy liczby c(α K) mogą być wyliczone jednoznacznie, to znaczy czy wyniki są efektywne. W rzeczywistości wszystkie poprawki twierdzenia Liouville′a w odniesieniu do powyższego są nieskuteczne gdyż dotyczą hipotetycznego założenia , wykonanego na początku że nierówności te dysponują co najmniej jednym dużym rozwiązaniem. Niemniej jednak udało się uzyskać rezultaty dla poszczególnych liczb algebraicznych; na przykład Baker udowodnił w 1964 oku właściwości funkcji hipergeometrycznych, takich ,że dla wszystkich liczb wymiernych p/q (q > 0) mamy


Co więcej, mała, ale skuteczna poprawa twierdzenia Liouville′a, to znaczy , poprawne dla dowolnego algebraicznego α, została ustanowiona w drodze teorii form liniowych w logarytmach.
6.Liczby przestępne
W 1873 Hermite zaczął nową erę w teorii liczb kiedy udowodnił ,że e , naturalna podstawa logarytmów , jest przestępna. Wcześniej ustalono ,że e nie było ani liczbą wymierną ani niewymiernością kwadratową; w rzeczywistości ułamek łańcuchowy dla e był znany, mianowicie
e = [2,1,2,1,1,4,1,1,6,1,1,8...]
Ale praca Hermite′a opierała się na zupełnie innym pomyśle dotyczącym przybliżenia funkcji analitycznych przez funkcje wymierne. W 1882 roku Lindeamnn znalazł uogólnienie argumentu Hermite′a i uzyskała tym samym swój słynny dowód przestępności π TO wystarczyło aby rozwiązać problem starożytnych Greków, budowy za pomocą cyrkla i linijki, kwadratu o powierzchni równej danemu okręgowi. W rzeczywistości, biorąc pod uwagę jednostkę długości, wszystkie punkty na tej płaszczyźnie, które są zdolne do budowy, są dane przez przecięcia linii i okręgów, skąd ich współrzędne w odpowiednim punktom odniesienia są liczbami algebraicznymi. Zatem przestępność π implikuje ,że długość √π nie może być zbudowana klasycznie a więc kwadratura koła jest niemożliwa. Lindemann w rzeczywistości udowodnił, że dla różnych liczb algebraicznych α1,...,αn i niezerowych liczb algebraicznych β1,...,β1 mamy
β1eα1+ ....+βneαn ≠ 0 . Przestępność π wynika przez wzgląd na tożsamość Eulera e = -1; a wynik wyraźnie obejmuje również przestępność, z log α dla algebraicznego α nie 0 lub 1, i funkcji trygonometrycznych cos α sin α i tan α dla wszystkich niezerowych algebraicznych α. w sensie miary Lebesgue, "prawie wszystkie" liczby są przestępne; faktycznie Cantor zaobserwował w 1874 ,że zbiór wszystkich liczb algebraicznych jest policzalny. Jednakże okazała się bardzo trudne do wykazania przestępność poszczególnych liczb; na przykład stała Eulera γ oparła się takim atakom, to samo odnosi się do wartości ξ(2n+1)(n=1,2,...) funkcji zeta Riemanna, chociaż Apery wykazał ,że ξ(3) jest niewymierna .W 1900 roku Hilbert podniósł w siódmym ze swych 23 problemów, kwestię udowodnienia przestępności 2√2 i, bardziej ogólnie, że αβ dla algebraicznego α nie 0 lub 1 i algebraicznego niewymiernego β Hilbert wyraził opinię ,że rozwiązanie leży dalej w przyszłości niż hipoteza Riemanna czy twierdzenie Fermata. Ale wyjątkowo, w 1929 roku, Gelfond stwierdził specjalny przypadek ,że eπ = (-1)-i jest przestępne, a całkowite rozwiązanie siódmego problemu Hilberta Gelfond i Schneider ustanowili niezależnie w 1934 roku. Uogólnienie twierdzenia Gelfonda-Schneidera uzyskał Baker w 1966 roku; dostarczało ono , na przykład, przestępności eβ0α1 β1... αn βn i co więcej nie znikającej postaci liniowej
β1 log α1 + ... + βn log αn
gdzie α i β oznaczają niezerowe liczby algebraiczne. Ta praca umożliwiła ustanowienie ilościowych wersji wyniku, dając dodatnią najniższą granicę form liniowych w logarytmach, a te odegrały znaczącą rolę w efektywnych rozwiązaniach szerokiego zakresu problemów diofantycznych. Kilka klasycznych funkcji, oprócz ex pokazało ,że przyjmuje wartości przestępne przy niezerowych wartościach algebraicznych argumentu; obejmują one funkcję eliptyczną Weierstrassa ℘(z), funkcję Bessela J0(z) i funkcja eliptyczna modularna j(z), gdzie, w ostatnim przypadku z zawszenie nie jest ani rzeczywistym ani urojonym kwadratem. Dla zilustrowania podstawowych technik tego twierdzenia , podamy teraz krótki dowód przestępności e, argument może być łatwo rozszerzony dla dostarczania przestępności π a nawet ogólnego twierdzenia Lindemanna. Dowód zależy od właściwości całki


zdefiniowanej dla t ≥ 0 gdzie f jest rzeczywistym wielomianem stopnia m. Poprzez całkowanie przez części mamy


gdzie f(j)(x) oznacza j-tą pochodną f(x) Dalej obserwujemy ,że jeśli f^ oznacza wielomian uzyskany z f przez zastąpienie każdego współczynnika jego wartością bezwzględna, wtedy


Załóżmy teraz ,że e jest algebraiczne, tak więc
α0 + α1e + ... + αnen = 0
dla pewnych liczb całkowitych α0, α1,...,αn, przy α0 ≠ 0. Wstawiamy
f(x) = xp-t(x-1)p ... (x-n)p
gdzie p jest dużą liczbą pierwszą, wtedy stopień m z f to (n+1)p-1. Będziemy porównywać szacunki dla
J = α0I(0) + α1I(1) + ... + αnI(n)
Z powyższego równania widzimy ,że


Teraz, kiedy 1 ≤ k ≤ n, mamy f(j)(k) = 0 dla j < p, i


dla j ≥ p, gdzie g(x) = f(x) / (x-k)p. Zatem, dla wszystkich j, f(j)(k) jest całkowicie podzielne przez p!. Dalej, mamy f(j)(0) = 0 dla j < p - 1 i


dla j ≥ p-1 , gdzie h(x) = f(x)/xp-1. Wyraźnie, h(f)(0) jest całkowicie podzielne przez p dla j > 0 , i h(0) = (-1)np(n!)p. Zatem, dla j ≠ p-1, f(j)(0) jest całkowicie podzielne przez p! a f(p-1)(0) jest całkowicie podzielne przez (p-1)! ale nie przez p dla p > n. Wynika stąd ,że J jest niezerową liczbą całkowitą podzielną przez (p-1)!, skąd |J| ≥ (p-1)! .Z drugiej strony, trywialne szacowanie f^(k) ≤ (2n)m i m ≤ 2np daje
|J| ≤ |a1|ef^(1)+...+ |an|nenf^(n) ≤ cp
dla pewnego c niezależnego od p. Nierówności są sprzeczne dla p wystarczająco dużego, a sprzeczność dowodzi ,że jest przestępne.
7.Twierdzenie Minkowskiego
Praktycznie intuicyjna dedukcja powiązana z geometrią figur na płaszczyźnie, lub bardziej ogólnie, w euklidesowej n-przestrzeni, może czasami przynieść wielkie wyniki w teorii liczb. Minkowski był pierwszym, który systematycznie wykorzystywał tą obserwacje i nazwał wyniki badań Geometrią Liczb. Najsłynniejsze twierdzenie w tym kontekście jest twierdzenie o ciele wypukłym, jakie Minkowski uzyskała w 1896 roku. Przez ciało wypukłe rozumiemy ograniczony, otwarty zbiór punktów w euklidesowej n-przestrzeni, która zawiera λx + (1-λ)y dla wszystkich λ z 0 < λ < 1 gdy zawiera x i y. Zbiór punktów będzie symetryczny od początku jeśli zawiera -x gdy zawiera x. Najprostsza forma twierdzenia Minkowskiego zakłada ,że jeśli ciało wypukłe ϑ symetryczne względem początku ma pojemność przekraczającą 2n wtedy zawiera punkt całkowity inny niż początek. Przez punkt całkowity rozumiemy punkt którego wszystkie współrzędne dą liczbami całkowitymi. Dla udowodnienia tego, wystarczy sprawdzić poniżesz wyniki przez wzgląd na Blichfeldta : dowolny ograniczony obszar ℜ o pojemności V przewyższającej 1 zawiera różne punkty x,y, takie ,że x-y jest punktem całkowitym. Twierdzenie Minkowskiego występuje w związku z pojęciem ℜ = 1/2ϑ to znaczy zbiór punktów 1/2 x z x w ϑ, i odnotowaniu ,że jeśli x i y należą do ℜ wtedy 2x i -2y należą do ϑ, skąd x-y = 1/2(2x-2y) również należą do ϑ. Aby udowodnić wynik Blichfeldta, zauważmy ,że ℜ jest unią rozłącznych podzbiorów ℜu gdzie u = (u1,...,un) przebiega wszystkie punkty całkowite a ℜu oznacza część ℜ, która leży w przedziale uj ≤ xj < uj (1 ≤ j ≤ n). Zatem V = ΣVu, gdzie Vu oznacza pojemność ℜu i, zgodnie z hipotezą, uzyskujemy ΣVu > 1. Wynika z tego ,że jeśli każdy z obszarów ℜu jest tłumaczone przez -u aby leżał w przedziale 0 ≤ xj < 1 (1 ≤ j ≤ n), wtedy przynajmniej dwa z tłumaczonych obszarów, powiedzmy tłumaczone na ℜu i ℜv, muszą się nakładać. Zatem istnieje punkt x w ℜu a y w ℜv takie ,że x-u=y-v, a więc x-y jest punktem całkowitym. Aby ustanowić bardziej ogólną postać twierdzenia Minkowskiego, potrzebujemy pojęcia kraty. Najpierw przypomnijmy sobie, że punkty a1 ,...,an w euklidesowej n-przestrzeni będą liniowo niezależne jeśli tylko liczby rzeczywiste t1,...,tn spełniają t1a1 + ... + tnan = 0 są t1 = ... = tn = 0; jest to odpowiednik warunku, że d = det(aij) ≠ 0, gdzie aj = (aj1,...,anj). Przez kratę A rozumiemy zbiór punktów w postaci
x = u1a1 + ... + unan
gdzie a1,...,an są ustalonymi niezależnymi liniowo punktami a u1,...,un przebiegają wszystkie liczby całkowite. Wyznacznik Λ jest zdefiniowany jako d(Λ) = |d|. Przy tej notacji,, uogólnione twierdzenie Minkowskiego zapewnia ,że jeśli dla dowolnej kraty Λ, ciał-o wypukłe ϑ symetryczne wobec początku, ma pojemność przekraczającą 2nd(Λ), wtedy zawiera punkt Λ inny niż początek. Wynik może być ustanowiony przez prostą modyfikację wcześniejszego argumentu. Jako bezpośrednie zastosowanie, niech λ1,...,λn będą liczbami dodatnimi i niech ϑ będzie ciałem wypukłym |xj| < λj (1 ≤ j ≤ n); pojemność ϑ jest 2nλ1...λn. Zatem zapisujemy
Lj = u1aj1 + ... + unajn (1 ≤ j ≤ n)
dedukujemy ,że jeśli λ1...λn > d(Λ) wtedy istnieją liczby całkowite u1...un nie wszystkie 0 , takie ,że |Lj| < λj (1 ≤ j ≤ n). Odnosi się do tego ,jako liniowej formy twierdzenia Minkowskiego. Może to być lekko zaostrzone pokazując ,że jeśli λ1...λn = d(Λ) wtedy istnieją licby całkowite u1...un, nie wszystkie 0 , takie ,że |L1| ≤ λ1 i |Lj| < λj (2 ≤ j ≤ n). Faktycznie, dla każdego m = 1,2,...istniej nie zerowy punkt całkowity um dla którego |L1| ≤ λ1 + 1/m i |Lj| < λj (2 ≤ j ≤ n); ale um są ograniczone, a więc um = u dla pewnego stałego u i nieskończenie wielu m, z czego u = (u1n1,...,θn są liczbami rzeczywistymi i jeśli Q > 0 wtedy istnieją liczby całkowite p, q1,...,qm nie wszystkie 0, takie że |qj| < Q (1 ≤ j ≤ n) i
|q1θ1 + ... + qnθn - p| ≤ Q-n
Podobnie widzimy ,że istnieją liczby całkowite p1,...,pn, q, nie wszystkie o, takie ,że |q| ≤ Qn i |qθj - pj| < 1/Q (1 ≤ j ≤ n). Wynika ,że jeśli jedna z θ1,...,θn jest niewymierna, wtedy
j - pj/q| < q-1-1/n (1 ≤ j ≤ n)
dla nieskończenie wielu liczb wymiernych pj / q (q > 0). Te wyniki uogólniają twierdzenie Dirichleta. W przeciwnym kierunku, łatwo jest rozszerzyć obserwację na niewymierny kwadraty, wykazując ,e kiedy θ jest liczbą algebraiczną o stopniu n+1, istnieje c = c(θ) > 0 takie ,że |q1θ + ... + qnθn - p| > cq-n
dla wszystkich liczb całkowitych p,q1,...,qn przy q = max|qj| > 0. Implikuje to , z klasycznej zasady przeniesienia, że wykładnik -1-1/n jest najlepszym z możliwych. Wiemy ,z twierdzenia przestępności, że dla dowolnego ε > 0, istnieje c > 0 takie ,że
|q1e + ... + qnen - p| > cq-n-e
dla wszystkich liczb całkowitych p,q1,...,qn przy q = max|qj| > 0. Co więcej, głębsza praca Schmidta, uogólnienie twierdzenia Thue-Siegela-Rotha, pokazuje ,że to samo otrzymamy kiedy e,...,en są zastępowane przez liczby algebraiczne θ1,..., θn z 1,θ1,...,θn, liniowo nienależne nad liczbami wymiernymi; analogicznie z punktami kraty, mówimy ,że liczby rzeczywiste Φ1,...,Φn są liniowo niezależne nad liczbami wymiernymi jeśli tylko liczby wymierne t1,...,tm spełniają t1Φ1 + ... + tmΦm = 0 są t1 = ... = tm = 0. Przypuszczenie Minkowskiego ,że jeśli L1,...,Ln są formami liniowymi jak powyżej i jeśli θ1,...,θn są dowolnymi liczbami rzeczywistymi wtedy istnieją liczby całkowite u1,...,un takie ,że
|L1 - θ1|... |Ln - θn| ≤ 2-nd(Λ)
Obecnie to przypuszczenie pozostaje otwarte, ale jest trywialne w przypadku n = 1 a sam Minkowski udowodnił ,że jest poprawne w przypadku n = 2. Było kolejno weryfikowane dla n = 3,4 i 5, a Czebotarjew wykazał ,że jest poprawne dla wszystkich n jeśli 2-n jest zastąpione przez 2-1/2 n. Praca Minkowskiego dostarczyła wyników stwierdzających ,że jeśli θ jest niewymierna a θ′ nie jest postaci rθ + s dla liczb całkowitych r,s, wtedy jest nieskończenie wiele liczb całkowitych q ≠ ) takie ,że dla pewnej liczby całkowitej p,
|qθ - p - θ′} < 1/(4|q|) a stała 1/4 jest najlepsze z możliwych. Wynik implikuje ,że liczby {nθ}, gdzie n=1,2,..., są zwarte w jednostce interwału, to znaczy , dla każdego θ′ przy 0 < θ′ < 1 , i dla każdego ε > 0, mamy |{nθ - θ′}| < ε dla pewnego n. Słynne twierdzenie Kroneckera implikuje ,że , bardziej ogólnie, punkty
({nθ1}...nθm}) (n=1,2,...)
gdzie 1,θ1,...,θm są liniowo niezależne nad liczbami wymiernymi, są warte w jednostce sześciennej w euklidesowej m-przestrzeni.
Ćwiczenia
a) Wylicz ułamek łańcuchowy [1,2,3,1^,4^]
b) Zakładając ,że π jest podane prze 3.1415926... poprawnie do siedmiu liczb po przecinku, udowodnij ,że pierwsze trzy konwergujące do π to 22/7, 333/106 i 335/113. Sprawdź ,e |π - 335/113| > 10-6
c) Niech θ , θ′ będą pierwiastkami równania x2-ax-1 = 0, gdzie a jest dodatnią liczbą całkowitą a θ > 0. wykaż ,że mianowniki w konwergencji do θ są dane przez
qn-1 = (θn - θ′n) / (θ - θ′) . Sprawdź ,że ciąg Fibonacciego 1,1,2,3,5,... jest dany przez q0, q1... w specjalnym przypadku
d) Udowodnij ,że mianowniki qn, w konwergencji do liczby rzeczywistej θ spełnia qn ≥ (1/2(1+√5))n-1. Udowodnij również ,że jeśli ilorazy cząstkowe są ograniczone od góry przez stałą A, wtedy qn ≤ (1/2(A+√(A2 + 4)))n
e) Zakładając ,że ułamek łańcuchowy dla e jest taki jak w sekcji 6, wykaż ,że |e-p/q| > c/(q2 log q) dla wszystkich liczb wymiernych p/q (q > 1), gdzie c jest dodatnią stałą
f) Przyjmując twierdzenie Thue-Siegela-Rotha, wykaż ,że suma a-b + a-b2 + a-b3 + ... jest przestępna dla liczb całkowitych a ≥ 2, b ≥ 3
g) Niech α, β γ będą liczbami rzeczywistymi z Δ = aδ - βγ ≠ 0. Udowodnij ,że istnieją liczby całkowite x,y obie nie zerowe, takie ,że |L| + |M| ≤ (2|Δ|)1/2, gdzie L = αx + βy i M = γ + δy. Wydedukuj ,że nierówność }LM| & le; 1/2|Δ| jest rozwiązywalne nietrywialne
h) Przy tej samej notacji, udowodnij ,że nierówność L2 + M2 ≤ (4/π)|Δ| jest rozwiązywalna w liczbach całkowitych x,y, obu niezerowych. Sprawdź ,że stała 4/π nie może być zastąpiona przez liczbę mniejszą niż (4/3)1/2
i) Zakładając twierdzenie Kroneckera i przestępność eπ, wykaż ,że , dla liczb pierwszych p1,...,pm, istnieje liczba całkowita n > 0 taka ,że cos (log pjn) ≤ -1/2 dla j = 1,2,...,m

CZĘŚĆ VII : Pola kwadratowe

1.Pola liczb algebraicznych
Mimo ,że zajmiemy się polami kwadratowymi, zaczniemy jednak od krótkiego omówienia bardziej ogólnej koncepcji pola liczby algebraicznej. Teoria dotycząca takich pól powstała przy próbach rozwiązania wielkiego twierdzenia Fermata i jest jedną z najpiękniejszych i głębokich w matematyce. Niech α będzie liczbą algebraiczną stopnia n i niech P będzie wielomianem minimalnym dla α. Przez sprzężenie α oznaczamy zera α1,...,αn z P. Pole liczby algebraicznej k generowane przez α nad liczbami wymiernymi Q jest definiowane jako zbiór liczb Q(α), gdzie Q(x) jest wielomianem ze współczynnikami wymiernymi; ten zbiór może być traktowany jako osadzony w polu liczb zespolonych C a zatem jego elementy podlegają zwykłej operacji dodawania i mnożenia. Aby sprawdzić czy k jest rzeczywiście polem musimy wykazać ,że każdy niezerowy element Q(α) ma odwrotność. Teraz, jeśli P jest wielomianem minimalnym dla α jak powyżej wtedy P,Q są względnie pierwsze a więc istnieją wielomiany R,S takie ,że PS + QR = 1identycznie, to znaczy dla wszystkich x. Podstawiając x = α daje to R(α) = 1/Q(α). Pole k ma stopień n nas Q, i zapisujemy [k:Q] = n. Konstrukcja może być kontynuowana analogicznie dla każdego pola liczby algebraicznej k i każdej liczby algebraicznej β , pole K = k(β) z elementami danymi przez wielomian w β ze współczynnikami w k. Stopień [K:k] z K nad k jest definiowany w oczywisty sposób jako stopień β nad k. Teraz K jest faktycznie polem liczby algebraicznej nad Q, może być wykazane ,że K = Q(γ), gdzie γ = uα + vβ dla liczb wymiernych u,v; zatem mamy
[K:k][k:Q] = [K:Q]
Mówimy ,że liczba algebraiczna jest liczbą algebraiczną całkowitą jeśli współczynnik najwyższej potęgi x w wielomianie minimalnym P to 1. Liczby całkowite algebraiczne w polu liczby algebraicznej k formuje pierścień r. Pierścień ma całkowitą podstawę, to znaczy istnieją elementy ω1,...,ωn w R takie ,że każdy element w R może być wyrażony jednoznacznie w postaci u1ω1 + ... + unωn dla pewnych liczb wymiernych u1,...,un .Możemy zapisać ωi = pi(α), gdzie pi oznacza wielomian nad Q, i wtedy łatwo sprawdzić ,że liczba (det pij))2 jest wymiernie całkowicie niezależna od wyboru podstawy; jest nazwana wyróżnikiem k i okazuje się być ważny niezmienniczo. Liczba całkowita algebraiczna α będzie podzielna przez liczbę całkowitą algebraiczną β jeśli α / β jest liczbą całkowitą algebraiczną. Liczba całkowita algebraiczna ε będzie jednością jeśli 1/ε jest liczbą całkowitą algebraiczną. Załóżmy teraz ,że R jest pierścieniem liczb całkowitych algebraicznych w polu liczby k. Dwa elementy α , β R są sprzężone jeśli α = εβ dla pewnej jedności ε, i jest to relacja równoważności na R. Element α z R jest nieprzywiedlny jeśli każdy dzielnik α w R jest albo sprzężony albo jednością .Wywołujemy jednoznaczny rozkład na czynniki domeny R jeśli każdy element R może być wyrażony szczególnie jednoznacznie jako iloczyn nieredukowalnych elementów. Podstawowe twierdzenie arytmetyki zakłada ,że pierścień liczb całkowitych k = Q ma tą właściwość; ale nie dla każdego k. Niemniej, wiadomo z pionierskich badań Kummera i Dedekinda ,że właściwość jednoznacznej faktoryzacji może być przywrócona przez wprowadzenie ideałów, a to formułuje główny temat algebraicznej teorii liczb. Prace nad twierdzeniem Fermata skłoniła wiele osób do tematu powiązanego ze szczególnym przypadkiem pola cyklotomicznego Q(ξ) gdzie ξ jest pierwiastkiem z jedności.
2.Pole kwadratowe
Niech d będzie liczbą całkowitą wolnego kwadratu, dodatnią lub ujemną, ale nie 1. Pole kwadratowe Q(√d) jest zbiorem wszystkich liczb postaci u + v√d z liczbami wymiernymi u,v ,z zastrzeżeniem dla zwykłych operacji dodawania i mnożenia. Dla elementu α = u+v√d w Q(√d) definiuje normę dla α jako liczby wymiernej N(α) = u2 - dv2. Wyraźnie N(α) = αα^, gdzie α^ = u - v√d; α^ jest nazywane sprzężeniem α, Teraz dla dowolnych elementów α, β w Q(√d) widzimy ,że &(alpha;&beta)^ = α^β^ a zatem mamy ważny wzór N(α)N(β) = N(αβ). Łatwo jest sprawdzić ,że Q(√d) jest rzeczywiście polem; w szczególności, odwrotnością dowolnego niezerowego elementu α jest α^/N(α). Pole specjalne Q(√(-1)) jest nazywane polem Gaussa i jest zwyczajem wyrażać swoje elementy w postaci u+iv; w tym przypadku mamy N(α) = u2 + v2 a więc wzór iloczynu jest ścisłą tożsamością do której odnosimy się w sekcji 4 Części V. Przejdziemy teraz do określenia liczb całkowitych algebraicznych w Q(√d). Załóżmy ,że α = u+v√d jest taką liczbą całkowita i niech a = 2u , b = 2v. Wtedy α jest wielomianem zerowym P(x) = x2 - ax + c, gdzie c = N(α) , a więc liczby wymierne a,c musza faktycznie być liczbami całkowitymi. Mamy 4c = a2 - b2d a, ponieważ d jest wolnym kwadratem, wynika również ,że b jest wymierną liczbą całkowitą. Teraz jeśli d ≡ 2 lub 3 (mod 4) wtedy, kwadrat jest kongruentny do 0 lub 1 (mod 4), widzimy ,że a,b są parzyste a zatem u,v są wymiernymi liczbami całkowitymi; stąd, w tym przypadku, podstawa całkowita dla Q(√d) jest dana przez 1, √d. Jesli d ≡ 1 (mod 4),co jest tylko jedną z możliwości, wtedy a ≡ b (mod 2) a zatem u-v jest wymierną liczbą całkowitą; przypomnijmy ,że v = 1/2 b, konkludujemy ,że ,w tym przypadku, podstawa całkowita Q(√d) jest dana przez 1,1/2(1+√d). Wyróżnik D z Q(√d), jak zdefiniowano w sekcji 1, dlatego jest 4d kiedy d ≡ 2 lub 3(mod 4) i jest d kiedy d ≡ 1 (mod 4). Jest blisko analogi między teorią pól kwadratowych i teorii binarnych form kwadratowych jak opisaliśmy w Części V. W szczególności, wyróżnik D Q(√d) jest kongruentna do 0 lub 1 (mod 4) a α =x + 1/2y(1+√d) kiedy d ≡ 1 (mod 4). Zatem widzimy ,że N(α = F(x,y), gdzie F oznacza formę podstawową z wyróżnikiem D , to znaczy x2 - dy2 kiedy D ≡ 0 (mod 4) i (x+1/2 y)2 - 1/4dy2 kiedy D ≡ 1 (mod 4).
3.Jedności
Przez jedność w Q(√d) rozumiemy liczbę algebraiczną ε w Q(√d) taką ,że 1/ε jest liczbą algebraiczną. Wyraźnie, jeśli ε jest jednością wtedy N(ε) i N(1/ε) są wymiernymi liczbami całkowitymi a ponieważ N(ε)N(1/ε) = 1 widzimy ,że N(ε) = ± 1 .Odwrotnie, jeśli N(ε) = ± ` , wtedy εε^ = ± 1 a więc ε jest jednością. Zatem , jedności w Q(√d) są określone przez rozwiązania całkowite x,y równania F(x,y) = ± 1. Powinniśmy rozróżnić dwa przypadki ze względu na d < 0 lub d > 0; w pierwszym przypadku pole kwadratowe będzie urojone a w drugim przypadku rzeczywiste. Teraz w polu kwadratowym urojonym jest tylko skończona ilość jedności, Faktycznie ,jeśli d < -3, wtedy jak łatwo sprawdzić, równanie F(x,y) = ± ma tylko rozwiązanie x = ±1, y = 0 a więc tylko jedności w Q(√d) to ±1. Dla d = -1, to znaczy dka pola Gaussa, mamy F(x,y) = x2 + y2 i dlatego są cztery jedności ±1, ±i. Dla d = -3 mamy F(x,y) = x2 + xy + y2 a równanie F(x,y) = ±1 ma sześć rozwiązań, mianowicie (±1,0),(0,±1),(1,-1) i (-1,1); zatem jedności Q(√(-3)) to ±1.1/2(±1,±√(-3)). wynika stąd ,że jedności w urojonym polu kwadratowym wszystkie są pierwiastkami z jedności; dane są przez zera x2 - 1 kiedy D < -4, z teo x4 - 1 kiedy D = -4 i przez te x6 - 1 kiedy D = -3. Zatem liczba jedności jest taka sama jak liczba w dla form z wyróżnikiem D wskazanym w sekcji 3 Części V. Zajmijmy się teraz rzeczywistym polem kwadratowym; w tym przypadku jest nieskończenie wiele jedności. Aby określić wynik wystarczy wykazać ,że kiedy d > 0, jest jedność η w Q(√d) inne niż ±1; wtedy ηm jest jednością dla wszystkich liczb całkowitych m , a ponieważ jedynymi pierwiastkami z jedności w Q(√d) to ± 1, widzimy ,że różne m daje różne jedności. Użyjemy twierdzenia Dirichleta w aproksymacji diofantycznej; twierdzenie implikuje ,że dla dowolnej liczby całkowitej Q > 1, istnieje wymierne liczby całkowite p,q przy 0 < q < Q, takie ,że |{α| ≤ 1/Q, gdzie α = p - q√d. Teraz sprzężenie α^ = α + 2q√d spełnia |α^| ≤ 3Q√d a zatem mamy |N(α)| ≤ 3√d .Dalej ponieważ √d jest niewymierne, uzyskujemy Q → ∞, nieskończenie wiele α z tą właściwością. Ale N(α) jest ograniczoną liczbą wymierną całkowitą niezależnie od Q, a zatem, dla nieskończenie wiele α, pobiera pewną stałą wartość, powiedzmy N. Co więcej możemy wybrać dwa różne elementy ze zbioru nieskończonego, powiedzmy α = p-q√d a α′ = p′-q′√d, takie ,że p ≡ p′ (mod N) a q ≡ q′ (mod N). Teraz wstawiamy η = α / α′. Wtedy N(η) / N(α′) = 1 .Dalej, η wyraźnie nie jest 1 i nie jest również -1 ponieważ √d jest niewymierne a q,q′ są dodatnie. Co więcej mamy η =x + y√d , gdzie x = (pp′ - dqq′) / N a y = (pq′ -p′q)/N a powyższe kongruencje implikują ,że x,y są liczbami całkowitymi wymiernymi. Zatem η nie jest trywialną jednością w Q(√d). Argument tu pokazuje, że równanie Pella x2 - dy2 = 1 ma nietrywialne rozwiązanie. Możemy teraz podać proste wyrażenie dla wszystkich jedności w rzeczywistym polu kwadratowym. Faktycznie rozważymy zbió wszystkich jedności w polu które przekracza 1. Zbiór nie jest pusty, w razie gdy η jest jednością uzyskaną powyżej wtedy jedna z liczb ±η lub ±1/η jest składową. Dalej, każdy element zbioru ma postać u+v√d, gdzie u , v są albo liczbami całkowitymi albo, w przypadku d ≡ 1 (mod 4), ewentualnie połówkami liczb nieparzystych. Co więcej u i v są dodatnie, dla u-v√d jest większe niż jej sprzężenie u-v√d, które leży między 0 a 1. Wynika stąd ,że jest najmniejszy element , powiedzmy ε Teraz jeśli ε jest jednością dodatnią w polu, wtedy jest jednoznaczna liczba całkowita m taka ,że εm ≤ ε′ < εm+1; daje to 1 ≤ ε′/εm < ε. Ale epsilon;′/εm jest również jednością w polu a zatem , z definicji ε konkludujemy ,że ε′ = εm. Pokazuje to ,że wszystkie jedności w polu są dane przez ±εm, gdzie m = 0, ±1,±2,... Wyniki tu ustanowione dla pól kwadratowych są specjalnym przykładem sławnego twierdzenia Dirichleta dotyczącego jedności w dowolnym polu liczby algebraicznej. Załóżmy ,że pole k jest generowane przez liczbę algebraiczną α stopnia n i ,że ściślej s sprzężenia α1,....,αn z α są liczbami rzeczywistymi; wtedy n = s+2t, gdzie t jest parą sprzężonych zespolonych. Twierdzenia Dirichleta zakłada ,że istnieje r = s + t -1 podstawowych jedności ε1,...,εr w k takie ,że każda jedność w k może być wyrażona jednoznacznie w postaci ρε1m1 .... εrmr ; gdzie m1,...,mr są liczbami całkowitymi a ρ jest pierwiastkiem z jedności w k
4.Liczby pierwsze i rozkład na czynniki
Niech R będzie pierścieniem liczb całkowitych algebraicznych w polu kwadratowym Q(√d). Przez liczbę pierwsza π w R określamy element R taki ,że nie jest ani zerem ani jednością, a który ma taką właściwość ,że jeśli π jest podzielne przez αβ , gdzie α, β są elementami R, wtedy albo π dzieli się przez α albo π dzieli się przez β. Zaznaczmy jednocześnie ,że liczba pierwsza π jest nieprzywiedlna w sensie wskazanym w sekcji 1l; jeśli π = αβ wtedy albo α/π albo β/π jest elementem R skąd albo β albo α są jednościami. Jednakże, nieprzywiedlny element nie może być liczbą pierwszą .Rozważmy na przykład, liczbę 2 w polu kwadratowym Q(√(-5)). Z pewnością jest nieprzywiedlna, bo jeśli 2 = αβ wtedy 4 = N(α)N(β); ale N(α) i N(β) mają postać x2+5y2 dla pewnych liczb całkowitych x,y a ponieważ równanie x2+5y2 = ±2 nie ma rozwiązania całkowitego, wynika ,że albo N(α) = ±1 albo N(β) = ± 1 a zatem albo α albo β jest jednością. Z drugiej strony, 2 nie jest liczbą pierwszą w Q(√(-5)). Teraz każdy element α R który nie jest ani 0 ani jednością może być rozłożony na czynniki do skończonego iloczynu elementów nieredukowalnych. Jeśli α nie jest sama nieredukowalną niż α = βγ dla pewnych β ,γ w R z których żadna nie jest jednością . Jeśli β byłą nieredukowalna wtedy może być rozłożona na czynniki podobnie, to samo dotyczy γ Proces musi się zakończyć, bo jeśli α = β1...βn, gdzie żadna β nie jest jednością, wtedy, ponieważ |N(βj)| ≥ 2, widzimy ,że |N(α)} ≥ 2n. Pierścień R będzie pierścieniem z jednoznacznością rozkładu jeśli wyrażenie dla α jako skończony iloczyn elementów nieredukowalnych jest zasadniczo jednoznaczny, to znaczy jednoznaczny z wyjątkiem porządku czynników i możliwego zastąpienia elementów nieredukowalnych przez ich sprzężenia. Podstawowym problemem w teorii liczb jest określenia , która domena ma jednoznaczny rozkład, a tu definicja liczby pierwszej odgrywa kluczową rolę. W rzeczywistości mamy podstawowe twierdzenie ,że R jest pierścieniem z jednoznacznością rozkładu jeśli i tylko jeśli każdy nieredukowalny element w R jest również liczbą pierwszą w R. Aby sprawdzić to twierdzenie, zauważmy ,że jeśli rozkład w R jest jednoznaczny i jeśli &pi jest elementem nieredukowalnym takim, że π dzieli się przez αβ dla pewnych α , β w R wtedy &pi musi być sprzężone z jednym z nieredukowalnych czynników α lub β a więc π dzieli się przez α lub β. Odwrotnie, jeśli każdy nieredukowalny element jest również pierwszy wtedy możemy twierdzić jak w demonstracji podstawowego twierdzenia arytmetyki podanego w sekcji 1 Części I; zatem jeśli α = π1...πk to iloczyn elementów nieredukowalnych i jeśli π′ jest elementem nieredukowalnym występującym w innym rozkładzie, wtedy π′ musi dzielić się przez πj dla pewnego j, skąd π′ i πj są sprzężone i zakładamy przez indukcję ,że wynik odnosi się do α / π′ za którym podążą wymagana jednoznaczność rozkładu. Wszystkie urojone pola kwadratowe Q(√d) które mają właściwość jednoznacznego rozkładu są znane; są one dane przez d = -1,-2,-3,-7,-11,-19,-43,-67 i -163. To twierdzenie ma długą historię, datującą się od Gaussa, a zostało udowodnione, niezależnie, przez Bakera i Starka w 1966 roku.; metody dowodu były różne , jedna zależała od twierdzenia przestępności, druga od modularnych funkcji eliptycznych. Twierdzenia wykazały ,że dziewięć wyróżników d wskazanych w ćwiczeniu a) Części V jest tylko wartościami dla których h(d) = 1. Problem znalezienia wszystkich rzeczywistych pól kwadratowych Q(√d) z jednoznacznym rozkładem pozostaje otwarty; istnieją ogólne przypuszczenia ,że jest nieskończenie wiele takich pól ale jeszcze tego nie udowodniono. Niemniej, wszystkie takie pola z relatywnie małym d , na przykład d <100, są znane;
5.Pola euklidesowe
Pole kwadratowe Q(√d) będzie euklidesowe jeśli jego pierścień liczb całkowitych R ma właściwość taką ,że , dla dowolnych elementów α , β R przy β ≠ 0, istnieją elementy γ , δ R takie ,że α = βγ + δ a |N(δ)| < |N(β)| . Dla takich pól istnieje algorytm euklidesowy analogiczny do tego opisanego w Części I. Faktycznie możemy wygenerować sekwencję równań δj-2 = δj-1γj + δj (j=1,2,...) , gdzie δ-1 = α, δ0 β , δ1 = δ, γ1 = γ a |N(δj)| < |N(δj-1)|; sekwencja kończy się kiedy δk+1 = 0 dla pewnego k a wtedy δk ma właściwości największego wspólnego dzielnika, to znaczy, δk dzieli się przez α i β, a każdy wspólny dzielnik α, β dzieli się przez δk. Co więcej mamy &deltak = αλ + βμ dla pewnego λ, μ w R. Może być to zweryfikowane albo przez kolejne zastąpienia lub obserwowanie ,że |N(δk)| jest najmniejszą składową zbioru dodatnich liczb całkowitych postaci |N(αλ - βμ)}, gdzie λ μ przechodzą elementy R. Faktycznie zbiór z pewnością ma najmniejsza składową |N(δ′)|, gdzie δ′ = αλ + βμ dla pewnych λ, μ w R; zatem każdy wspólny dzielnik α, β dzielą się przez δ′. Dalej, δ′ dzieli się przez α , ponieważ z α=δ′γ + δ″ , z |N(δ″)| < |N(δ′)| , widzimy ,że δ″ = αλ′ + Βμ dla pewnych λ′, μ′ w R , skąd N(δ″) = 0 a więc &delta″l = 0; podobnie δ′ podzielne jest przez β. Zatem mamy δ′ = δk. Jasne jest że jeśli δk jest jednością , przez dzielenie, uzyskujemy elementy λ μ w R z αλ + βμ = 1 . Przejdziemy teraz do udowodnienia ,że pole euklidesowe ma jednoznaczny rozkład. Wystarczy, jak w sekcji 4, wykazać ,że każdy nieredukowalny element π w R jest pierwszy; odpowiednio przypuszczamy ,że π dzieli się przez αβ ale ,że π nie dzieli się przez α. Wtedy, z powyższych uwag, istnieją liczby całkowite λ μ w R takie ,że αλ + πμ = 1. Daje to αβλ + πβμ = β ska π dzieli się przez β. Zatem π jest liczbą pierwszą . Zostało udowodnione przez Chatalanda i Davenporta w 1950 roku, i niezależnie przez Inkeriego w tym samym czasie ,że jest dokładnie 21 pól euklidesowych A(√d); wartości d są podane jako -11,-7,-3,-3,-1,2,3,4,6,7,11,13,17,19,21,29,33,37,41,57 i 73. Udowodniono wcześniej, przez Heilbrona,że lista musi być skończona, i zweryfikowano to jak konsekwencja prac Dicksona, Perrona, Oppenheimera, Remaka i Redei, że te wylistowane pola są rzeczywiście euklidesowe; potwierdzimy to twierdzenie dla pierwszych ośmiu pól za chwilę. Łatwo zobaczyć ,że nie może być innego pola euklidesowego przy d < 0. Rzeczywiście jeśli d ≡ 2 lub 3 (mod 4) i d ≤ -5 wtedy nie może mieć √d = 2γ + δ przy |N(δ)| < 4; możemy wyrazić γ δ jako x +y√d i x′+y′√d odpowiednio; gdzie x,y i x′,y′ są liczbami całkowitymi wymiernymi, a ponieważ N(δ) ≥ x′2 + 5y′2, uzyskamy y′ = 0, w przeciwieństwie do 2y + y′ = 1 .Podobnie jeśli d ≡ 1 (mod 4) i d ≤ -15, wtedy nie mamy 1/2(1+√d) = 2γ + δ przy |N(δ)| < 4. Najtrudniejszą częścia tego twierdzenia jest dowód ,że nie ma innych pól euklidesowych przy d > 0. Davenport wykazał ,przez pomysłowy algorytm uzyskany z badań nas aproksymacją diofantyczną, że jeśli d > 214 wtedy Q(√d) nie jest polem euklidesowym; redukuje to problem skończonego sprawdzania przypadków. Redei twierdził pierwotnie ,że pole Q(√97) było euklidesowe ale Burnes i Swinnerton-Dyer udowodnili ,że jest to błędne. Wykażemy teraz ,że jeśli d = -2, -2, lub 3 wtedy Q(√d) jest euklidesowe. Niech α, β będą liczbami całkowitymi algebraicznymi w Q(√d) przy β ≠ 0. Wtedy α/β = u +v√d dla pewnych liczb wymiernych u,v. Wybieramy liczby całkowite x,y jak najbliżej u,v i wstawiamy r = u-x, s=v-y; wtedy |r| ≤ 1/2 a |s| ≤ 1/2. Zapisując γ = x + y√ uzyskujemy α = &betalγ + δ , gdzie δ = β(r+s√d). Daje to N(δ) = N(β)(r2 - ds2) .Ale dla |d| ≤ 2 mamy |r2 - ds2| ≤ r2 - 2s2 ≤ 3/4, i dla d = 3 mamy |r2 - ds2| ≤ max(r2, ds2) ≤ 3/4 .Zatem |N(δ)| < |N(β)|. W końcu, udowodnimy ,że Q(√d) jest euklidesowe kiedy d = -11,-7,-3, 5 i 13. W tych przypadkach mamy d ≡ 1 (mod 4) a więc 1,1/2(1+√d) jest bazową liczbą całkowitą dla Q(√d). Ponownie niech α , β będą liczbami całkowitymi algebraicznymi w Q(√d), przy β ≠ 0 i niech α/β = u+v√d przy wymiernych u,v. Wybieramy liczbę całkowitą y tak blisko jak to możliwe 2v i wstawiamy s = v-1/2y; wtedy |s| ≤ 1/4. dalej wybieramy liczbę całkowitą x tak blisko jak to możliwe do u-1/2y i wstawiamy r = u-x-1/2 y; wtedy |r| ≤ 1/2. Zapisując γ = x +1/2y(1+√d) widzimy ,że α = βγ + δ , gdzie δ = β(r+s√d). Teraz, dla |d| ≤ 11 , mamy |r2 - ds2| ≤ 1/4 + 11/16 < 1, i , dla d = 13, mamy |r2 - ds2| ≤ 13/16.
6.Pole gaussowskie
Kończąc tą część, opiszemy teraz podstawowe właściwości fundamentalnego pola kwadratowego, mianowicie pole gaussowskie Q(√(-1)) lub Q(i) . Widzieliśmy ,że liczby całkowite w tym polu, to znaczy liczby całkowite Gaussa, mają postac x+iy, z x,y, liczbami całkowitymi wymiernymi. Zatem norma liczby całkowitej Gaussa ma postać x2 + y2, i , w szczególności, nie jest ujemna. Odnotowaliśmy w sekcji 3, że są tylko cztery jedności ±1 i ±i. Co więcej udowodniliśmy w sekcji 5 ,że pole jest euklidesowe a więc ma jednoznaczny rozkład. Zatem nie ma potrzeby rozróżniania między nieredukowalnymi elementami a liczbami pierwszymi, i będziemy używać ostatniej terminologii. W rzeczywistości będziemy się odnosili do tych elementów jako liczb pierwszych Gaussa. Naszym celem teraz jest określenie wszystkich liczb pierwszych Gaussa. Zaczniemy od dwóch uwag wstępnych, które w rzeczywistości stosuje się analogicznie do wszystkich pól kwadratowych z jednoznacznym rozkładem .Najpierw jeśli jeśli α jest liczbą całkowitą Gaussa i jeśli N(α) jest wymierną liczbą pierwszą wtedy α jest liczbą pierwszą Gaussa; dla jasności, jeśli α = βγ dla pewnych liczb całkowitych Gaussa β γ wtedy N(α) = N(β)N(γ) a więc albo N(β) = 1 albo N(γ)=1 skąd albo β albo γ jest jednością. Po drugie zaobserwujemy ,że każda liczba pierwsza Gaussa π dzieli się tylko przez jedną liczbę pierwszą p. Dla π z pewnością dzieli się przez N(π) a więc jest najmniejsza dodatnia liczba całkowita wymierna p taka ,że π dzieli się przez p; a p jest liczbą pierwszą wymierną, bo jeśli p = mn, gdzie m,n są liczbami całkowitymi wymiernymi, wtedy, ponieważ π jest liczbą pierwszą Gaussa, mamy albo π podzielne przez m lub π podzielne przez n skąd, przy minimalnej właściwości p, albo m albo n to 1. Liczba pierwsza p jest jednoznaczna jeśli p′ jest dowolna inną liczbą pierwszą wymierną wtedy istnieje wymierna liczba całkowita a a′ takie ,że ap+a′p′ = 1; zatem jeśli π było podzielne zarówno przez p i p′ wtedy byłaby podzielna przez 1 a więc będzie jednością w przeciwieństwie do definicji. Następnie odnotujmy ,że liczba pierwsza wymierna p jest albo sam liczbą pierwszą Gaussa albo jest iloczynem π&pi′ dwóch liczb pierwszych Gaussa, gdzie π ,π′ sa sprzężone. Rzeczywiście p jest podzielne przez jakąć liczbę pierwszą Gaussa π a zatem mamy p = πλ dla liczby całkowitej Gaussa λ; daje to N(π)N(λ) = p2 a te dwa przypadki odpowiadają prawdopodobieństwu N(λ) = 1, implikując ,że λ jest jednością i ,że p jest sprzężone z π ,a N(λ) = p implikuje ,że N(π) = p. Teraz pierwszy przypadek stosuje się kiedy p ≡ 3 (mod 4) a drugi kiedy p ≡ 1 (mod 4). dla N(π) ma postać x2 + y2 a kwadrat jest kongruentny do 0 lub 1 (mod 4) .Dalej jeśli p ≡ 1 (mod 4), wtedy -1 jest resztą kwadratową (mod p) skąd p dzieli się przez x2 + 1 = (x+i)(x-i) dla pewnej liczby całkowitej wymiernej x ; ale jeśli p było gaussowską liczbą pierwszą wtedy byłaby podzielna albo przez x+i lub x-i, w przeciwieństwie do faktu ,że ani x/p + i /p ani x/p-1/p jest liczbą całkowita Gaussa .W odniesieniu do liczby pierwszej 2, mamy 2 = (1+i)(1-i) a tu 1+i i 1-i są liczbami pierwszymi Gaussa, i co więcej, sprzężone. Przez połączenie naszych wyników, znajdujemy ,że całkowitość liczb pierwszych gaussowskich jest dana przez wymierne liczby pierwsze p ≡ 3 (mod 4), przez współczynniki π, π′ w wyrażeniu p = ππ′ odnoszące się do liczb pierwszych p ≡ 1 (mod 4), i przez 1+i, razem ze wszystkimi ich sprzężeniami formułowanymi przez mnożenie z ±1 i ±i. Argumenty tutaj dostarczają kolejnego dowodu na wynik ,że każda liczba pierwsza p ≡ 1 (mod 4) może być wyrażona jako suma dwóch kwadratów. Wiele z definicji i twierdzeń omawianych wcześniej dla pól wymiernych posiada naturalną analogię w polu gaussowskim. Zatem ,na przykład, można określić największe wspólne dzielniki i kongruencje w oczywisty sposób, i jest analogia z twierdzeniem Fermata o tym ,że jeśli π jest liczbą pierwszą Gaussa a α jest liczbą całkowitą Gaussa, z (α π) = 1, wtedy αN(π)-1 ≡ 1 (mod π). Jest również , na przykład, analogia z twierdzeniem liczb pierwszych, o tym ,że liczba nie sprzężona z liczbami pierwszymi Gaussa π z N(π) ≤ x jest asymptotyczna do x/log x przy x → ∞
7.Ćwiczenia
a) Wykaż, że jedności w Q(√2) są dane przez ±(1+√2)n, gdzie n = 0, ±1,±2,.... Znajdź jedności w Q(√3)
b) Określ liczby całkowite n i d dla których (1 + n√d)/(1-n√d) jest jednością w Q(√d)
c) Przez rozpatrzenie iloczynów norm, lub w przeciwnym razie, udowodnij ,że jest nieskończenie wiele nieredukowalnych elementów w domenie całkowitej dowolnego pola kwadratowego
d) Wyjaśnij, dlaczego równania 2.11 = (5+√3)(5-√3) nie jest niezgodne z faktem ,że Q(√3) ma jednoznaczny rozkład
e) Udowodnij ,że równanie 2.3 = (√(-6))(-√(-6)) implikuje ,ze Q(√-6) nie ma jednoznacznego rozkładu
f) Wykaż że 1+√(-17) jest nieredukowalne w Q(√(-17)). Sprawdź ,że Q(√(-17)) nie ma jednoznacznego rozkładu
g) Znajdź równania aby wykazać ,że Q(√d) nie ma jednoznacznego rozkładu dla d = -10,-13,-14 i -15
h) Przez rozważenie kongruencji mod 5, wykaż ,że nie ma algebraicznych liczb całkowitych w Q(√10) z normą ±2 i ±3. Udowodnij ,że 4 + √10 jest nieredukowalne w Q(√10) Zatem sprawdź ,że Q(√10) nie ma jednoznacznego rozkładu
i) Użyj faktu ,że Q(√3) jest euklidesowskie dla określenia liczba całkowitych algebraicznych α , β w Q(√3) takich ,że (1+2√3)α + (5+4√3)β = 1
j) Udowodnij ,że liczby pierwsze w Q(√2) są dane przez liczby pierwsze wymierne p ≡ ± 3(mod 8), współczynniki π, π′ w wyrażeniu p = ππ′ w odniesieniu do liczb pierwszych p ≡ ± 1 9mod 8 i przez √2, razem ze wszystkimi ich sprzężeniami.
k) Wykaż ,że jeśli π jest liczbą pierwszą gaussowską wtedy liczby 1,2,...,N(π) formuje całkowity zbiór reszt (mod π); to znaczy , wykaż ,że żadna z różnic nie jest podzielna przez π ,ale ,że dla dowolnej liczby całkowitej Gaussa α jest wymierna liczba całkowita a przy 1 ≤ a ≤ N(π), taka ,że π dzieli się przez α - a .Zastosuj ten wynik dla ustalenia analogicznego twierdzenia Fermata odnotowanego na końcu sekcji 6.

CZĘŚĆ VIII : Równania diofantyczne

1.Równanie Pella
Analiza diofantyczna ma swoją genezę w żyznym umyśle Fermata. Studiował on edycję Bacheta, opublikowaną w 1621 roku, pierwszych sześciu ksiąg jakie pozostały ze słynnych "Arithmetica"; był to traktat, pierwotnie składający się z trzynastu ksiąg, napisanych przez greckiego matematyka Diofantosa z Aleksandrii (około trzeci wiek naszej ery). "Arithmetica" skupiała się tylko na szczególnych rozwiązaniach wymiernych lub całkowitych równań algebraicznych, ale zainspirowała Fermata do rozpoczęcia badań o naturze wszystkich takich rozwiązań, czym rozpoczął współczesne teorie. Szczególnie znane są równania diofantyczne, szczególnie sławnym wyzwaniem Fermata wobec angielskich matematyków w tym czasie jest równanie
x2 - dy2 = 1
gdzie d jest dodatnią liczbą całkowitą inną niż doskonały kwadrat. Zwykle odnosimy się do tego jako równania Pella ale nomenklaturowo nie ma historycznego uzasadnienia, ze względu na Eulera, ponieważ Pell nie przyczynił się do tego tematu. Fermat przypuszczał ,że istnieje co najmniej jedno nietrywialne rozwiązanie w liczbach całkowitych x,y , to znaczy rozwiązanie inne niż x = ± 1, y = 0; przypuszczenie zostało udowodnione przez Lagrange′a w 1768 roku. Faktycznie otrzymaliśmy ten wynik w sekcji 3 Części VII; założyliśmy ,że d jest wolnym kwadratem ale argument wyraźnie odnosi się do dowolnego d, który nie jest doskonałym kwadratem. Teraz jest jednoznaczne rozwiązanie równania Pella w którym liczby całkowite x,y mają swoje najmniejsze dodatnie wartości; jest to nazywane rozwiązaniem fundamentalnym. Niech x′, y′ będą rozwiązaniem i wstawiamy ε = x′ + y′ √d. Wtedy, przez argumenty z sekcji 3 Części VII widzimy, że wszystkie rozwiązania są dane przez x+y√d = εn, gdzie n = 0, ±1,±2,.../ W szczególności, równanie ma nieskończenie wiele rozwiązań. większy wgląd w charakter rozwiązań jest dostarczony rpzez algorytm ułamka łańcuchowego. najpeirw zaobserwujmy ,że dowolne rozwiązanie w liczbach dodatnich całkowitych x,y spełnia x-y√d = 1 /(x+y√d), skąd x > y√d i x-y√d < 1/(2y√d). Daje to |√d -x/y| < 1/(2y2) i wynika z seklcji 3 Część VI ,że x/y jest zbieżne do √d. Teraz w sekcji 4 Części VI ,mamy ułamek łańcuchowy dla √d w postaci
[a0,(a1,...,am)^];
liczba m powtarzająca iloczyny cząstkowe jest nazywana okresem √d. Niech pn/qn (n=1,2...) będzie zbieżne do √d i niech θn (n=1,2,...) będzie ilorazem całkowitym. Mamy x = pn, y = qn dla pewnego n, to znaczy pn2 - dqn2 = 1. Tu n musi być nieparzyste
√d = pnθn+1 + pn-1 / qnθn+1 + qn-1
z czego, przypominając ,że pn-1qn - pnqn-1 = (-1)n, uzyskujemy
qn√d - pn = (-1)n / (pnθn+1 + qn-1),
a więc, dla parzystego n, qn√d > pn. Faktycznie n musi mieć postać lm-1, gdzie l =1,2,3,... kiedy m jest parzyste a l = 2,4,6,... kiedy m jest nieparzyste. Dla wyrażenia dla √d powyższego
(pn - qn√d)θn+1 = qn-1√d - pn-1
a zatem
(pn2 - dqn2)&thetan+1 = (qn-1√d - pn-1)(qn√d + pn) = (-1)n-1√d + c
gdzie c jest liczbą całkowitą .Ale pn2 - dqn2 = 1 a n jest nieparzyste; zatem θn+1 = √d + c. Teraz √d = a0 + 1/θ1, gdzie θ1 jest czystym okresem, i mamy θn+1 = an+1 + 1/θn+2. Ponieważ θ1 > 1, θn+2 > 1, uzyskujemy an+1 = a0+c i θ1 = θn+2; wynika stą ,że n+1 jest podzielne przez m a więc n ma postać lm-1 jak założyliśmy. Dlatego wykażemy ,że jedyne możliwe dodatnie rozwiązania x,y równania Pella są dane przez x = pn, y = qn, gdzie pn / qn jest zbieżne do √d przy n w postaci lm-1 jak powyżej .Faktycznie , wszystkie z tych pn , qn spełniają to równanie a zatem obejmują pełen zbiór dodatnich rozwiązań. Ze względu na okresowość √d mamy θ1 = θn+2 dla wszystkich n = lm-1 jak powyżej, a zatem
√d = pn+1θ1 + pn / qn+1θ1 + qn
ale √d = a0 + 1/ θ1, i przy zastąpieniu dla θ1 i zastosowaniu faktu ,że √d jest niewymierne, uzyskujemy
pn = qn+1 - a0q, pn+1 - a0pn = qnd
Eliminując a0, widzimy ,że
pn2 - dqn2 = pnqn+1 - pn+1qn
a ponieważ n jest nieparzyste, wynika stąd ,że pn2 - dqn2. Podobna analiza ma zastosowanie do równania x2 - dy2 = -1. w tym przypadku nie ma rozwiązania kiedy okres m z √d jest parzyste. Kiedy m jest nieparzyste, wszystkie dodatnie rozwiązania sądane przez x = pn, y = qn, gdzie pn/qn jest zbieżne do √d a n = lm-1, przy l = 1,3,5,... Dalej, kiedy równanie jest rozwiązywalne, jest rozwiązanie w liczbach dodatnich całkowitych x′, y′ o najmniejszych wartościach ,znanych jako rozwiązanie fundamentalne, a pisząc η = x′ + y′&radoc;d, dedukujemy ,że wszystkie rozwiązania dadane przez x+y√d = ±ηn, gdzie n = ±1, ±3, plusmn;5,...; wynik jest faktycznie łatwy do uzyskania odnotowując ,że fundamentalne rozwiązanie x2 - dy2 = 1 jest dane przez ε = η2. Analogiczny wynik osiągniemy dla bardziej ogólnego równania x2 - dy2 = k, gdzie k jest niezerową liczbą całkowitą. Tu, kiedy równanie jest rozwiązywalne, można określić skończony zbiór rozwiązań x′ y′, taki ,że pisząc ξ = x′+y′√d, wszystkie rozwiązania są dane przez x+y√d = ±ξεn przy n = 0, ± 1, ± 2,.... jako przykład rozpatrzmy równanie x2-97y2 = -1. Ułamek łańcuchowy dla √97 to
[9,(1,5,1,1,1,1,1,1,5,1,18)^].
Zatem okres m z √97 to 11, a ponieważ m jest nieparzyste, równanie jest rozwiązywalne. Rzeczywiście, fundamentalne rozwiązanie jest dane przez x = p10, y = q10, gdzie pn / qn (n= 1,2,...) oznacza zbieżność do √97. Teraz najpierw pierwsze dziesięć zbieżności do √97 to 10,59/6,69/7,128/13.197/20,325/33,522/53,847/86,4757/483 i 5604/569. Zatem podstawowe rozwiązanie x2 - 97y2 = -1 to x = 5604, y = 569. dalej, jeśli zapiszemy η = 5604 + 569√97 wtedy ε = η2 daje fundamentalne rozwiązanie x2 - 97y2 = 1; rozwiązaniem jest faktycznie x = 62 809 633 , y = 6 377 352. Ułamek łańcuchowy dla √d zawsze ma formę
[a0 , (a1,a2,a3,...,a3,a2,a1,2a0)^], jak dla powyższego √97, a co więcje okres m dla √d jest zawsze nieparzysty kiedy d jest liczbą pierwszą p ≡ 1 (mod 4). Faktycznie, dla takiego p, równanie x2 - py2 = -1 jest zawsze rozwiązalne. Jeśli ′ i y′ jest fundamentalnym rozwiązaniem dla x2 -py2 = 1 wtedy x′ jest nieparzyste a więc (x′ + 1, x′ -1) = 2; daje to albo x′ + 1 = 2u2 , x′ - 1 = 2pv2 albo x′ - 1 = 2u2, x′+1 = 2pv2 dla pewnych dodatnich liczb całkowitych u,v przy y′ = 2uv, skąd, u2 - pv2 = ±1 a zatem znak minus musi być ponieważ v < y′
2.Równanie Thue
Przez wieki opracowano mnogość technik dla rozwiązywania konkretnych równań diofantycznych. Naukowe rozprawy Dicksona z historii teorii liczb zawierają liczne odniesienia do wczesnych prac w tej dziedzinie .Większość z nich było natury ad-hoc, ale brakowało spójnej teorii. W 1900 roku, jako dziesiąty ze słynnych 23 problemów Hilberta, był problem o uniwersalny algorytm podjęcia decyzji czy równanie w postaci f(x1,...,xn) = 0, gdzie f oznacza wielomian ze współczynnikami całkowitymi, jest rozwiązywalny w liczbach całkowitych x1,...,xn. Problem został rozwiązany negatywnie przez Matjasewicza, w oparciu o pomysły Davisa, Robinson i Putnama w zbiorze rekurencyjnie przeliczalnym. Dowód został później udoskonalany pokazując ,że algorytm poszukiwany przez Hiberta nie istnieje, nawet jeśli ograniczmy naszą uwagę do wielomianu z dziewięcioma zmiennymi, i wydaje się całkiem prawdopodobne ,że nie istnieje dla wielomianów tylko z trzema zmiennymi. Dla wielomianów z dwiema zmiennymi sytuacja wydaje się być inna. W 1909 roku, została wprowadzona nowa technik, w oparciu o aproksymacje diofantyczne, przez norweskiego matematyka Axela Thue. Rozważał on równanie F(x,y) = m , gdzie F oznaczało nieredukowalną formę binarną ze współczynnikami całkowitymi i stopnia co najmniej 3, a m było dowolną liczbą całkowitą. Równanie można wyrazić jako
a0xn + a1xn-1y + ... + anyn = m
a to może być zapisane w postaci
a0(x - a1y) ... (x - any) = m
gdzie a1,...,an oznacza całkowity zbiór sprzężeń liczb algebraicznych. Zatem jeśli równanie jest rozwiązywalne dla dodatnich liczb całkowitych x, y , wtedy najbliższe liczby α1,..., αn do x/y, powiedzmy α, spełniają |x-αy| << 1 .Używamy tu notacji Winogradowa; przez a << b rozumiemy a < bc dla pewnej stałej c, to znaczy, w tym przypadkyu, liczby niezależnej od x i y, i podobnie a >> b będziemy rozumieć b < ac, dla pewnego takiego c. Teraz, dla y wystarczająco dużego i dla α ≠ αj mamy
|x - αjy| = |(x - αy) + (α - αj) >> y;
daje to |x - αy| << 1/yn-1 skąd |α - x/y| << 1/yn .Ale przez poprawkę Thue do twierdzenia Liouville′a, mamy |α - x/y| >> 1/yK dla dowolnego K > 1/2 n+1. Wynika stąd, ze y jest ograniczone od góry a więc jest tylko skończenie wiele możliwości dla x i y. Argument oczywiści rozciąga się do liczb całkowitych x,y dowolnego znaku, a więc otrzymujemy znakomity wynik, że równanie Thue ma tylko skończenie wiele rozwiązań w liczbach całkowitych. Wyraźnie warunek n ≥ 3 jest tu konieczny, ponieważ pokazujemy ,że równanie Pella ma nieskończenie wiele rozwiązań. Demonstracja Thue ma ważne ograniczenie. Chociaż podaje oszacowanie liczby rozwiązań F(x,y) = m, nie pozwala na podanie pełnej listy rozwiązań w danej instancji lub rzeczywiście określa czy lub nie równanie jest rozwiązywalne. Jest to konsekwencja nieefektywnej natury oryginalnej nierówności Thue od której zależy dowód .Pewne efektywne przypadki nierówności zostały pozyskane ,a w tych przypadkach, można łatwo rozwiązać powiązane równanie Thue nawet z całkiem dużymi wartościami m; Ale pozostaje jeszcze podstawowe ograniczenie argumentu Thue. Inne podejście zostało zapoczątkowane przez Delaunaya i Nagella w latach dwudziestych XX wieku. Obejmowało rozkład na czynniki w polach liczby algebraicznej i pozwalało pewnego typu równaniom Thue o małym stopniu, na całkowite rozwiązanie, W szczególności, metoda stosowana była do równanie x3 - dy3 = 1, gdzie d jest wolnym sześcianem całkowitym, a przyniosło to taki skutek ,że istnieje co najwyżej jedno rozwiązanie w liczbach całkowitych niezerowych x,y .Metoda został stworzona przez Skolema przy zastosowaniu analizy w domenie p-adycznej, i dostarczył on nowego dowodu twierdzenia Thue w przypadku gdy nie wszystkie zera F(x,1) są rzeczywiste. Praca zależała od zawartości własności liczb całkowitych p-adycznych i na ogół była nieefektywna, ale Ljunggrenowi udało się zastosować tą technikę do działania z kilkoma typowymi przykładami. Na przykład wykazał ,że jedyne rozwiązania całkowite (x,y) równania x3 - 3xy2 - y3 = 1 to (1,0), (0,-1), (-1,1), (1,-3), (-3,2) i (2,1). Całkowicie inną demonstrację twierdzenia Thue podał Baker w 1968 roku. Obejmowała ona formy liniowe e logarytmach i prowadziła do wyraźnej granicy dla rozmiaru wszystkich całkowitych rozwiązań x,y F(x,y) = m; w rzeczywistości metoda prowadziła do ograniczenie postaci c|m|c′, gdzie ,c , c′ są liczbami zależnymi tylko od F. Zatem, w zasadzie, całkowita lista rozwiązań może być określona w szczególnym przypadku przez skończoną ilość obliczeń. W praktyce ograniczenia występujące w metodzie Bakera są duże, zazwyczaj 1010500.
3.Równanie Mordella
Niektóre wyniki odnoszą się do równania y2 = x3 + k , gdzie k jest niezerową liczbą całkowitą, odkryte przez Mordella w 1922 roku, a równanie to towarzyszyło Mordellowi przez całe życie. Twierdzi się ,że zapoczątkował naturalny podział ze względu na działanie z rozwiązaniami całkowitymi x,y lub rozwiązaniami wymiernymi. Zacznijmy od tego ostatniego. Równanie y2 = x3 + k przedstawia krzywą eliptyczną w rzeczywistej płaszczyźnie rzutowej. Przez punkt wymierny na krzywej rozumiemy albo parę (x,y) liczb wymiernych spełniających równanie albo punkt w nieskończoności na krzywej; innymi słowy, punkty wymierne są podane we współrzędnych homogenicznych (x,y,z), gdzie λx, λy, λz są wymierne dla pewnego λ. Odnotowano, przynajmniej w czasach Bacheta, że cięciwa łącząca dwa dowolne punkty wymierne na krzywej przecina krzywą w punkcie wymiernym, i podobnie styczna w punkcie wymiernym przecina ponownie punkt wymierny. Zatem, Fermat zauważył ,że jeśli jest punkt wymierny na krzywej inny niż punkt w nieskończoności, wtedy biorąc cięciwę i styczną, należało oczekiwać ,generalnie uzyskania nieskończoności punktów wymiernych; dokładny wynik tego rodzaju został ustanowiony przez Fuetera w 1930 roku. Było również wiadomo ,że zbiór wszystkich punktów wymiernych na krzywej formuje grupę w procesie cięciwy i stycznej (rysunek)


Wynik jest w rzeczywistości konsekwencją dodatkowej formuły dla funkcji Wierestrassa x = ℘(u), y = 1/2℘′(u), która parametryzuje krzywą. Rzeczywiście przy tej notacji prawo grupy staje się po prostu dodatkowymi parametrami. Mordell udowodnił ,że grupa ma skończoną podstawę, to znaczy, jest skończony zbiór parametrów u1,...,ur takich ,że wszystkie punkt wymierne na krzywej są dane przez u = m1u1 + ... + urur, gdzie m1,...,mr przebiegają wszystkie liczby całkowite wymierne,. Jest to odpowiednik twierdzenia ,że jest skończony zbiór punktów wymiernych na krzywek , taki ,że poczynając od zbioru i biorąc wszystkie możliwe cięciwy i styczne, uzyskujemy całkowita ilość punktów wymiernych na krzywej. Demonstracja obejmowała pomysłową technikę, przypisywane zazwyczaj Fermatowi, znaną jako metoda nieskończonego pochodzenia. Zastosujemy tą prace bardziej ogólnie do równania y2 = x3 + ax + b, przy a,b wymiernych, a więc, przez transformację biwymeirną, do krzywej rodzaju 1. Weil rozszerzył twierdzenie o krzywe wyższego rodzaju a temat ten zdobył później wielką sławę i stymulował wiele dalszych badań. To ostatnie zostało skierowane bezpośrednio do problemu określania podstawowych elementów u1,...,ur , lub przynajmniej ścisłych wartość r; zwykle odnosimy się do tego jako rangi grupy Mordell-Weila.Nie ma ogólnego algorytmu dla określenia tych jednostek ale można je znaleźć praktycznie. Zatem ,na przykład, Billing udowodnił w 1937 ,że wszystkie punkty wymierne na krzywej y2 = x3 - 2 są dane przez mu1, gdzie u1 jest parametrem odpowiadającym punktowi (3,5) a m przebiega przez wszystkie liczby całkowite. Ponieważ nie wiele U,sub>1 jest okresem powiązanym z funkcją Weierstrassa, wynika ,że równanie y2 = x3 - 2 ma nieskończenie wiele rozwiązań wymiernych. Z drugiej strony, wiadomo ,na przykład, ,że równanie y2 = x3 + 1 ma tylko rozwiązania wymierne dane przez (0,±1)(-1,0) i (2,±3) i ,że to równanie y2 = x3 - 5 nie ma rozwiązań wymiernych. Wrócimy teraz do rozwiązań całkowitych y2 = x3 + k. Chociaż początkowo, Mordell wierzył ,że dla pewnych wartości k, równanie miałoby nieskończenie wiele rozwiązań w liczbach całkowitych x,y, później wykazał ,że , faktycznie, dla wszystkich k , jest tylko skończenie wiele rozwiązań . Dowód obejmował twierdzenie redukcji binarnych form sześciennych i zależał ostatecznie od twierdzenia Thue o równania F(x,y) = m. Zatem argument nie pozwala na pełną listę rozwiązań będących określonymi w szczególnym przypadku. Jednakże, sytuacja zmieniła się przez pracę Bakera. Podał efektywną demonstrację twierdzenia Thue, i jako konsekwencja, podał wszystkie rozwiązania y2 = x3 + k, granice dla |x| i |y| postaci exp(c|k|c′) ,gdzie c, c′ są stałymi bezwzględnymi; Stark później wykazał ,że c′ może być wzięte jako 1 + ε dla dowolnego ε > 0, dowodząc ,że c było dopuszczone w zależności od &epsilon. Zatem , zasadniczo, całkowita lista rozwiązań może być teraz określona dla określonej wartości k przez skończoną ilość obliczeń W praktyce,granice jakie powstają są zbyt duże aby umożliwić sprawdzenie skończenie wiele pozostałych możliwości dla x i y bezpośrednio; ale jak dal równania Thue, można zwykle osiągnąć to przez pewne analizy uzupełniające. W ten sposób wykazano ,na przykład, że wszystkie rozwiązania całkowite równania y2 = x3 - 28 są dane przez (4,±6),(8,&pkusmn;22) i (37, ± 226). Niemniej, w wielu przypadkach, są dostępne dużo czytelniejsze metody rozwiązania. W szczególności, często wystarczy odwołać się do prostej kongruencji. Rozważmy, na przykład, równanie y = x,sup>3 + 11. Ponieważ y2 ≡ 0 lub 1 (mod 4), widzimy ,że jeśli jest rozwiązanie, wtedy x musi być nieparzyste i w rzeczywistości x ≡ 1 (mod 4). Teraz mamy
x3 + 11 = (x+3)(x2-3x+9) -16
a x2 - 3 x + 9 jest dodanie i kongruentne do 3 (mod 4) .Zatem jest liczba pierwsza p ≡ 3 (mod 4) która dzieli się przez y2 + 16. Ale daje to y2 ≡ -16 (mod p), skąd (yz)2 ≡ -1 (mod p), gdzie z = 1/4 (p+1) .Zatem -1 jest residuum kwadratowym (mod p). Dlatego konkludujemy, ze równanie y2 = x3 +11 nie ma rozwiązań w liczbach całkowitych x,y. Inną typową metodą rozwiązywania jest faktoryzacja w polach kwadratowych. Rozważmy równanie y2 = x3 - 11. Ponieważ y2 = 0, 1 lub 4 (mod 8) widzimy ,że jeśli jest rozwiązanie, wtedy x musi być nieparzyste. Użyjemy wyniku uzyskanego w sekcji 5 Części VII, że pole Q(√(-11)) jest euklidesowe a więc ma jednoznaczny rozkład. Mamy (y+√(-11))(y-√(-11)) = x3, a współczynniki po lewej stronie są liczbami względnie pierwszymi; dla wspólnego dzielnika dzielimy 2√(-11), w przeciwieństwie do faktu ,że ani 2 ani 11 nie dzielą się przez x. Zatem, przypominając ,że jedności w Q(√(-11)) są to ±1 uzyskujemy y + √(-11) - ±&omega3 a x = N(ω) dla pewnych liczb całkowitych algebraicznych ω w tym polu. W rzeczywistości, możemy pominąć znak minus ponieważ -1 może być wprowadzone w module .Teraz, ponieważ -11 ≡ 1 (mod 4), mamy ω = a + 1/2b(1+√(-11)) dla pewnych wymiernych liczb całkowitych a,b/ Stąd, równając współczynniki √(-11) widzimy ,że
1 = 3(a+1/2 b)2(1/2 b) - 11(1/2b)3
to znaczy (3a2 + 3ab - 2b2)b = 2. Daje to b = ± 1 lub ± 2. a więc rozwiązania (a,b) to (0,-1),(1,-1), (1,2) i (-3,2) .Ale mamy x = a2 + ab + 3b2.Zatem konkludujemy ,że całkowite rozwiązania równania y2 = x3 - 11 to (3,±4) i (15, ±58). Podobna analiza może przeniesiona na równanie y2 = x3 + k ilekroć Q(√k) m,a jednoznaczne rozkład, a k = 2,3,5,6 lub 7 (mod 8). Wkrótce po ustanowieniu swojego twierdzenia, na skończoność liczb rozwiązań y2 = x3 + k. Mordell rozszerzył wynik do równania
y2 = ax3 + bx2 + cx + d
gdzie sześcian po prawej stronie ma różne zera; jeszcze raz praca opierała się na ostatecznym twierdzeniu Thue, ale wykorzystywała redukcję form kwadratowych zamiast sześciennych. W liście do Mordella, opublikowanego w 1926 roku pod pseudonimem X ,Siegel opisał alternatywny argument, który stosował bardziej ogólnie równanie hipereliptyczne y2 = f(x), gdzie f oznacza wielomian ze współczynnikami całkowitymi iz przynajmniej trzema prostymi zerami; rzeczywiście jest stosowane do równania supereliptycznego ym = f(x), gdzie m jest liczbą całkowitą ≥ 2. Twierdzenie było dalej rozwijane przez Siegela w 1929 roku; w głównej pracy połączył udoskonaloną nierówność Thue z twierdzeniem Mordella - Weila, udało mu się podać prosty warunek dla równania
f(x,y) = 0, gdzie f jest wielomianem ze współczynnikami całkowitymi, przekazując tylko skończenie wiele rozwiązań w liczbach całkowitych x,y. W szczególności wykazał ,że wystarczy jeśli krzywa przedstawiana przez równanie ma rodzaj co najmniej 1. Wynik zastosowane przez Schinzela, w połączeniu ze starą metoda Runge′a dotyczącą funkcji algebraicznych, dostarczył uderzającego rozszerzenia twierdzenia Thue; zakłada ,że równanie F(x,y) = G(x,y) ma tylko skończenie wiele rozwiązań w liczbach całkowitych x,y , gdzie F jest formą binarną, haj pokazano w sekcji 2, a G jest wielomianem ze stopniem mniejszym niż F
4.Równanie Fermata
Przy okazji, na wysłużonym egzemplarzu edycji Bacheta dzieł Diofantosa, Fermat napisał " Nie da się zapisać sześcianu jako sumy dwóch sześcianów, czwartej potęgi jako sumy dwóch potęg czwartych, oraz w ogólności, żadnej potęgi poza drugą jako sumy dwóch podobnych potęg. Odkryłem zaiste wspaniały dowód, ale margines jest zbyt mały ,aby go zawrzeć". Jak wiadomo, mimo wysiłków wielu matematyków w ciągu kilku stuleci, nikomu nie udało się udowodnić przypuszczenia Fermata i są poważne wątpliwości czy Fermat rzeczywiście miał dowód. Ustalono wiele szczególnych przypadków przypuszczenia Fermata, głównie w wyniku prac Kummera. Było to niezwykłe badanie Kummera, które doprowadziło do powstania teorii liczb algebraicznych. Kummer wykazał ,że problem Fermata jest ściśle związany z polami cyklotomicznymi. To ostatnie pojawia się przez zapisanie równania Fermata xn + yn = zn w postaci
(x+y)(x+ζy)...(x+ζn-1y) = zn,
gdzie ζ jest pierwiastkiem z jedności. Jak zobaczymy za chwilę, przypadek n = 4 może być łatwo potraktowany; zatem wystarczy udowodnić ,że równanie nie ma rozwiązań w dodatnich liczbach całkowitych x,y,z kiedy n jest nieparzystą liczbą pierwszą p. Współczynniki po lewej stronie są liczbami całkowitymi algebraicznymi w polu cyklotomicznym Q(ζ) a, kiedy p ≤ 19, pole ma jednoznaczny rozkład. Kummer wyprowadził różne bardziej ogólne kryteria. W szczególności, wprowadził pojęcie prawidłowej liczby pierwszej p i udowodnił ,że przypuszczenie Fermata utrzymuje się dla wszystkich takich p; liczba pierwsza będzie prawidłowa jeśli nie jest podzielna przez pierwszą liczbę Bernoulliego 1/2(p-3), to znaczy, współczynniki Bj w równaniu


Kummer również ustanowił wynik dla pewnych klas nieregularnych liczb pierwszych. Zatem, w szczególności, wykorzystał wszystkie p < 100; są tylko trzy nieregularne liczby pierwsze w tym zakresie i z tymi mógł działać oddzielnie. Najlepszy wynik został osiągnięty przez Wagstaffa w 1978 roku; przez rozszerzone obliczenia skutecznie wyliczył przypuszczenie Fermata dla wszystkich p < 125 000
Przed pracami Kummera, równanie Fermata miał już rozwiązania dla kilku małych wartości nn. Specjalny przypadek x2 + y2 = z2 datuje się od czasów Greków a rozwiązanie (x,y,z) w liczbach całkowitych dodatnich zostało nazwane trójkątami pitagorejskimi. Wystarcza to do określenia wszystkich takich trójkątów z x,y,z, jako liczbami względnie pierwszymi i z parzystym y; bo jesli x i y byłyby oba nieparzyste, mielibyśmy z2 ≡ 2 (mod 4) co jest niemożliwe. Zapisując równanie w postaci (z+x)(z-x) = y2 , i odnotowując ,że (z+x,z-x) = 2, uzyskujemy z + x = 2a2, z - x = 2b2 a y = 2ab dla pewnych liczb całkowitych a,b przy (a,b) = 1 Daje to
x = a2 - b2, y = 2ab , z = a2 + b2
Co więcej, ponieważ z jest nieparzyste, widzimy ,że a i b mają przeciwne parzystości. Odwrotnie, łatwo jest sprawdzić ,że jeśli a,b są dodatnimi liczbami całkowitymi z (a,b) = 1 i przeciwnie parzyste wtedy x,y ,z powyższe spełniają trójkąt pitagorejski przy (x,y,z) = 1 i z parzystym y. Zatem znaleźliśmy najbardziej ogólne rozwiązanie x2 + y2 = z2. Pierwsze cztery trójkąty pitagorejskie, to znaczy z najmniejszymi wartościami z, to (3,4,5), (5,12,13),(15,8,171) i (7,24,25). Kolejnym najprostszym przypadkiem równania Fermata jest x4 + y4 = z4. Zostało to rozwiązane przez samego Fermata, używając metody nieskończonego pochodzenia. Rozważał on fakt równania x4 + y4 = z2 Jeśli jest rozwiązanie w dodatnich liczbach całkowitych, wtedy można założyć ,że x,y,z są liczbami względnie pierwszymi i ,że y jest parzyste. Teraz (x2,y2, z) jest trójkątem pitagorejskim i istnieją liczby całkowite a,b jak wyżej takie ,że x2 = a2 - b2, y2 = 2ab i z = a2 + b2. Dalej , b musi być parzyste, bo w przeciwnym razie będziemy mieli a parzyste i b nieparzyste, a więc x2 ≡ -1 (mod 4), co jest niemożliwe. Ponadto, (x,b,a) jest trójkątem pitagorejskim. Zatem uzyskujemy x = c2 - d2, b = 2cd i a = c2 + d2 dla pewnych dodatnich liczb całkowitych c,d przy (c,d) = 1. Daje to y2 = 2ab = 4cd (c2+d2) .Ale c ,d i c2 + d2 są względnie pierwsze w parach, z cego c = e2, d = f2 a c2 + d2 = g2 dla pewnych dodatnich liczb całkowitych e,f,g. Zatem ma e4 + f4 = g4 a g ≤ g2 = a ≤ a2 < z. wynika z tego przekonanie ,że z jest minimalnym wyborem na początku, że równanie x4 + y4 = z4 nie ma rozwiązań w dodatnich liczbach całkowitych x,y,z. Pierwszy oczywisty dowód ,że równanie x3 + y3 = z3 nie ma nietrywialnych rozwiązań , podał Euler w 1770 roku, ale argument zależy od właściwości liczb całkowitych w postaci a2 + 3b2 i od dawna są wątpliwości co do jego pełnej poprawności, Kontrowersyjna demonstracja została podana później przez Gaussa przy zastosowaniu właściwości pola kwadratowego Q(√(-3)). Dowód jest inną ilustracją metody nieskończonego pochodzenia. Przez rozważanie kongruencji (mod λ4), gdzie λ jest liczbą pierwszą 1/2(3-√(-3)) w Q(√(-3)), łatwo jest sprawdzić ,że jeśli równanie x3 + y3 = z3 ma rozwiązanie w liczbach dodatnich całkowitych, wtedy przynajmniej jedna z x,y,z jest podzielna przez λ. Zatem dla liczby całkowitej n ≥ , równanie α3 + β3 + ηλ3nγ3 = 0 ma rozwiązanie z η jedności w Q(√(-3)) i z α, β, γ niezerowymi liczbami całkowitymi algebraicznymi w tym polu. Łatwo jest teraz wydedukować ,przez rozkład α3 + β3 ,że to samo równanie z n zastąpień przez n-1, ma rozwiązanie jak powyżej, i wynika pożądany rezultat. Równanie x5 + y5 = z5 zostało rozwiązane przez Legendre′a i Dirichleta około 1825 roku, a równanie x7 + y7 = z7 przez Lame w 1839 roku. Ówcześnie jednak, argumenty ad-hoc stały się całkiem skomplikowane i była tak aż do fundamentalnej pracy Kummera, który przypuszczenie Fermata ustanowił dla wyższych wykładników pierwszych. Liczne uzyskane wyniki skupiał się na specjalnych klasach rozwiązań. Na przykład Sophie Germain udowodniła w 1823 roku ,że jeśli p jest nieparzystą liczbą pierwszą taką ,że 2p_1 jest również liczbą pierwszą, wtedy "pierwszy przypadek" przypuszczenia Fermata jest spełniony dla p, to znaczy, równanie xp + yp = zp nie ma rozwiązań w dodatnich liczbach całkowitych z xyz niepodzielnym przez p. Dalej, Wieferich udowodnił w 1909 roku ,że ten sam wniosek jest poprawny dla dowolnego p , które nie spełnia kongruencji 2p-1 ≡ 1 (mod p2). Wyniki te były przyjmowane z wielką atencją w ówczesnym czasie. Ostatni warunek nie jest w rzeczywistości bardzo rygorystyczny; są tylko dwie liczby pierwsze do 3*109, które spełniają tą kongruencję, mianowicie 1093 i 3511. W innym kierunku istotny postęp uczynił Faltings za pomocą geometrii algebraicznej; potwierdził dawne przypuszczenie Mordella , które przedstawił jako specjalny przypadek, iż dla danego n ≥ 4, jest tylko skończona ilość rozwiązań równania Fermata we względnie pierwszych liczbach całkowitych x,y,z.
Równanie Catalana W 1844 roku Catalan przypuszczał ,że jedynym rozwiązaniem równania xp - yq = 1 w liczbach calkowitych x,y,p,q ,wszystkie > 1, jest 32 - 23 = 1. Przypuszczenie nie zostało jeszcze ustalone ,ale godną uwagi demonstrację stworzył Tijdeman w 1976 roku. Udowodnił za pomocą teorii form liniowych w logarytmach (sekcja 6 ,Cześć VI) ,że równanie ma tylko skończenie wiele rozwiązań całkowitych i wszystkie z nich mogą być skutecznie ograniczone. Zatem, w zasadzie, praca Tijdemana zredukowała problem po prostego sprawdzenia skończenie wielu przypadkach; jednak , w chwili obecnej, granice ustalone przez tą teorię są zbyt duże dla praktycznych obliczeń. Aby zilustrować to podejście, rozważmy najprostsze równanie axn - byn = c, gdzie a,b i c ≠ 0 są danymi liczbami całkowitymi, i staramy się powiązać wszystkie rozwiązania w dodatnich liczbach całkowitych x,y i n ≥ 3. Możemy założyć , bez straty dla ogólności, że a i b są dodatnie, i wystarczy potraktować przypadek y ≥ x. Równanie może być zapisane w postaci eΛ - 1 = c/(byn), gdzie
Λ = log (a/b) + n log (x/y)
Teraz możemy założyć ,że yn > (2c)2, w przeciwnym razie rozwiązania mogą być ograniczone; wtedy mamy |eΛ- 1| < 1/(2y1/2n) .Ale dla liczby rzeczywistej u, nierówność |eu- 1| < 1/2 implikuje ,że |u| ≤ 2||eu- 1|. Zatem uzyskujemy |Λ| < y -(1/2) n, to znaczy log |Λ| < -(1/2)n log y. Z drugiej strony, z teorii form liniowych w logarytmach, mamy log |Λ| >> - log n log y, gdzie implikowana stała zależy tylko do a i b. Zatem widzimy ,że 1/2 n << log n, skąd n jest ograniczone w zakresie a i b. Wymagane granice dla x i y teraz wynikają z efektywnego rezultatu Bakera w równaniu Thue. Praca Tijdemana na równaniu xp - yq = 1 działa na tej samej zasadzie. Możemy założyć ,że p , q są nieparzystymi liczbami pierwszymi a wtedy z elementarnego rozkładu na czynniki, uzyskujemy x = kXq + 1, y = lYp - 1 dla liczb całkowitych X,Y, gdzie k jest 1 lub 1/p a l jest 1 lub 1/q. Wyraźnie mamy |p log x - q log y| << y-q a zastąpienie po lewej stronie dla x i y daje formę liniową
Λ = p log k - q log l + pq log (X/Y)
dla której |Λ| jest mała; podobne formy powstają przez zastąpienie x i y. Teoria form liniowych w logarytmach dostarcza teraz żądanych granic dla p i q, a te dla x i y , a następnie postępują zgodnie z efektywną wersją wyniku na równaniu supereliptycznym. Kilka przykładów równania Catalana zostało rozwiązanych na długo przed nadejściem teorii przestępności. Rzeczywiście w Średniowieczu, Leo Hebraeus działał już z przypadkami x = 3 i y = 2, a w 1738 , Euler rozwiązał przypadek p = 2 , q = 3. Przypadek q = 2 został potraktowany przez V.A. Lebesgue w 8150 roku, przypadek p = 3 i q = 3 przez Nagella w 1921 roku, przypadek p = 4 przez S.Selberga w 1932 roku a przypadek p = 2, który zawierał wynik dla p = 4, przez Chao Ko w 1967. Co więcej Cassels udowodnił w 1960 roku ,że jeśli p, q są liczbami pierwszymi, jak można założyć, wtedy p dzieli się przez y a q dzieli się przez x. Posmakujmy trochę tych prac przez udowodnienie ,że równanie x5 - y2 = 1 nie ma rozwiązań w liczbach całkowitych, z wyjątkiem x = 1, y = 0. Użyjemy właściwości jednoznacznego rozkładu na czynniki pola gaussowskiego. Jasne, że ponieważ y2 ≡ 0 lub 1 (mod 4), mamy x nieparzyste i parzyste y. Równanie może być zapisane w postaci x5 = (1+iy)(1-iy), i ponieważ x jest nieparzyste, współczynniki po prawej stronie są liczbami względnie pierwszymi. Zatem mamy 1 +iy = εω5, gdzie ε jest jednością gaussowską a ω jest liczbą całkowitą Gaussa. Teraz ε = ± 1 lub ± i, a więc ε = ε5 .Zatem, zapisując εω = u + iv, gdzie u,v są liczbami całkowitymi wymiernymi, mamy 1 +iy = (u+iv)5. To daje u5 - 10u3v2 + 5v4 = &plumn;1. Wynika stąd łatwo ,że u = 1, v = 0 a więc x = 1 , y = 0, czego oczekiwaliśmy. Argument może być łatwo rozszerzony dla ustanowienia bardziej ogólnego twierdzenia Lebesgue, dla dowolnej liczby nieparzystej pierwszej p, równanie xp - y2 = 1 nie ma rozwiązań w dodatnich liczbach całkowitych. Szczególnie interesujący jest wynik na równanie wykładnicze diofantyczne jakie uzyskali Erdos i Selfridge w 1975 roku; udowodnili oni ,że iloczyn kolejnych liczb całkowitych nie może być doskonałą potęgą, to znaczy równanie
yn = x(x+1)...(x+m-1)
nie ma rozwiązań w liczbach całkowitych x,y,m,n , wszystkie > 1
7.Ćwiczenia
a) Udowodnij ,że jeśli (xn, yn) przy n = 1,2,... jest sekwencją dodatnich rozwiązań równania Pella x2 - dy2 = 1, zapisywanych zgodnie ze zwiększaniem się wartości x lub y, wtedy xn i yn spełniają rekurencyjną relację un+2 - 2aun+1 + un = 0 ,gdzie a jest dodatnią liczbą całkowitą. Znajdź a kiedy d = 7
b) Określ czy lub nie równanie x2 - 31y2 = -1 jest rozwiązywalne w liczbach całkowitych x,y
c) Wykaż ,że jeśli p,q są liczbami pierwszymi ≡ 3 (mod 4) wtedy co najmniej jedno z równań px2 - qy2 = ± 1 jest rozwiązywalne w liczbach całkowitych x,y
d) Udowodnij przez kongruencję ,że jeśli a,c są liczbami całkowitymi przy a > 1, c > 1 i a+c ≤ 16, wtedy równanie x4 - ay4 = c nie ma rozwiązań w liczbach wymiernych x,y
e) Wykaż ,że równanie x3+2y3 = 7(z3 + 2w3), nie ma rozwiązań we względnie pierwszych liczbach x,y,z,w
f) Przez rozważenie przecięcia ćwiartki powierzchni x4 + y4 + z4 = 2 z linią y = z-x = 1 -tx, gdzie t jest parametrem, wykaż ,że równanie x4 + y4 + z4 = 2w4 ma nieskończenie wiele rozwiązań w liczbach całkowitych względnie pierwszych x,y,z,w
g) Rozwiąż równanie y2 = x3 - 17 w liczbach całkowitych x,y przez rozważenie współczynników z x3 + 8
h) Rozwiąż równanie y2 = x3 - 2 w liczbach całkowitych x,y przez rozkład na czynniki w Q(√(-2))
i) Udowodnij metodą nieskończonego pochodzenia ,że równanie x4 - y4 = z2 nie ma rozwiązań w dodatnich liczbach całkowitych x,y,z