Trzy perły teorii liczb

CZĘŚĆ I : Twierdzenie Van Der Waerden′a o ciągu arytmetycznym

Latem 1928 roku, "tematem dnia " w Getyndze był wynik osiągnięty przez młodego matematyka holenderskiego vad der Weaerdena, o którym z entuzjazmem mówili wszyscy tamtejsi matematycy. Problem był następujący: Wyobraź sobie ,że zbiór wszystkich liczba naturalnych należy podzielić w jakikolwiek sposób na dwie części (np. na liczby parzyste i nieparzyste, liczby pierwsze i złożone, albo w jakiś inny sposób). Czy wtedy można stwierdzić ,że postęp arytmetyczny o dowolnej długości można znaleźć w co najmniej jednej z tych części? .Wszystkim , którym to pytanie zadano, potraktowali ten problem na pierwszy rzut oka jako dość prosty, a jego twierdzące rozwiązanie wydaje się być niemal oczywistym. Pierwsze próby rozwiązania go nie doprowadziły do niczego. I jak matematycy w Getyndze oraz ich zagraniczni goście mieli w tradycji stałą współpracę ze sobą , stał się on szybko obiektem powszechnego zainteresowania. Wszyscy się nim zajmowali, od czcigodnego uczonego do młodego studenta. Po kilku tygodniach uległ on atakowi młodego mężczyzny, który przybył do Getyngi aby studiować. Holender, van der Waerden. Było to rozwiązanie elementarne, ale nie proste. Problem okazał się głęboki, choć wygląd był zwodniczo prosty. Właściwie van der Waerden udowodnił więcej niż było wymagane. W pierwszej kolejności, założył że liczby naturalne są podzielne nie tylko na dwie, ale wiele, powiedzmy k, klas (zbiorów). Po drugie, okazało się ,że nie jest konieczne rozłożenie całej sekwencji liczb naturalnych w celu zagwarantowania istnienia postępu arytmetycznego określonej długości l i przynajmniej jednej z tych klas; pewien segment wystarczy do tego celu. Długość n(k,l) tego segmentu jest funkcją liczb k i l. Oczywiście nie ma znaczenia gdzie weźmiemy ten segment, tak dług jak n(k,l) są kolejnymi liczbami naturalnymi. Twierdzenie van der Waerdena można sformułować jak następuje:
Niech k i l będą dwoma dowolnymi liczbami naturalnymi. Wtedy istnieją liczby naturalne n(k,l) takie ,że jeśli dowolny segment, o długości n(k,l), ciąg liczb naturalnych jest podzielny w dowolny sposób na k klas (niektóre z nich mogą być puste), wtedy postęp arytmetyczny, wtedy postęp arytmetyczny długości l pojawia się co najmniej raz w tych klasach.
To twierdzenie jest prawdziwe trywialnie dla l = 2. Aby to zobaczyć , wystarczy ustawić n(k,2) = k+1; jeśli k+1 liczb jest podzielnych na k klas, wtedy z pewnością co najmniej jedna z tych klas zawiera więcej niż jedną liczbę, a dowolna para liczb formuje postęp arytmetyczny długości 2, co udowadnia to twierdzenie. Udowodnimy to twierdzenie przez indukcję na l. W konsekwencji, będziemy zakładać ,ze twierdzenie zostało zweryfikowane dla jakiejś liczby l ≤ 2 i dla dowolnej wartości k, i wykażemy ,że zachowuje swoją poprawność dla liczby l+1 (i naturalnie również dla wszystkich wartości k)
Zgodnie z naszym założeniem, dla każdej liczby naturalnej k istnieje liczba naturalna n(k,l) taką ,że jeśli dowolny segment, długości n(k,l), z liczb naturalnych, jest podzielny w dowolny sposób na k klas, istnieje w co najmniej w jednej z tych klas postęp arytmetyczny o długości l. Musimy wtedy udowodnić ,że dla każdej liczby naturalnej , również istniej n(k,l+1). Rozwiążemy ten problem przez zbudowanie liczby n(k,l+1). W tym celu ustawimy
q0 = l, n0=n(k,l)
a potem definiujemy liczby q1, q2, …., n1, n2 sukcesywnie jak następuje : Jeśli qs-1 i ns-1 zostały już zdefiniowane dla pewnego s > 0 wstawiamy
(1) qs = 2ns-1qs-1 , ns = n(k1s, l) (s = 1,2,….) Liczby ns, qs są oczywiście zdefiniowane niniejszym dla dowolnego s ≥ 0. Teraz zakładamy, że dla n(k,l+1) możemy wziąć liczbę qk. Musimy wykazać wtedy ,że jeśli segment, długości qk, ciągu liczb naturalnych jest podzielny w dowolny sposób na k klas, wtedy istnieje postęp arytmetycznych długości l+1 w co najmniej jednej z tych klas. Dla skrócenia , możemy ustawić l+1 = l′
Zakładamy wtedy ,że segment Δ, długości qk, ciągu liczb naturalnych jest podzielny w dowolny sposób na k klas. Mówimy ,że dwie liczby a i b z Δ są tego samego typu, jeśli a i b należą do tej samej klasy i wtedy zapisujemy a ≈ b. Dwa równej długości podsegmenty z Δ, δ = (a, a+1, …, a + r) i δ′ = (a′ + a′ + 1 , …., a′ + r), będą tego samego typu, jeśli a ≈ a′, a+1 ≈ a′+1 , …, a = r ≈ a′ + r i wtedy zapisujemy δ ≈ δ′ . Liczba różnych możliwych typów dla liczb segmentu Δ jest oczywiście równe k. Dla segmentów postaci (a, a+1) (tj. dla segmentów długości 2) liczba możliwych typów to k2; a ogólnie, dla segmentów długości m, jest ich km. (Oczywiście, nie wszystkie te typy muszą w rzeczywistości pojawiać się w segmencie Δ). Ponieważ qk = 2nk-1 qk-1, segment Δ może być rozpatrywany jak ciąg 2 nk-1 podsegmentów długości qk-1. Takie podsegmenty, jakie widzieliśmy, mogą mieć kqk-1 różnych typów. Lewa połówka segmentu Δ zawiera teraz nk-1 takich podsegmentów, gdzie nk-1 = n(k1k-1, l) zgodnie z l .Przez wzgląd na sens liczby n(kqk-1, l) zakładamy ,że lewa połówka segmentu Δ zawiera ciąg arytmetyczny z l tych podsegmentów tego samego typu
Δ12, …., Δl
Długości qk-1; tu mówimy w skrócie ,że równej długości segmenty Δl formują ciąg arytmetyczny, jeśli ich początkowe liczby formują taki ciąg. Nazywamy różnice między liczbami początkowymi sąsiednich segmentów postępu Δ1, Δ2,… Δ1 różnicą d1 tego postępu. Naturalnie, różnica między drugimi (trzecimi, czwartymi itd.) liczbami tych dwóch sąsiednich segmentów jest podobnie równa d1 .Do tego postępu dodajemy kolejny (l+1) -ty wyraż Δ′l (przypominam ,że l′ = l+1) co może już rzutować poza granicę lewej połówki tego segmentu Δ ,ale które w dowolnym przypadku jeszcze należy całkowicie do tego segmentu Δ. Segmenty Δ1, Δ2,…,Δl, Δ1′ wtedy formują postęp arytmetyczny, długości l′ = l+1 i różnicą d1, segmenty długości qk-1, gdzie Δ1, Δ2,… , Δl są tego samego typu. Nie wiemy niczego o typie ostatniego segmentu Δl′. To kończy pierwszy krok naszej konstrukcji.
Teraz przejdziemy do kroku drugiego. Weźmy jeden z pierwszych l wyrazów z postępu segmentów właśnie zbudowanych. Niech tym wyrazem będzie Δi1, więc l ≤ i1 ≤ l; Δi1, jest segmentem długości qk-1. Traktujemy go w ten sam sposób jak segment Δ .Ponieważ qk-1 = 2nk-2qk-2, lewa połówka segmentu Δ;i1, może być rozpatrywana jako ciąg nk-2 podsegmentów długości qk-2. Dla podsegmentów tej długości istnieje kqk-2 możliwych typów a z drugiej strony nk-2 = n(kqk-2, l) z powodu (l). Dlatego też lewa połówka z Δi1, musi zawierać postęp z l tych podsegmentów tego samego typu, Δi1 i2 (l ≤ i2 ≤ l), długości qk-2. Niech d2 będzie różnicą tego postępu (tj. różnica między liczbami początkowymi dwóch sąsiednich segmentów) Do tego postępu segmentów dodamy (l+1)- ty wyraz Δ i1l′, o którego typie nie wiemy nic. Segment Δ i1l′ nie musi należeć do lewej połówki segmentu Δi1 , ale musi oczywiście należeć do segmentu Δi1. Teraz przeniesiemy naszą konstrukcję, które wykonaliśmy w jednym z segmentów Δi1, stosownie do wszystkich Δi1, (l ≤ i1 ≤ l′). Zatem uzyskujemy zbiór segmentów Δ;i1i2 (l ≤ i1 ≤′ , l ≤ i ≤ l′) z tych dwóch indeksów. Jasne jest ,że dwa dowolne segmenty z tego zbioru z indeksami nie przekraczającymi l są tego samego typu:
Δi1i2 ≈ Δi′1i2′ ( l ≤ i1, i2, i′1, i′2 ≤ l)
Bez wątpienia zobaczymy ,że ten process może być kontynuowany. Realizujemy go k razy. Wynikami naszej konstrukcji po pierwszym kroku będą segmenty długości qk-1, po drugim kroku, segmenty długości qk-2 itd. Po k -tym kroku,wyniki tej konstrukcji są segmentami długości q0 = 1 tj. proste liczby są naszym oryginalnym segmentem Δ; Niemniej oznaczamy je przez
Δi1i2….ik (l ≤ i1, i2, …, ik ≤ l′)
Dla l ≤ s ≤ k i l ≤ i1,….,is, i′1,…,i′s ≤ mamy
(2) Δi1i2… is ≈ Δi′1i2′…. i′s
Teraz dwie przydatne nam uwagi
1. W (2) , jeśli s < k i jeśli is+1, is+2,..., ik są dowolnymi indeksami branym z ciągu 1, 2, ..., l, l′ wtedy liczba Δi1i2…isis+1...ik pojawia się n a tej samej pozycji w segmencie Δi1 ... is jako liczba Δi′1i′2... i′sis+1 ... ik nie w segmencie Δi′1…. i′s. Ponieważ te dwa segmenty są tego samego typu z powodu (2), wynika ,że
(3) Δi1i2…isis+1… ik ≈ Δi′1i′2i′sis+1… ik
Jeśli l ≤ ii , …, is, i′1, … ,i′s ≤ l i l ≤ is+1, is+2 ,…, ik ≤ l′ (l ≤ s ≤ k)
2. Dla s ≤ k i i′s = is+l, , Δi1…..is-1is i Δi1…. is-1i′s są oczywiście segmentami sąsiednimi w s-tym kroku naszej konstrukcji. Dlatego też dla dowolnych indeksów is+1, … ik, liczby Δi1…. is-1isis+1…ik i Δi1 … is-1i′sis+1….ik pojawiają się na tej samej pozycji w dwóch takich sąsiednich segmentach, tak więc (przy i′s = is+1)
(4) Δi1… is-1i′sis+1… ik - Δi1… is-1isis+1… ik = ds
Teraz jesteśmy blisko naszego celu. Rozważmy poniższe k+1 liczb z segmentu Δ :

Ponieważ segment Δ został podzielony na k klas I mamy k+1 liczb w (5), istnieją dwie z takich liczb, które należą do tej samej klasy. Niech będą to liczby ar i as ( r < s), tak więc

Rozważmy l+ liczb

Pierwsze l liczb z tej grupy (tj. tych przy i < l′) należą do tej samej klasy z powodu (3). Ostatania (i = l′), jednak, jest tego samego jak pierwsza z powodu (6). Konsekwentnie wszystkie l+1 liczb w (7) są tego samego typu, i udowadnia nasze założenia mamy tylko do wykazania ,że te liczby z postępu arytmetycznego tj. ,że różnica ci+1 - ci (l ≤ i ≤ ) nie zależy od i. Ustawiamy i + 1 = i′ dla skrócenia. Dalej niech

tak więc ci,0 = ci , ci,s-r = ci+1 a zatem

Z powodu (4) mamy

Zatem różnica
ci+1 - ci = dr+1 + dr+2 + … + ds
i jest rzeczywiście niezależne od i, co kończy dowód naszego założenia.

CZĘŚĆ II : Hipoteza Landau′a - Schnirelmann′a i twierdzenie Mann′a

Być może słyszałeś o twierdzeniu Lagrange′a, że każda liczba naturalna jest sumą co najwyżej czterech kwdratów. Innymi słowy, każda liczba naturalna jest albo sama kwadratem innej liczby albo samą dwóch albo trzech albo czterech kwadratów. Warto jest zaznajomić się z zwartością tego twierdzenia w innej postaci. Zapiszmy ciąg wszystkich liczb doskonałych poczynając od zera:
(S) 0 ,1, 4, 9, 16, 25,….
To jest pewna sekwencja liczb całkowitych. Oznaczmy go przez S i wyobraźmy sobie cztery całkowicie identyczne jego kopie , S1,S2, S3, S4. Teraz wybieramy dowolną liczbę a12 z S1, a22 z S2, a32 z S3 i a42 z S4 i dodajmy te liczby razem. Suma wynikowa
(*) n = a12 + a22 + a32 + a42
może być:
1.Zerem (jeśli a1 = a2 = a3 = a4 = 0)
2.Kwdratem liczby naturalnej (jeśli w pewnej reprezentacji (*) liczba n trzech liczb a1, a2, a3 są zerami a czwarta nie jest zerem
3.Sumą dwóch kwadratów liczb naturalnych (jeśli w pewnej reprezentacji (*) z liczby n dwóch z liczb a1, a2, a3, a4 są zerami a pozostałe dwa nie są zerami)
4.Sumą trzech kwadratów liczb naturalnych (jeśli w pewnej reprezentacji (*) z liczby n jedna z liczb a1, a2, a3, a4 jest równa zero a pozostałe trzy nie są zerami)
5.Sumą czterech kwadratów liczb naturalnych (jeśli w reprezentacji z liczby n wszystkie cztery liczby są różne od zera)
Zatem liczba wynikowa n jest albo zerem albo liczbą naturalną która może być przedstawiona jako suma co najmniej czterech kwadratów, i jest jasne ,że odwrotnie każda liczba naturalna może być uzyskana przez opisany proces .
Teraz ułóżmy wszystkie liczby naturalne n które mogą być uzyskane z pomocą naszego procesu (tj. przez dodawanie czterech liczb branych odpowiednio z sekwencji S1, S2, S3, S4) w sekwencji
(A) 0, n1, n2, n3
(gdzie 0 < n1 < n2 < n3 < … , tak więc jeśli są równe liczbom wśród tych skonstruowanych, tylko jedna z nich pojawia się w (A)). Uogólnijmy nasz proces. Niech będzie dane k monotonicznie zwiększających się ciągów liczb całkowitych które zaczynają się od zera:

Wybieramy pojedynczą liczbę z każdego ciągu A(i) (1 ≤ i ≤ k) i dodajemy te k liczb razem. Suma tych wszystkich liczb skonstruowanych w ten sposób, jeśli uporządkujemy je w zależności od wielkości, daje nową sekwencję:
(A) 0 , n1, n2,…., nm, …
Tego samego typu, który nazwiemy suma danych sekwencji A(1), A(2), … , A(k) :

Treść twierdzenia Lagrange′a jest taka ,że suma S+S+S+S zawiera cały ciąg liczb naturalnych
Być może słyszałeś o słynnym twierdzeniu Fermata, że suma S + S zawiera wszystkich liczb pierwszych pozostawia resztę 1 jeśli dzieli się przez 4 (tj. liczby 5,13,17,29,…). Być może wiesz również ,że Iwan Winogradow udowodnił twierdzenie, z którym nie mogli sobie poradzić matematyce z ostatnich dwustu lat.
Jeśli oznaczymy przez P ciąg
(P) 0 ,2,3,5,6,11,13,17,…
składający się z zera i wszystkich liczb pierwszych, wtedy suma P + P + P zawiera wszystkie wystarczająco duże liczby nieparzyste. Zacytowaliśmy te przykłady z bardzo skromnego powodu : zapoznać cię z pojęciem sumy ciągów liczb i pokazać jak pewne klasyczne twierdzenia teorii liczb mogą być formułowane w sposób prosty i wygodny przy pomocy tej koncepcji
Jak niewątpliwie zaobserwowałeś, we wszystkich wspomnianych przykładach, skupialiśmy się na pokazaniu ,że suma pewnego ciągu liczb przedstawia sekwencję , która zawiera całkowitą lub prawie całkowitą tą lub tą klasę liczb (np. wszystkie liczby naturalne, wszystkie wystarczająco duże liczby nieparzyste, i innego tego typu rodzaju). We wszystkich innych podobnych problemach celem badania jest udowodnienie ,ze suma danych ciągów liczb przedstawia zbiór liczb , który jest w pewnym sensie "gęsty" w ciągu liczb naturalnych. Jest to często przypadek, kiedy zbiór zawiera cały ciąg liczb naturalnych. Twierdzenie Lagrange′a mówi ,że suma czterech postępów S zawiera cały ciąg liczb naturalnych. Teraz zwyczajem jest nazywanie ciągu A podstawą (ciągu liczb naturalnych) rzędu k jeśli suma k identycznych ciągów A zawiera wszystkie liczby naturalne. Twierdzenie Lagrnage′a wtedy stanowi ,że ciąg S kwadratów doskonałych jest podstawą rzędu cztery. Później pokażemy ,że ciąg doskonałych sześcianów formuje podstawę rzędu dziewiątego. Krótka refleksja ukaże ,że podstawa rzędu k jest również podstawą rzędu k+1 .w obecnych i przyszłych przykładach "gęstość" sumy która jest ustanowiona jest określona przez szczególne właściwości arytmetycznej natury liczb, które wkraczają dla nadrobienia tych ciągów (te liczby będą albo doskonałymi kwadratami lub liczbami pierwszymi, albo innymi o podobnej naturze). Rosyjski uczony Lew Schnirelmann pierwszy postawił pytanie : Do jakiego stopnia, gęstość sumy kilku ciągów jest określana wyłącznie przez gęstości składnika sumy, niezależnie od ich arytmetycznej natury?. Ten problem okazał się nie tylko głęboki i interesujący, ale również przydatny dla potraktowania pewnych klasycznych problemów. Zanim będziemy mogli określić problem w tej dziedzinie precyzyjnie i napisać słowo "gęstość" bez cudzysłowu, jest oczywiste, że najpierw musimy się zgodzić jaką liczbę (lub jakie liczby) użyjemy do zmierzenia "gęstości" naszych ciągów (podobnie jak w fizyce słowa "ciepło" i "zimno" nie nabyły znaczenia naukowego, dopóki nie nauczyliśmy się mierzyć temperatury) .Bardzo wygodną miarę "gęstości" ciągu liczb, zaproponował Schnirelmann. Niech
(A) 0, a1, a2, … , an
będzie ciągiem liczb ,gdzie ,jak zwykle, wszystkie i an są liczbami naturalnymi a an < an+1 (n = 1,2,…). Oznaczmy przez A(n) liczbę liczb naturalnych w ciągu (A), które nie przekraczają n (zero nie jest zliczane), więc 0 ≤ A(n) ≤ n. Wtedy mamy nierówność
0 ≤ A(n) /n ≤ 1
Ułamek A(n)/A , który dla różnych n, naturalnie ma inne wartości ,może oczywiście interpretowany jako rodzaj średniej gęstośi ciągu (A) w segmencie od l do n ciągu liczb natiralnyc, Zgodnie z sugestią Schnirelmanna, kres dolny wszystkich wartości tego ułamka jest nazywany gęstością ciągu A (w całym ciągu liczba naturalnych). Oznaczmy ta gęstość przez d(A). Aby lepiej zapoznać się z elementarnymi właściwościami tego pojęcia, zalecane jest aby s przekonał się o słuszności następujących twierdzeń :
1.Jeśli a1 > 1 (tj. ciąg (A) nie zawiera jedności), wtedy d(A) = 0
2.Jesli an = 1 +r(n-1) (tj. Ciąg (A) , zaczynający się od a1, jest postępem arytmetycznym z wyrazem początkowym l i różnicą r), wtedy d(A) = l/r
3.Gęstość każdego postępu geometrycznego jest równa zeru
4.Gęstość ciągu kwadratów doskonałych jest równa zeru
5. Dla ciągu (A) zawierającego cały ciąg liczb naturalnych (an = n , n = 1,2,..) jest konieczne i wystarczające ,że d(A) = l
6.Jeśli d(A) = 0 i A zawiera liczbę 1, i jeśli ε > 0 jest dowolne, wtedy istnieją wystarczająco duże liczby m takie ,że A(m) < εm
Jeśli udowodnisz to wszystko ,dowiesz się dość o pojęciu gęstości, aby móc go używać.
Teraz zapoznamy się z dowodem niezwykłego, choć prostego .lematu Schnirelmanna:
(1) d(A+B) ≥ d(A) + d(B) - d(A)d(B)
Znaczenie tej nierówności jest jasne : gęstość sumy dwóch dowolnych ciągów liczb jest nie mniejsza niż suma ich gęstości pomniejszona o iloczyn tych gęstości. Ta "nierówność Schnirelmanna" przedstawia pierwsze narzędzie, dla szacowania gęstości sumy z gęstości składników sumy. Oto jego dowód. Oznaczmy przez A(n) liczbę liczb naturalnych pojawiających się w ciągu A i nie przekraczających n, a przez B(n) analogiczną liczbedka ciągu B. Dla skrócenia oznaczamy d(A) = α , d(B) = β , A + B = C d(C) = γ. Segment (l,n) z ciągu liczb naturalnych zawiera A(n) liczb ciągu A, każda z nich również pojawia się w ciągu C. Niech ak i ak+1 będą dwoma kolejnymi liczbami tej grupy. Między nimi istnieje ak+1 - ak = l liczb, które nie należą do A. Te liczby to :
ak + 1, ak + 2, …, ak + l = ak+1 - l
Niektóre z nich pojawiają się w C, np. wszystkie liczby postaci ak + r, gdzie r występuje w B (co oznaczymy skrótowo : r εB) Istnieje wiele liczb tego rodzaju, jednakże, ponieważ są to liczby z B w segmencie (1, l) to znaczy, B(l) z nich. W konsekwencji każdy segment długości l dołączony między dwie kolejne liczby ciągu A zawiera co najmniej B(l) liczb które należą do C. Wynika z tego ,że liczba ,C(n), liczb segmentu (l,n) pojawiająca się w to co najmniej
A(n) + ΣB(l)
gdzie sumowanie jest rozszerzone na wszystkie segment które są wolnymi liczbami pojawiającymi się w A. Przez wzgląd na definicję gęstości jednak, B(l) ≥ βl , więc
C(n) ≥ A(n) + βΣl = A(n) + β{n-A(n)}
ponieważ Σl jest sumą długości wszystkich segmentów które sąwolnymi liczbami pojawiającymi się w A, która jest po prostu liczbą n-A(n) liczb segment (l,n), który nie występuje w A. Ale A(n) ≥ αn a zatem
C(n) ≥ A(n)(1- β) + βn ≥ αn(1-β) + βn
co daje
C(n) / n ≥ α + β - αβ
Ponieważ ta nierówność odnosi się do dowlonej liczby naturalnej n, mamy
γ = d (C) ≥ α + β - αβ
Nierówność Schnirelmanna (1) może być zapisana w równoważnej postaci
1-d(A+B) ≤ {1 - d(A)}{1 -d(B)}
a w tej postaci może być łatwo uogólnione do przypadku dowolnych kilku składników sumy


Jest to udowodnione przez prostą indukcję; nie powinieneś mieć problemów z tym. Jeśli zapiszemy ostatnia nierówność w postaci


ponownie włączamy jedynkę dla szacowania gęstości sumy z gęstości składników sumy. Schnirelmann wyprowadził szereg bardzo niezwykłych wyników z tej elementarnej nierówności i uzyskał poniższe ważne twierdzenie :
Każda dodatnia gęstość jest podstawą ciągu liczb naturalnych
Innymi śłowy, jeśli α = d(A) > ), wtedy suma wystarczająco dużej liczby ciągów A zawiera cały ciąg liczb naturalnych.
Oznaczmy dla skrócenia przez Ak sumę k sekwencji, każda znich pokrywająca się z A. Wtedy z mocy nierówności (2)
d(Ak ≥ 1 - (1-α)k
Ponieważ α > 0 , mamy, dla wystarczająco dużego k
(3) d(Ak > 1 / 2 Teraz możemy łatwo wykazać ,że ciąg A2k zawiera cały ciag liczb naturalnych. Jest to prosta konsekwencja poniższych uogólnionych twierdzeń
Lemat. Jeśli A(n) + B(n) > n - 1, wtedy n występuje w A + B
Rzeczywiście, jeśli n pojawia się w A lub w B, wszystko jest udowodnione. Możemy dlatego założyć ,że n nie występuje ani w A ani B. Wtedy A(n) = A(n-1) i B(n) = B(n-1) , i w konsekwencji
A(n-1) + B(n-1) > n -1
Teraz niech a1, a2,..., ar i b1, b2 ,..., bs będą liczbami segmentu (l,n-1) która pojawia się w A i B, odpowiednio, więc r = A(n-1) , s - B(n-1). Wtedy wszystkie liczby
a1, a2,..., ar
n- b1, n - b2,..., n - bs
należą do segment (l,n-1). Istnieje r + s = A(n-1) + B(n-1) z tych liczb, co jest większe niż n-1. Zatem jedna z tych liczb w górnym wierszu jest równa liczbie w dolnym wierszu. Niech ai = n - bk .Wtedy n = ai + bk, tj. n pojawia się w A + B
.Wróćmy do naszego celu ,mamy, na podstawie (3) dla dowolnego n:
Ak(n) > 1 / 2n 1 / 2 (n-1)
i dlatego
Ak(n) + Ak(n) > n-1
Zgodnie z lematem udowodnionym, wynika ,że na pojawia się Ak + Ak = A2k. Ale n jest dowolną liczbą naturalną a zatem nasze twierdzenie jest udowodnione.
To proste twierdzenie prowadzi do szeregu ważnych zastosowań według Schirelmanna. Na przykład, pierwszy udowodnił ,że ciąg P składający się z jedności i wszystkich liczb pierwszych jest podstawą ciągu liczb naturalnych. Ten ciąg P ma gęstość zero, ponieważ Euler już udowodnił ,więc twierdzenie które udowodniliśmy nie jest dokładnie stosowalne do tego. Ale Schirelmann mógł udowodnić ,że P + P ma gęstość dodatnią. Zatem P+P formuje podstawę i dlatego P rzeczywiście również. Z tego łatwo wywnioskować ,że dowolna liczba naturalna, z wyjątkiem 1, może, dla wystarczająco dużego k, być przedstawiona jak suma co najmniej k liczb pierwszych
Zostałeś wprowadzony w najkrótszy z możliwych sposbów w problemy pojedynczej i fascynującej gałęzi teorii liczb, której badanie zapoczątkowały prace Lwa Schnirelmanna. Naszym obecnym celem jest określenie problemu na tym polu i przystąpienie do jego sformułowania.
Na jesieni 1931 roku, Schnirelmann , po rozmowach z Landauem w Getyndze, odkrył ciekawy fakt: We wszystkich konkretnych przykładach , które były możliwe do opracowania, było możliwe zastąpienie nierówności:
d(A+B) ≥ d(A) + d(B) - d(A)d(B)
przez krótszą (i prostszą) nierówność
(4) d(A+B) ≥ d(A) + d(B)
To znaczy gęstość sumy zawsze okazuje się być co najmniej tak duża jak suma gęstości składników sumy (przy założeniu oczywiście, że d(A) + d(B) ≤ 1). Założyli oni ,że nierówność (4) była wyrażeniem uniwersalnego prawa, ale pierwsze próby udowodnienia tego twierdzenia nie powiodły się. Wkrótce okazało się ,że jeśli to twierdzenie jest prawdziwe, droga do jego udowodnienia będzie bardzo trudna. Odnotujmy w tym miejscu ,że jeśli hipotetyczna nierówność (4) przedstawia prawo uniwersalne, wtedy to prawo może być bezpośrednio uogólnione przez indukcję do przypadku dowolnych kliku składników sumy; tj. przy założeniu, że


Mamy


Problem ten nie mógł pomóc, ale przyciągnął uwagę badaczy ze względu na prostotę i eleancję ogólnego prawa hipotetycznego (4) z jednej strony , a z drugiej ze względu na ostry kontrast między elementarnym charakterem problemu i trudnościami w jego rozwiązaniu, co się okazało już przy pierwszym podejściu. W 1932 roku, udowodniono nierówność (4) dla najważniejszego specjalnego przypadku d(A) = d(B) (ten przypadek musi być rozpatrywany jako najważniejszy ponieważ w większości konkretnych problemów , wszystkie składniki sumy są takie same0 W tym samym czasie udowodniono nierówność (5) przy założeniu ,że d(A1) = d(A2) = … d(Ak) (jest łatwo zauważyć ,że ten wynik nie może być wyprowadzony z poprzedniego po prostu przez indukcję, ale wymaga specjalnego dowodu). Metody dowodu były całkowicie elementarne ale bardzo złożone. Publikacja tych dowodów przyciągnęła uwagę uczonych z wielu krajów do hipotezy Landaua - Schnirelmanna. Wiele znaczących wyników zostało osiągniętych Niektórzy autorzy przechodzili od domeny liczb naturalnych do innych pól. Problem stał się "modny" Niektórzy oferowali nagrodę za jego rozwiązanie. Landau, w swoim traktacie poświęconym najnowszym osiągnięciom w teorii liczb napisał "że powinno się nakłaniać do tego problemu czytelników" .Ale okazał się uparty i wytrzymały na wysiłki najzdolniejszych uczonych przez szereg lat. Dopiero w 1942 roku, młody matematyk amerykański , Mann w końcu go rozpracował; znalazł całkowity dowód nierówności (4) ( a zatem także nierówności (5)). Jego metoda była całkowicie elementarna . Dowód jest długi i bardzo złożony. Rok później, w 1943, Artin i Scherk opublikowali nowy dowód tego samego twierdzenia, który opierał się na całkiem innej idei. Jest krótszy i bardziej przejrzysty, chociaż całkiem elementarny. Jest to dowód, o którym teraz pomówimy
Załóżmy ,że A i N są dwom ciągami. Ustawiamy A + B = C . Niech A(n), d(A) itd. mają swoje zwykłe znaczenie. Przypomnijmy ,że wszystkie nasze ciągi zaczynają się od zera, ale ,że tylko liczby naturalne pojawiające się w tym ciągu są rozpatrywane kiedy obliczamy A(n), B(n),C(n). Musimy udowodnić ,że
(6) d(C) ≥ d(A) + d(B)
Udowadniamy ,że d(A) + d(B) ≤ 1 .Dla skrócenia zapiszemy d(A) = α , d(B) = β .
PODSTAWOWY LEMAT : Jeśli n jest dowolną liczbą naturalną, istnieje liczba całkoiwta m (1 ≤ m ≤ n) takie ,że
C(n) - C(n-m) ≥ (α + β)m
Innymi słowy, istnieje "reszta" (n-m+1, n) z segment (;,n), w której średnia gęstość ciagu C to co najmniej α + β. Spójrzmy teraz na dwa problemy : po pierwsze, dowód podstawowego lematu i po drugie, wykazanie , że nierówność(6) wynika z lematu podstawowego. Drugi z tych problemów jest nieporównywalnie łatwiejszy niż pierwszy, więc powinniśmy rozpocząć od drugiego problemu. Załóżmy wtedy ,że podstawowy lemat został już udowodniony. Oznacza to ,że w pewnej "reszcie" (n - m+1, n) z segmentu (l,n) średnia gęstość ciągu C to co najmniej α + β. Z podstawowego lematu, jednak, segment (l, n-m) ponownie ma pewną "resztę" (n-m-m′ + l, n-m) w której średnia gęstość C to co najmniej α + β .Jasne jest ,że kontynuując ten proces, segment (l,n) jest ostatecznie podzielny na skończoną liczbę subsegmentów, w każdym średnia gęstość C to co najmniej α + β Dlatego też średnia gęstość C to również co najmniej α + β w całym segmencie (l,n). Ponieważ n była dowolna , mamy
d( C ) ≥ α + β ; (co było do udowodnienia)
Zatem ten problem jest teraz zredukowany do udowodnienia podstawowego lematu Przejdziemy teraz do dowodu, który jest długi i skomplikowany
Normalny ciąg
Będziemy odnosić się do liczby n jako stałej, a wszystkie ciągi jakie będziemy badać będą składać się z liczby 0 i pewnych liczb z segmentu (l,n). Zgodzimy się nazywać taki ciąg N normalnym, jeśli posiada następującą właściwość: Jeśli dowolne liczby f i f′ segmentu (l,n) nie pojawiają się w N, wtedy żadna z liczb f+f′ - n pojawia się w N (gdzie przypadek f = f′ nie jest wykluczony). Jeśli liczba n należy do ciągu C wtedy
C(n) - C(n-1) = 1 ≥ (α + β) ⋅ l
tak że podstawowy lemat jest trywialnie poprawny (m=1) .W konsekwencji powinniśmy założyć w następstwie , że n nie występuje w C. Podstawowy lemat jest łatwy do udowodnienia w przypadku kiedy ciąg C jest normalny. Rzeczywiście, oznaczmy przez m najmniejszą liczbę dodatnią która nie pojawia się w C (m ≤ n ponieważ n , z założenia, nie występuje C). Niech s będzie dowolną liczbą całkowitą leżącą między n-m a n; n-m < s C(n) - C(n-m) = m-1
Z drugiej strony, z lematu, ponieważ m nie występuje w C = A + B mamy A(m) + B(m) ≤ m-1. W konsekwencji
(7) C(n) - C(n-m) ≥ A(m) + B(m) ≥ (α + β)m
,co ponownie udowadnia poprawność podstawowego lematu
Rozszerzanie kanoniczne
Zwrócimy teraz uwagę na przypadek gdzie sekwencja C = A + B nei jest normalna. W tym przypadku będziemy dodawać do zbioru B zgodnie ze zdefiniowanym schematem, liczby ,które do niego nie należą, a tym samy przekazywane z B do rozszerzonego zbioru B1. Zbiór A + B1 = C1 ewidentnie będzie wtedy pewnym rozszerzeniem zbioru C. To rozszerzenie zbiorów B i C (zbiór A pozostaje niezmodyfikowane) będą zdefiniowane dokładnie i jednoznacznie; jest to możliwe jeśli i tylko jeśli zbiór C nie jest normalny. Nazwiemy to rozszerzenie, rozszerzeniem kanonicznym zbiorów B i C. Przejdźmy do definiowania rozszerzenia kanonicznego zbiorów B i C. Jeśli C nie jest normalny, istniejądwie liczby xc i c′ w segmencie (0,n) takie ,że
c∉ C, c′ ∉ C , c + c′ - n ∈ C
Ponieważ C = A + B, wynika ,że
(8) c + c′ - n = a + b (a ∈ A, b ∈ B)
Niech β0 będzie najmniejszą liczbą zbioru B , która może odegrać role liczby b w równaniu (8). Innymi słowy β0 jest najmniejszą liczbą całkowitą b ∈ B, która spełania równanie (8) dla odpowiednio wybranych liczb c ∉C, c′ ∈ C, a ∈ A segmentu (0,n). Ta liczba β0 będzie nazywana podstawą naszego rozszerzenia. Zatem równanie
(9) c + c′ - n = α + β0
koniecznie ma rozwiązania w liczbach c,c′, spełniających warunki
c ∉C , c′ ∉ C, a ∈ A
gdzie wszystkie trzy liczby należą do segment (0,n). Zapiszemy wszystkie liczby c i c′ , które spełniania równanie (9) i enumerujemy warunki, do postaci zbioru C*. Wyraźnie zbiory C i C* nie mają wspólnego pojedynczego elementu. Nazwiemy ich sumę (tj wszystkie liczby ,które występują albo w C albo w C*)
C ∪ C* = C1
kanonicznym rozszerzeniem zbioru C. Zbadajmy teraz wyrażenie β0 + n-c. Jeśli c pozwala przejść przez wszystkie liczby zbioru C* ,jaki skonstruowaliśmy, wartość tego wyrażenia formują pewien zbiór B*. Zgodnie z równaniem (9), każda taka liczba β0 + n- c (c ∈ C*) może być zapisana w postaci c′ -a , gdzie c′ ∈ C*, a ∈ A. Niech b* będzie dowolną iczbą występująca w B*. Ponieważ jest w postaci β0 + n -c, jest ≥ β0 ≥ 0 ; a ponieważ jest również postać c′ - a (c′ ∈ C* , a ∈ A), jest ≤ c′ ≤ n. Zatem wszystkie liczby zbioru B* należy do segmentu (0,n). Co więcej ,jeśli b* ∈ B*, wtedy b* ∉ B, ponieważ w przeciwnym razie będzie wynikało z b* = c′ - a ,że c′ = a + b* ∈ A + B = C ,co jest fałszywe. Zbiór B* jest osadzony w segmencie (0,n), i nie ma elementów wspólnych ze zbiorem B. Wstawiamy
B ∪ B* = B1
i nazywamy zbiór B1 kanonicznym rozszerzeniem zbioru B. Pokażmy ,że
A + B1 = C1
Najpierw ,niech a ∈ A, b1 ∈ B1. Udowodnimy ,że a + b ∈ C1. Z b1 ∈ B1 wynika ,że albo b1 albo b1 ∈ B*. Jeśli b1 ∈ B, wtedy a + b1 ∈ A + B = C ⊂ C1 .Jeśli b1 ∈ B*, jednak, wtedy a + b1 albo wystąpi w C, a zatem również w C1, albo a+b1 ∉ C. Ale w tym przypadku (ponieważ b1, jako element tego zbioru B* , jest postaci β0 + n-c′, c′ ∉ C) uzyskujemy
c = a + b1 = a + β0 + n - c′ ∉ C
Dlatego też
c + c′ - n = a + β0 ∈ A + B = C
gdzie c ∉ C a c′ ∉ C .Ale wtedy zgodnie z definicją zbioru C*
c = a + b1 ∈ C* ⊂ C1 , co było do udowodnienia. Zatem wykazaliśmy ,że A + B1 ⊂ C1
Aby udowodnić odwrotną relację, załóżmy ,że c ∈ C1, co oznacza ,że albo c ∈ C albo c ∈ C*. Jeśli c ∈ C , wtedy c = a + b, a ∈ A, b ∈ B ⊂ B1. Jeśli, jednak, c ∈ C*, wtedy dla pewnego a ∈ A, liczba b* = c - a, jak wiemy, występuje w B*. Mamy c = a + b* ∈ A+B* ⊂ A + B1. Dlatego C1 ⊂ A + B1. Udowodniliśmy również powyżej ,że A + B1 ⊂ C1. W konsekwencji C1 = A + B1. Przypomnij sobie ,że z naszym założeniem, n ∉ C. Łatwo zauważyć - i jest to ważne - ,ze liczba n nie pojawia się rozszerzeniu C1. Dlatego mając n ∈ C*, możemy , z definicji, C*, wstawić c′ = m w równaniu (9), co może dawa,c c = α + β0 ∈ A + B = C, podczas gdy c ∉ C zgodnie z (9). Jeśli rozszerzony ciąg C1 nie jest jeszcze normalny, wtedy ,z powodu A + B1 = C1 a n ∉ C1, zbiory A,B1 i C1 formują trójkę ze wszystkimi właściwościami trójki A,B,C , które są konieczne dla nowego rozwinięcia kanonicznego. Weźmy nową baze β1 tego rozwinięcia, definiując komplementarne zbiory B1*, C1*, wstawiamy
B1 ∪ B1* = B2, C1 ∪ C1* = C1
i możliwe jest dowiedzenie ,że A + B2 = C2 i n ∉ C2. Ewidentne jest ,że ten proces może być kontynuowany dopóki jedno z rozwinięc Ch udowodni ,że jest normalne. Oczywiście ten przypadek musi z pewnością mieć miejsce, ponieważ w każdym rozwinięciu dodajemy nowe liczby to zbiorów Bμ i Cμ bez przekraczania granic segmentu (0,n)
W ten sposób uzyskujemy końcową sekwencję zbiorów
B = B0 ⊂ B1 ⊂ … ⊂ Bh
C = C0 ⊂ C1 ⊂ … ⊂ Ch
gdzie każde Bμ+1 (odpowiednio Cμ+1) zawiera liczby które nie pojawiają się w Bμ (Cμ) w celu uzupełnienia zbiorów Bμ* (Cμ*), tak więc
Bμ* = Bμ ∪ Bμ*, Cμ* = Cμ ∪ Cμ* (0 ≤ μ ≤ h-1)
Oznaczamy przez βμ podstawę rozwinięcia która przenosić (Bμ, Cμ) do (Bμ+1, Cμ+1). Mamy
A + Bμ = Cμ, n ∉ Cμ (0 ≤ μ ≤ h). W końcu, zbiór Ch jest normalny, podczas gdy zbiory Cμ (0 ≤ μ ≤ h-1) nie są.
Właściwości rozszerzenia kanonicznego
Teraz sformułujemy i udowodnimy w postaci trzech lematów te właściwości rozszerzenia kanonicznego , które są konieczne. Tylko Lemat 3 będzie miał dalsze zastosowanie; Lematy 1 i 2 są wymagane dl udowodnienia Lematu 3
Lemat 1. βμ > βμ-1 (1 ≤ μ ≤ h-1)l tj. podstawy kolejnych kanonicznych rozszerzeń formują monotonicznie rosnący ciąg.
| Faktycznie, ponieważ βμ ∈ βμ = βμ-1 ∪ βμ-1*. albo βμ ∈ βμ-1* albo βμ ∈ βμ-1. Jeśli βμ ∈ βμ-1* wtedy βμ jest w postaci
βμ = βμ-1+n+c
Gdzie c ∈ Cμ-1* ⊂ Cμ i dlatego c < n ,tak więc βμ > βμ-1, i Lemat 1 jest udowodniony. Jeśli βμ ∈ βμ-1, wtedy z definicji liczby βμ istnieją całkowite a ∈ A, c ∉ Cμ, c′ ∉ Cμ takie ,że
c + c′ - n = a + βμ ∈ Cμ.
Ale dla βμ ∈ βμ-1, mamy
(10) c+c′ - n = a βμ ∈ A + βμ-1 = Cμ-1,
gdzie c ∉ Cμ-1, c′ ∉ Cμ-1. Zatem, z powodu właściwości minimalnej z βμ-1, βμ ≥ βμ-1. Jeśli βμ = βμ-1 wynika z (1) i z definicji zbioru Cμ-1* ,że
c ∈ Cμ-1* ⊂ Cμ, c′ ∈ Cμ-1* ⊂ Cμ. Oba są fałszywe i dlatego βμ > βμ-1. W następstwie oznaczamy przez m najmniejszą liczbę dodatnią całkowitą, która nie pojawia się w Ch
Lemat 2. Jeśli c ∈ Cμ* (0 ≤ μ ≤ h-1) i n-m < c < n, wtedy c > n-m + βμ. To znaczy, wszystkie liczby c ze zbioru Cμ* które leżą w przedziale n-m < c , n są osadzone w tej części segmentu, która jest charakteryzowana przez nierówność n-m+βμ < c < n. Musimy wykazać ,że
c+m-n > βμ
Wynika z n - m < c < n ,że
0 < m+c - n < m
Dlatego też z definicji liczby m
m + c - n ∈ Ch
Teraz
Ch = Cμ ∪ Cμ* ∪ Cμ+1* ∪ … ∪Ch-1*
Rozważmy dwa przypadki
1.Jeśli m + c - n ∈ Cμ, wtedy
m+c-n = a + bμ; a ∈ A, bμ ∈ Bμ
Ale m ∉ Cμ i c ∉ Cμ. Dlatego z powodu minimalnej właściwości βμ musimy mieć bμ ≥ βμ. Jeśli bμ = βμ wynika z definicji zbioru Cμ* ,że m ∈ Cμ*, co jest fałszywe ponieważ Cμ* ⊂ Cμ+1 ⊂ Ch a m ∉ Ch .W konsekwencji bμ > βμ tak więc
m+c-n = a + bμ ≥ bμ > βμ i Lemat 2 jest udowodniony
2.Jeśli c′ = m+c-n ∈ Cv* (μ ≤ v ≤ h-1), wtedy, z definicji zbioru Cv*, c′ spełnia równanie postaci (9)
c′ - a = βv + n - c″
gdzie a ∈ A, c″ ∈ Cv*. Zatem c′ ≥ c′ - a > β v ≥ β μ (gdzie ostatnia nierowność jest dana z Lematu 1), i Lemat 2 jest ponownie udowodniony
Lemat 3. Mamy
Cμ*(n) - Cμ*(n-m) = Bμ*(m-1) (0 ≤ ν h-1)
To znaczy, liczba całkowita c ∈ Cμ* w segmencie n-m < c < n jest dokładnie taka sama jak liczba całkowita b ∈ Bμ* w segmencie 0 < b < m (ta sama długość).
Zbadajmy związek (11) b = βμ+n-c
Z definicji zbiorów Bμ* i Cμ*. c ∈ Cμ* implikuje b ∈ Bμ* i odwrotnie. Jeśli , dodatkowow n-m+ βμ < c < n, wtedy βμ < b < m i odwrotnie. Zatem
Cμ*(n) - Cμ*(n-m+ βμ) = Bμ*(m-1) - Bμ*μ)
Z Lematu 2 Cμ*(n-m+ βμ) = Cμ*(n-m).Z drugiej strony, każde b ∈ Bμ* może by wyrażone w postaci (11), gdzie c < n ; b dlatego przekracza βμi w konsekwencji Bμ*( βμ) = 0 .Wynika z tego
Cμ*(n) - Cμ*(n-m) = Bμ*(m-1), co był do udowodnienia
Dowód fundamentalnego lematu
Bardzo łatwo jest teraz udowodnić fundamentalny lemat z poprzednich wyników i stosując Lemat 3, który został udowodniony. Jeśli zastosujemy wynik w postaci nierówności (7) do ciagów A, Bh i Ch, odkryjemy ,że
(12) Ch(n) - Ch(n-m) ≥ A(m) + Bh(m)
gdzie m jest najmniejszą liczbą dodatnią która nie występuje w Ch . Oczywiście m ∉ A i m ∉ Bh, tak więc możemy zapisać A(m-1) i Bh(m-1) zamiast A(m) i Bh(m) odpowiednio.
Mamy
Ch = C ∪ C* ∪ C1* ∪... ∪ Ch-1*
Bh = B ∪ B* ∪ B1* ∪ ...∪ Bh-1*,
gdzie zbiory pojawiające się w dowolnej z tych dwóch sum są wzajenie wykluczające, tak więc


musimy oczywiście wstawić C0* = C*, B0* = B* .Z powodu (12) wynika ,że


Z Lematu 3 jednakμ*(n) - C(n-m) ≥ A(m) + B(m-1) = A(m) + B(m) ≥ (α + β) m
co udowadnia fundamentalny lemat. Zakończy to również dowód twierdzenia Manna, które rozwiązuje fundamentalny problem metryczny addytywnej teorii liczb.

CZĘŚĆ III : Elementarne rozwiązanie problemu Waringa

Będziemy przywoływać twierdzenie Lagrange′a, które zostało omówione na początku poprzedniego rozdziału. Mówimy ,że każda liczba naturalna może być wyrażona jako suma co najwyżej czterech kwadratów. Wykażemy również , że to twierdzenie może być ustanowione w całkowicie innych wyrazach: Jeśli cztery ciągi, każdy identyczny z
(A2) 0, 12, 22, … ,k2, …
są dodawane razem, wynikowy ciąg zawiera wszystkie liczby naturalne. Lub krócej, ciąg (A2) jest podstawą (ciągiem liczb naturalnych) rzędu cztery .Wspomnieliśmy ,że jako pokazano wcześniej, ciąg sześcianów
(A3) 0, 13, 23, … , k3, …
ma podstawę rzędu dziewięć . Wszystkie te fakty prowadzi w liczbach naturalnych do hipotezy ,że , dla dowolnej liczby naturalnej n , ciąg
(An) 0, 1n, 2n, … , kn, …
jest podstawą ( której rząd zależy od n). Takie twierdzenie zostało zaproponowane przez Waringa w osiemnastym wieku. Jednak problem był bardzo trudny do udowodnienia, aż do początku XX wieku, kiedy uniwersalna poprawność hipotezy Waringa została zademonstrowana przez Hilberta (1909). Dowód Hilberta jest nie tylko ciężki w aspekcie formalnym i na podstawie skomplikowanych teorii analitycznych, ale również brakuje mu przejrzystości w aspektach konceptualnych. Dziesięć do piętnastu lat później, nowe dowody twierdzenia Hilberta dostarczyli Littlewood w Angli i I.M Winogradow w ZSRR. Dowody te jednak dalej były analitycznie i formalnie nieporęczne, ale różniły się korzystnie od dowodu Hilberta swoją jasnością i prostotą koncepcji, która nie pozostawiała nic do życzenia. W rzeczywistości, dzięki temu obie metody stały się potężnymi źródłami nowych twierdzeń arytmetycznych. Ale kiedy nauka związana jest z takim całkowicie elementarnym problemem , jak problem Waringa, to zawsze staramy się znaleźć rozwiązanie, które nie wymaga żądnych koncepcji lub metod, które wykraczają poza granice arytmetyki elementarnej. Taki w pełni elementarny dowód twierdzenia Hiberta po raz pierwszy otrzymał w 1942 roku, młody radziecki matemtyk Linnik. Odnosiliśmy się już do faktu ,że "elementarny" nie oznacza "prosty". Elementarne rozwiązanie problemu Waringa odkryte przez Linnika, jak zobaczymy, nie jest prosty i zajmie trochę czasu aby go zrozumieć i przetrawić. Idea Schnirelmanna odgrywa znaczącą rolę w dowodzie Linnika. Schnirelmaa udowodnił swoje słynne twierdzenie ,że ciąg złożony z zera, jedności i wszystkich liczb pierwszych, jest podstawą ciągu liczb naturalnych: Wykazał ,że ciąg P + P ma gęstość dodatnią. Ponieważ zgodnie z ogólnym twierdzeniem Schnirelmanna, które udowodniliśmy, każdy ciąg o dodatniej gęstości jest podstawą sekwencji liczb naturalnych. Ta sama metoda leży u podstaw dowodu twierdzenia Hilbera, odkrytego przez Linnika .Wszystko sprowadza siędo dowodu ,że suma wystarczająco dużej liczby ciągów An jest ciągiem dodatniej gęstości. Tak szybko jak to osiągniemy, możemy, na ocy tego samego ogólnego twierdzenia Schirelmanna, uważać twierdzenia Hilberta za udowodnione
Podstawowy Lemat
Jeśli dodamy razem k ciągów, identycznych z An, zgodne z zasadą w Części II, ewidentnie uzyskamy ciąg An(k), które zawierają zero i wszystkie te liczby naturalne, które mogą być wyrażone jako suma co najwyżej k części sumy w postaci xm , gdzi x jest dowolną liczbą naturalną. Innymi słowy, liczba m należy do ciągu An(k) jeśli równanie
(1)x1n + x2n + … + xkn = m
jest rozwiązywalne w całkowitych liczbach nieujemnych xi (1 ≤ i ≤ k). Problem polega na wykazaniu ,że dla wystarczająco dużego k , ciąg An(k) ma dodatnią gęstość. Dla wstępnie przypisanego k i m, równanie (1) generalnie może być rozwiązane na kilka różnych sposobów. W dalszym ciągu będziemy oznaczać przez rk(m) liczbę tych sposobów tj. liczba systemów nieujemnych liczb całkowitych x1,x2,…, xk , które spełniają równanie (1). Jasne jest ,że liczba m wystąpi w An(k) jeśli i tylko jeśli rk(m) > 0. Poniżej założymy ,że liczba n będzie dana i stała, i dlatego nazywamy wszystkie liczby które zależą tylko od n ,stałymi. Takie stałe będą oznaczane przez literę c lub c(n), gdzie taka stała c może mieć różne wartości w różnych częściach naszego omówienia, o ile tylko te wartości są stałymi
Podstawowy lemat. Istniej naturalna liczba k = k(n), zależna tylko od n, i stała c , taka ,że dla dowolnej liczby naturalnej N
(2) rk(m) < cN(k/n)-1 (1 ≤ m ≤ N)
Ponownie stajemy przed dwoma problemami : po pierwsze , udowodnienie podstawowego lematu i po drugie przejście od konkluzji podstawowego lematu ,że ciąg An(k) ma dodatnią gęstość. Tym razem ponownie drugi problem jest łatwiejszy niż pierwszy, więc zaczniemy od drugiego problemu. Wynika bezpośrednio z definicji liczby rk(m), że suma
rk>(0) + rk(1) + … + rk(N) = Rk(N)
przedstawia liczbę systemów (x1,x2,…,xk ) z k nieuejmnymi liczbami całkowitymi dla których
(3) x1n+ x2n + … + xkn ≤ N
Każda grupa liczb dla których
0 ≤ xi (N/k)1/n (1 ≤ i ≤ k)
oczywiście spełniają ten warunek. Aby spełnić te nierówności, każde xi może ewidentnie być wybrany w więcej niż (N/k)1/n różnych sposobów (xi = 0,1,.., [(N/k)1/n]). Po dowolnym wyborze tego rodzaju, liczby x1,x2,… ,xk mogą być połączone, a więc mamy więcej niż (N/k)k/n różnych możliwości dla wybierania kompletnego systemu liczb całkowitych xi (1 ≤ i ≤ k) a więc spełnia warunek (3). To pokazuje ,że
(4) Rk(N) ≥ (N/k)k/n
Zakładamy ,że podstawowy lemat wykazano jako poprawny, i że nierówność (2) jest spełnione dla dowolnego N. Teraz musimy zweryfikować ,że nierówność (2) składa się z nierówności (4), które udowodniliśmy, tylko jeśli ciąg An(k) ma dodatnią gęstość. Idea poza poniższą dedukcję jest bardzo prosta : W sumie Rk(N), tylko te części sumy rk(m) są różne od zera, dla którego m występuje w An(k). Jeśli An(k) ma gęstość zero, wtedy dla dużego N liczba takich części sumy byłaby relatywnie mała, z powodu (2), jednak każda część sumy nie może być bardzo duża. Ich suma Rk(N) dlatego, będzie również relatywnie mała, podczas gdy z (4) musi być raczej duża. Pozostaje przejść do obliczeń. Załóżmy ,że d(An(k)) = 0. Wtedy dla dowolnie małego ε > 0 i odpowiedniego N
An(k)(N) < εN
Tu liczba N może być założona jako duża, ponieważ An(k) (dla dowolnego k) zawiera liczbę całkowitą l. Stosując szacowanie (2) uzyskujemy


a zatem, dla wystarczająco dużego N
Rk(N) < 2cεNk/n
Dla wystarczająco małego ε
2cε < (1/k)k/n
tak więc
Rk(N) < (N/k)k/n
co przeczy (4). Dlatego musimy mieć
d(An(k)) > 0
, ale jak już wiemy, to udowadnia twierdzenie Hilberta
Lematy dotyczące równań liniowych
Musimy znaleźć pewne szacunki dotyczące liczby rozwiązań układów równań liniowych.
Lemat 1.W równaniu
(5) a1z1 + a2z2 = m
Niech a1, a2 , m będą liczbami całkowitymi przy | a2| ≤ | a1| ≤ A, i niech a1 i a2 będą liczbami względnie pierwszymi. Wtedy liczba rozwiązań równania (5) spełniających nierówności |z1| ≤ A, |z2| ≤ A nie przekracza 3A/| a1|.
Dowód : Załóżmy ,że a1 > 0, bo w przeciwnym razie mamy do zastąpienia z1 przez - z1 w każdym rozwiązaniu. Niech { z1z2} i { z1′,z2′} będą dwoma różnymi rozwiązaniami równania (5). Wtedy z :
a1z1 + a2z2 = m
a1z1′ + a2z2′ = m
otrzymujemy
a2(z2′ - z2) = a1(z1 - z1′) przez odejmowanie, Lewą stronę tego równania musimy podzielić przez a1 .Ale (a1a2) = 1 i w konsekwencji z2′ - z2 musi być podzielne przez a1. Teraz z2′ ≠ z2 i dlatego | z2′ - z2|, ponieważ wielokrotność a1 , nie jest mniejsza niż a1. Zatem dla dwóch różnych rozwiązań {z1,z2} i { z1′ ,z2′} równania (5) musimy mieć | z2′ - z2| ≥ a1. W każdym rozwiązaniu { z1z2} równania (5), zgódźmy się na nazwanie z1 pierwszą składową a z2 drugą. Oczywiste jest ,że liczba rozwiązań równania (5) ,które spełniają warunki |z1| ≤ A, | z2| ≤ A, jest nie większa niż t drugich składowych, które występują w przedziale < -A, A >. Ponieważ udowodniliśmy ,że dwie takie drugie składowe są co najmniej w odstępie a1, różnica między największą a najmniejszą drugą składową występująca w przedziale < -A , A > to co najmniej a1(t-1). Z drugiej strony, ta różnica nie przekracza 2A, tal więc
a1(t-1) ≤ 2A
(t-1) ≤ 2A/ a1
t≤(2A/ a1) + 1 ≤ 3A/ a1
(ponieważ , z założenia, a1 &le A i dlatego 1 ≤ A/ a1. To dowodzi Lematu 1
Lemat 2
W równaniu
(6) a1z1 + a2z2 + … + alzl = m
Niech ai i m będą liczbami całkowitymi spełniającymi warunki:
|ai| ≤ A (1 ≤ i ≤ l), (a1,a2,…., al) = 1
Wtedy liczba rozwiązań równania (6) spełniających nierówności |zi| ≤ A (1 ≤ i ≤ l) nie przekracza
c(l)Al-1/H
gdzie H jest największą z liczb |a1|, | a2 |, …., | al | a c(l) jest stałą, zależną od l.
Dowód: Jeśli l = 2, Lemat 2 oczywiście staje się Lematem 1 (z c(2) = 3). Zgodnie z tym Lemat 2 został zweryfikowany dla l = 2. Będziemy zatem przyjmować ,że l ≥ 3 i ,że prawdziwość lematu 2 została ustanowiona dla przypadku l-1 niewiadomych. Ponieważ numerowanie nie jest ważne, możemy założyć ,że |al| jest największą z liczb |a1|, |a2|, … , |al| tj. H = | al| Mamy dwa przypadki do rozważenia
1.a1 = a2 = … = al-1 = 0. Ponieważ (a1,a2, … , al) = l , mamy | al| = H = 1, tak więc dane równanie jest postaci ±zl = m. W tym równanie każda z niewiadomych z1, z2, &helllip; zl-1 może być założona jako dowolna wartość całkowita w przedziale < -A, A >, a zatem najwyżej 2A +1 ≤ 3A wartości wszystkich. Jak dla zl, jednak, można założyć co najwyżej jedną wartość. W konsekwencji liczba rozwiązań danego równania spełniającego te nierówności | zi| ≤ A (1 ≤ i ≤ l) nie przekracza
(3A)l-1 = c(l)Al-1/H
Co udowadnia Lemat 2 dla tego przypadku
2.Jeśli co najmniej jedna z liczb a1, a2, … , al-1 jest różna od zera wtedy
(a1 a2, … al-1) = δ , istnieje. Oznaczmy przez H′ największą z liczb
| ai| / &deltal (1 ≤ i ≤ l-1)
Załóżmy teraz ,że liczby z1, z2, … zl spełniają dane równanie (6) i nierówności | zi| ≤ A (1 ≤ i &;le l) Ustawiamy
(7) (a1/δ) z1 + (a2/δ) z2 + … + (al-1/δ) zl-1 = m′
a zatem
a1 z1 + a2 z2 + … + al-1 zl-1 = δm′
Wtedy oczywiście
(8) δm′ + al zl = m
i


co implikuje ,że
|m′| ≤ lH′A
Zatem, jeśli liczby z1, z2, … zl spełniają równanie (6) i nierówność | zi| ≤ A (1 ≤ i ≤ l), wtedy liczba całkowita m′ istnieje, która , z tymi liczbami spełnia równania (7) i (8), gdzie |m′| ≤ lH′A. Ale w równaniu (8) wyraźnie δ ≤ |al| i (δ al) (w przeciwnym razie powinniśmy mieć (a1, a2, … al-1) > 1. Zatem w Lemacie 1, liczba rozwiązań równania (8) (z niewiadowymi m′, zl), dla których |m′| ≤ lH′A, | zl| ≤ A < lH′A, nie przekracza 3lH′A/|al|. Dla tego samego m′ , równanie (7), zgodnie z Lematem 2 dla równania z l-1 niewiadomymi, ma co najmniej c(l)Al-2/H&prime rozwiązań w liczbach całkowitych zi przy | zi| ≤ A. Ewientne jest ,że liczba rozwiązań { z1, z2,…, zl} równania (6), które spełniają nierówności | zi| ≤ A (1 ≤ i ≤ l) , nie przekracza
(3lH′A/|al|) c(l)Al-2/H′ = c(l)Al-1/| al| = c(l)Al-1/H, co kończy dowód Lematu 2.
Zbadamy teraz całkowitość równań w postaci:
(9) a1 z1 + a2 z2 + … + al zl = 0
gdzie | ai| ≤ A (1 ≤ i ≤ l) i, jak zawsze, wszystkie ai są liczbami całkowitymi. Niech B będzie liczbą dodatnią ,której związek z liczbą A jest opisany przez ich nierówności 1 ≤ A ≤ B ≤ c(l)Al-1 i niech l > 2 .Chcemy teraz oszacować sumę liczb rozwiązań zi, | zi| ≤ B (1 ≤ i ≤ l) wszystkich równań (9) z tej rodziny.
1. Najpierw oddzielnie zbadamy równanie (9) dla a1 = a2 = … = al = 0 (jest składową naszej rodziny) i oszacujmy liczbę jego rozwiązań które spełniają nierówności | zi| ≤ B (1 ≤ i ≤ l). Nasze równanie jest oczywiście spełnione przez dowolny układ liczb z1, z2, &hellip, zl i musimy wyliczyć ile takich układów istnieje , które spełniają nierówności | z1| ≤ B , | z2| ≤ B, … | zl| z≤ B. Ponieważ przedział < -B , B > zawiera co najmniej 2B+1 liczb całkowitych, każda zi może zakładać co najmniej 2B+1 różnych wartości. Konsekwentnie liczba układów { z1, z2,… zl}tego typu którym jesteśmy zainsteresowani nie przekracza (2B+1)l ≤ (3B)l = c(l)Bl. Z naszej hipotezy jednak. B ≤ c(l)Al-1, tak więc c(l)Bl = c(l)Bl-1B≤ c(l)(AB)l-1. Zatem, dla tego przypadku gdzie a1 = a2 = … al = 0, równanie (9) ma co najwyżej c(l)(AB)l-1 rozwiązań typu jaki nas interesuje
2o. Nawet jeśli tylko jeden z tych współczynników ai jest różny do zera, największy wspólny dzielnik tych współczynników (a1, a2, … al) = δ ,istnieje. Załóżmy najpierw ,że δ = 1 i niech H będzie największą z liczb | ai| (i = 1,2, … l). Wyraźnie H jest jedną z liczb całkowitych w przedziale ( < l , A >. Zatem , H jest albo między A i A/2, albo między A/2 a A/4, albo między A/4 a A/8 itd. Dlatego jest możliwe znalezienie liczby całkowitej m ⋛ 0 takiej, że
(10) A/2m+1 < H ≤ A/2m
Zgodnie z Lematem 2, dla równanie w postaci (9) w którym δ = 1 a H spełnia nierówności (10) , liczba rozwiązań zi, | zi| ≤ B, nie przekracza
c(l)Bl-1/H ≤ c(l)Bl-1/(A/2m+1) = c(l)Bl-12m/A
Z drugiej strony jednak wynika ,że
(11) | ai| ≤ A/2m (1 ≤ i ≤ l)
W konsekwencji liczba równań typu (9) dla których nierówności (10) są spełnione jest najwyżej równa liczbie równań tego samego typu, które spełniają warunek (11), tj. co najwyżej
(2(A/2m) + 1)l ≤ (3A/2m)l = c(l)Al2-ml
Zatem sula liczba rozwiązań | zi| ≤ B wszystkich takich równań typu (9) dla których δ = 1 i A2-(m+l) < H ≤ A2-m, nie przekracza
(c(l)Bl-12m/A) ⋅c(l)Al2-ml = c(l)(AB)l-12-(l-1)m
Podsumowują c to szacowanie, dla wszystkich m ≥ 0, dochodzimy do konkluzji : Suma liczb rozwiązań | zi| ≤ B wszystkich równań (9) dla których | ai| ≤ A (1 ≤ i ≤ l) i δ = 1 to co najwyżej
c(l)(AB)l-1
3o. Pozostaje nam znaleźć liczbę rozwiążań wymaganego typu dla równania przy δ > 1. W tym przypadku równanie (9) jest ewidentnie synonimem równania
(a1/δ) z1 + (a2/δ) z2 + … + (al/δ)zl = 0
gdzie tylko
(a1/δ , a2/&delta ,; … al/δ) = 1
A liczba A musi być zastąpiona liczbą Aδ Jak widziałeś w 2o , suma liczb rozwiązań | zi| ≤ B wszystkich takich równań, dla danego, stałego δ nie przekracza
c(l)(Aδ-1⋅B)l-1 = c(l)(AB)l-1δ-(l-1);
Wyraźnie teraz mamy sumą tego wyrażenia nad wszystkimi możliwymi wartościami δ (1 ≤ δ ≤ A).
Zatem znajdujemy ,że suma liczb wymaganych rozwiązań wszystkich równań w postaci (9), gdzie | ai| ≤ A (1 ≤ i ≤ l) i nie wszystkich ai są równe zeru, nie przekraczając wartości


Aby uzyskać pierwszą relację zastosujemy nierówność


który jest poprawny dla dowolnej liczby naturalnej q I dla dowolnego A ≥ 1 (oznaczamy przez q liczbę l-2, która jest dodatnia ,ponieważ zakładamy ,że l > 2). Tu mamy prosty dowód : Dla n ≥ 1 mamy


a zatem
(n+1)-(q+1) < q-1{n-q-(n+1)-q}
Podstawiając kolejno n = 1,2, …, A-1, w tej nierówności i dodając wszystkie nierówności wynikowe razem odkrywamy ,że


co implikuje ,że


co był do udowodnienia
Porównując to z wynikiem w 1o, gdzie uzyskaliśmy szacunki dla przypadku a1 = a2 = … = al = 0, dochodzimy do konkluzji:
Lemat 3.Niech l > 2 i l ≤ A ≤ B ≤ c(l)Al-1. Wtedy suma liczb rozwiązań |zi| ≤ B (1 ≤ i ≤ l) wszystkich równań w postaci
(9) a1z1 + a2z2 + … + alzl = 0
gdzie | ai| ≤ A (1 ≤ i ≤ l) ,nie przekracza
c(l)(AB)l-1
Dwa więcej lematy
Przed przejściem do dowodu fundamentalnego lematu, musimy zająć się dwoma lematami specjalnego typu. Oba są bardzo proste, zarówno w pomyśle jak i formie, a ich asymilacja może powodować trudności ponieważ są zainteresowane enumeracją wszystkich możliwych kombinacjach, których konstrukcja jets trochę zawiła. Trudność z takim abstrakcyjnym problemem kombinatorycznym jest taki ,że trudno przedstawić go w symbolach matematycznych : musimy wyrazić to wyrażanie bardziej w słowach niż w znakach. To jest oczywiście trudność prezentacji, jednak, a nie samego tematu.
Oznaczmy przez A skończony kompleks (tj. zbiór) liczb, nie wszystkie z nich są koniecznie różne. Jeśli liczba a występuje λ razy w kompleksie A, możemy powiedzieć ,że jego krotnością jest lambda. Niech a1, a2, … , ar będą różnymi liczbami ktore pojawiają się w A, i niech λ1, λ2, … , …r będą ich odpowiednimi krotnościami . Niech B będzie innym kompleksem tego samego typu, która zawiera różne liczby b1, b2, … , bs z odpowiednimi krotnościami μ1, μ2, … , μs. Zbadajmy równanie
(12) x + y = c
gdzie c jest daną liczbą a x i y są niewiadomymi. Zainteresujemy się takimi rozwiązaniami {x,y} tego równania w których x jest jedną z liczb kompleksu A (skrót x ∈ A) a y jest jedną z liczb z kompleksu B (Y ∈ B). Jeśli liczba x = a1 a y = b1 spełniają równanie (12), daje to λiμk rozwiązań wymaganego rodzaju, ponieważ niektóre z "próbek" λi liczby ai, które występują w kompleksie A, mogą być połączone z dowolną próbką μk liczby bk pojawiająca się w kompleksie B. Ale mamy λiμk ≤ 1 / 2 (λi2 + μk2. Dlatego liczba takich rozwiązań równania 12 , gdzie x= ai, y = bk nie jest większe niż 1 / 2(λi2 + μk2. Wynika z tego ,że liczba wszystkich rozwiązań x ∈ A , y ∈ B równania (12) nie jest większa niż suma Σ1 / 2(λi2 + μk2). Tu suma jest ponda wszystkimi parami wskaźników {i,k} dla których ai + b-k = c. Nasza suma jest powiększona jeśli sumujemy λi2 nad wszystkimi i i μk2 nad wszystkimi k (ponieważ każde bk może być połączone z co najwyżej jednym ai). W końcu wynika ,że liczba rozwiązań x ∈ A, y ∈ B równania (12) nie przekracza liczby


Z drugiej strony, rozważmy równanie
(13) x - y = 0
i obliczmy liczbę rozwiązań x ∈ A, y ∈ A. Każde takie rozwiązanie jest w postaci x = y = ai (1 ≤ u ≤ r). Dla danego i uzyskujemy λi2 rozwiązań, ponieważ liczby x i y mogą pokrywać, niezależnie jedna od drugiej, dowolną próbkę λi liczby ai pojawiającej się w A. Zgodnie z całkowita liczbą rozwiązań x ∈ A, y ∈ A równania (13) jest równa


W dokładnie ten sam sposób odkrywamy, oczywiście, że liczba rozwiązań x ∈ B , y ∈ B tego samego róznania jest równa


Jeśli porównamy te wyniki z powyższymi, dojdziemy do konkluzji:
Lemat 4 .Liczba rozwiązań równania
x + y = c, x ∈A, y ∈ B
nie przekracza połowy sumy liczb rozwiązań równań
x - y = 0, x ∈ A, y ∈ A
i
x - y = 0, x ∈ B, y ∈ B
Dla specjalnego przypadku w których kompleksy A i B pokrywają się uzyskujemy następujące
Następstwo. Liczba rozwiązań równania
x+y=c, x ∈ A, y ∈ A
nie przekracza liczby rozwiązań równania
x-y=0, x ∈ A, y ∈ A
Teraz niech k i s będą dowolnymi liczbami naturalnymi. Wstawiamy k⋅2s = l i zbadamy równanie
x1 + x2 + … + xl = c
Niech A1, A2, … ,Al będą skończonymi koleksami liczb. Załóżmy ,że kompleks Ai(1≤i≤l) składa się z różnych liczb ai1, ai2, … , z odpowiednimi krotnościami λi1, λi2, … . Interesuje na liczba rozwiązań równania
(14) x1 + x2 + … + xl = c , xi ∈ Ai (1 ≤ i ≤ l)
Jeśli ustawimy
x1 + x2 + … + xl/2 = x , x(l/2) + 1 + … + xl = y
(l/2 jest oczywiście liczbą całkowitą), wtedy dane równanie może być zapisane w postaci
x+y=c,
a Leat 4, który udowodniliśmy, może być do tego zastosowany. Musimy tylko odkryć , do których kompleksów liczby x i y należą. Ponieważ xi ∈ Ai (1 ≤ i ≤ l), x może być dowolną liczbą postaci z1 + z2 + … + zl/2 , gdzie zi ∈ Ai (1 ≤ i ≤ l/2)/. Podobnie y może być dowolną liczbą tej samej postaci, gdzie, jednak zi ∈ A(l/2)+i (1 ≤ i ≤ l/2). Zatem z Leamtu 4, liczba rozwiązań równania (14) nie przekracza połowy sumy liczba rozwiązań równania
(15) x - y = 0
w następujących dwóch hipotezach
1.x = z1 + z2 + … + Zl/2 ; y = z1′ + z2′ + … + zl/2
gdzie
(16) zi ∈ Ai, zi′ ∈ Ai (1 ≤ i ≤ l/2)
2.x i y mają tą samą postać, ale
(17) zi ∈ A(l/2)+i, zi′ A(l/2)+i <(1 ≤ i ≤ l/2)
W obu przypadkach równania (15) może być przepisane w postaci
(18) (z1 - z1′) + (z2 - z2′) + … + (zl/2 - zl/2′) = 0
Konkludujemy ,że liczba rozwiązań równania (14) nie przekracza połowy sumy liczb rozwiązań równania (18) pod kątem hipotez (16) i (17) tj. nie przekracza połowy sumy liczb rozwiązań równań


Równanie (18) ma l/2 składowych sumy po lewej stronie tj. połowę oryginalnego równania (14). Ustawiamy


sprowadzając w ten sposób równanie (18) do postaci
x+y = 0
Do tego możemy zastosować Lemat 4. Ewidentne jest ,że przechodzimy do równania (18) z równanie (14), uzyskując z równania (18) do równania


gdzie musimy rozważyć sumę liczb rozwiązań tego równania wedle następujących (teraz czterech) hipotez:


Ponieważ l = k ⋅2s, możemy powtarzać ten proces s razy. My oczywiście kończymy następującym równaniem


gdzie musimy rozpatrzyć sumę liczb rozwiązań tego równania pod 2s różnych hipotez:


wtedy równanie (20) przybiera prostszą postać
(21) y(1) + y(2)+ … +y(2s-1) - y(2s-1+1) - … - y(2s) = 0
Tu skoncentrujemy się na sumie liczb rozwiązań równania (21) przy 2s hipotez, które różnią się między sobą wartością parametru w (0 ≤ w ≤ 2s-1):
y(j) = y1(j) + y2(j) + … + yk(j)
gdzie
y1(j) ∈Awk+1, y2(j) ∈Awk+2, … yk(j) ∈A(w+1)k (j = 1,2, … 2s)
Zatem możemy wyrazić wynik końcowy nasze dedukcji w postaci :
Lemat 5 Jeśli l = k ⋅ 2s, liczba rozwiązań równania
(14) x1 + x2 + … xl = c , xi ∈ Ai (1 ≤ i ≤ l)
nie przekracza sumy liczb rozwiązań równania


przy hipotezie w = 0,1,2, … , 2s-1
Zwróć uwagę na połączenie między Lematem 4 i Lematem 5 dla k = s = 1, l = 2
Teraz jesteśmy gotowi zaatakować bezpośrednio lemat podstawowy
Dowód podstawowego lematu
Mamy zamiar udowodnić podstawowy lemat metodą indukcji na n. Często jest to przypadek dowodu indukcyjnego . W dowodach indukcyjnych, twierdzenie uznaje się za poprawne dla liczby n-1, i jest udowadniany dla liczby n. Zatem silniejsze twierdzenie , tym bardziej ,że daje nam przypadek n-1;oczywiście tym bardziej ma być udowodnione dla liczby n. Bezpośrednio nas interesuje liczba rozwiązań równania x1n + x2n + … + xkn = m (1 ≤ m ≤ N) (gdzie zgodnie z samym problemem, 0 ≤ xi ≤ m1/n ≤ N1/n. Ale xn jest najprostszym przypadkiem wielomianu n-tego stopnia
f(x) = a0 xn + a1xn-1 + … + an-1 x+ an
a będzie na naszą korzyść, aby zastąpić dane równanie (1) równaniem bardziej ogólnym równaniem
(22) f(x1) + f(x2) + … + f(xk)= m
gdzie niewiadome są podatne na słabsze warunki |xi| ≤ N1/n (1 ≤ i ≤ k). Dowód naszego twierdzenia dla równania (22) da nam więcej niż naprawdę potrzebujemy, ale jak zobaczymy, właśnie to umacnia nasze twierdzenie, które stwarza możliwości indukcji. A więc dla m ≤ N , oznaczmy prze rk(m) liczbę rozwiązań równania (22), które spełniają warunki |xi| ≤ N1/n (1 ≤ i ≤ k).
Niech współczynniki wielomianu f(x) spełniają nierówności
(23) |a1| ≤ c(n)Ni/n ( ≤ i ≤ n)
Wtedy ,dla odpowiednio wybranego k = k(n)
rk(m) < c(n)N(k/n-1)-1 (1 ≤ m ≤ N)
Ponieważ nierówności (23) są oczywiście spełnione przypadku f(x) = xn dla c(n) = 1, to twierdzenie rzeczywiście poprawia nasz lemat fundamentalny.
Rozważmy najpierw przypadek n = 1 , f(x) = a0x + a1. Ustawiamy k(1) = 2, tak więc równanie (22) wymaga postaci
a01 + x2) = m-2a1 . Jesteśmy zainteresowani rozwiązaniami tego równania ,które spełniają wymagania | x1| ≤ N. Zatem co najwyżej 2N + 1 ≤ 3N wartości jest możliwych dla x1. Ale co najwyżej jedno x2 odpowiada każdemu x1 , tak więc
r2(m) ≤ 3N
co kończy dowód naszego twierdzenia dla n = 1 (k = 2)
Teraz rozważmy n > 1 , i przypuśćmy ,że nasza założenia zostały zweryfikowane dla wykładnika n-1. Wstawiamy k(n-1) = k′ i wybieramy
k = k(n) = 2n⋅2[4 log2k′]
gdzie wykładnik oznacza największą liczbę całkowitą nie przekraczającą 4 log2k′ W dalszym ciągu ustawiamy [4log2k′] - 1 = s, dla skrócenia, tak więc
(24) k = 2n⋅2s+1
Dla oszacowanie liczby, rk(m), rozwiązań równania (22), najpierw zastosujemy Lemat 1 ustawiając


Kompleks A (i kompleks B , który pokrywa się z nim, w tym przypadku) składa się ze wszystkich sum postaci


Z następstwa Lematu 4, rk(m) nie przekracza liczby rozwiązań tego równania x-y = 0, gdzie x ∈ A, y ∈ A tj


Innymi słowy, rk(m) nie przekracza liczby rozwiązań tego równania


gdzie |x1| ≤ N1/n , |yi| ≤ N1/n (1 ≤ i ≤ k/2) .Teraz ustawiamy xi - yi = hi (1 ≤ i ≤ k/2) i zastępujemy układ niewiadowmych {xi, yi} układem{yi,hi}; tu możemy pozwolić yi I hi, założyć wszystkie możliwe wartości całkowite w przedziale < -2N1/n, + 2N1/n > , co może tylko zwiększać liczbę rozwiązań naszego równanie. Oznacza to ,że każda suma f(x1) - f(y1) w równaniu (25) jest zastępowane przez równanie


Jeśli zmienimy zmienną t sumy przez wstawienie
v+t = u
tak więc
n-v-t = n-u , t = u - v
uzyskujemy


jest wielomianem stopnia n-1 ze współczynnikami


który zależy od liczb hi. Zatem, w nowych zmiennych {yi, hi} równanie (25) zakłada postać
(26) h1Φ1(y1) + h2Φ2(y2) + … + h1/2kΦ1/2k(y1/2k) = 0
W tym równaniu liczby hi i yi mogą przybierać dowolne wartości całkowite w przedziale < -2N1/n, + 2N1/n >, gdzie musimy zapamiętać ,że współczynniki wielomianów Φi(y) (stopnia n-1) zależy od liczb h. Musimy udowodnić to: Liczba rk(m) które są szacowane, nie przekraczają sumy liczb rozwiązań w liczbach całkowitych yi , |yi| ≤ 2N1/n (1 ≤ i ≤ k/2), z wszystkich równań (26), które mogą być uzyskiwane ze wszystkich możliwych wartości liczb hi, |hi| ≤ 2N1/n (1 ≤ i ≤ k/2)
Kontynuacja
Teraz mamy zamiar zbadać jedno z równań (26) tj. będziemy traktować liczbę hi (1 ≤ i ≤ k/2) przez chwilę jako stałą. Zastosujmy Lemat 5 to tego równania; liczby hi Φi( yi) odgrywają rolę niewiadomych ii, liczba 1 / 2 k = 2n ⋅2s odgrywa rolę liczby l, i ustawiamy 2n = kO dla skrótu. Przypomnijmy raz jeszcze ,że liczby hi pojawiają się w rówaniu (26) nie tylko wyraźnie ale również przez współczynniki wielomiany Φi(y). Kompleks Ai do którego muszą należeć liczby xi = hi Φi( yi) składa się ze wszystkich liczb postaci hi Φi( yi), gdzie liczby hi mają daną, stałą wartość a liczby yi muszą przebiegać przez przedział < -2N1/n, + 2N1/n. Zgodnie z Lematem 5, liczba rozwiązań równania (26) spełniające wymagania, nie przekraczają sumy licz rozwiązań równania
(21) y(1) + y(2) + … + y(2s-1+1 - … y(2s) = 0
przy 2s hipotez, które odpowiadają wartościom parametru w = 0,1,… 2s-1:


gdzie, pamiętaj, Ar (1 ≤ r ≤ 2s jest kompleksem liczb postaci hrΦr(yr), z wcześniej opisanym hr i dowolnym yr |yr| ≤ 2N1/n. Dla przypadku w = 0 (jaki wybraliśmy jako przykład) równanie (21) w formie rozwiniętej wygląda tak:


każda z liczb yi(j) jest liczbą postaci hiΦi(vi(j)), gdzie |vi(j)| ≤ 2N1/n. Zatem ostanie równanie może być przepisane w postaci


Stawiając na zwięzłość


to równanie można zapisać krócej:
(27) h1z1 + h2z2+ … + hkOzkO = 0
Biorąc wszystko razem mamy 2s równań tego rodzaju, a ich całość może być zapisana w formie zwartej


Narazie zwrócimy się do zabadania równania (27), które może być rozpatrywane jako typowe. Dla oszacowania liczby rozwiązań tego równania które nas interesuje, musimy najpierw jak ilości Φi(vi(j)) mogą się różnić. Aby to zakończyć przypomnijmy ,że


Zatem wynika z naszych hipotez |av| < c(n)Nv/n I |hi| ≤ 2N1/n ,że


tj ze względu na u ≤ n
(28) |ai,u| < c(n)N(u-1)/n
Z drugiej strony, z powodu |vi(j)| ≤ 2N1/n, mamy |vi(j)|n-u ≤c(n) ⋅N(n-u)/n a w konsekwencji
|ai,u| ⋅ |vi(j)|n-u ≤ c(n)N(u-1)/nN(n-u)/n = c(n)N(n-1)/n
Takie samo oszacowanie (z innym c(n)) stosuje się do całego Φi(vi(j)), ponieważ liczba wyrazów tego wielomiany jest równa n. Zgodnie z tym
i(vi(j))| < c(n)N(n-1)/n (1 ≤ i ≤ kO , l ≤ j ≤ 2s)
Ale każde zi jest sumą 2s = c(n) składnków sumy w postaci ±Φi(vi(j)) i dlatego
|zi| < c(n)N(n1)/n (1 ≤ i ≤ kO
(z innym c(n) , naturalnie), Oznacza to ,że w równaniu (27) każde zi może zakładać tylko wartości leżące w przedziale < -c(n)N(n-1)/n, + c(n)N(n-1)/n > . Niech m^ będzie jedną z tych liczb. Równanie zi = m^ może być spełnione generalnie nie tylko na jednen ale na kilka sposobów, ponieważ definicja liczby zi jest taka ,że jedna i ta sama wartość zi może być dobrym wynikem z różnymi wyborami liczb vi(j) (1 ≤ j ≤ 2s. Teraz musimy oszacować liczbę rozwiązań relacji zi = m^, tj . równanie
(29) Φi(vi(1) + … + Φi(vi(2s-1) - Φi(vi(2s-1+1)) - … &Pho;i(vi(2s)) = m^
Do tego celu musimy w końcu zastosować indukcję.
Najpierw przepiszemy równanie (29) w postaci


Jest to możliwe ponieważ fla k′ = k(n-1) > 1 (a zobaczymy ,że już k(1) = 2) mamy
2s-1 = 2[4log2k′]-2 > k&pirme;
Jeśli oznaczymy prawą stronę ostatniego równania przez m′, otrzymamy
(30) Φi(vi(1)) + … + Φi(vi(k′)) = m′
Wybierzmy pewne określone wartości dla licz
vi(j) (k′ + 1 ≤ j ≤ 2s
(w przedziale < -2N1/n , +2N1/n, naturalnie); wtedy m′ również uzyskuje określoną wartość. Do równania (30)zastosujemy teraz twierdzenie do udowodnienia, ponieważ Φi(y) jest wielomianem stopnia n-1. Musimy zweryfikować, że wszystkie konieczne hipotezy są spełnione. Mamy


gdzie zgodnie z (28)
(31) |ai,u| < c(n)N u-1/n = c(n)(Nn-1/n)u-/n-1
i łatwo zauważyć
|m′| < c(n)Nn-1/n
(ponieważ m^ a wszystkie Φi(yi(j)) spełnia tą nierówność)
Na mocy ostatniego równania, rola N może być liczbą c(n)N(n-1)/n; wtedy warunki (31), które spełniają współczynniki wielomianu Φi(y), są dokładnie warunkami (23) z n zastąpionym przez n-1. Zatem wszystkie hipotezy są rzeczywiście spełnione, i możemy założyć ,że liczba rozwiązań równania (30), dla których |vi(j)| ≤ 2N1/n = 2(N(n-1)/n)1/(n-1), nie przekracza liczby
(32) c(n)(Nn-1/n)k′/n-1 - 1 = c(n)Nk′-n+1/n
To szacowanie jest uzyskiwane dla stałych wartośći vi(k′+1), … , vi2s)
Wyraźnie mamy co najwyżej
(33) (4N1/n + 1)2s-k′ = c(n)N2s -k′/n
takiego system wartości. Całkowita liczba rozwiązań wymaganego typu, równania (29), daltego nie przekracza iloczynu prawej strony (32) i (33) tj. jest to co najwyżej
(34) c(n)N2s-n+1/n
Teraz wróćmy do równania (27) .Widzieliśmy ,że każde zi może zakładać tylko wartości leżące w przedziale < -c(n)N(n-1)/n, +c9n)N(n-1)/n > Teraz widać ,że krotności każdej z tych wartości nie przekraczają liczby (34). Ten wynik umożliwia zredukowanie cały problem do oszacowania liczby rozwiązań równań liniowych. Zredukowaliśmy szacowanie rk(m) do oszacowanie liczby rozwiązań równań postaci (26). Ale ponieważ udowodniliśmy przez zastosowanie Lematu 5, liczbę rozwiązań równania (26) , dla którego |y1| ≤ 2N1/n, jest co najwyżej równa dymie liczby rozwiązań 2s równań typu (27) tj. już równań liniowych .W tym połączeniu uzyskujemy ograniczenie wewnątrz której niewaidome zi są różne. Pewne nową trudnością jest to ,że te nowe niewiadome zi muszą być rozpatrywane z pewnymi krotnościami. Na koniec nie możemy zapomnieć ,że wszystkie te obliczenia są tworzone przy założeniu ,że liczby hi są wybrane i stałe. Dlatego też ,jeszcze musimy pomnożyć uzyskany wynik przez liczbę wszystkich takich możliwych wyborów. Końcowy wynik tej sekcji , jaki musimy zapamiętać : Nasze oszacowanie liczby rk(m) nie przekracza sumy liczby rozwiązań w liczbach całkowitych zi , |zi| ≤ c(n)N(n-1)/n, z krotnościami λi c(n)N(2s-n+1)/n , równania w postaci


gdzie w przebiega wartości 0,1, …, 2s-1 a liczby hr (1 ≤ r ≤ 2skO), zakładają, niezależnie jedna od drugiej, wszystkie liczby całkowite w przedziale < -2N1/n, +2N1/n >
Konkluzja
Teraz , kiedy zredukowaliśmy problem top oszacowania liczby rozwiązań równań liniowych, które są niezalzeżneym specjalnymi formami wielomianu, szybko dotrzemy do celu przy pomocy Lematu 3. Oznaczmy przez K określoną kombinację liczb hi, |h,sub>i| ≤ 2N1/n (1 ≤ i ≤ k/2), i przez Uw(K) liczbę rozwiązań równania (35) dla tej stałej kombinacji K i dla pewnego wcześniej opisanego w, gdzie koncentrujemy się na tych rozwiązaniach zi, które spełniają nierówności |zi| ≤ c(n)N(n-1)/n, z krotnościami λi ≤ c(n)N(2s-n+1)/n/ Wtedy zgodnie z wynikiem końcowym w poprzedniej sekcji


gdzie składniki sumy nad K rozszerzają się nad wszystkie dopuszczalne kombinacje K z liczb hi. Można to zapisać


Jest to bezpośrednio ewidentne, jednak dla różnych w suma
\


nie różni się od innych. Możemy teraz zapisać


Tu UO(K) jest liczbą rozwiązań równania
(36) h1z1 + h2z2 + … + hkOzkO = 0
dla danej kombinacji K z liczb hi, |hi| ≤ 2N1/n (1 ≤ u ≤ k/2), gdzie |zi| ≤ c(n)N(n-1)/2 a zi ma krotności λi ≤ c(n) ⋅N(2s-n+1)/n. Oznaczmy przez UO*(K) liczbę rozwiązań tego samego równania przy założenie ,że wszystkie zi są proste. Wtedy
UO(K) ≤ {c(n)N2s-n+1/n}kOUO*(K)
lub przywołując ,że kO = 2n
UO(K) ≤ c(n)N2(2s-n+1)UO*(K)
a zatem
(37) rk(m) ≤ c(n)N2(2s-n+1)ΣKUO*(K)
Każde K przedstawia pewne dopuszczalne wartości wszystkich hi (1 ≤ i ≤ k/2); liczba UO*K, jednak , jest całkowicie określone przez wartości pierwszego kO = 2n z tych wartości (1 ≤ i ≤ 2n), poniewać one same pojawiają się w równaniu (36). Oczywiście kiedy wybieramy pewną stałą kombinację K, również jednoznacznie definiujemy pewną kombinację K&primel wartości h1 , h2, … , h2n. Ale jeśli, odwrotnie, pewna kombinacja K′ liczb h1, h2, …, h2n jest wybrana, wtedy odpowiada nie pojedynczej kombinacji K, ale raczej o ile istnieją sposoby doboru pozostałych "suplementów" hi (2n < i ≤ k/2). Ponieważ każde hi musi należeć do przedziału < -2N1/n, +2N1/n >, jest ewidentne ,ze kombinacja K′ odpowiada co najwyżej
c(n)(N1/n)k/n⋅2n
= c(n)N(k/2n)-2
kombinacji K. Zatem


gdzie UO*(K′) jest liczbą rozwiązań w liczbach całkowitych zi, |zi| ≤ c(n)⋅N(n-1)/n (1 ≤ I ≤ 2n) równania (36) dla danej kombinacji K′ z liczb hi, |hi| ≤ 2N1/n (1 ≤ i ≤ 2n) , a składnik sumy będzie rozszerzone na wszystkie takie kombinacje. Z (37) uzyskamy (38) rk(m) ≤ c(n)N2(2s-n+1)N(k/2n)-2 ΣK′UO*(K′) = c(n)N2(2s+1-nΣK′UO*(K′)
Na koniec, ΣK′ jest bezpośrednio szacowana za pomocą Lematu 3, gdzie musimy wstawićl = 2n, A = 2N1/n, B = c(n)N(n-1)/n, możemy łatwo zweryfikować ,że wszystkie te hipotezy Lematu 3 są spełnione. Przez zastosowanie tego lematu odkrywamy ,że


Na końcu, nierówność (38) daje


co kończy dowód podstawowego lematu jak również twierdzenie Hilberta.