En populärvetenskaplig introduktion till urvalsaxiomet och dess konsekvenser Hampus Altvall Eli Cramsky Alexander Davidson Tobias Magnusson Handledare: Petter Strandmark 17 maj 2012 Sammanfattning I denna artikel ges läsaren en introduktion till urvalsaxiomet och de underliggande matematiska koncept som krävs för att förstå vad urvalsaxiomet är. De händelser inom matematikforskningen som gav upphov till urvalsaxiomet och de axiomsystem det tillhör sammanfattas på lekmannanivå. Vidare bekrivs givetvis vilka matematiker som låg bakom det. Specifikt kommer klargöras den centrala roll som Ernst Zermelos och Abraham Fraenkels axiomatisering av mängdläran och Georg Cantors ursprungliga mängdlära har. Utöver detta läggs stor vikt på att förklara vilka synbara paradoxer urvalsaxiomet ger upphov till. Ett antal av dessa beskrivs i detalj med stringenta matematiska formuleringar. 1
Inledning Denna artikel ämnar att för matematikstudenten introducera urvalsaxiomet på ett lättbegripligt men likväl adekvat sätt. I avsnitt 1 ges en definition av urvalsaxiomet, i avsnitt 2 förklaras mängdlärans historia och urvalsaxiomets uppkomst, i avsnitt 3 kommenteras urvalsaxiomets användningsområden, i avsnitt 4 introduceras diverse begrepp inom mängdlära och algebra som krävs för att förstå senare avsnitt, i avsnitt 5 ges ett par exempel på ickeintuitiva följder av urvalsaxiomet, i avsnitt 6 introduceras begreppet mått och urvalsaxiomet används för att visa existensen av omätbara mängder och i avsnitt 7 ges en kort introduktion till Banach-Tarskis sats. Symboler för alla det finns tomma mängden delmängd union snitt tillhör logisk negation ℵ alef (kardinaltal) 2
1 Urvalsaxiomet Definition 1. Urvalsaxiomet kan formuleras på följande sätt. Låt Ψ vara en mängd av icke-tomma mängder Ψ = {ψ i } i I. Det gäller då att det finns en mängd U så att U = {f : Ψ i I ψ i f (ψ i ) ψ i } (1) med U > 0. Om f U så kallas f en urvalsfunktion för Ψ. Det är med andra ord alltid möjligt att ur elementen ψ 1, ψ 2, ψ 3,... (som i sin tur är mängder) av Ψ med hjälp av en urvalsfunktion välja exakt ett element och av dessa bilda en ny mängd Φ. Urvalsaxiomet låter oss härleda existensen av en mängd utan att explicit konstruera dess element. Walesaren Bertrand Russell (1872-1970) uttryckte det som följer. Betrakta en oändlig mängd med par av skor. Genom att exempelvis plocka ut vänsterskon ur varje par kan en ny mängd bildas. Betrakta nu i stället en oändlig mängd med par av strumpor. Det finns då ingen möjlighet att specificera en regel som explicit väljer ut ett element ur varje par eftersom strumporna är identiska. Urvalsaxiomet kungör dock att en mängd med ett element från varje par av strumpor existerar, utan att förtälja hur varje element är valt. 2 Historia Urvalsaxiomet i den form det används idag uppträdde först som en bevisteknik i det första beviset av välordningssatsen 1. Detta bevis utfördes av tysken Ernst Zermelo (1871-1953) och publicerades 1904 i hans artikel Beweis, dass jede Menge wohlgeordnet werden kann[1] och uppkom genom ett antal diskussioner med landsmannen Erhard Schmidt (1876-1959). Faktum är att Zermelo i denna artikel visade att det som senare skulle kallas urvalsaxiomet implicerar välordningssatsen (det går även att visa omvändningen och alltså är välordningssatsen faktiskt ekvivalent med urvalsaxiomet). Sannolikt betraktade Zermelo redan vid denna tid detta som något av ett axiom vilket framgår av formuleringen Dieses logische Prinzip lässt sich zwar nicht auf ein noch einfacheres zurückführen, wird aber in der mathematischen Deduktion überall unbedenklich angewendet. [1, s. 516] som kan översättas till Denna logiska princip kan med säkerhet inte reduceras till en enklare sådan, men används överallt inom matematisk slutledning utan vidare eftertanke. och mycket riktigt blev principen 1908 axiom VI i Zermelos axiomatisering av mängdläran[2], den första av sitt slag. Man kan ställa sig 1 Välordningssatsen kungör att det för varje mängd går att hitta en ordning så att alla dess icke-tomma delmängder har ett minsta element. 3
frågan varför en axiomatisering av mängdläran över huvud taget är nödvändig och denna fråga är definitivt en legitim sådan men för att kunna besvara den behöver först mängdlärans historia förklaras. 2.1 Den ursprungliga mängdläran Till skillnad från många andra matematiska principer uppstod inte den första mängdläran gradvis genom korrespondens mellan ett stort antal forskare utan kan spåras tillbaka till en enskild artikel 2 av den mycket inflytelserika och vid sin tid tämligen kontroversiella tyske matematikern Georg Cantor (1845-1918), publicerad 1874.[3] Ett argument för varför detta bör kallas mängdlärans ursprung är att det är det första matematiska verket som studerar mängder för sig själva och dessutom mängder med ett oändligt antal element (vilket inte tidigare gjorts på ett rigoröst sätt). I artikeln visade Cantor att mängden av alla reella algebraiska tal är uppräknelig 3 och att mängden av reella tal inte är det och därmed insågs att oändliga mängder verkade kunna ha olika storlekar trots att de är oändliga.[4] Cantors upptäckt var inte populär av alla inom matematikvärlden och landsmannen Leopold Kronecker (1823-1891) var starkt kritisk till hans resultat och motarbetade Cantor aktivt genom sitt redaktörskap på den tidsskrift (Journal für die reine und angewandte Mathematik) Cantor skickade sin artikel till och lyckades försena publiceringen av Cantors nästa artikel.[4] Denna artikel är dock oerhört viktig för mängdlärans och matematikens utveckling som helhet och innehåller den första definitionen av en bijektion mellan två mängder och Cantor använde även detta för att definiera vad det innebär att två mängder har samma kardinalitet (antal element).[5] Efter dessa två artiklar publicerade Cantor sex artiklar som vidare utvecklade hans idéer kring mängdläran mellan 1879 och 1884.[6] Denna gång i Mathematische Annalen för att undvika Kroneckers kritiska redaktörskap. I dessa artiklar utvecklade han de första så kallade transfinita talen i form av de transfinita ordinaltalen. Dessa tal användes först för att särskilja mellan olika oändliga mängder (och var alltså alla oändligt stora men ändå av olika storlek, därav begreppet transfinit) men i de senare av dessa sex artiklar utvecklade Cantor även en aritmetik för dessa tal och försvarade deras existens. Det är viktigt att poängtera att under hela denna tid är själva begreppet mängd mycket vagt. Cantor definierade begreppet mängd (tyska: menge) först 1895, men även då mycket vagt; Unter einer Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unsrer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen [7] vilket kan översättas till Med en mängd menar vi varje samling M av givna välurskiljbara objekt m från vå- 2 Detta beror dock på vad som skall kallas mängdlära, begreppet mängd definierades först senare. 3 En mängd A säges vara uppräkneligt oändlig om det finns en bijektion mellan N och A. 4
ra tankar eller vår uppfattning (vilka säges vara element i M). Denna artikel innehöll även den kända kontinuumhypotesen 4 vilken Cantor till sitt stora förtret inte kunde bevisa 5.[6] Kurt Gödel (1906-1978)[8] och Paul Cohen (1934-2007)[9, 10] visade dock senare att kontinuumhypotesen inte kan bevisas i Zermelo och Fraenkels mängdlära och därmed ej heller i Cantors mängdlära vilket förklarar de svårigheter Cantor hade med att finna ett bevis. Mot 1800-talets slut och 1900-talets början började ett antal paradoxer uppenbara sig inom Cantors mängdlära. 2.2 Paradoxer i Cantors mängdlära Cantor hittade 1899[11] en paradox i sin mängdlära gällandes kardinaliteten av mängden av alla mängder. Cantors paradox Informellt kan Cantors paradox beskrivas som följer. Betrakta mängden C av alla mängder. Givetvis gäller 6 2 C = C och alltså 2 C = C men enligt Cantors sats gäller att 2 C > C, en motsägelse. Cantors paradox publicerades dock först 1932.[12] Innan Cantor hade funnit sin paradox hade italienaren Cesare Burali-Forti (1861-1931) 1897[13] också hittat en paradox, gällande mängden av alla ordinaltal. Burali-Fortis paradox I Cantors mängdlära gäller följande för ordinaltalen: 1. Till varje välordnad mängd finns ett unikt ordinaltal. 2. Varje mängd av ordinaltal där varje element förutom det första har en föregångare är välordnad och har ett ordinaltal som är större än alla ordinaltal i mängden. 3. Mängden av alla ordinaltal X är välordnad. Av 3 och 1 följer att X har ett ordinaltal ω. Men ω X och alltså så måste ω < ω enligt 2, en motsägelse. Kanske mest signifikant i raden av alla paradoxer som uppkom var Russells paradox, uppkallad efter sin upptäckare Bertrand Russell och upptäckt 1901. 4 Kontinuumhypotesen kungör att det inte finns någon mängd S sådan att N = ℵ 0 < S < 2 ℵ 0 = R. 5 Cantors formulering var 2 ℵ 0 = ℵ 1 men detta kräver dock både urvalsaxiomet (vilket Cantor använde informellt) och en förståelse av kardinaltalen vilket vi inte förutsätter att läsaren har. Kort kan sägas att kardinaltalen betecknar antal element (kardinalitet) för oändliga mängder. 6 2 C betecknar potensmängden, mängden av alla delmängder till C. 5
Han beskriver den i ett brev till Gottlob Frege (1848-1925) 1902[14, s. 124-125] men den publiceras första gången 1903 i hans bok The Principles of Mathematics.[15] Russells paradox Denna paradox är enklare att förstå än de två föregående, ty den kräver inte någon förståelse för varken kardinaltal eller ordinaltal. Bilda A = {x x x}. Om A A så A A, men om A A så A A. Alltså gäller A A A A, en uppenbar motsägelse. Dessa tre paradoxer skakade fundamentet till Cantors mängdlära och någonting behövde göras för att undvika dessa. Russells lösning var att skapa ett typsystem vilket han introducerade i artikeln Mathematical logic as based on the theory of types[16], och den tidigare nämnda Ernst Zermelo utvecklade av denna anledning sin axiomatisering av mängdläran.[2] I denna artikel kommer Russells typsystem inte att förklaras; vi kommer i stället att ägna oss åt Zermelos axiomatisering, ty det är i denna urvalsaxiomet finns. 2.3 Zermelos, Fraenkel och Skolems axiomatisering av mängdläran Som tidigare nämnt publicerade Zermelo det första försöket till en axiomatisering av mängdläran 1908.[2] Detta axiomsystem innehöll sju axiom vilka enligt Zermelo tycktes vara oberoende. Zermelo lyckades dock inte att visa dess konsistens, någonting som senare skulle visa sig vara omöjligt enligt Gödels andra ofullständighetssats. Målet med axiomatiseringen var dock främst att beskriva mängdläran på ett sådant sätt att det inte längre går att härleda alla kända paradoxer och detta lyckades Zermelo åstadkomma. Axiomatiseringen var dock inte helt utan brister och det tredje axiomet, uppdelningsaxiomet, utnyttjar något som Zermelo kallar för definita frågor eller påståenden. Problemet är att begreppet definit är tämligen vagt och åberopar till exempel de universellt gällande lagarna för logik utan att vidare förklara vilka dessa är. Denna brist reparerades 1922 av norrmannen Thoralf Skolem (1887-1963)[14, s. 290-301] och israelen Abraham Fraenkel (1891-1965)[14, s. 284-289], men även av ungersk-amerikanen John von Neumann (1903-1957)[14, s. 393-414] och tysken Hermann Weyl (1885-1955)[18, 19] men då med en annan bas än Zermelos ursprungliga axiomatisering. Zermelos axiomatisering tillsammans med Fraenkels korrigering och urvalsaxiomet kallas ZFC och är sedan 1960-talet en standardmässigt använd axiomimatisering av mängdläran. Det fanns dock fortfarande ett antal obesvarade frågor gällande ZFC. Kanske absolut viktigast var frågan om axiomen verkligen var konsistenta. Vidare ger som tidigare nämnt urvalsaxiomet upphov till många ickeintuitiva resultat, detta fick många inom matematikvärlden att tvivla på om urvalsaxiomet verkligen var välmotiverat som axiom. 6
Genom Gödels ofullständighetssatser och Gödel och Cohens bevis för att urvalsaxiomet är logiskt oberoende blev dessa frågor besvarade, men kanske inte så som man hade tänkt sig. 2.4 Ofullständighetssatserna och urvalsaxiomets logiska oberoende År 1931 publiceras kanske 1900-talets viktigaste artikel inom matematisk logik, Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I, skriven av den tidigare nämnda Kurt Gödel.[17] Varför denna artikel är så viktig är därför att den innehåller Gödels ofullständighetssatser, vilka beskrivs på ett informellt sätt nedan. Gödels första ofullständighetssats Varje formellt system som är kraftfullt nog att representera aritmetik för de naturliga talen (som till exempel ZFC, Peanos axiomsystem eller Principia Mathematica) kan inte vara både konsistent och fullständig. Denna sats vilar på begreppen konsistenta och fullständiga formella system, det är långt utanför denna artikels omfång att ge en precis definition av dessa, men för att läsaren skall kunna få en översiktlig förståelse av satsen ges nedan en informell definition. Konsistens Ett formellt system säges vara konsistent om det inte innehåller några motsägelser. Fullständighet Ett formellt system säges vara fullständigt om för varje påstående φ i systemet finns ett bevis för antingen φ eller φ. Från den första ofullständighetssatsen kan också härledas den andra ofullständighetssatsen som ger ett direkt svar på frågan om axiomens konsistens i ZFC. Gödels andra ofullständighetssats Ett formellt system kraftfullt nog för att representera aritmetik för de naturliga talen kan bevisa sin egen konsistens om och endast om det är inkonsistent. Denna sats säger alltså att om man inom ZFC kan bevisa att ZFC är konsistent så är det inkonsistent, och om det är konsistent kan detta inte bevisas i ZFC. Om Zermelo och Fraenkel varit duktiga nog i konstruktionen av sin axiomatisering av mängdläran skulle de alltså aldrig kunna bevisa att det är konsistent vilket ger ett tämligen intressant svar på den fråga vi ställde tidigare. 7
Frågan om urvalsaxiomets motivering som axiom besvarades av Gödel[8] tillsammans med Cohen[9, 10] och beviset blev först klart 1964, 26 år efter det att Gödel bevisat den första delen. De visade att om ZF (Zermelo- Fraenkels axiomatisering utan urvalsaxiomet) är konsistent så är urvalsaxiomet logiskt oberoende i ZF, vilket betyder att varken urvalsaxiomet eller dess negation kan bevisas i ZF. Informellt kan bevisprocessen beskrivas som följer. Gödel: Om ZF är konsistent så är ZFC konsistent Gödel visade genom att skapa en så kallad inre modell som satisfierar ZFC att ZFC är konsistent förutsatt att ZF är det. Detta betyder att negationen till urvalsaxiomet C inte kan bevisas i ZF för då hade ju ZFC inte kunnat vara konsistent. Cohen: Om ZF är konsistent så är ZF C konsistent Cohen konstruerade genom en teknik som kallas forcing en mycket mer komplex modell som satisfierar ZF C (ZF med negationen till urvalsaxiomet som axiom) vilket visar att ZF C är konsistent förutsatt att ZF är det. Detta betyder på samma sätt som innan att urvalsaxiomet inte kan bevisas i ZF. Alltså är urvalsaxiomet logiskt oberoende (ibland kallat oavgörbart) i ZF. Efter detta ansågs inte urvalsaxiomet lika kontroversiellt längre, man kunde nu motivera dess existens som ett axiom. 3 Användning av urvalsaxiomet Urvalsaxiomet används framför allt som en bevisprincip och behövs exempelvis för att visa att varje vektorrum har en bas.[20, s. 48][21] Det går även att visa omvändningen. Urvalsaxiomet är alltså ekvivalent med detta påstående. Som tidigare nämnts gäller detta även för välordningssatsen, och det finns i själva verket många satser inom matematiken som är ekvivalenta med urvalsaxiomet. Senare i artikeln kommer att visas att urvalsaxiomet behövs för att konstruera en omätbar mängd, och kan även användas för att härleda ett stort antal icke-intuitiva resultat. Vi kommer strax att behandla några av dessa, men först krävs en förståelse av begreppet ekvivalensklass. Läsaren ges nedan möjligheten till en sådan förståelse. 4 Diverse definitioner Detta avsnitt behandlar inte urvalsaxiomet. Här redovisas i stället teori nödvändig för läsarens fortsatta förståelse av denna rapport. Inspiration har hämtats ur Lars-Christer Böiers bok Diskret Matematik, en bok väl lämpad för den vidare intresserade läsaren.[22, s.110 - s.131] 8
4.1 Några binära operationer på mängder Definition 2. Låt A och B vara mängder. Unionen av A och B, betecknad A B, är den mängd som innehåller de element som finns i antingen A eller B, eller i båda. Ett element x tillhör unionen av mängderna A och B om och endast om x tillhör A eller B. Det gäller alltså att A B = {x x A eller/och x B}. Exempel Unionen av mängderna {1,2,3} och {2,3,4} är mängden {1,2,3,4}, det vill säga {1,2,3} {2,3,4} = {1,2,3,4}. Definition 3. Låt A och B vara mängder. Snittet av A och B, betecknat A B, är den mängd som innehåller de element som finns i både A och B. Ett element x tillhör snittet av mängderna A och B om och endast om x tillhör A och x tillhör B. Det gäller alltså att A B = {x x A och x B}. Exempel Snittet av mängderna {1,2,3} och {2,3,4} är mängden {2,3}, det vill säga {1,2,3} {2,3,4} = {2,3}. Definition 4. Två mängder kallas disjunkta om deras snitt är den tomma mängden. Exempel Låt A = {1,3,5,7} och B = {2,4,6,8}. Eftersom A B = är A och B disjunkta. Begreppen union och snitt kan generaliseras till att gälla ett godtyckligt antal mängder. Definition 5. Unionen av en samling av mängder är den mängd som innehåller de element som tillhör åtminstone en av mängderna i samlingen. Vi använder notationen A 1 A 2 A n = n A i i=1 för att beteckna unionen av mängderna A 1, A 2,..., A n. Motsvarande notation gäller för snittet av ett godtyckligt antal element. 9
4.2 Cartesisk produkt Definition 6. Låt A och B vara mängder. Den cartesiska produkten av A och B, betecknad A B, utgörs av mängden av alla ordnade par (a, b), där a A och b B. Således, A B = {(a, b) a A och b B}. Då B = A skrives vanligen A 2. Definitionen utvidgas helt naturligt till ett godtyckligt antal mängder. Exempel. Om A = {1,2,3} och B = { 2,π} så är A B = {(1, 2),(1,π),(2, 2),(2,π),(3, 2),(3,π)}. Observera att produkterna A B och B A i regel är olika. Exempel. Läsaren är sedan tidigare bekant med R R, det vill säga R 2, och allmännare R n, den cartesiska produkten av n stycken R. 4.3 Relation Definition 7. Låt A och B vara mängder. En relation från A till B är en delmängd av A B. Då man tolkar en delmängd av A B som en relation, med a A och b B, skrives a b. Man säger att a är relaterat till b. I de fall då B = A pratar man om en binär relation på A. Exempel. Låt A = {2,3,4,5,6}. Definiera en relation på A genom x y x y (x delar y). Relationen utgörs då av följande element ur A A: (2,2), (2,4), (2,6), (3,3), (3,6), (4,4), (5,5). Vi skriver till exempel att 2 4 och 2 3. A. Vidare definierar vi följande begrepp för binära relationer på en mängd Definition 8. En relation på A är (a) reflexiv om a a, för alla a A, (b) symmetrisk om a b b a, och 10
(c) transitiv om a b och b c a c. Definition 9. En relation på en mängd A som är reflexiv, symmetrisk och transitiv utgör en ekvivalensrelation på A. Exempel. Låt A vara mängden Z av heltal, och n ett fixt positivt heltal. Relationen på Z definierad av är en ekvivalensrelation, ty är a b n a b reflexiv: n a a för alla a Z, symmetrisk: n a b n b a, transitiv: n a b och n b a n a b + b c n a c. Denna ekvivalensrelation kallas kongruens modulo n och skrives a b mod n. Två tal a och b är kongruenta modulo n exakt då a och b ger samma rest vid division med n. För n = 3 gäller exempelvis 6 9 mod 3 och 6 10 mod 3. 4.4 Ekvivalensklasser Låt A vara en mängd och A i, för i I, ett ändligt eller oändligt antal delmängder av A. Definition 10. Vi säger att {A i } i I utgör en partition av A om A = i I A i och A i A j =, då i j. I en partition är med andra ord mängderna A i parvis disjunkta, och täcker tillsammans hela A. Exempel Antag att A = {1,2,3,4,5,6}. Samlingen av mängder A 1 = {1,2,3}, A 2 = {4,5} och A 3 = {6} bildar tillsammans en partition av A, eftersom dessa mängder är disjunkta och deras union är A. Definition 11. För en ekvivalensrelation på en mängd A definieras ekvivalensklassen [x] tillhörande x A som mängden [x] = {y A y x}. 11
Klassen [x] utgörs av alla y A som är ekvivalenta med, det vill säga relaterade till, x. Exempel. Betrakta ekvivalensrelationen kongruens modulo n på Z, och låt n = 3. Klassen [0] utgörs av alla heltal kongruenta med 0 modulo 3, det vill säga alla heltal som vid division med 3 ger samma rest som 0 (det vill säga 0). Således är Analogt är [0] = {..., 3,0,3,...}. [1] = {..., 2,1,4,...}, [2] = {..., 1,2,5,...}. Fortsatt gäller att [3] = [0], [4] = [1], [5] = [2], och så vidare. Inga nya delmängder tillkommer, och eftersom [0], [1] och [2] är disjunkta bildar de tillsammans en partition av Z. 5 Icke-intuitiva resultat I detta avsnitt presenteras ett antal icke-intuitiva resultat som urvalsaxiomet ger upphov till. På grund av sin icke-intuitiva natur uppfattas ofta dessa resultat som paradoxala, men eftersom de formellt sett inte ger upphov till motsägelser kan de inte sägas vara paradoxer. 5.1 Fångar i hatt Ett uppräkneligt oändligt antal fångar har radats upp på ett led och iklätts varsin färgad hatt. Varje fånge ges chansen att gissa färgen på sin hatt en gång. Om en fånge gissar rätt friges hen omedelbart, annars skjuts hen på fläcken. Varje fånge kan se alla andra fångars hattar, men ej sin egen. Givna chansen att i förväg lägga upp en strategi, kan fångarna säkerställa att endast ett ändligt antal fångar skjuts? Lösning. Låt F vara mängden F = {f f : N Ω}, där Ω = {alla färger}. Definiera ekvivalensrelationen där n N. Låt sedan A vara mängden f g ω N. n ω. f (n) = g(n), (2) A = {[f ] f F}, 12
där [ f ] är ekvivalensklasserna definerade så att [f ] = {g g f }. Enligt urvalsaxiomet finns det en urvalsfunktion u : A F sådan att [f ] A. u([f ]) [f ]. Fångarna skapar i förväg gemensamt en mängd B, B = {u([f ]) [f ] A}. När fångarna sedan ställs i ett faktiskt led, givet av en funktion f i F, ser varje fånge att f g för någon funktion g = u([ f ]) i B. Varje fånge k gissar nu att hen har samma hattfärg som g(k). Men enligt (2) är f (k) = g(k) för alla k ω, varför alla fångar inklusive och efter k = ω kommer att överleva. Urvalsaxiomet kan även användas för att bestämma en funktions värde i en punkt, givet att övriga punkters funktionsvärden är kända. 5.2 Funktionsvärdesgissning 1. Leopold tänker på en godtycklig funktion f : R R. 2. Georg väljer ett x R. 3. Leopold ger Georg mängden G = {(x 0, f (x 0 )) x 0 x}. 4. Georg gissar värdet av f (x). Kan Georg gissa rätt med sannolikheten 1? Lösning. Låt F vara mängden F = {f f : R R}. Definiera sedan ekvivalensrelationen f g x 0 C. f (x 0 ) = g(x 0 ) (3) där C = {x i x i R,1 i N n, n ändligt}. Låt A vara mängden A = {[f ] f F}, där [ f ] är ekvivalensklasserna definierade sådana att [f ] = {g g f }. 13
Enligt urvalsaxiomet existerar en urvalsfunktion u : A F sådan att [f ] A. u([f ]) [f ]. Georg skapar mängden B = {u([f ]) [f ] A}. När Georg väljer sitt x gör han det med likformig sannolikhetsfördelning från ett godtyckligt valt intervall [a, b] R. När sedan Leopold ger Georg mängden G ser Georg att f g, för någon funktion g = u([f ]) i B. Om Georg nu gissar att f (x) = g(x) så kommer han att gissa rätt så länge x C i (3). Men sannolikheten att med likformig sannolikhetsfördelning välja ett tal från den ändliga mängden C av ett oändligt antal möjliga tal på [a, b] är noll. Georg gissar därför rätt med sannolikheten 1, oavsett vilket f Leopold väljer. 6 Mått och mätbarhet Inom måtteorin är Lebesgue-måttet[23], uppkallat efter den franske matematikern Henri Lebesgue (1875-1941), det standardiserade sättet att tilldela mått till delmängder av det Euklidiska rummet R n. För n = 1, 2 och 3 sammanfaller Lebesgue-måttet med vårt vanliga sätt att mäta längd, area respektive volym. I det allmänna fallet talar man om n-dimensionell volym, n-volym eller bara volym. Mängder som kan tilldelas Lebesgue-mått säges vara Lebesgue-mätbara, och måttet för en sådan mängd A skrives λ(a). I detta avsnitt kommer vi att begränsa oss till mätning av längd på den reella talaxeln R, och vi skall visa att man med hjälp av urvalsaxiomet kan konstruera en icke Lebesgue-mätbar, begränsad delmängd av denna. 6.1 Mått på intervall För att kunna bilda en icke Lebesgue-mätbar mängd behöver vi först redogöra för några av Lebesgue-måttets egenskaper för mätning av längd i R, vilka presenteras nedan. 1. λ(a) 0 för alla Lebesgue-mätbara mängder A. 2. En enhetslängd har längden 1. 3. Om U är en disjunkt union av ett uppräkneligt antal disjunkta, Lebesgue-mätbara mängder A n så är U själv Lebesguemätbar och λ(u) = λ( n A n ) = n i=1 λ(a i). 4. Om A är en Lebesgue-mätbar mängd och λ(a) = 0, en så kallad nollmängd, så är varje delmängd av A också en nollmängd. 14
5. Om A är en Lebesgue-mätbar mängd och x R så är translationen (parallellförflyttningen) av A med x defienerad av A + x = {a + x a A} även den Lebesgue-mätbar, med samma längd som A. Vidare är en delmängd B av R Lebesguemätbar om och endast om B + x är Lebesgue-mätbar. 6.2 Existensen av en icke-mätbar mängd Sats 1. Det existerar på intervallet ]0, 1[ en icke Lebesgue-mätbar delmängd av R.[24, s. 32] Bevis. Definiera relationen på R genom a b a b Q. Man verifierar lätt att är en ekvivalensrelation: den är reflexiv (a a för alla a), symmetrisk (a b medför att b a) och transitiv (a b och b c medför att a c). Observera att varje ekvivalensklass tillhörande för något a kan skrivas på formen Q+a, och är sålunda tät 7 i R. Eftersom dessa ekvivalensklasser är disjunkta, och eftersom varje dito skär intervallet ]0, 1[ kan vi med hjälp av urvalsaxiomet skapa en delmängd E ]0, 1[ innehållande exakt ett element ur varje ekvivalensklass. Vi skall nu visa att E är icke-mätbar. Låt {r n } vara en uppräkning av de rationella talen i intervallet ] 1,1[, och låt E n = E + r n för varje n. Vi skall kontrollera att (a) delmängderna E n är disjunkta, (b) n E n ligger i intervallet ] 1,2[, och (c) intervallet ]0,1[ ligger i n E n. För att bekräfta (a) antar vi att E m E n. Det finns då element e och e i E sådana att e + r m = e + r n, varur det följer att e e (omflyttning ger e e = r n r m, som ju är rationellt). Men då är ju e = e och n = m, vilket visar (a) eftersom det endast finns ett element från varje ekvivalensklass i E. Kriterium (b) uppfylles av att E ]0,1[ och att varje term i {r n } ligger i ] 1,1[. Betrakta nu (c). Låt b vara ett godtyckligt element i ]0,1[, och låt e vara det element i E som uppfyller b e. Då är b e rationellt och återfinns i intervallet ] 1,1[ (både b och e ligger ju i ]0,1[), och kan således skrivas som r n för något n. Därav följer att b E n, och (c) är visad. Antag att mängden E är Lebesgue-mätbar. Då är för varje n delmängden E n mätbar, varför egenskap (a) ovan medför att ( ) λ E n = λ(e n ). n n 7 En tät mängd är en delmängd A till ett topologiskt rum X sådan att det i varje omgivning till varje element x X finns ett element ur A. 15
Vidare följer av invarians vid translation att λ(e n ) = λ(e) för varje n. Sålunda gäller att om λ(e) = 0 så är λ( n E n ) = 0, vilket motsäger (c) ovan, medan om λ(e) 0 är λ( n E n ) = + (alla E n har ju samma längd, nämligen λ(e), och de är dessutom oändligt många), vilket i sin tur motsäger (b). Antagandet att E är Lebesgue-mätbar leder alltså till en motsägelse, och beviset är klart. Detta bevis är en modifierad variant av italienaren Giuseppe Vitalis (1875-1932) konstruktionbevis av denna sats[25], vilket var det första exemplet på en omätbar mängd. Mängden Vitali konstruerade i sitt bevis kallas Vitalimängden. 7 Banach-Tarskis sats Banach-Tarskis sats är en tämligen icke-intuitiv sats som bevisades av polackerna Stefan Banach (1892-1945) och Alfred Tarski (1901-1983) år 1924 i deras artikel Sur la décomposition des ensembles de points en parties respectivement congruentes.[26] Satsen kan formuleras som följer.[27] Sats 2 (Banach-Tarski). Om X och Y är begränsade delmängder av R 3 med icke-tomma inren så existerar ett tal n N och partitioner {X i 1 i n} och {Y i 1 i n} av X respektive Y sådana att X i är kongruent 8 med Y i för alla i. Låt nu X vara ett klot i rummet och Y vara unionen av två translaterade kopior av X. Då gäller enligt satsen att X kan delas upp i ett finit antal bitar och sedan roteras och translateras så att resultatet blir hela Y, det vill säga två kopior av X. Det bör poängteras att en uppdelning av detta slag är fysikaliskt omöjlig, ty bitarna är omätbara i den mening som definierades tidigare. Beviset lämnas åt läsaren som övning. (Tips: använd urvalsaxiomet.) 8 Geometrisk kongruens; två delmängder av R 3 är kongruenta om den ena efter ett ändligt antal rotationer och translationer kan överföras på den andra. 16
Referenser [1] E. Zermelo: Beweis, dass jede Menge wohlgeordnet werden kann. Mathematische Annalen 59, s. 514-516, 1904, http://resolver.sub.unigoettingen.de/purl?gdzppn002260018 [2] E. Zermelo: Untersuchungen über die Grundlagen der Mengenlehre. I. Mathematische Annalen 65, s. 261-281, 1908, http://resolver.sub.unigoettingen.de/purl?gdzppn002262002 [3] G. Cantor: Über eine Eigenschaft des Inbegriffs aller reellen algebraischen Zahlen. Journal für die reine und angewandte Mathematik 77, s. 258-262, 1874, http://www.cs.elte.hu/ badam/matbsc/11o/cantor1874.pdf [4] P.E. Johnson: The Genesis and Development of Set Theory. The Two-Year College Mathematics Journal 3, s. 55-62, 1972 [5] G. Cantor: Ein Beitrag zur Mannigfaltigkeitslehre. Journal für die reine und angewandte Mathematik 84 s.242-258, 1878 [6] T. Gowers, J. Barrow-Green, I. Leader: Princeton Companion to Mathematics, Princeton University Press, s.778-780, 2008, ISBN: 9781400830398 [7] G. Cantor: Beiträge zur Begründung der transfiniten Mengenlehre. I. Mathematische Annalen 46, s.481-512, 1895 [8] K. Gödel: The Consistency of the Axiom of Choice and of the Generalized Continuum-Hypothesis. Proceedings of the National Academy of Sciences of the USA 24, s.556-557, 1938, http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez& artid=1077160 [9] P. Cohen: The Independence of the Continuum Hypothesis I. Proceedings of the National Academy of Sciences of the USA 50, s. 1143-1148, 1963, http://www.ncbi.nlm.nih.gov/pmc/articles/pmc221287/pdf/pnas00240-0135.pdf [10] P. Cohen: The Independence of the Continuum Hypothesis II. Proceedings of the National Academy of Sciences of the USA 51, s. 105-110, 1964, http://www.ncbi.nlm.nih.gov/pmc/articles/pmc300611/pdf/pnas00175-0117.pdf [11] H. Curry: Foundations of Mathematical Logic. Courier Dover Publications, s. 5, 1963 17
[12] G. Cantor, red. E. Zermelo: Gesammelte Abhandlungen mathematischen und philosophischen inhalts, Berlin: J. Springer, 1932 [13] C. Burali-Forti: Una questione sui numeri transfiniti. Rendiconti del Circolo Matematico di Palermo 11, s. 154-164, 1897 [14] J. van Heijenoort: From Frege to Gödel: A Source Book in Mathematical Logic 1879-1931, Harvard University Press, 1967 [15] B. Russell: The Principles of Mathematics, W. W. Norton & Company, Inc, 1903 [16] B. Russell: Mathematical logic as based on the theory of types American Journal of Mathematics 30, s.222-262, 1908, http://www.jstor.org/stable/pdfplus/2369948.pdf [17] K. Gödel: Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I. Monatshefte für Mathematik und Physik 38, s. 173-198, 1931 [18] H. Weyl: Über die Definition der mathematischen Grundbegriffe Mathematisch-naturwissenschaftliche Blätter 7, s. 93-95, 1910 [19] H. Weyl: Das Kontinuum. Kritische Untersuchungen über die Grundlagen der Analysis, Leipzig: Veit, 1918 [20] S. Roman: Advanced Linear Algebra, Graduate Texts in Mathematics 135, New York: Springer-Verlag, Upplaga 3, 2005, ISBN: 978-0-387-24766-3 [21] A. Blass: Existence of bases implies the axiom of choice. Contemporary Mathematics 31, s. 31-33, 1984 [22] L.C. Böiers: Diskret Matematik, Studentlitteratur, Upplaga 2:6, 2003 [23] http://en.wikipedia.org/wiki/lebesgue_measure, 2012-04-25 [24] D. Cohn: Measure Theory, Stuttgart: Birkhäuser, 1980, ISBN: 3-7643- 3003-1 [25] G. Vitali: Sul problema della misura dei gruppi di punti di una retta, Bologna: Tipografia Gamberini e Parmeggiani, 1905 [26] S. Banach, A. Tarski: Sur la décomposition des ensembles de points en parties respectivement congruentes. Fundamenta Mathematicae 6, s. 244-277 [27] K. Stromberg: The Banach-Tarski Paradox. The American Mathematical Monthly 86, s. 151-161, 1979 18