Statistisk Fysik. Jens Fjelstad, Marcus Berg. 3 november 2011

Relevanta dokument
Statistisk Fysik. Jens Fjelstad. 23 oktober 2007

Statistisk Termodynamik

Statistisk Fysik Avancerat kompendium

4 rörelsemängd. en modell för gaser. Innehåll

Kap 4 energianalys av slutna system

Kinetisk Gasteori. Daniel Johansson January 17, 2016

Idealgasens begränsningar märks bäst vid högt tryck då molekyler växelverkar mera eller går över i vätskeform.

Termodynamik och inledande statistisk fysik

Exempel på statistisk fysik Svagt växelverkande partiklar

David Wessman, Lund, 29 oktober 2014 Statistisk Termodynamik - Kapitel 3. Sammanfattning av Gunnar Ohléns bok Statistisk Termodynamik.

Studieanvisningar i statistisk fysik (SI1161) för F3

Grundläggande matematisk statistik

TMS136. Föreläsning 4

4 Diskret stokastisk variabel

SF1901: Sannolikhetslära och statistik

Tentamen i Termodynamik och Statistisk fysik för F3(FTF140)

SF1901: Sannolikhetslära och statistik

@

Andra föreläsningen kapitel 7. Patrik Lundström

Tentamen i FTF140 Termodynamik och statistisk mekanik för F3

SF1901 Sannolikhetsteori och statistik I

Föreläsning 12: Ideal gas i klassiska gränsen med inre frihetsgrader, ekvipartitionsprincipen

TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer

Termodynamik Föreläsning 4

Grundläggande matematisk statistik

SF1911: Statistik för bioteknik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Kapitel IV. Partikeltalet som termodynamisk variabel & faser

Lektionsanteckningar 11-12: Normalfördelningen

4-1 Hur lyder Schrödingerekvationen för en partikel som rör sig i det tredimensionella

Statistisk Termodynamik Kompendium

Kapitel II. Termodynamikens statistiska bas

Repetition F4. Lunds universitet / Naturvetenskapliga fakulteten / Kemiska institutionen / KEMA00

Lösningar till tentamen i Kemisk termodynamik

Bose-Einsteinkondensation. Lars Gislén, Malin Sjödahl, Patrik Sahlin

F3 Introduktion Stickprov

Lösningar till tentamen i Kemisk termodynamik

Entropi. Det är omöjligt att överföra värme från ett "kallare" till ett "varmare" system utan att samtidigt utföra arbete.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Instuderingsfrågor, Griffiths kapitel 4 7

Två system, bägge enskilt i termisk jämvikt med en tredje, är i jämvikt sinsemellan

Föreläsning 4: Konfidensintervall (forts.)

Tentamen i Termodynamik och Statistisk fysik för F3(FTF140)

SF1901 Sannolikhetsteori och statistik I

Tentamen i FTF140 Termodynamik och statistisk mekanik för F3

Introduktion till statistik för statsvetare

Övning 1 Sannolikhetsteorins grunder

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Fysikaliska modeller

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Termodynamik Av grekiska θηρµǫ = värme och δυναµiς = kraft

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

1-1 Hur lyder den tidsberoende Schrödingerekvationen för en partikel som rör sig längs x-axeln? Definiera ingående storheter!

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

9. Konfidensintervall vid normalfördelning

Laboration 3. Ergodicitet, symplektiska scheman och Monte Carlo-integration

Experimentella metoder, FK3001. Datorövning: Finn ett samband

Hjälpmedel: Det för kursen ociella formelbladet samt TeFyMa. 0 x < 0

= 0. Båda skärningsvinklarna är således π/2 (ortogonala riktningsvektorer).

Övning 1(a) Vad du ska kunna efter denna övning. Problem, nivå A. Redogöra för begreppen diskret och kontinuerlig stokastisk variabel.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Mekanik Föreläsning 8

18. Fasjämvikt Tvåfasjämvikt T 1 = T 2, P 1 = P 2. (1)

10. Kinetisk gasteori

Gamla tentafrågor, FYS022:2, Statistisk Fysik, rörande statistisk fysik och statistisk kvantfysik. P i = 1 Z exp( βe i), Z = i.

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Mekanik FK2002m. Kinetisk energi och arbete

F9 SAMPLINGFÖRDELNINGAR (NCT

Vektorgeometri för gymnasister

Repetion. Jonas Björnsson. 1. Lyft ut den/de intressanta kopp/kropparna från den verkliga världen

Föreläsning 8 för TNIU23 Integraler och statistik

Stokastiska signaler. Mediesignaler

SF1626 Flervariabelanalys Lösningsförslag till tentamen DEL A

Repetition F8. Lunds universitet / Naturvetenskapliga fakulteten / Kemiska institutionen / KEMA00

Termodynamik Föreläsning 7 Entropi

1 Mätdata och statistik

Räkneövning 5 hösten 2014

Lösningsförslag envariabelanalys

Kvantmekanik II (FK5012), 7,5 hp

Temperatur T 1K (Kelvin)

9. Magnetisk energi Magnetisk energi för en isolerad krets

Tentamen i Kemisk Termodynamik kl 14-19

NFYA02: Svar och lösningar till tentamen Del A Till dessa uppgifter behöver endast svar anges.

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Karta över Jorden - viktigt exempel. Sfär i (x, y, z) koordinater Funktionen som beskriver detta ser ut till att vara

= v! p + r! p = r! p, ty v och p är dt parallella. Definiera som en ny storhet: Rörelsemängdsmoment: H O

Statistik 1 för biologer, logopeder och psykologer

ANDREAS REJBRAND Elektromagnetism Coulombs lag och Maxwells första ekvation

Betingning och LOTS/LOTV

Andra EP-laborationen

Dubbelintegraler och volymberäkning

SF1901: Sannolikhetslära och statistik

university-logo Mekanik Repetition CBGA02, FYGA03, FYGA07 Jens Fjelstad 1 / 11

SF1901 Sannolikhetsteori och statistik I

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A. e 50k = k = ln 1 2. k = ln = ln 2

Tentamen i tmv036c och tmv035c, Analys och linjär algebra C för K, Kf och Bt A =, = det(a λi) = e 2t + c 2. x(t) = c 1. = c 1.

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Föreläsning 12: Regression

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

FAFA Föreläsning 7, läsvecka 3 13 november 2017

Transkript:

Statistisk Fysik Jens Fjelstad, Marcus Berg 3 november 2011 Dessa anteckningar är ämnade att användas som kurslitteratur för kursdelen statistisk fysik i kursen Termodynamik och statistisk fysik (FYGB02) på Karlstads Universitet höstterminen 11. De här anteckningarna är tillräckliga för att göra tentan. För fördjupning rekommenderar vi att ni går till http://stp.clarku.edu/notes/ och laddar ned gratisboken Statistical and Thermal Physics av Gould & Tobochnik. Innehåll 1 Introduktion: kinetisk gasteori för ideal gas 2 1.1 Inledning..................................... 2 1.2 Kinetisk teori för klassisk ideal gas...................... 2 1.3 Fördelningsfunktioner, sannolikhet och statistik.............. 7 1.3.1 Regler för sannolikhet......................... 9 1.3.2 Bernoulliprocesser och binomialfördelningen............ 11 1.4 Hastighetsfördelningsfunktionen för en ideal gas.............. 18 1.5 Mikroskopiska argument: två första försök................. 21 2 System med många frihetsgrader: Ensembler 25 2.1 Från termodynamik till statistisk fysik.................... 25 2.2 Mikrokanonisk ensemble............................ 28 2.3 Kanonisk ensemble............................... 37 2.4 Stor kanonisk ensemble............................ 48 3 Tillämpningar på system av fria partiklar 52 3.1 Klassiska partikelsystem............................ 52 3.2 Einsteinmodellen................................ 56 3.3 Oskiljbara partiklar, Bosoner och Fermioner................. 57 3.4 Ideala kvantgaser................................ 63 A Matematiskt appendix 71 A.1 Gaussisk integral................................ 71 A.2 Stirlings approximation............................ 71 1

1 Introduktion: kinetisk gasteori för ideal gas 1.1 Inledning Statistisk fysik handlar om system med makroskopisk mängd materia, som en mol gas, it motsats till mikroskopiska mängder, som en enskild gasmolekyl. Termodynamik som ni studerat den hittills handlar också om makroskopiska mängder materia. Skillnaden är att vi i statistisk fysik utgår från de mikroskopiska beskrivningen, själva gasmolekylerna och deras egenskaper, för att beskriva makroskopiska egenskaper som tryck, temperatur och så vidare. Makroskopiska system har typiskt av storleksordningen 10 23 mikroskopiska frihetsgrader (antalet partiklar i en mol), och en exakt beskrivning av alla dessa partiklar skulle vara hopplöst komplicerad även för dagens superdatorer. En av poängerna med statistisk fysik är att en sådan beskrivning också i många avseenden skulle vara onödigt komplicerad. Istället används metoder från matematisk statistisk. Vi använder vår oförmåga att urskilja detaljerna i ett makroskopiskt system till att ersätta detaljerad information om systemets exakta konfiguration med en sannolikhetsfördelning. Liksom i termodynamik pratar vi om statistisk fysik för system i jämvikt, och för system ur jämvikt. I den här texten behandlas endast system i jämvikt. Det finns även olika angreppspunkter för en mikroskopisk behandling, med olika fördelar och nackdelar. En metod som tar hänsyn till många mikroskopiska detaljer, och är kapabel att även beskriva system ur jämvikt, är s.k. kinetisk teori. Vi studerar i nästa avsnitt den enklaste versionen av kinetisk teori, den för en klassisk ideal gas. Avsikten är delvis att visa hur man med relativt enkla argument delvis kan härleda egenskaperna hos en ideal gas, men också att introducera begrepp och metoder som används i statistisk fysik. Vi fortsätter sedan med att diskutera sannolikhet och statistik något mer detaljerat. Därefter behandlas grunderna till den statistiska fysiken, vi försöker t.ex. motivera varför de egenskaper vi kan beräkna verkligen motsvarar de egenskaper vi använder oss av i klassisk termodynamik. Slutligen använder vi oss av de metoder vi lärt oss för att beskriva termodynamiken hos några enkla system. Mer specifikt behandlas klassisk och kvantmekanisk ideal gas, svartkroppsstrålning, samt värmekapaciteten hos fasta ämnen. 1.2 Kinetisk teori för klassisk ideal gas I kinetisk teori är vi främst intresserade av mångpartikelsystem där individuella partiklar kan röra sig relativt fritt, typiskt gaser, och vi antar därför i resten av avsnittet att vi studerar en gas med ett stort antal molekyler. Grundantagandet i kinetisk teori är att all växelverkan sker mellan två molekyler åt gången, dvs vi bortser från simultana kollisioner mellan fler än två molekyler. Det enklaste specialfallet är förstås om vi som första approximation antar att molekylerna överhuvudtaget inte kolliderar med varandra. 2

En ideal gas i klassisk termodynamik är en gas som uppfyller tillståndsekvationen PV = NkT (dvs allmänna gaslagen, eller Boyles lag). Konstanten k kallas Boltzmanns konstant (i SIenheter: k = 1,38 10 23 J/K), och N är antalet molekyler i gasen. Vi jämför detta med PV = nrt som är en alternativ formuleringar av gaslagen, där R är gasens gaskonstant (i J/(K mol)) som kan skrivas R = N A k. Antalet partiklar är N = nn A, N A är Avogadros tal och n är antalet mol: R = N A k = ( 6.0 10 23 partiklar/mol ) (1.4 10 23 J/K ) 8.3 J/(K mol) (1.1) Man kan i stora drag säga att vi i statistisk fysik betraktar väldigt små effekter (k) för väldigt många partiklar (N A ) och i slutändan får något som är vardags-storlek (R). Denna tillståndsekvation beskriver en gas där De enskilda molekylerna (el. atomerna) är punktformiga partiklar, dvs de tar själva inte upp någon volym. Molekylerna i gasen kolliderar inte med varandra, de är s.k. fria partiklar (potentiella energin är noll). Deras enda växelverkan är elastiska, ögonblickliga kollisioner med systemets gränsyta, inte med varandra. Molekylernas rörelse beskrivs klassisk mekanik, utan hänsyn till kvantfysiska eller relativistiska effekter. Vi skall nu se hur man utifrån dessa grundläggande antaganden (nästan) kan härleda allmänna gaslagen. Betrakta därför en gas med N molekyler i volym V V För att vara konkreta tar vi en mol gas (runt 25 liter vid atmosfärstryck och rumstemperatur). Då är antalet partiklar N N A (Avogadros tal) = antalet partiklar i 1 mol 6 10 23. 3

Vi vet ingenting om hur varje enskild molekyl rör sig i gasen, speciellt känner vi inte hastigheten v hos en enskild molekyl, men antag för ögonblicket att medelvärdet av alla molekylers hastigheter känt, och beteckna detta v (Ibland betecknas detta v.) Vi antar vidare att systemet som sådant inte rör sig, och att molekylerna inte påverkas av några yttre krafter som gravitationskraften eller elektriska eller magnetiska krafter (dvs. vi antar att systemet är enkelt kompressibelt). Då kan vi använda symmetriargument för att säga något om vad partiklarna i medeltal har för hastigheter. De två följande argumenten kommer vi sedan att härleda mer direkt. Med dessa antaganden finns ingenting i systemet som säger att en riktning i rummet är mer speciell än någon annan (alla riktningar ekvivalenta). Eftersom N är stort ger symmetri v = v x = v y = v z = 0. (1.2) Uttryckt annorlunda: då N är väldigt stort är det rimligt att anta att för varje molekyl som har hastighet v så finns en annan molekyl som har hastighet v. Däremot gäller v 2 0 ( notera v 2 v 2 ). Eftersom alla riktningar är ekvivalenta är ger symmetri att v 2 x = v2 y = v2 z, dvs v 2 = v 2 x + v2 y + v2 z = 3v2 x. (1.3) Som sagt, vi kommer att kunna härleda de här utsagorna mer direkt längre fram. Inre energin i en ideal gas Den inre energin i en gas ges av summan av alla individuella molekylers energier, och i en ideal gas är detta bara summan av alla molekylers rörelseenergi. En molekyl med hastigheten v har kinetisk energi E k = 1 2 mv2, och medelvärdet av denna är därför E k = 1 2 mv2 Summerar vi ihop all kinetisk energi i gasen får vi alltså den inre energin: och speciellt drar vi slutsatsen Trycket i en ideal gas U = NE k = N 1 2 mv2, (1.4) vx 2 = 1 3 v2 = 2 U 3 mn. (1.5) Trycket uppstår då molekylerna kolliderar med väggarna. Vi betraktar en molekyl som studsar mot en vägg placerad någonstans längs x-axeln, sådan att väggen är parallell med (y z)-planet. Innan kollisionen har molekylen hastighetenv 1 = v x i+v y j+v z k, och 4

v z v 2 v y v x v 1 eftersom kollisionen är elastisk blir hastigheten efter kollisionen v 2 = v x i + v y j + v z k. Molekylen får impulsen p 2 p 1 = 2mv x i under kollisionen, och väggen får därmed impulsen p = 2mv x i. För att beräkna trycket (dvs kraften per areaenhet) som gasen utverkar på väggen måste vi veta hur många kollisioner som sker per tidsenhet. Antag v y = v z = 0 och att alla molekyler har farten v x. Antalet molekyler som träffar en area A under tiden dt ges av hälften (ty hälften rör sig bort från väggen) av alla molekyler som befinner sig inuti en tänkt cylinder med basyta A och längd v x dt. v x A v x dt Eftersom N/V är partikeltätheten i gasen har vi att antalet molekyler som träffar tvärsnittsarean A under tiden dt är 1 2 Av xdt N V (1.6) 5

Vad händer om v y, v z godtyckliga? Så länge N är stort är det rimligt att anta att för varje molekyl inuti den tänkta cylindern som rör sig ut ur cylindern innan den träffar tvärsnittsarean, finns en molekyl utanför cylindern som träffar arean. v v Antalet är alltså oförändrat (1.6). Den totala impulsen som väggen får under tiden dt ges av varje impulsen för varje kollision multiplicerat med antalet kollisioner under tiden dt, dvs dp x = 2mv x 1 2 Av xdt N V. (1.7) Impulslagen i Newtonsk mekanik, dp dt = F, relaterar kraften till tidsderivatan av rörelsemängden, dvs impulsen som överförs per tidsenhet. Om vi förkortar med dt i (1.7) och använder impulslagen ger detta F x = dp x dt = N V mav2 x (1.8) Nu vill vi ta hänsyn till att vi har olika möjliga värden på v x, och eftersom vi inte kan känna till varje enskild molekyls hastighet så är det enda vi kan göra att medelvärdesbilda. Trycket på denna vägg blir därmed P = F x A = N V mv2 x. (1.9) Med hjälp av (1.5) v 2 x = 2 3 U mn kan vi skriva om detta som PV = 2 3 U (1.10) vilket är en tillståndsekvation för vår ideala gas. För att få ideala gaslagen P V = N kt från detta skulle vi behöva visa att U = 3 NkT (1.11) 2 6

det vill säga att medelvärdet av molekylernas kinetiska energi är helt bestämt av temperaturen E k = 3 kt. (1.12) 2 Ekvation 1.12 kommer vi att bevisa senare, men låt oss först fundera över vad den betyder. Vi ser att temperaturen T är ett mått på den genomsnittliga rörelseenergin hos molekylerna. Det är alltså den fysikaliska tolkningen av temperatur på molekylnivå. Notera också att temperaturen bara anger just medelvärdet, med andra ord kan vi med det här synsättet inte definiera någon temperatur alls för enskilda molekyler; temperaturen är en statistisk storhet för en stor mängd partiklar. Kom ihåg att faktorn 3 kommer från att molekylerna kan röra sig i ett tredimensionellt rum. Om vi istället betraktar en ideal gas i en dimension får vi E k = 1 2kT, och i två dimensioner gäller E k = kt. Exempel 1.1 Hastigheten hos molekyler i ideal gas vid rumstemperatur T = 293K. E k = 3 2 kt = 3 2 1,38 10 23 293J = 6,07 10 21 J Om gasen är O 2 så är m = 5,31 10 26 kg, och vi får vilket leder till v 2 = 2E kin m 2 6,07 10 21 = 5,31 10 26 m 2 /s 2 = 2,28 10 5 m 2 /s 2 v rms = v 2 = 478 m/s där vi har använt förkortningen rms som står för root mean square, som helt enkelt betyder roten ur medelvärdet av kvadraten (på hastigheten, i det här exemplet). Varför kunde vi inte helt enkelt räkna ut medelvärdet av vektorn v, som ovan, och ta kvadraten av det? Det skulle ha blivit noll, enligt (1.2). Vi skall titta på den här viktiga skillnaden igen senare. Vi har sett att om vi nu kan visa att E k = 3 2kT kan vi från (1.10) härleda allmänna gaslagen. Medelvärdet av energin per partikel bestäms ju av medelvärdet av hastigheten per partikel (när vi inte har någon potentiell energi), så vi behöver kunna beräkna v 2 från några mer grundläggande principer. För att förstå det måste vi börja med fördelningsfunktioner. 1.3 Fördelningsfunktioner, sannolikhet och statistik En hastighets-fördelningsfunktion anger hur många partiklar som har en viss hastighet, eller hastighet i ett visst intervall (jfr sannolikhetstätheten i p-rummet i kvantmekanik, men diskussionen här är just nu helt klassisk). 7

Exempel 1.2 Antag att vi har 10 partiklar, och endast 5 hastigheter är möjliga Medelhastigheten: Hastighet Antal partiklar v 1 = 1m/s 2 v 2 = 2m/s 0 v 3 = 3m/s 5 v 4 = 4m/s 1 v 5 = 5m/s 2 v = 1 10 (2 v 1 + 0 v 2 + 5 v 3 + 1 v 4 + 2 v 5 ) = 3, 1m/s = 0,2 v 1 + 0 v 2 + 0,5 v 3 + 0,1 v 4 + 0,2 v 5 = p 1 v 1 + p 2 v 2 + p 3 v 3 + p 4 v 4 + p 5 v 5 p 1 är sannolikheten att en partikel har hastigheten v 1, p 2 är sannolikheten att partikeln har hastigheten v 2, etc. Mer allmänt: värden v 1, v 2,..., v N med sannolikheter p 1, p 2,..., p N ger medelvärdet N v = p i v i (1.13) i=1 och på samma sätt för kvadraten på hastigheten N v 2 = p i vi 2 (1.14) i=1 och för vilken funktion f av hastigheten som helst: N f(v) = p i f(v i ). (1.15) i=1 Låt v vara en kontinuerlig variabel med tillåtna värden mellan v 1 och v 2, och p(v)dv sannolikheten att en partikel skall ha hastighet i intervallet [v,v + dv]. Då har vi v = v 2 = f(v) = v2 v 1 v2 vp(v)dv v 1 v 2 p(v)dv (1.16) v2 v 1 8 f(v)p(v)dv.

Vi måste kräva v2 v 1 p(v)dv = 1, (1.17) dvs sannolikheten att finna någon hastighet, vilken som helst, måste vara 1, dvs. 100%. De p i och p(v) vi ser ovan kallas fördelningsfunktioner, eller sannolikhetsfördelningar. Vår jakt på en härledning av allmänna gaslagen har vi alltså reducerat till en härledning av fördelningen av hastigheterna, och vi kommer att återkomma till det i sektion 3.1. 1.3.1 Regler för sannolikhet Betrakta en process eller operation med flera olika möjliga utfall, exempelvis processen kasta en tärning med de möjliga utfallen,,,, och, eller processen singla slant med möjliga utfall krona och klave. Ett utförande av processen eller operationen kallas ett försök. Mängden av alla möjliga utfall av en given operation kallas utfallsrum. För tärningsexemplet är utfallsrummet W = {,,,,, }, och för myntexemplet ges utfallsrummet av W = {krona,klave}. Exempel 1.3 Betrakta processen kast med två tärningar. Finn sannolikheten P(n) för att få talet n då vi kastar två tärningar. Om vi kan skilja de två tärningarna åt, och ordningen mellan tärningarna därmed spelar roll, så är sannolikheten för varje par av tärningar 1 1 6 6 = 1 36. Eftersom ordningen mellan de två tärningarna här inte spelar roll så är sannolikheten att få exempelvis (, ) 1 36 + 1 36 = 1 18, och detsamma gäller för alla utfall då de två tärningarna inte visar samma antal prickar. Eftersom det bara finns ett möjligt utfall (, ) så är sannolikheten för detta 1 36, och detta gäller för alla fall då båda tärningarna visar samma antal synliga prickar. Det är endast en tärningskombination som ger n = 2, nämligen (, ), så P(2) = 1 36. Det är återigen endast en tärningskombination som ger n = 3, men eftersom (, ) = (, ) så har vi P(3) = 1 18. För n = 4 blir resultatet P(4) = 1 18 + 1 36 = 1 12, detta eftersom vi har två möjliga utfall med n = 4 nämligen (, ) = (, ), samt (, ). För n = 5 har vi P(5) = 1 5 9 svarande mot utfallen (, ) och (, ). P(6) = 36 med utfall (, ), (, ), (, ). P(7) = 1 6 med utfall (, ), (, ), (, ). P(8) = 5 36 med utfall (, ), (, ), (, ). P(9) = 1 1 9 svarande mot (, ), (, ). P(10) = 12 svarande mot (, ) och (, ). P(11) = 1 1 18 svarande mot utfallet (, ), och slutligen P(12) = 36 med det enda 9

utfallet (, ). Resultatet visas i följande tabell n=2 n=3 n=4 n=5 n=6 n=7 n=8 n=9 n=10 n=11 n=12 P(n) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36 Om vi plottar P(n) som funktion av n får vi följande graf: P n 1 6 5 36 1 9 1 12 1 18 1 36 2 4 6 8 10 12 n Exempel 1.4 Låt P(n) vara fördelningen från exempel 1.3. Denna fördelning ger n = 12 n=2 np(n) = (2 + 12) 1 1 1 + (3 + 11) + (4 + 10) 36 18 12 + (5 + 9)1 5 + (6 + 8) 9 36 + 71 6 = 7, dvs medelvärdet av n är 7, något vi hade kunnat gissa oss till eftersom grafen ovan är centrerad och symmetrisk kring 7. Notera att om grafen inte är symmetrisk, så behöver inte heller medelvärdet vara i mitten av variabelns definitionsområde. Givet en variabel X är det intressant att ha ett mått på hur bred dess sannolikhetsfördelning är, betrakta därför en ny variabel Variansen σx 2 av X är definierad enligt X = X X. σ 2 X = ( X)2 = (X X) 2, (1.18) 10

dvs variansen är medelvärdet av kvadraten på variabelns avvikelse från sitt medelvärde. Ett alternativt uttryck får vi om vi utvecklar kvadraten: ( X) 2 = X 2 2XX + X 2 = X 2 2X 2 + X 2 = X 2 X 2, dvs variansen av en variabel är medelvärdet av kvadraten på variabeln (alltså variabelns 2:a moment) minus kvadraten av medelvärdet av variabeln. Kvadratroten av variansen kallas standardavvikelsen: σ X = ( X) 2 = X 2 X 2. (1.19) Ofta är det mer relevant att ha ett mått på bredden av en fördelning av en variabel X som tar hänsyn till den typiska storleken på X (om vi t.ex. har tagit fram en fördelning över priset på en viss vara i olika butiker är det relevant att jämföra skillnaden mellan höga och låga priser med genomsnittspriset). Ett sådant mått ges av den relativa bredden på fördelningen: σ X X. 1.3.2 Bernoulliprocesser och binomialfördelningen En process med två möjliga utfall där resultatet av varje försök är oberoende av resultaten av alla tidigare försök kallas Bernoulliprocess. Ett exempel är singla slant, där de två möjliga utfallen är krona respektive klave. I detta exempel har de två utfallen lika stor sannolikhet, nämligen 1 2. I en allmän Bernoulliprocess har utfallen sannolikheterna p respektive q, vilka således måste uppfylla p + q = 1, eller q = 1 p. Det räcker alltså att specificera en sannolikhet för att definiera en Bernoulliprocess. Random walk Ett vanligt exempel på en Bernoulliprocess är en en-dimensionell s.k. Random walk (också kallad drunkards walk ): Antag att en person endast kan ta steg längs en linje, åt höger eller åt vänster, och att varje steg är lika långt. Antag vidare att personen i fråga är berusad och snarare raglar än går, och sannolikheten för att ett steg sker åt vänster (höger) är p (q = 1 p). Om personen tar totalt N steg, hur stor är då sannolikheten att precis n av dessa steg har varit åt vänster? Vi kallar denna sannolikhet P N (n), och försöker bestämma den. Om n av totalt N steg sker åt vänster, så sker förstås N n steg åt höger. Produktregeln för sannolikheter ger sannolikheten p n q N n för varje N-stegs promenad med n steg åt vänster (t.ex. om N = 3 och n = 2 ges en möjlighet av vänster-höger-vänster med sannolikhet pqp = p 2 q, och en annan möjlighet ges av höger-vänster-vänster med sannolikhet qpp = p 2 q). Således är P N (n) proportionell mot p n q N n, och det återstår att bestämma proportionalitetsfaktorn. 11

Om sannolikheten för varje enskild N-stegs promenad med precis n steg åt vänster är p n q N n så ges sannolikheten för en N-stegs promenad att vara någon av dessa promenader av p n q N n multiplicerat med antalet dylika promenader. Antalet sådana promenader är lika med antalet sätt på vilka vi kan välja ut n olika element ur en mängd med N element (om det inte spelar någon roll i vilken ordning vi väljer elementen). Detta antal är som bekant 1 givet av binomialkoefficienten ( N n P N (n) = ( ) N p n q N n = n ) = N! n!(n n)!, och vi har N! n!(n n)! pn q N n. (1.20) Av uppenbara skäl kallas denna sannolikhetsfördelning för binomialfördelningen. Vi antog ingenting som är specifikt för random walk, så om vi i en godtycklig Bernoulliprocess frågar efter sannolikheten att precis n utfall av N försök är av det ena slaget (svarande mot sannolikheten p) får vi alltid svaret P N (n). Vi kontrollerar snabbt att fördelningen P N (n) uppfyller villkoren för en sannolikhetsfördelning. Eftersom p,q > 0 och ( N n) > 0 då n N, så följer att PN (n) > 0 för alla n < N. För att kontrollera att N n=0 P N(n) = 1 är det lämpligt att studera binomialutvecklingen av (p + q) N : (p + q) N = N n=0 ( ) N p n q N n = n N P N (n), men i en Bernoulliprocess måste p + q = 1, så (p + q) N = 1 och därmed har vi visat att alla sannolikheter adderar till 1. n=0 Exempel 1.5 Vad är sannolikheten för att vi får krona precis 3 gånger om vi en singlar slant 5 gånger? Vi har en Bernoulliprocess med p = q = 1 2, och det frågas efter P 5(3). P 5 (3) = ( 5 3 )( 1 2 ) 3 ( ) 1 (5 3) = 5! 2 3!2! 1 2 5 = 5 16 1 I fall detta inte är bekant ger vi här ett snabbt bevis. Vi kan välja ett element ur en N-element mängd på N olika sätt. Efter att vi har valt ett element kan vi välja ett till på N 1 sätt, osv. Iteration ger att vi kan välja n olika element ur en mängd med N element på N(N 1)(N 2)... (N n 1) sätt. Om ordningen på de valda elementen inte spelar någon roll så måste vi dessutom dela med antalet olika ordningsföljder vi kan välja n givna element, vilket är n! Svaret är alltså N(N 1)...(N n 1) n! = N! n!(n n)! 12

System av N fria spinn Man kan tycka att Bernoulliprocesser är alltför enkla för att ha någon som helst betydelse för fysikaliska system, men faktum är att den enklaste modellen för magnetism i kristallina material beskrivs med hjälp av en Bernoulliprocess. Vi introducerar därför vad som brukar kallas ett system av N fria spinn. Antag att vi har N st. frihetsgrader som kan ta två värden: spinn upp ( ) och spinn ner ( ), och numrera dessa från 1 till N. Varje frihetsgrad är tänkt att motsvara en kvantmekanisk partikel 2 med spinn 1 2, där spinnet kan peka antingen upp eller ner längs någon given riktning (vanligtvis antaget att vara z-riktningen i något koordinatsystem). Vi visualiserar t.ex. alla möjliga konfigurationer med N = 3 fria spinn där n = 1 spinn pekar upp som,,. Varje frihetsgrad har ett magnetiskt moment µ. Detta innebär att om vi lägger på ett yttre magnetfält riktat uppåt (i positiva z-axelns riktning) med styrkan B så har ett spinn som är riktat uppåt energin µb, och ett spinn som är riktat nedåt har energin µb. Om B = 0 antar vi att varje spinn kan vara riktat uppåt eller nedåt med lika stor sannolikhet, 1 2. Om å andra sidan B 0 så är sannolikheterna för att hitta ett spinn upp respektive ner olika. Vi kan ännu inte bestämma på vilket vis de ändras (detta dyker upp i avsnitt 2.3), så tillsvidare antar vi att sannolikheterna för spinn upp resp. ner är p resp. q = 1 p då B 0. Till spinn nr. i associerar vi en stokastisk variabel s i {±1} som är positiv om spinnet är riktat upp, och negativ annars, dvs den är positiv med sannolikhet p och negativ med sannolikhet q. Energin för samma spinn kan då skrivas som ǫ i = µbs i. Den totala energin för systemet av N fria spinn ges av E = N N ǫ i = µb s i = BM (1.21) i=1 där vi har introducerat systemets magnetisering M = µ i=1 N s i. (1.22) Kopplingen till Bernoulliprocesser är uppenbar: mätning av ett spinn är en Bernoulliprocess. Frågan vad är sannolikheten att hitta precis n spinn upp i ett system med 2 Beroende på förkunskaper kan det möjligtvis låta märkligt att vi kan numrera kvantmekaniska frihetsgrader. Man lär sig i kvantmekanik att fria partiklar inte är åtskiljbara, vilket precis betyder att vi inte kan sätta namn (eller nummer) på enskilda partiklar. Detta förutsätter dock att partiklarna är fria att röra sig i rummet, men systemet med fria spinn vi beskriver här är tänkt att motsvara kvantmekaniska partiklar som sitter fast på bestämda punkter i ett kristallgitter, och därmed kan skiljas åt (vi kan t.ex. numrera punkterna i gittret, och vi antar att partiklarna inte kan flytta sig mellan olika gitterpunkter). Ordet fria betyder alltså här inte att spinn-frihetsgraderna är fria att röra sig hur som helst, utan snarare att det inte verkar några krafter mellan olika spinn. Det faktum att fria identiska partiklar kvantmekaniskt är oåtskiljbara har stora konsekvenser för statistisk fysik, och är något vi återkommer till senare i kursen. i=1 13

N fria spinn? är ekvivalent med frågan vad är sannolikheten att precis n steg i en N-stegs promenad sker åt vänster? så svaret är P N (n) = ( N n) p n q N n, dvs binomialfördelningen. Exempel 1.6 Vad är medelvärdet av M i ett system av N fria spinn? Det är instruktivt att lösa detta på två sätt. 1. Notera först att N N M = µ s i = µ s i. i=1 Varje spinn är oberoende av alla andra, och s i = ±1 med sannolikhet p resp. q = 1 p. Medelvärdet ges alltså av s i = p q = 2p 1. Speciellt gäller detta för alla i = 1,...,N, så s 1 = s 2 =... = s N = p q =: s. Resultatet är alltså i=1 M = µns = µn(p q) = µn(2p 1). (1.23) 2. Om n av variablerna s i tar värdet 1, och resten (N-n) tar värdet 1 så blir magnetiseringen M = M n := µ(n (N n)) = µ(2n N). Vi vet att sannolikheten att hitta precis n spinn upp är P N (n) = ( N n) p n q (N n), så vi kan beräkna medelvärdet av magnetiseringen enligt N M = M n P N (n) = µ n=0 = 2µ N N! (2n N) n!(n n)! pn q N n n=0 N N! n n!(n n)! pn q N n µn n=0 N n=0 N! n!(n n)! pn q N n (1.24) Summan i den andra termen har värdet 1 (det är summan av alla P N (n)), och för att beräkna den första summan noterar vi följande: Med andra ord gäller p N n=0 N N! n n!(n n)! pn q N n = p p n=0 ( ) N p n q N n = n N n=0 N ( ) N n p n 1 q N n. n n=0 ( ) N p n q N n = p n p (p + q)n = pn(p + q) N 1 = pn där vi i sista steget har använt p+q = 1. Insättning i (1.24) ger samma resultat som i föregående metod, dvs M = µn(2p 1) = µn(p q). Som förväntat får vi M = 0 om p = q = 1 2, och M = ±µn om p = 1 resp. 0. 14

Den andra metoden i exemplet ovan visar på en väldigt användbar metod för att beräkna medelvärden, som dessutom kan itereras, och t.o.m. generaliseras till andra sannolikhetsfördelningar. Den första summan i (1.24) är precis n, dvs vi har n = p p (p + q)n p+q=1 = pn(p + q) N 1 p+q=1 = Np. (1.25) Detta resultat är precis vad vi förväntar oss: medelvärdet av antalet spinn som är upp ges av totala antalet spinn multiplicerat med sannolikheten att ett enskilt spinn är upp. Det är även intressant att bestämma variansen σ 2 n och standardavvikelsen σ n. Vi vet att variansen ges av ( n) 2 = n 2 n 2, så vi behöver beräkna n 2. dvs n 2 = N ( ) N n 2 p n q N n = p n p n=0 Vi har alltså N ( N n n n=0 ) p n q N n = p p p p (p + q)n p+q=1, n 2 = Np + N(N 1)p 2 = (Np) 2 + Np(1 p) = n 2 + Npq. (1.26) σ 2 n = n 2 n 2 = Npq, σ n = Npq. (1.27) Den relativa bredden på fördelningen av n blir σ n n = vilken minskar med antalet spinn N. ( ) q 1/2 1, p N Normalfördelning (Gaussfördelning) Den mest vanligt förekommande kontinuerliga fördelningen är den s.k. normalfördelningen (ibland Gauss-fördelningen ): p(x) = ce α2 (x x 0 ) 2 (1.28) där c, α och x 0 är konstanter, och x är variabeln av intresse. Att den förekommer så ofta i statistik beror på centrala gränsvärdessatsen, som säger att om man lägger ihop många oberoende variabler med samma fördelningsfunktion kommer summan att gå mot en normalfördelning. Den s.k. normeringen c kan man räkna ut i termer av de andra konstanterna, genom att använda ekvation (1.17): 1 = p(x)dx = c = c α e α2 (x x 0 ) 2 dx (gör nu substitutionen y = α(x x 0 )) e y2 dy = c π α 15

där vi använde Gaussintegralen (se appendix (A.1)) e y2 dy = π. Alltså c = α. (1.29) π För att förstå hur man skall tolka α och x 0 beräknar vi först medelvärdet x: x = xp(x)dx = α xe α2 (x x 0 ) 2 dx (gör återigen substitutionen y = α(x x 0 )) π = 1 (y/α + x 0 )e y2 dy π 1 = α π = x 0. ye y2 dy + x 0 π e y2 dy (1.30) Det sista steget följer från att integranden i den första integralen är udda, samt än en gång värdet på Gaussintegralen för den andra integralen. Vi ser alltså att x 0 är medelvärdet. Tolkningen av α ser vi om vi beräknar variansen av x enligt (1.16): σx 2 = (x x) 2 = (x x 0 ) 2 = α (x x 0 ) 2 e α2 (x x 0 ) 2 dx. π Den sista integralen kan vi beräkna på ett enkelt sätt med ett trick. Om vi tänker oss integralen e α2 (x x 0 ) 2 π dx = (1.31) α som en funktion av α kan vi derivera denna, med resultatet d dα dvs vi har visat att e α2 (x x 0 ) 2 dx = 2α (x x 0 ) 2 e α2 (x x 0 ) 2 dx = 1 d 2α dα (x x 0 ) 2 e α2 (x x 0 ) 2 dx, e α2 (x x 0 ) 2 dx. Om vi istället deriverar högerledet i (1.31) och multiplicerar med 1/(2α) får vi 1 d 2α dα π α = 16 π 2α 3,

vilket visar att σx 2 = 1 2α 2 (1.32) dvs σ x = 1 α 2 så standardavvikelsen σ x och konstanten α står i nära förbindelse. Man skriver därför ofta om p(x) uttryckt i σ x istället: p(x) = 2 1 e (x x) 2σx 2, (1.33) 2πσ 2 x vilket ser lite mer komplicerat ut, men fördelen är att om man lyckas organisera om ett givet p(x) så det är uttryckt på den här formen så kan man direkt läsa av standardavvikelse σ x och medelvärde x utan att behöva göra om räkningarna ovan. Normalfördelningen som gräns av binomialfördelningen Vi visar här att om vi tar gränsen N av binomialfördelningen P N (n), så får vi en normalfördelning. Fakultetsfunktionen n! kan utvidgas till att vara definierad för alla positiva reella tal (m h a gammafunktionen som uppfyller Γ(n + 1) = n! när n är ett positivt heltal), och det följer att även P N (n) är en väldefinierad funktion för alla positiva reella tal. Vi har sett att den relativa bredden på binomialfördelningen minskar med N, och för stora värden på N kommer därför fördelningen att ha ett tydligt maximum i det mest sannolika värdet n, vilket sammanfaller med medelvärdet n = Np. Låt oss därför finna ett approximativt uttryck för P N (n) nära n. Vi skulle kunna försöka att Taylorutveckla fördelningsfunktionen kring n, men om vi undersökerp N (n) så ser vi att den varierar starkt kring n för stora N, så det är bättre att Taylorutveckla ln (P N (n)). Till andra ordningen har vi ln (P N (n)) ln (P N (n )) + (n n ) dln (P N(n)) dn n=n }{{} =0 + 1 2 (n n ) 2 dln (P N(n)) dn (1.34) n=n }{{} = β<0 där den linjära termen försvinner eftersom vi utvecklar kring ett extremvärde, och konstanten β är positiv eftersom extremvärdet är ett maximum. Vi behöver koefficienten β, och skriver därför ut uttrycket vi skall derivera. ( ln (P N (n)) = ln N! n!(n n)! pn q N n ) = ln (N!) ln (n!) ln (N n)! + ln p n + ln q N n }{{}}{{} =n lnp =(N n)ln q 17

För att kunna arbeta med detta uttryck använder vi Stirlings approximation: ln N! N lnn N (1.35) som gäller för stora N. Denna approximation, tillsammans med en något noggrannare version, är mycket användbar i statistik, och vi visar den i appendix A.2. En enkel beräkning visar att d dn (n ln n n) = ln n, och insättning ovan ger d dn ln (P N(n)) ln n + ln (N n) + ln p ln q (1.36) Vi deriverar en gång till och evaluerar uttrycket i n = n = Np: d 2 ln (P N (n)) dn = 1 n=np Np 1 N(1 p) = 1 Npq, (1.37) dvs β = 1 Npq = 1. Konstanten ln(p σn 2 N (Np)) beräknas på liknande vis, men där måste vi använda den noggrannare versionen av Stirlings approximation (A.3). Resultatet är ln (P N (Np))) 1, och om vi exponentierar (1.34) får vi slutligen 2πσ 2 n P N (n) ) 2 1 e (n n 2σn 2. (1.38) 2πσ 2 n Detta resultat är en konsekvens av ett mer allmänt resultat, centrala gränsvärdessatsen: Sannolikhetsfördelningen för summan av N stokastiska variabler är i gränsen N en normalfördelning, oberoende av de N enskilda variablernas fördelningar. I fallet med binomialfördelningen så motsvarar P N (n) sannolikhetsfördelningen för summan av N stokastiska variabler, t.ex. fria spinnvariabler. Centrala gränsvärdessatsen brukar bevisas i en grundkurs i matematisk statistik, men se även Gould & Tobochnik. 1.4 Hastighetsfördelningsfunktionen för en ideal gas Det är möjligt ge argument för att hastighetsfördelningen i en ideal gas måste se ut på ett visst sätt. I avsnitt (3.1) visar vi detta från grundläggande principer, men i det här avsnittet tjuvtittar vi lite på resultatet först. Medelvärdet på hastigheten är som vi argumenterade förut noll, och standardavvikelsen ( bredden på normalfördelningen) σ v visar sig vara 3kT σ v = m. (1.39) 18

För en ideal gas med temperatur T i en dimension har hastigheterna alltså enligt (1.33) fördelningsfunktionen ( m ) 1/2 p(v) = e mv2 2kT. (1.40) 2πkT Detta uttryck kallas Maxwell-Boltzmann-fördelningen i en dimension. Vi beräknar medelvärden enligt (1.16). p( v ) T 1 T 2 > T 1 T 3 > T 2 T 4 > T 3 Figur 1: Sannolikhetsfördelningen för v som följer från Maxwell-Boltzmann fördelningen, ritad för några olika temperaturer. Vår jakt på en härledning av allmänna gaslagen har vi alltså reducerat till en härledning av Maxwell-Boltzmann-fördelningen, och vi kommer att återkomma till det i sektion 3.1. v Maxwell-Boltzmann-fördelningen i tre dimensioner I tre dimensioner har man en sådan fördelning i varje riktning. Beteckna med v = (v x,v y,v z ) hastigheten i tre dimensioner hos en punktpartikel med massan m. I en klassisk ideal gas med temperaturen T ges sannolikheten att hitta en partikel med hastighet i intervallet [v,v + dv] alltså av uttrycket p(v)dv = ( m ) 3/2 mv e 2 2kT dv x dv y dv z, 2πkT 19

dvs sannolikhetsfördelningen är produkten av tre normalfördelningar, en i varje riktning: p(v) = = ( m 2πkT ( m 2πkT ) 3/2 e mv2 x 2kT e mv2 y 2kT e mv2 z 2kT Medelvärdet av en funktion f(v) beräknas enligt ( m ) 3/2 f(v) = f(v)e mv2 2kT dv 2πkT ) 3/2 e mv2 2kT. (1.41) vilket ofta förenklas eftersom fördelningen ser likadan ut i alla riktningar i hastighetsrummet. T.ex. beräknar vi enkelt v = v x i + v y k + v z k. För den första termen får vi [ ( m ) 1/2 ] [ v x = v x e mv2 x ( m ) 1/2 2kT dv x e mv 2 ] y 2kT dv y 2πkT 2πkT [ ( m ) 1/2 ] e mv2 z 2kT dv z 2πkT ( m ) 1/2 = v x e mv2 x 2kT dv x 2πkT = 0. (1.42) I första steget har vi utfört integralerna över v y och v z, vilka båda ger värdet 1, och andra steget följer av att integranden är en udda funktion. Alternativt kan vi identifiera fördelningen i x-led med en normalfördelning (1.28), och vi ser i så fall direkt att v x = 0. Samma jämförelse ger också c = m 2πkT, och ur (1.32) följer att σ2 v x = vx 2 = kt m. Uppenbarligen har vi vx 2 = v2 y = v2 z, och därför v2 = 3vx 2 = 3kT m. Nu vill vi bestämma sannolikhetsfördelningen n(v) för farten v = v 2. För att få n(v) uttrycker vi v i sfäriska koordinater (v,v θ,v φ ). Ett infinitesimalt volymselement i sfäriska koordinater skriver vi som v 2 dv sin v θ dv θ dv φ (jfr uttrycket r 2 dr sin θ dθ dφ). Alltså kan vi skriva ( m ) 3/2 mv p(v)dv = e 2 2kT v 2 sin v θ dv dv θ dv φ. 2πkT Vi kan integrera över alla riktningar, dvs över vinkelkoordinaterna, och få ett uttryck som endast innehåller beloppet v. Ingenting i fördelningsfunktionen beror på riktningen, så vi behöver endast utföra integralen π 0 2π sin v θ dv θ dv φ = 4π, vilket är arean hos en enhetssfär. Om vi utför vinkelintegralen i båda leden av ovanstående uttryck har vi slutligen ( m ) 3/2 n(v)dv = 4π v 2 e mv2 2kT dv (1.43) 2πkT 0 20

Figur 1 (sid. 19) visar n(v) för några olika temperaturer. Skillnaden mot en vanlig normalfördelning är att maximum är lite utsmetat åt höger. Det kommer från faktorn v 2 i (1.43). 1.5 Mikroskopiska argument: två första försök Innan vi ger oss in på ordentlig statistisk fysik i nästa kapitel kan vi härleda två resultat med det vi har gjort hittills. Specifik värmekapacitet Vi vet från termodynamik att de specifika värmekapaciteterna ges av c P = ( ) E T P, c V = ( ) E T V (1.44) och kan mätas experimentellt. Det är intressant att betrakta förhållandet κ = c P c V (1.45) som experimentellt är runt 1.67 för några gaser. (I fysik betecknas det ofta γ.) Vi får en ideal gas κ = c V + R c V = 1 + R c V (1.46) där R = N A k är molära gaskonstanten i J/K mol). Vi vet att E = (3/2)NkT så c V = ( ) E T V = 3 Nk (1.47) 2 och molära specifika värmekapaciteten c V får vi genom att dela med antalet mol n: vilket ger som stämmer bra för enkla monatomära gaser. c V = 1 3 n 2 Nk = 3 2 N Ak (1.48) κ = 1 + N Ak 3 2 N Ak = 1 + 2 3 = 5 1.667 (1.49) 3 Entropin för en ideal gas Vi har hittills visat hur man via enkla resonemang utgående från klassisk mekanik kan göra statistiska utsagor om ett stort antal fria partiklar. Låt oss se om insikten vi leddes till ovan om den inre energin hos molekylerna låter oss säga något om entropi. Vi kommer att. 21

Vi antar att entropin är en funktion av V, T, och N (eftersom vi studerar totala istället för specifika entropin måste vi ange tre egenskaper istället för två), dvs S S(V,T,N). Vi använder oss dessutom av Gibbs 1:a ekvation du = TdS pdv +µdn, och betraktar en isoterm process för slutet system med ideal gas. Att systemet är slutet betyder att N (mängden materia) inte kan ändras. Från uttrycket (1.11) ovan ser vi att U U(T,N), och Gibbs ekvation ger därför för en isoterm process att 0 = TdS PdV ds = P T dv = NkdV V, där vi i sista steget har använt PV = NkT. Om vi integrerar ds = NkdV/V får vi S(V,T,N) = Nk ln V + f(t,n) där "integrationskonstanten"f är en okänd funktion av N och T. Betrakta nu en kvasistatisk adiabatisk process för slutet system ( ds = 0). Gibbs 1:a ekvation ger du = pdv = NkT dv V 3 dt 2 T = dv V V T 3/2 konstant där vi har använt U = 3 2NkT. Detta bestämmer delvis funktionen f, och vi får [ S(V,T,N) = Nk ln V T 3/2] [ + g(n) = k ln (V T 3/2 ) N] + g(n) där g är en okänd funktion av N. Vi vet att entropin är extensiv, dvs om vi delar upp volymen i två delar med storlekarna V 1, N 1 respektive V 2, N 2 så skall S(V 1 + V 2,T,N 1 + N 2 ) = S(V 1,T,N 1 ) + S(V 2,T,N 2 ), vilket ställer villkor på funktionen g(n). Ett annat sätt att uttrycka extensiviteten är att säga att om vi håller T och N/V konstant så skall S vara linjär i N, och vi väljer helt enkelt g(n) sådan att detta gäller. Men vi vet bara säkert att S är extensiv i vanlig termodynamik med många partiklar, då N (om vi håller N/V konstant brukar detta kallas den termodynamiska gränsen). Lösningen visar sig vara g(n) = k ln N!, vilket ger det korrekta uttrycket [ ] (V T 3/2 ) N S(V,T,N) = k ln. (1.50) N! Faktorn N! i nämnaren följer inte ur någon klassisk härledning av S, men kommer automatiskt in om vi utgår från en mer fundamental (kvantmekanisk) beskrivning. Så vi kom inte riktigt ända fram till entropin för en ideal gas, men vi kan göra en intressant och ganska abstrakt observation från det vi sett. V är volymen som en (punktformig) molekyl har att röra sig i i rummet. Nu kan man införa ett mer abstrakt begrepp, 22

fasrummet. Detta är ett utvidgat rum som parametriseras av inte bara läge i tre dimensioner utan också hastighet i tre dimensioner, för varje partikel. Det betyder att för en partikel kan vi specificera dess tillstånd som en punkt i ett fasrummet, som har sex dimensioner. Det må vara svårt att föreställa sig ett sexdimensionellt rum, men det går att använda vanliga matematiska formler för att beskriva dem, t.ex. kommer vi att använda oss av volymen hos en sexdimensionell sfär. Hur är partiklarna fördelade i fasrummet? Vi har sett att v rms är proportionellt mot T 1/2, och volymen i tre dimensioner är proportionellt mot kuben av radien. Så vi skulle kunna säga att T 3/2 anger den ungefärliga volymen i hastighetsrummet som en molekyl kan befinna sig i. Följaktligen är V T 3/2 volymen i fasrummet för en molekyl, och (V T 3/2 ) N volymen i fasrummet för N (punktformiga) molekyler som går att skilja åt. Är partiklarna inte åtskiljbara delar man med den kombinatoriska faktorn N!. Volymen i fasrummet betecknas Ω. Uttryckt i dessa termer kan vi skriva om (1.50) som S = k ln Ω (1.51) vilket, som vi kommer att se, är ett av postulaten som statistisk fysik vilar på. Problem 2.1 Hur stor är sannolikheten att få minst en sexa om man kastar en tärning 24 gånger? 2.2 Antag tre tärningar kastas samtidigt. Vad är sannolikheten att det totala antalet synliga prickar är 10?, 9? 2.3 Vad är sannolikheten att totala antalet synliga prickar är 11 om tre tärningar kastas samtidigt? Vad är sannolikheten att totala antalet synliga prickar är 12? Vad är fel i följande resonemang? Talet 11 erhålles på 6 olika vis: (1,4,6), (2,3,6), (1,5,5), (2,4,5), (3,3,5), (3,4,4). Talet 12 erhålles också på 6 olika vis: (1,5,6), (2,4,6), (3,3,6), (2,5,5), (3,4,5), (4,4,4), och därför är sannolikheterna lika stora. 2.4 Ett par har två barn. a) Vad är sannolikheten att minst ett av barnen är en flicka? b) Antag att vi känner till att minst ett barn är en flicka. Vad är sannolikheten att det andra barnet också är en flicka? c) Antag istället att vi känner till att det äldsta barnet är en flicka. Vad är sannolikheten att även det yngsta barnet är en flicka? 2.5 Antag att variabeln x tar värdena 2, 1, 0, 1, och 2 med sannolikheterna 1/16, 4/16, 6/16, 4/16, och 1/16. Beräkna x och x 2. 2.6 Beräkna medelvärdet, variansen och standardavvikelsen för variabeln x som ges av antalet synliga prickar vid kast av en tärning. 23

2.7 Hur många gånger måste man kasta en tärning i genomsnitt innan man får en sexa? 2.8 Processen att kasta ett mynt N gånger är ekvivalent med systemet med N fria spinn om vi associerar antalet krona med n och antalet klave med N n. För ett rättvist mynt är sannolikheten för krona p = 1 2, och sannolikheten för klave q = 1 p = 1 2. Vad är sannolikheten att vi efter tre kast med myntet har fått krona precis två gånger? 2.9 Antag att en endimensionell slumpgångare tar steg med längd a, med sannolikhet p åt vänster. Låt variabeln x vara avståndet från utgångspunkten. Beräkna x och ( x) 2 för en N-stegspromenad. 2.10 Den stokastiska variabeln X har sannolikhetsfördelning där A och λ är positiva konstanter. a) Bestäm A i termer av λ { Ae p(x) = λx för 0 X < 0 annars b) Vad är medelvärdet av X? Vad är det mest sannolika värdet på X? c) vad är medelvärdet av X 2? d) Välj λ = 1 och beräkna sannolikheten att en mätning av X ger ett värde mellan 0 och 1. e) Välj λ = 1 och beräna sannolikheten att en mätning av X ger ett värde mindre än 0.3. 2.11 Antag att hastigheten hos molekylerna i en gas är Maxwell-Boltzmann-fördelade: p(v) = ( m ) 3/2 e mv2 2kT 2πkT Om vi mäter hastigheten hos en molekyl i gasen, vad är sannolikheten att vi får v x 0, v y 0, och v z 0? 24

2 System med många frihetsgrader: Ensembler Om vi accepterar att materia inte kan behandlas exakt som ett kontinuerligt medium utan i själva verket består av en stor mängd mikroskopiska frihetsgrader (molekyler, enskilda atomer, eller ännu mindre beståndsdelar) så vill vi som fysiker gärna kunna förklara de fenomen vi observerar, och de storheter vi mäter, utgående från de mikroskopiska beståndsdelarna. Vi såg redan i avsnitt 1.2 att det är möjligt att delvis härleda allmäna gaslagen direkt från Newtons mekanik tillämpad på ett stort partikelsystem. Det står klart att den enkla modellen av kinetisk teori inte kan beskriva alla tänkbara system, t.ex. tog vi endast hänsyn till en egenskap hos molekylerna, nämligen deras massa, och vi vet att olika ämnen kan ha radikalt olika termodynamiska egenskaper. Vi kan delvis förbättra modellen genom att ta hänsyn till att de enskilda molekylerna kolliderar med varandra, och om vi dessutom antar att endast två partiklar är inblandade i varje enskild kollision leder oss detta till den s.k. Boltzmannekvationen som ligger till grund för området kinetisk teori. Men inte heller en sådan modell kan beskriva alla typer av system som vi är intresserade av. Det är t.ex. svårt att se hur vi beskriver andra faser, som vätskor och fasta ämnen, än mindre övergångar mellan olika faser. I detta avsnitt går vi igenom en allmän och framgångsrik metod att behandla mångpartikelsystem som är i jämvikt i termodynamisk mening. Vi börjar med att försöka motivera metoden, och fortsätter med att tillämpa den på ett antal olika situationer. 2.1 Från termodynamik till statistisk fysik Betrakta en gas instängd i ett kärl med volym V, och de termodynamiska egenskaperna vi använder för att beskriva gasen (T, P, U, S, etc). Vi förväntar oss att vissa av dessa, t.ex. trycket P, i själva verket är ett tidsmedelvärde som uppstår därför att vi mäter under en ändlig tid (om våra mätningar kunde utföras under ett mycket kortare tidsindtervall skulle vi se att egenskaperna fluktuerar med tiden). Vi förväntar oss dock inte att alla egenskaper har en tolkning som ett tidsmedelvärde. Antag t.ex. att vårt kärl är perfekt isolerat; eftersom den totala energin är bevarad så kan den inre energin U inte ändras med tiden, utan har ett konstant fixt värde. Om vi i stället antar att kärlet är i termisk kontakt och jämvikt med en temperaturreservoir så kan energi i form av värme transporteras in till och ut från systemet, dvs systemets energi kan fluktuera. I denna situation är det rimligt anta att det värde på U som vi tillskriver systemet har tolkning som ett tidsmedelvärde. Vår definition på termisk jämvikt, å andra sidan, medför nu att temperaturen T har ett fixt konstant värde 3. För att ta oss vidare inför vi ett par nya begrepp. Med ett makrotillstånd menar vi värden på en eller flera termodynamiska egenskaper, t.ex. specificerar vi ett makrotillstånd av V, U, och N (vilket beskriver ett termodynamiskt tillstånd för ett isolerat system), eller V, T, N (beskriver tillståndet för ett slutet 3 Den här diskussionen implicerar att vissa egenskaper är mer naturliga än andra för att beskriva ett givet system. T.ex. är temperaturen T naturligt att ange för ett system i termisk jämvikt med ett annat system, medan den inre energin U ur denna synvinkel blir mindre naturlig. För ett isolerat system är U en naturlig egenskap, medan T är mindre naturlig. 25

system i termisk jämvikt med ett annat system), eller V, T, µ (där µ är den kemiska potentialen), vilket ger ett termodynamiskt tillstånd för ett öppet system i kontakt med en generaliserad temperaturreservoir. Med ett mikrotillstånd menar vi en mikroskopisk konfiguration för ett system, dvs ett tillstånd för varje mikroskopisk frihetsgrad. Med tillståndet för en klassisk partikel menar vi dess läge och rörelsemängd, så för att beskriva ett mikrotillstånd för en gas av klassiska partiklar måste vi veta varje partikels läge och rörelsemängd. Tillståndet för en kvantmekanisk partikel ges av en vågfunktion som beskriver partikeln, vilken i sin tur ofta karakteriseras av några få s.k. kvanttal, t.ex. energin, rörelsemängden, totala rörelsemängdsmomentet, och rörelsemängdsmomentets komponent i z-riktningen. Ofta är det därför möjligt att beskriva ett mikrotillstånd för ett system av kvantmekaniska partiklar genom att ange en uppsättning kvanttal. En viktig skillnad mellan klassiska och kvantmekaniska partiklar är att man för de senare inte kan ange läge och rörelsemängd med godtycklig noggrannhet samtidigt (detta är en konsekvens av Heisenbergs osäkerhetsrelation). Exempel 2.1 Alla möjliga mikrotillstånd för ett system av N = 3 fria spinn:,,,,,,, För att motivera en statistisk behandling av mångpartikelsystem antar vi att vårt system beter sig ergodiskt (antagandet brukar kallas den ergodiska hypotesen), vilket innebär att allt eftersom tiden går så passerar systemet genom alla tillgängliga mikrotillstånd, och att systemet tillbringar lika mycket tid i alla mikrotillstånd med samma totala energi. Det är känt att alla system inte är ergodiska, och det faktum att vissa system inte är det har t.o.m. viktiga konsekvenser för deras termodynamik (t.ex. kan fasövergångar inte kunna förekomma i exakt ergodiska system), men vi antar för ögonblicket att de system vi studerar är ergodiska. Säg att vi vill veta värdet på en makroskopisk storhet A som ges av tidsmedelvärdet a A = 1 T T 0 A(t)dt, där A(t) bestäms av systemets mikrotillstånd vid tiden t. Om systemet under tidsintervallet T vi utför vår mätning hinner passera genom en stor del av alla tillgängliga mikrotillstånd så kan vi ersätta tidsmedelvärdet med medelvärdet över alla tillgängliga mikrotillstånd, A = p(x)a(x)dx mikrotillst med en än så länge okänd sannolikhetsfördelning p(x). Ergodicitet medför att systemet tillbringar lika mycket tid i alla mikrotillstånd med samma totala energi, så vi drar slutsatsen att p(x) endast beror på systemets totala energi. 26

För att formalisera diskussionen ovan något så inneför vi begrepper ensemble: Med en ensemble menar vi mängden av alla mikrotillstånd förenliga med ett givet makrotillstånd. Exempel 2.2 Betrakta ett system av N = 5 fria spinn där vi fixerar den totala energin till E = µb (dvs vi specificerar makrotillståndet E = µb, N = 5), bestäm motsvarande ensemble. Kom ihåg att energin ges av E = µb N i=1 s i, dvs för att energin skall vara µb så måste det finnas ett netto-spinn ner. Ensemblen är alltså mängden av mikrotillstånd med tre spinn ner och två upp, dvs {,,,,,,,,, } Det finns ett antal standardensembler i statistisk fysik, svarande mot olika makroskopiska situationer. De tre vanligaste är den mikrokanoniska ensemblen (fix E, V, N, se avsnitt 2.2), den kanoniska ensemblen (fixt T, V, N, se avsnitt 2.3), och den stora kanoniska ensemblen (fix T, V, µ, se avsnitt 2.4), men även andra ensembler förekommer, t.ex. svarande mot fixt P istället för V. Utgående från den ergodiska hypotesen kan vi alltså argumentera för att vi kan bestämma makroskopiska egenskaper genom att ta medelvärdet av storheter över alla mikrotillstånd som är förenliga med de makroskopiska krav vi satt på systemet (dvs makrotillståndet). Från vår erfarenhet av sannolikhetsfördelningar vet vi å andra sidan att sådana kan ha större eller mindre varians, dvs spridning kring medelvärdet. Eftersom vi erfarenhetsmässigt vet att vi alltid mäter (i princip) samma värden på tryck och temperatur för identiskt preparerade system så förväntar vi oss att en statistisk metod likt den vi just har diskuterat måste resultera i en fördelning för de makroskopiska storheterna med mycket liten relativ bredd, finns det någon anledning att tro att det alltid måste vara på det viset? Med reservation för att vi endast betraktar system där N är väldigt stort så är svaret ja, och anledningen kan vi härleda till centrala gränsvärdessatsen. Kom ihåg att den relativa bredden av binomialfördelningen skalade med N som (N) 1/2, så för stora N får vi en normalfördelning med mycket liten relativ bredd. Andra fördelningar ger liknande resultat, och eftersom en makroskopisk storhet typiskt är summan av N mikroskopiska storheter, får vi ett väldefinierat värde på den makroskopiska storheten. Det är dock viktigt att vara medveten om att vi endast kan förvänta oss att få den klassiska termodynamiken från statistisk fysik om vi betraktar väldigt stora system. Speciellt brukar man kalla gränsen N där n = N V hålls fixt, den termodynamiska gränsen. Som vi skall se så är det ibland möjligt att använda statistiska metoder för ett godtyckligt värde på N, och efter att ha utfört erforderliga beräkningar, ta gränsen N. 27