LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 3 MATEMATISK STATISTIK AK FÖR CDI, FMS012, HT10 Laboraion 3: Sora alens lag, cenrala gränsvärdessasen och enkla punkskaningar Syfe med den här laboraionen är a du skall bli mer förrogen med följande vikiga områden inom maemaisk saisik Sora alens lag Cenrala gränsvärdessasen Punkskaningar 1 Förberedelseuppgifer Som förberedelse ill laboraionen bör du läsa igenom kapiel 5, 6 och 11 sam hela laboraionshandledningen. Till laboraionens sar har du med dig lösningar ill förberedelseuppgiferna. a) Redogör för Sora alens lag. b) Redogör för Cenrala gränsvärdessasen. c) Lå X vara anal ögon vid e ärningskas med p X (k) = 1/6 för k = 1, 2, 3, 4, 5, 6. Vilken ungefärlig fördelning har summan av anale ögon vid n oberoende kas då n är sor? (Behövs i avsni 3. Cenrala gränsvärdessasen) d) Give daa x 1, x 2,..., x n som är oberoende och exponenialfördelade med vänevärde a, dvs med ähesfunkionen 1 1 a e x/a, x 0. Härled ML- och MK-skaningarna av a. (Behövs i avsni 4.1. ML- och MK-skaning) e) Anag a Z N (m, s). Vilken fördelning har R = A + Z då A är e reell al? f) Anag a f är rekangelfördelad på inervalle (0, 2p). Beräkna E(f). (Behövs i avsni 5. Överlagring av vågor med samma frekvens) g) Beräkna exaka värden på E(cos f) och E(sin f) då f har fördelning enlig föregående uppgif. (Behövs i avsni 5. Överlagring av vågor med samma frekvens) h) Anag a X och Y är oberoende med fördelningen N (0, s). Då kan man visa a Z = X 2 +Y 2 är Exp(1/2s 2 )-fördelad. Använd dea för a härleda fördelningen för R = Z. (Behövs i avsni 5. Överlagring av vågor med samma frekvens) i) Anag a x 1, x 2,..., x n är oberoende observaioner av en Rayleighfördelad s.v. med ähesfunkion f X (x) = x b 2 e x2 /2b 2 ; x 0. Härled ML-skaningen av b. (Behövs i avsni 5. Överlagring av vågor med samma frekvens) 1 I kursboken används parameern l, men här väljer vi a använda vänevärde (och sandardavvikelsen) a = 1/l.
2 Laboraion 3, Masa AK för CDI, HT10 2 Sora alens lag Sora alens lag säger a om X n är medelvärde av n likafördelade oberoende sokasiska variabler X 1,..., X n med ändlig varians, så gäller P( X n mx > e) 0 då n för varje e > 0, vilke också kan uryckas som a X n mx i sannolikhe. Enkel sag så kommer medelvärde av n variabler a avvika från vänevärde all mindre då n växer. E sä a illusrera dea är a kasa en ärning många gånger och se a de succesiva medelvärdena konvergerar mo vänevärde. Simulera förs 100 ärningskas. >> X=floor(6*rand(1,100)+1) Funkionen floor avrundar nedå. Tänk u a varje elemen i X verkligen har en fördelning som e ärningskas. E sä a räkna u de succesiva medelvärdena är följande. >> Xbar=cumsum(X)./(1:100) Funkionen cumsum ger en vekor där elemen i är summan av de i försa elemenen i inparameern, i vår fall X. Noaionen./ beyder elemenvis division och (1:100) är en vekor med alen 1 o m 100. Tänk u a Xbar innehåller de succesiva medelvärdena. Ploa dem. >> plo(xbar) Gör om allihop med fler kas, ex 1000 s. Ser all u som du väna dig? 3 Cenrala gränsvärdessasen Börja med a hia på en diskre sannolikhesfunkion med några möjliga ufall, ex den likformiga fördelningen över 1 o m 6, dvs e ärningskas. Maa sedan in denna sannolikhesfunkion i form av en vekor. >> p=[0 1 1 1 1 1 1]/6 Nollan finns där för a de blir läare a hålla reda på saker och ing om de försa elemene i vekorn är sannolikheen för a ufalle är noll. Välj gärna någon annan sannolikhesfunkion än ovansående förslag. Ria upp sannolikhesfunkionen med kommando bar. >> bar(0:lengh(p)-1,p) Funkionen lengh ger längden av en vekor. Som du ve kan sannolikhesfunkionen för en summa av vå oberoende diskrea sokasiska variabler beräknas genom en diskre falning, se formelsamlingen. I Malab finns en funkion, conv, som uför jus en sådan falning (falning heer convoluion på engelska). >> p2=conv(p,p) >> p4=conv(p2,p2) >> p8=conv(p4,p4) Här blir p8 allså sannolikhesfunkionen för en summa av åa sycken oberoende sokasiska variabler vardera med sannolikhesfunkionen p. Ria upp dessa nya sannolikhesfunkioner. När börjar de likna en normalfördelning? Räkna nu u vänevärde och sandardavvikelse för en sokasisk variabel med sannolikhesfunkionen p.
Laboraion 3, Masa AK för CDI, HT10 3 >> mu=sum((0:6).*p) >> sigma=sqr(sum(((0:6)-mu).^2.* p)) Funkionen sum ger summan av elemenen i en vekor, noaionen.^2 beyder elemenvis kvadrering av en vekor och sqr är kvadraroen. Vi kan nu jämföra sannolikhesfunkionen p4 med den approximaiva normalfördelning N (nm, ns) (där n = 4) som vi får ur cenrala gränsvärdessasen. >> bar(0:lengh(p4)-1,p4) >> hold on >> xx=0:0.5:30; >> plo(xx,normpdf(xx,4*mu,sqr(4)*sigma)) >> hold off Kommando hold on gör a de man ria ine as bor vid näsa ploning. Approximeras p4 väl av normalfördelningen? Pröva också vad som händer om p är en mycke sned fördelning, >> p= [.......] Hur många komponener behövs de nu i summan för a fördelningen väl ska kunna approximeras med en normalfördelning? 4 Punkskaningar 4.1 ML- och MK-skaning Vi skall i den här uppgifen ia lie närmare på vå av de vanligase skaningsmeoderna i saisiken, nämligen ML- och MK-skaning. Vi skall bl.a. se a ML-skaning är e maximeringsproblem medan MK-skaning kan ses som e minimeringsproblem. I filen madaa.da har vi 150 mäningar av livslängden (enhe: immar) av en viss komponen i en bil. Livslängden hos varje komponen anages vara oberoende av varandra. Ladda in daa och gör en försa undersökning av livslängderna. >> load madaa.da >> plo(madaa, * ) >> his(madaa) Vi är inresserade av a skaa vänevärde a för komponenen. En varian a göra dea på är a göra en ML-skaning av a. För a kunna göra en ML-skaning måse vi ha en uppfaning vilken fördelning daa har. Från liknande experimen som gjors idigare har de visa sig a fördelningen för livslängden hos en viss komponen är approximaiv exponenialfördelade (med parameer a enlig förberedelseuppgif 4). Allså, vi anar a livslängden är exponenialfördelad och säller upp log-likelihoodfunkionen. Hur ser den u? Svar: l(a) = ln L(a) =... De finns en m-fil, ML_exp, som beräknar l(a). Sudera m-filens Malabkommandon och förvissa dig om a den verkligen ger rä funkion! (ype ML_exp) Ria upp l(a), då 30 a 150. Hur ser funkionen u och vilke värde på a mosvarar MLskaningen? (Du kan zooma in på delar av figuren för a se ydligare.)
4 Laboraion 3, Masa AK för CDI, HT10 >> a=linspace(30, 150, 200); >> L = ML_exp(a,madaa); >> plo(a, L) >> grid Nu går vi över och iar på hur en MK-skaning av a ser u. Fördelen med MK jämför med ML är a fördelningen för daa ej behöver vara känd. Börja nu med a sälla upp förlusfunkionen, Q(a). Svar: Q(a) =... Programme MK_exp är skrive för a beräkna Q(a). Tia på Malabkommandona för a kolla a de sämmer! Ria u Q(a), vilke värde på a mosvarar MK-skaningen? >> Q = MK_exp(a, madaa); >> plo(a, Q) Både ML- och MK-skaningen av a är enkel a beräkna, se förberedelseuppgif 4). Beräkna aml och amk och jämför med dina figurer. 4.2 Skaningen a är en sokasisk variabel! Om vi skulle a 150 nya mäningar av livslängden hos ovansående komponener (dvs e ny sickprov) så skulle skaningen av a med säkerhe bli annorlunda, dvs skaningen kan ses som en sokasisk variabel. För a illusrera dea änker vi oss a vi ar 1000 sickprov med 150 mäningar i varje sickprov. Efersom vi ine har 1000 rikiga sickprov så får vi nöja oss med a simulera daa. Genom a unyja funkionen exprnd kan vi enkel generera exponenialfördelade slumpal. Vi säer själva de sanna vänevärde ill 100, dvs a = 100 >> help exprnd >> a = 100; >> x = exprnd(a, 150, 1000); Kolonn nummer i i marisen x mosvarar sickprov i. Nu skall vi skaa a för varje sickprov. De kan göras enkel enlig >> a_es = mean(x); Elemen i i vekorn a_es innehåller skaningen av a för sickprov i. Ploa a_es! Hur ser de u? Vilken ungefärlig fördelning har skaningen av a? Använd dig av kommandona his och normplo och dina nyförvärvade kunskaper om Sora alens lag och Cenrala gränsvärdessasen för a a reda på dea.
Laboraion 3, Masa AK för CDI, HT10 5 5 Rayleighfädande radiokanal En illämpning av cenrala gränsvärdessasen 5.1 Bakgrund och viss bakomliggande eori Vid digialransmission över en ransmissionskanal kodas 0:or och 1:or på olika sä. När man använder modulaionssyseme 2-PSK (Phase Shif Keying) kodas 0:a och 1:a förs ill en s.k. basbandssignal enlig följande. ( ) ( ) 0:a s() = A sin 2p = A sin 2p, [0, T b ), T b T ( ) b ( ) 1:a s() = A sin 2p + p = A sin 2p, [0, T b ), T b där A är ampliuden på basbandssignalen och T b är idsavsånde mellan sända biar (kallas biperioden nedan). Biperioden är kring 5 mikrosekunder för en GSM-elefon. Vågformerna moduleras sedan, mha ampliudmodulering i en s.k. modulaor, upp på bärvågsfrekvens och sänds från sändaren ill moagaren aningen via kabel eller via radio. På signalens väg mo moagaren kommer den föruom a dämpas även a söras av bl.a. addiiv brus. Som e av de försa blocken i moagaren sier en s.k. demodulaor som modulerar ner signaler från e snäv frekvensinervall run rä bärvågsfrekvens ill basbandsfrekvens och sedan lågpassfilrerar resulae. Då har i princip basbandssignalen ovan åerskapas. En modell för signalen efer demodulaorn a bli ( ) 0 sänd moagen signal r() = A r sin 2p + Y (), [0, T b ), T ( b ) 1 sänd moagen signal r() = A r sin 2p + p + Y (), [0, T b ), T b där Y () är en slumpmässig brussignal, en s.k. sokasisk process och där A r är ampliuden hos den åerskapade basbandssignalen. I moagaren, efer demodulaorn, sier en deekor som vid idpunken T b ar beslu om de var en 0:a eller 1:a som säns. För a kunna göra de har deekorn via en känd essignalsekvens synkronisera sig med avseende på biperiodernas idslägen, en s.k. koheren deekor. Man kan visa se kurser i Sokasiska processer och Digial ransmissionseori a beslussignalen i den opimala deekorn (dvs den deekor som minimerar P(felakig beslu)) vid idpunk T b är B(T b ) = A r + Z, om 0 sänd, B(T b ) = A r + Z, om 1 sänd, där bruse Z kan anas vara normalfördela Z N (0, s) efersom de beror på den slumpmässiga brussignalen under hela biperioden och hur den agi sig in i beslussignalen. Noera a B(T b ) N (A r, s) om 0:a sänd och B(T b ) N ( A r, s) om 1:a sänd, se förberedelseuppgif 5). Om B(T b ) > 0 besluas a 0:a sänd och om B(T b ) < 0 besluas a 1:a sänd. Som man försår så kan bruse göra så a felakig beslu as. Varför?... Hjälper de a skruva upp försärkningen på demodulaorns ugång så a A r blir sörre?... Är de någo anna som också blir proporionell sörre?... Genom a välja A i förhållande ill dämpningen i kabeln respekive radioförbindelsen så kan man se ill a A r s så a sannolikheen för felbeslu minimeras. Tyvärr beyder en sor ampliud mycke signalenergi så därför måse man i verkligheen göra en kompromiss mellan signalenergi T b
6 Laboraion 3, Masa AK för CDI, HT10 och sannolikheen för felakig beslu. Vid goda överföringsförhållanden kan man dock passa på a s.k. adapiv minska signalenergin men ändå bibehålla en låg s.k. bifelshal. I en radiokanal får man uöver dämpning p.g.a. långa sräckor eller hinder även dämpning av den moagna signalen p.g.a s.k. flervägsubredning, även kallad snabb fädning (fading på engelska). På vägen från radiosändaren ill radiomoagaren kommer radiosignalerna a a olika långa vägar genom lufen (en viss del av signalen kommer a a raka vägen från sändaren ill moagaren, medan andra kommer a sudsa mo marken och byggnader ec.) och anlända vid moagaren med olika faslägen. Därför kommer de flervägsubredda radiosignalerna a inerferera med varandra vid moagaranennen. Flervägsubredningsförhållandena kan ändras under en biperiod, om moagare och sändare rör sig snabb i förhållande ill varandra eller om reflekerande föremål av beydelse rör sig snabb,.ex. lågflygande flygplan, vingar hos vindkrafverk, passerande bilar. Dea borser vi dock från i eorin nedan. Om bärvågens frekvens är ca 1 GHz så kommer en biperiod på ca 5 mikrosekunder a omfaa ca fem usen perioder hos bärvågen. De skillnader i gångid som uppsår mellan de flervägsubredda radiosignalerna kan därför vara så sora a de ger inerferensfenomen på bärvågsfrekvensen uan a de behöver vara så sora a signaler usända under en biperiod nämnvär påverkar den moagna signalen under näsa biperiod. Sådana skillander i gångid och mosvarande fasläge hos e sor anal adderade vågor och hur deras resulerande ampliud blir skall vi nu sudera i näsa avsni. 5.2 Överlagring av vågor med samma frekvens - En illämpning av cenrala gränsvärdessasen Anag a vi adderar e sor anal vågor,.ex. ljus eller ljudvågor, som alla har samma ampliud, A och frekvens f, men där faserna kan vara olika, S N () = A sin(2pf + fk), där fk är oberoende rekangelfördelade sokasiska variabler på inervalle 0 ill 2p. Om vi använder addiionsreglerna för rigonomeriska funkioner får vi S N () = A cos fk sin(2pf) + A sin fk cos(2pf) = = A sin(2pf) cos fk + A cos(2pf) sin fk. I förberedelseuppgiferna har du visa a E(cos fk) = E(sin fk) = 0. Vidare gäller de a E(cos 2 fk) = 2p cos 2 1 fk 0 2p d fk = 1 2, V (cos fk) = E(cos 2 fk) (E(cos fk)) 2 = 1 2. På samma sä följer a V (sin fk) = 1 2. Efersom vi har överlagra e sor anal vågor kan vi unyja Cenrala Gränsvärdessasen som ger a summorna ovan är approximaiv normalfördelade X N = A Y N = A N cos fk N (0, A 2 ), N sin fk N (0, A 2 ).
Laboraion 3, Masa AK för CDI, HT10 7 Vidare gäller de a C( N i=1 cos f i, N j=1 sin f j) = 0. A kovariansen verkligen blir 0 kan man överyga sig om genom följande beräkning C( cos fi, sin fj) = i=1 j=1 = C(cos fi, sin fj) = i=1 j=1 E(cos fj sin fj) = 0, j=1 C(cos fj, sin fj) = j=1 efersom E(cos fj sin fj) = 2p 0 cos fj sin fj 1 d 2p f j = 2p 1 0 2 sin 2f j 1 d 2p f j = 0. Noera a C(cos fi, sin fj) = 0 då i j, efersom fasvinklarna är en följd av oberoende sokasiska variabler. (Dubbelsumman ovan kan allså reduceras ill en enkel summa.) Då summorna är approximaiv normalfördelade med kovariansen 0, kan vi ana a de också är oberoende. Nu följer de a S N () = X N sin(2pf) + Y N cos(2pf) = XN 2 + Y N 2 cos(2pf + y) = A N cos(2pf + y), där A N = X 2 N + Y 2 N, cos y = sin y = Y N X 2 N + Y 2 N X N, X 2 N + Y 2 N. Nu är X N och Y N approximaiv normalfördelade och oberoende. Enlig förberedelseuppgiferna gäller de a A N = XN 2 + Y N 2 är Rayleighfördelad med ähesfunkionen f AN (x) = x x2 e 2b b2 2, där b 2 = A 2 N 2. Vi ser här a signalampliuden (A N ), som mosvarar A r i radiofalle i förra sycke, kan bli väldig lien vid olyckliga omsändigheer vilke gör a sannolikheen för felakig beslu kan bli mycke sor. För a komma run sådana problem blir man vungen a använda sig av någon yp av felkorrigerande kod som klarar av a räa ill ensaka felakiga beslu. Vi skall ine diskuera kodningseori mer här, uan vi hänvisar den inresserade ill kurser i Radiosysem och Radioeknik, Digial ransmissionseori, Informaionseori och Kodningseknik.
8 Laboraion 3, Masa AK för CDI, HT10 5.3 Uppgif På insiuionen för illämpad elekroeknik har de gjors flera mäningar på flervägsubredning. Den mäning som vi skall ia på har gjors enlig följande. En lång känd essekvens har sänds från en radiosändare (bärvågsfrekvens 1800 MHz). Man har sedan gå omkring med en mobil moagare och mä upp moagen signalsyrka i mobilen (enhe: db). Avsånde mellan sändare och moagare har vari ungefär konsan så a moagen signalsyrka skulle vari konsan om ine flervägsubredningen funnis. Vidare har den usända signaleffeken vari sor så a bruse Z kan försummas, dvs variaionen i moagen signalsyrka beror bara på flervägsubredningen. I filen fading finns de daa du skall ia på. Endas ampliuden visas, dvs vi är ine inresserad om de är 0 (+R) eller 1 ( R) som är sänd uan bara ampliuden R. Efersom mäningarna har enheen db (sandard inom radiovärlden) så får vi ransformera dem ill linjär skala innan vi kan undersöka fördelningen för moagen signalsyrka. >> load fading >> fading=10.^(fading/10); >> plo(fading) Ploa hisogramme (kom ihåg a normera så a hisogramme kan jämföras med eoreisk ähesfunkion vars area under funkionen är 1) och jämför med olika Rayleighfördelningar. Funkionen raylpdf ger dig ähesfunkionen för en Rayleighfördelning >> help raylpdf >> x=[0:.1:4]; >> b=1; >> f=raylpdf(x,b); >> [n,x]=his(fading,x); >> f_es=n/(lengh(fading)*.1); >> plo(x,f,x,f_es, * ); >> b=... >> f=raylpdf(x,b);... Vilken Rayleighfördelning ser u a passa bäs? I sälle för a lea sig fram bland lämpliga värden på b bör man man i sälle göra en ML-skaning av b. Besäm denna (se förberedelseuppgif 4)). Ser de u som om moagen signalsyrka är Rayleighfördelad, dvs är de rimlig a använda denna modell som är baserad på cenrala gränsvärdessasen?