Några grundläggande begrepp och termer i statistikteorin

Relevanta dokument
Några grundläggande begrepp och termer i statistikteorin

Grundläggande matematisk statistik

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Föreläsning G04: Surveymetodik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Föreläsning G70 Statistik A

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Borel-Cantellis sats och stora talens lag

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

F10 ESTIMATION (NCT )

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

θx θ 1 om 0 x 1 f(x) = 0 annars

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

1. Test av anpassning.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Föreläsning 2: Punktskattningar

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Introduktion till statistik för statsvetare

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

4.2.3 Normalfördelningen

Datorövning 2 Fördelningar inom säkerhetsanalys

Datorövning 2 Fördelningar inom säkerhetsanalys

Statistik för ingenjörer 1MS008

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

S0005M V18, Föreläsning 10

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

a) Beräkna E (W ). (2 p)

2. Konfidensintervall för skillnaden mellan två proportioner.

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Lösningar och kommentarer till uppgifter i 1.1

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Tentamen i Sannolikhetsteori III 13 januari 2000

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Formelblad Sannolikhetsteori 1

TMS136: Dataanalys och statistik Tentamen med lösningar

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Stokastiska variabler

Genomsnittligt sökdjup i binära sökträd

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Matematisk statistik TMS063 Tentamen

TENTAMEN I MATEMATISK STATISTIK

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Tentamen i Matematisk statistik för V2 den 28 maj 2010

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

b 1 och har för olika värden på den reella konstanten a.

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

================================================

Avd. Matematisk statistik

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Id: statistik.tex :48:29Z joa

101. och sista termen 1

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Tentamen 19 mars, 8:00 12:00, Q22, Q26

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Handbok i materialstyrning - Del F Prognostisering

1. BERÄKNING AV GRÄNSVÄRDEN ( då x 0 ) MED HJÄLP AV MACLAURINUTVECKLING. n x

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

1. Hur gammalt är ditt barn?

Tolkning av sannolikhet. Statistikens grunder, 15p dagtid. Lite mängdlära. Lite mängdlära, forts. Frekventistisk n A /n P(A) då n

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Tentamen Metod C vid Uppsala universitet, , kl

Kompletterande kurslitteratur om serier

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

RESTARITMETIKER. Avsnitt 4. När man adderar eller multiplicerar två tal som t ex

Tentamen i matematisk statistik

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Föreläsning G70 Statistik A

= (1 1) + (1 1) + (1 1) +... = = 0

Transkript:

Matematisk statistik för STS vt 004 004-05 - 03 Begt Rosé Några grudläggade begrepp och termer i statistikteori Om matematisk statistik Som tidigare ämts brukar matematisk statistik delas upp i huvudområdea saolikhetsteori och statistikteori, det seare ofta också kallat statistisk iferesteori. Eftersom de två områdea igår i samma äme bör de ha ära relatio till varadra, och det har de också. Saolikhetsteori Saolikhetsteori är lära om hur "slumpe slår". Äve om slumpe står för det "tillfälliga", det "e förutsägbara", föler de vissa bestämda lagar som bl.a. beskriver att, och hur, slumpvariatioer ämar ut sig i "låga loppet". Exempel på sådaa lagar är de stora tales lag och cetrala gräsvärdessatse. Statistik och statistikteori I vardagsspråket står "statistik" för att ma samlar i data och seda sammaställer dem, geom att beräka atal, medelvärde, mediaer, stadardavvikelser, o. dyl. Såda dataisamlig görs valige i syfte att via kuskap om "verklighete". Frå data / observatioera vill ma kua dra slutsatser om verklighete. Med fiare ord vill ma göra iferes frå observatioer till "verklighet". Om slumpe varit med och "stört" isamlade data, vilket de ofta varit, är det dock lätt att bli vilseledd av slumpe i slutsatssteget. För att udvika det räcker det valige ite med att "käa / tycka sig fram". Ma måste kua "räka sig fram", och det ger statistikteori metoder för. De är förvisso litet krågliga, såväl begreppsmässigt som tekiskt, me uta dem är det stor risk att hama sett i slutsatsera. Huvuduppgifte för (de statistiska) iferesteori ka formuleras så här : Statistikteori / iferesteori tillhadahåller förfarade för att dra slutsatser frå slumpstörda data uta att bli vilseledd av slumpes spel. () Det är väl mer eller midre sälvklart att sådaa förfarade baseras på saolikhetsteoretiska övervägade. Några ord om slumpstörda data Slumpstörda data förekommer ymigt i praktike. Neda ages ågra huvudtyper av situatioer där slumpe fis med i bilde. Slumpmässiga mätfel Vid så gott som alla slags mätigar (fysikaliska, kemiska, biologiska, mm.) råkar ma oftast ut för fölade. Vid upprepad mätig av, som ma tycker i alla fall, precis samma sak på precis samma sätt, får ma ite precis samma resultat. Då "skyller" ma på slumpe, och talar om slumpmässiga mätfel. E syoym är (slumpmässigt) brus. Iheret slumpvariatio Exempel : Ma sätter 0 likadaa rädisfrö i ett lad. Efter viss tid skördas rädisora. De vägs (på e mycket precis våg), och kostateras väga åtskilligt olika. Exempel : Ma sätter ya glödlampor av samma märke att lysa, och oterar hur läge de brier ia de går söder. Ma kostaterar att lamporas livslägder varierar åtskilligt.

För de typ av variatio som föreligger i exemple ova har ma ofta ige bättre förklarig ä att de beror på "tillfälligheter", eller syoymt på "slumpe". Trots att fröa och lampora ser likadaa ut leder de ite till samma mätvärdr. I frösammahaget talar ma om biologisk slumpvariatio. E mer allmä term är iheret slumpvariatio, varmed avses ågotig i fölade stil : "Trots till syes lika utgågsförhållade får olika eheter olika mätvärde". Slumpmässiga urval När ma är itresserad av förhållade i e populatio (t.ex. alla hushåll i ladet) brukar det bli för dyrt och tidskrävade att göra e totaludersökig. Valigt är, äve är itresset gäller hela populatioe, att ma öer sig med att observera ett urval av populatioes eheter. Valigt är också, och det fis goda skäl för det, att ma låter slumpe vara med och dra urvalet, att ett slumpmurval udersöks. 3 Populatio och stickprov Två för fortsättige grudläggade termer och begrepp är populatio och stickprov. Dessa aväds, på gott och ot, med litet skiftade iebörder, dels e vardagsspråklig dels e mer mer tekisk iebörd. Slumpmässigt stickprov i vardagsspråklig meig De vardagsspråkliga iebörde av "populatio" brukar i statistikteori åberopas med de mer fullstädiga terme ädlig populatio. Med e såda avses e specificerad uppsättig eheter (elemet och obekt är syoymer som förekommer) av type : Alla sågverksföretag i Sverige per 003 - - 3. () Ofta är det av itresse att skaffa iformatio om e eller flera aspekter på förhålladea i e såda populatio, iformatio som avser eheteras värde för e eller flera variabler. Exempel 4: För populatioe () ka det t.ex. vara av itresse att få veta värdea på variablera "atal aställda 003 - - 3" och "beskattigsbar vist för år 003", t.ex. för att kua beräka geomsittlig vist per aställd. (3) E mölighet är då att totaludersöka populatioe, dvs. att samla i värdea på variablera av itresse för samtliga populatioseheter. E aa mölighet är att observera variabelvärdea för bara ett slumpurval av populatioes eheter. Ma talar då om att ma observerar ett slumpmässigt stickprov frå populatioe. Slumpmässigt stickprov = utfall av oberoede likafördelade stokastiska variabler Nyssämda iebörd av "slumpmässigt stickprov" är (väl?) vad vardagsspråket får e att täka på. I Bloms bok, och därmed i de här kurse, aväds terme för det mesta med e aa, och mer tekisk iebörd. Då hadlar det, åtmistoe i eklaste versioe, om mätvärde som framkommit uder tillsyes lika förutsättigar, me ädå blir olika på grud av slumpmässiga mätfel och / eller iheret slumpvariatio. Det är då aturligt att betrakta observatioera som utfall av oberoede, likafördelade stokastiska variabler. Äve i de slags situatioer sägs mätvärdea utgöra ett "slumpmässigt stickprov". Neda ges Bloms defiitio, på sida. (Sidrefereser går fortsättigsvis till Blom B.) DEFINITION : Ett slumpmässigt stickprov x, x,..., x frå (saolikhets)fördelig e F utgörs av utfallet av oberoede stokastiska variabler X, X,.., X, vilka alla har fördelige F. (4) Kommetar : De gemesamma fördelige F i ovaståede defiitio kallas ofta för de populatio som observatioera kommer frå. Ma säger : X, X..., X är ett slumpmässigt stickprov frå populatioe F. (5)

Iblad sägs F utgöra e oädlig populatio (till skillad frå e "ädlig populatio"). Kokretiserade bakgrud för de termiologi ges eda. Ett slumpmässigt stickprov om 0 mätfelsstörda observatioer uppfattas som ett "utplock" av 0 värde ur e täkt oädlig föld av upprepade mätigar. Fördeligsfutioe F uppfattas som ett "idealt" (kumulativt) histogram för de oädliga mätserie. (Blom sida 5). Kommetar : På sida i Blom ges e utvidgad defiitio av slumpmässigt stickprov. Där släpps förutsättige om att ett stickprov är utfallet av likafördelade s.v. X, X..., X står då för oberoede observatioer som ka ha olika fördeligar F, F..., F. Kommetar 3 : Terme "slumpmässigt stickprov" aväds alltså med två ågot olika iebörder, dels för ett utfall av oberoede s.v., dels för variabelvärdea för ehetera i ett slumpurval frå e ädlig populatio. Skillade mella de två begreppe består framför allt i fölade. När ma frå e ädlig populatio drar ett slumpurval uta återläggig (vilket ma ormalt gör), blir observerade värde ite oberoede av varadra (i saolikhetsteoretisk meig). För ett slumpmässigt stickprov eligt (4) är, som vi kommer att se, förutsättige om observatioeras oberoede e vital del av defiitioe. Dock, om de ädliga populatioe är "stor" i förhållade till urvalet är skillade försumbar, vilket vi kommer att tala mer om lägre fram. Relatio mella saolikhetsteori och iferesteori Skillade mella saolikhetsteori och statistikteori ka formuleras på fölade sätt. Vid e saolikhetsteoretisk problemställig förutsätts att populatioe är käd, dvs. att fördelige F (eller alla variabelvärde i e ädlig populatio) är käd. Givet detta vill ma beräka saolikhete för att stickprovsutfallet x, x,..., x satisfierar ågot givet villkor. (6) Vid e iferesteoretisk problemställig är det stickprovstfallet x, x,..., x som är kät, meda populatioe är mer eller midre okäd. Det ma vill, är att utifrå observatioera uttala sig om förhållade i populatioe. (7) 4 Statistisk modell Att de populatio F som geererat observatioera är mer eller midre okäd iebär att flera fördeligar F betraktas som täkbara "saa" fördeligar, att e hel famil av möliga "saa" fördeligar föreligger. Vid formaliserad beskrivig av situatioe är e ytterlighetsvariat att ma ite aser sig kua säga mer om fördelige F ä att de är e av "världes alla saolikhetsfördeligar". Ofta är dock förhålladet att ma, äve om ma ite vet allt om F, vet e hel del (eller åtmistoe atar sig veta). Specifikatio av sådat vetade / atagade kallas de statistiska modell som iferese baseras på. De statistiska modelle ager ramar för hur slumpe kom i är observatioera geererades. Exempel 5 : E valig typ av statistisk modell iebär bl.a. att ma käer forme på fördelige F. Ett exempel är att F är e ormalfördelig med käd stadardavvikelse σ =, me med okät positivt medelvärde m. Då är de statistiska modelle att famile av möliga fördeligar utgörs av {F N(m, ), 0 < m < }. Famile ifråga illustreras grafiskt eda. Statistik modell = famil av möliga fördeligar / populatioer : 3

Helt allmät gäller att statistisk iferes måste baseras på ågo modell / premiss. Ju mer detalerad modell ma aser sig kua age, desto säkrare slutsatser ka ma dra, vilket vi kommer att se måga exempel på. Me u mer detalerad modell ma aväder, desto större blir aturligtvis riske för felaktig modellspecifikatio (att modelle är "icke realistisk"). Kommetar 4 : De skillad mella statistikteori och saolikhetsteori som pekas på i (6) och (7) iebär ite att de är åtskilda disciplier. Tvärtom, för att kua dra föruftiga slutsatser om e okäd fördelig F gäller det, åtmistoe i pricip, att kua räka på hur stickprovet X, X..., X skulle uppföra sig för var och e av de möliga fördeligara F, dvs. att utföra saolikhetsteoretiska beräkigar. E sesmoral frå detta är att ma måste vara hyggligt varm i klädera ifråga om saolikhetsteori är ma skall lära sig statistikteori. Kommetar 5 : I (4) beteckas stickprovet med versaler X, X,..., X, vilket idikerar att de betraktas som stokastiska variabler. Små bokstäver x, x,.., x aväds också, t.ex. i (4). Beteckigsskillade aväds för att göra distiktio mella observatioera / mätvärdea ia de ihämtas respektive de (tal)värde som faktiskt erhölls som observatioer. Med saolikhetsteoris språkbruk står x, x,..., x för utfalle / realiserigara av de s.v. X, X,..., X. Som vi kommer att se är detta e viktig distiktio. Iblad vill ma resoera på de ea sida ("före observatio"), och iblad på de adra ("efter observatio"). [Ekoomer brukar göra distiktioe geom att säga att X, X,..., X står för observatioera ex ate ( = före) och x, x,..., x för observatioera ex post ( = efter)]. Blom reserverar "stickprov" förhålladevis strikt för utfallet x, x,..., x. I det avseedet kommer vi att vara litet mer lättsiiga, och kalla såväl X, X,..., X som x, x,..., x för stickprov. Parametrar i aslutig till e famil av möliga populatioer De aspekt på (de okäda) fördelige F som ma är itresserad av brukar kallas för e parameter. Som allmä bokstav för e såda aväds företrädesvis θ (= grekiskas "täta"). Ofta är θ "edimesioell", dvs. ett tal, me ka också vara två (eller mer) - dimesioell. I och med att vi laborerar med e hel famil av möliga fördeligar F, blir det också fråga om e famil av möliga värde för e parameter θ. Totalitete av möliga parametervärde kallas parameter - rummet, och beteckas i det allmäa fallet med A (θ A). Kommetar 6 : För de två begreppe "mölig fördelig F" och "parameter θ" föreligger ofta ett "höa - ägg - förhållade". (Vem kommer före de adra?) Iblad är det aturligt att uppfatta parameter θ som de primära storhete, som i si tur bestämmer fördelige F. (T.ex. i situatioer där θ har e kokret, t.ex. fysikalisk, tolkig, och slumpe kommer i via mätfel.) I adra fall är det aturligt att uppfatta fördelige F som det primära, som i si tur bestämmer parameter. (T.ex. om θ står för vätevärdet i fördelige F.) Här får ma laga efter läge. 4

5 Huvudtema iom de statistiska iferesteori Teori för statistisk iferes rymmer särskilt fölade tre huvudtema. Skattig (Itroduceras i Blom Kap 0. Där prefereras terme puktskattig.) Osäkerhetsgräser (Itroduceras i Blom Kap. Där kallat itervallskattig.) Hypotesprövig (Itroduceras i Blom Kap.) Neda kokretiseras med ett exempel. Exempel 6 : Ett företag tar emot ett parti om 000 kompoeter (av samma slag) frå e uderleveratör. Eligt giva regler ka e kompoet klassas som "felfri" eller "felaktig". Låt p = adele felaktiga kompoeter i hela partiet (dess felkvot). (8) I e första omgåg öer ma sig med att göra e stickprovskotroll av partiet. Ma väler på måfå ut 50 kompoeter, som ispekteras. Det visar sig att 3 är defekta. Vad ka sägas om p? Ma ka u alltid gissa, och e högst aturlig gissig är (väl?) att p har värdet : p* = 3 / 50 = 6 %. Med statistikteoretisk termiologi sägs att partiets felkvot (pukt) skattas till 6 %. Äve om ma tror att 6 % är e bra skattig, tror ma ite att ma hamat mitt i prick. Skattige 6 % är föread med viss osäkerhet. Det är öskvärt att kua age gräser för osäkerhete. Med hälp av förfarade som behadlas lägre fram ka ma komma till fölade typ av utsaga : Det är så gott som säkert att felkvote ligger i itervallet.5 % p 0.5 %. (9) Det fis olika sätt att uttrycka iehållet i (9) på. Ett är att säga att [.5 %, 0.5 %] är ett osäkerhetsitervall för p, eller att.5 % och 0.5 % ger osäkerhetsgräser för p. Ett aat, och det aväds företrädesvis i Blom, är att säga att [.5 %, 0.5 %] ger e itervallskattig av p. Ett trede sätt är att säga att [.5 %, 0.5 %] är ett kofidesitervall för p. Mer om det lägre fram. Atag att kotraktet mella företaget och uderleveratöre stipulerar att fullvärdiga partier får ha e felkvot om högst %. Ger ispektiosresultatet uderlag för att "kräva böter" av uderleveratöre? Vi fördupar oss ite i fråga, uta öer oss med att otera de ka formuleras som att det hadlar om pröva hypotese att felkvote är högst %. Läsavisigar till Bloms Kapitel 8 och 9 Som framgår av kapitelrubrikera är temat i de två kapitle "beskrivade statistik". Det ligger på gräse till gymasiestoff, och lämas i stort sett helt till sälvläsig. Neda listas begrepp som bör käas till. Sidhävisigara går som valigt till Blom B. Ogrupperade data, grupperade data, klassidelade data (sidor 8-30). Absoluta och relativa frekveser, kumulativa relativa frekveser (sida 9). Stolpdiagram och kumulativt stolpdiagram (sida 9). Histogram och kumulativt histogram (sida 3). När ett datamaterial x, x,..., x (dvs. e uppsättig tal) ordas i stigade storleksordig med mista värdet först osv., fås det ordade stickprovet som beteckas x (), x (),.., x () (sida 33). Ytterligare beteckigar är : x mi = x (), x max = x (). För ett tal p mella 0 och defiieras p - percetile, beteckad x p, som x p = x ([p ]+), där [ ] står för heltalsdel (sida 35). x p är, åtmistoe i stort sett, det värde i talmaterialet för vilket adele p av värdea är midre ä x p och adele - p är större. (Am. De precisa defiitioe av percetil ka skila ågot frå e statistikbok till e aa, me kommer ite att spela ågo roll i fortsättige.) Percetilera svarade till p = 5 %, 50 % och 75 %, dvs. x 0.5, x 0.5 och x 0.75, kallas också första kvartile, mediae respektive trede kvartile. Puktdiagram (sida 34). Lådagram (sidor 8 och 35), 5

Det valigaste lägesmåttet (syoym ivåmåttet) för ett talmaterial x, x,..., x är det (aritmetiska) medelvärdet, beteckat. x. Ett alterativt läges / ivåmått är mediae. Medelvärdet är x = (x + x +... x ) /. + Det valigaste spridigsmåttet (syoymt variabilitetsmåttet) är stadardavvikelse, beteckad s, vilke erhålls som kvadratrote ur variase, beteckad s ; s = = (x x ) s = s. (0) För kvadratsumma i (0) iför Blom åtmistoe två specialbeteckigar, ämlige Q (sida 35) och S xx (sida 44). Se äve Formel - och Tabellsamliges Avsitt.. xx = Q = (x x) = S, vilket ger s = Q / ( - ) = S xx / ( - ). () Neda ages ett par räkeregler för kvadratsumma Q. De mellersta återfis på sida 35 (och fis äve i FT - samlige), meda de högra (kostigt og) ite fis utskrive ågostas i Blom. Q = (x x ) = x ( x ) = x x. () = = = Det som står om regressio i Kapitel 9 ka hoppas över. Temat återkommer i Kapitel 3, som vi kommer att behadla rätt oga. Begrepp som bör käas till är tvådimesioellt puktdiagram, syoymt spridigsdiagram (sida 4), kovarias, beteckad c xy (sida 47) och korrelatioskoefficiet, beteckad r (sida 47), för ett tvådimesioellt datamaterial. = xy = Sxy /( ) där Sxy = (x x) (y y) = c. (3) r = c /(s s ) där s x och s y står för stadardavvikelse för x - resp. y - värdea. (4) xy x y Korrelatioskoefficiete r är ett mått på hur starkt x - och y - värdea samvarierar (liärt) med varadra. E såda atar ett värde mella - och +. Ytterlighetsvärdea - och + erhålls är x - och y - värdea ligger lägs e rät lie med egativ resp. positiv lutig. Värdet r = 0 återspeglar att det ite föreligger ågot sambad / beroede mella x - och y - värdea (sida 67.) Storhete S xy i (3), som kallas produktsumma krig de aritmetiska medelvärdea, behadlas på sidora 44 och 45. Där pekas också på (åtmistoe de mellersta av) fölade räkeregler (vilke också fis i Avsitt.3 i FT - samlige) ; S = xy x y ( x ) ( y ) = x y x y. (5) = Bevis av () : = = = Q = (x x ) = ( x x x + x = x x x + x = = = = ) = = x. Formlera i (5) ka härledas aalogt. x ( x) + x = x x = x ( x ) = = = = 6