Stockholms universitet September 2011
Balanseringspunkt Låt oss betrakta mätserie 4 för vilken vi antar att mätdata är längder hos rekryter. En strukturell kunskap om dessa längder är av betydelse vid tillverkning av tex uniformer. Men samma problem har klädkedjor som H&M, Zara mfl Vi har nu angett vad som skall mätas dvs vår slumpvariabel är X = längden hos en rekryt Ett mått av intresse för dessa längder är den genomsnittliga längden. Ordet genomsnittligt är mycket vagt och kan ges många tolkningar. Vi skall först använda ordet i betydelsen balanseringspunkt. Låt oss se hur detta mått kan beräknas.
Balanseringspunkt (forts) Med balanseringspunkten för två lika vikter, v, på avstånden x 1 och x 2 avses det tal x 2 som är sådant att v (x 1 x 2 ) = v ( x 2 x 2 ) Denna jämviktsekvation har lösningen x 2 = x 1 + x 2 2 Vad blir balanseringspunkten för tre lika vikter, v, på avstånden x 1, x 2 och x 3? För de två första talen finner vi x 2 och balanseringspunkten mellan detta tal, som nu har vikten 2v, och x 3 blir på samma sätt som ovan 2v ( x 2 x 3 ) = v ( x 3 x 3 )
Balanseringspunkt (forts) Denna andra jämviktsekvation har lösningen x 3 = x 1 + x 2 + x 3 3 För fyra tal finner vi analogt (beräkningarna överlåts till läsaren) x 4 = x 1 + x 2 + x 3 + x 4 4 och för våra 20 längdmätningar erhålls balanseringspunkten x 20 = x 1 + x 2 + x 19 + x 20 20 = 1 20 (x 1 + x 2 + x 19 + x 20 ) = 1 20 20 x i = 843 i=1 5 = 168.6
Balanseringspunkt (forts) När vi har många mätningar kommer vi ofta få dubletter, tripletter, osv. Låt oss därför antaga att vi fick n 1 stycken x 1, n 2 stycken x 2,..., n k stycken x k (bland de 20 hittar vi två stycken 154, två stycken 159 och två stycken 170. Resterande längder finns det bara en av). Vi kan nu skriva, n = n 1 + n 2 + + n k, x n = 1 n n i=1 x i = 1 n k n j x j = j=1 k n j j=1 n x j Inför nu beteckningen ˆp j = n j n där vi kallar ˆp j för normerad pinne. För normerade pinnar gäller k k n j ˆp j = j=1 j=1 n = k j=1 n j n = 1
Balanseringspunkt (forts) Allmänt kan vi skriva balanseringspunkten på formen x n = 1 n n x i = i=1 k ˆp j x j = j=1 k x j ˆp j j=1 Den allmänna balanseringspunkten känner vi även igen som det aritmetiska medelvärdet.
Spridning I nedanstående figur ser vi dels två lika stora pinnar nära varandra och dels samma pinnar långt ifrån varandra. x 1 = 1 x 2 = +1 x 1 = 100 x 2 = +100
Spridning (forts) Ett mått som mäter detta intryck är spridningen (variansen). För de två figurerna definieras denna av ˆσ 2 1 = 2 (x 1j x 1 ) 2 ˆp j respektive ˆσ 2 2 2 = (x 2j x 2 ) 2 ˆp j. j=1 j=1 Spridningen i dessa två fall blir ˆσ 2 1 = ˆσ 2 2 = 2 (x 1j x) 2 1 j=1 2 = ( 1)2 + (1) 2 2 = 1 2 (x 2j x) 2 1 j=1 2 = ( 100)2 + (100) 2 2 = 10 000 Här har vi antagit att pinnarna har storlek 1 2 detta följer av att de är lika och skall summeras till 1.
Spridning (forts) Allmänt definerar vi spridningen som ˆσ 2 = 1 n n (x i x) 2 k = (x j x) 2 ˆp j. i=1 j=1 För att få samma sort som för medelvärdet brukar man dra roten ur variansen och får då standardavvikelsen, ˆσ. För vår mätserie 4 finner vi ˆσ 2 = 68.0 ˆσ = 8.2
Ordna mätserien i växande storleksordning. Det värde som hamnar i mitten kallas median. en är en annan kandidat för ett genomsnittligt värde. Vad gör vi om det inte finns ett entydigt mittersta tal? Vi tar det aritmetiska medelvärdet av de två mittersta! För vår mätserie 4 har vi 20 mätningar och således blir medianen det aritmetiska medlevärdet av de två mittersta. Vi har ˆm = 169 + 170 2 = 169.5
(forts) Allmänt har vi en mätserie x 1, x 2,..., x n och arbetsgången blir 1 ordna i växande storleksordning och beteckna den ordnade mätserien x (1), x (2),..., x (n) och för denna gäller x (1) x (2) x (n). 2 bestäm medianen som x (k) n = 2k + 1 m = x (k) + x (k+1) 2 n = 2k
Första och tredje kvartilen en till den första hälften av den sorterade mätserien kallas den första kvartilen, Q 1. en till den andra hälften av den sorterade mätserien kallas den tredje kvartilen, Q 3. Med andra kvartilen, Q 2, menar vi medianen. För vår mätserie 4 erhålls Q 1 = 163, Q 3 = 174.5
Kvartilavstånd och räckvidd Vi kan nu definiera ett par enkla spridningsmått Med kvartilavståndet IQR avses skillnaden mellan tredje och första kvartilen IQR = Q 3 Q 1 Med räckvidden (range) avses skillnaden mellan största och minsta värdet R = x (n) x (1) För vår mätserie 4 finner vi IQR = 174.5 163 = 11.5 R = 184 154 = 30
Skevhet Begreppet skevhet introduceras enklast med hjälp av figurer y y 1 3 1 2 9 y x 1 3 3 4 5 x 1 3 1 29 x Här är figur a) skev åt höger, b) symmetrisk och c) skev åt vänster.
Skevhet (forts) Hur skapa ett mått för skevhet? Betraktar avståndet till medelvärdet och ta detta höjt till 3. Beräkna talet 3 j=1 (x j x) 3 ˆp j för de tre olika figurerna. Vi finner med x = 4 1 (1 4) 3 1 3 + (2 4)3 1 3 + (9 4)3 1 3 = 30, 2 (3 4) 3 1 3 + (4 4)3 1 3 + (5 4)3 1 3 = 0, 3 (1 6) 3 1 3 + (8 6)3 1 3 + (9 6)3 1 3 = 30. En dimensionslös skevhet definieras av ˆγ 1 = k j=1 (x j x) 3 ˆp j ˆσ 3 = 1 n n i=1 (x i x) 3 ˆσ 3 Framgent avses denna storhet när vi skriver ˆγ 1.
Toppighet Begreppet toppighet introduceras även det enklast med figurer 1 3 6 8 1 8 y y 1 2 3 1 2 3 x x 2 4 1 4 y y 2/5 1/5 1 2 3 1 2 3 Figur a) är spetsigare än b) som är spetsigare än c) som är spetsigare än d). x x
Toppighet (forts) Hur skapa ett mått för toppighet? Betraktar avståndet till medelvärdet och ta detta höjt till 4. Beräkna talet 3 j=1 (x j x) 4 ˆp j för de fyra olika figurerna. Vi finner med x = 2 1 (1 2) 4 1 8 + (2 2)4 6 8 + (3 2)4 1 8 = 0.25, 2 (1 2) 4 1 4 + (2 2)4 2 4 + (3 2)4 1 4 = 0.5, 3 (1 2) 4 1 3 + (2 2)4 1 3 + (3 2)4 1 3 = 0.66 6, 4 (1 2) 4 2 5 + (2 2)4 1 5 + (3 2)4 2 5 = 0.8. En dimensionslös toppighet definieras av ˆγ 2 = k j=1 (x j x) 4 ˆp 1 j n ˆσ 4 = n i=1 (x i x) 4 ˆσ 4 Framgent avses denna storhet när vi skriver ˆγ 2.
För vår mätserie 4 erhålls 20 1 20 (x i x) 3 = 3.41 och i=1 20 1 20 (x i x) 4 = 502.05 i=1 varför vi erhåller skevheten och toppigheten ˆγ 1 = 3.41 8.2 3 = 0.006 och ˆγ 2 = 502.05 8.2 4 = 0.111 Bestäm de genomgångna måtten (balanseringspunkt, spridning, varians, skevhet och toppighet) för de övriga mätserierna. Beskriv med egna ord vad de olika måtten står för.
169, 172, 159, 170, 154, 159, 184, 177, 181, 166, 170, 167, 164, 168, 174, 171,