Medelvärde, median och standardavvikelse

Relevanta dokument
Beskrivande statistik

Valresultat Riksdagen 2018

2 Dataanalys och beskrivande statistik

Grundläggande statistik kurs 1

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Arbeta med normalfördelningar

Statistiska samband: regression och korrelation

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Föreläsning G60 Statistiska metoder

Forskningsmetodik 2006 lektion 2

Arvodesenkät. Resultat Egenföretagare.

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2

Stora talens lag eller det jämnar ut sig

13.1 Matematisk statistik

Extramaterial till Matematik X

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

*****************************************************************************

Extramaterial till Matematik Y

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Handledning för konstruktion av tabeller och diagram med Excel

Repetitionsprov inför provet Statistik

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Excel-guide. Introduktion

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Att göra före det schemalagda labpasset.

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Föreläsning G60 Statistiska metoder

Hämtning av sekundärdata och introduktion till Excel

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Statistik och epidemiologi T5

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

En typisk medianmorot

Obligatorisk uppgift, del 1

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Syfte Syftet med den här laborationen är att du ska lära dig använda några grundfunktioner i Microsoft Excel.

Det är tänkt att varje elev eller grupp ska få en egen kopia av provresultaten och en egen datablankett att fylla i.

Beskrivande statistik

6-2 Medelvärde och median. Namn:

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Bearbetning och Presentation

Parade och oparade test

Beräkningar och diagram i EQUALIS resultatsammanställningar. P016 v

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Statistik 1 för biologer, logopeder och psykologer

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Intro till SPSS Kimmo Sorjonen (0811)

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

NpMa2b ht Kravgränser

Du ska undersöka om två figurer är likfonniga. En rätvinklig triangel kan

Extramaterial till Matematik X

Marknadsinformationsmetodik Inlämningsuppgift

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Extramaterial till Matematik X

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Datorövning 1 Calc i OpenOffice 1

Medicinsk statistik I

Extramaterial till Matematik X

Hypotestestning och repetition

Läs noggrant informationen nedan innan du börjar skriva tentamen

Begrepp Värde (mätvärde), medelvärde, median, lista, tabell, rad, kolumn, spridningsdiagram (punktdiagram)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Föreläsning 12: Regression

Elevrådet har gjort en undersökning på skolan kring hur lång tid varje elev på skolan dagligen ägnar åt att plugga.

Medicinsk statistik I

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Varje deluppgift ger 1 poäng. Det är även utskrivet vilken förmåga du kan visa på varje uppgift. Till exempel betyder EB, begreppsförmåga på E-nivå.

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

Formel/Funktion Hur Används till

Introduktion till statistik för statsvetare

Arbeta med verkliga data.

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

FK2002- FK2004 (HT2011)

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Gamla tentor (forts) ( x. x ) ) 2 x1

DATORÖVNING 2: STATISTISK INFERENS.

ÖVNINGSUPPGIFTER KAPITEL 2

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Richard Öhrvall, 1

Exponentiell och annan utveckling -exempel med konsumentpriser

Attila Szabo Niclas Larson Gunilla Viklund Mikael Marklund Daniel Dufåker. GeoGebraexempel

Piteås kunskapsresultat jämfört med Sveriges kommuner 2015/2016

Marknadsinformationsmetodik Inlämningsuppgift

Föreläsning G70 Statistik A

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum Skrivtid

Sammanfattningar Matematikboken X

Transkript:

Medelvärde, median och standardavvikelse Detta är en enkel aktivitet där vi på ett dynamiskt sätt ska titta på hur de statistiska måtten, t.ex. median och medelvärde ändras när man ändar ett värde i en datauppsättning. Det kan se ut så här. Vilka iakttagelser kan man då göra? Jo, medianen förändras inte alls men däremot har medelvärdet ökat till drygt 5. Vi prövar med några dragningar till. Problem 1: På sid 1 har vi en samling data och vi har sedan plottat datauppsättningen som punktdiagram i två likadana diagram. Sedan har vi lagt till linjer som visar medelvärde och median. Det gör man med verktyget Rita värde som finns under Analysera i verktygsmenyn. Man skriver då enligt syntaxen medelvärde:=mean(lista) eftersom våra värden finns i variabeln lista. Vi ser att medelvärdet är 4 och medianen 3 i den ursprungliga listan. Det kan du se om du klickar på linjerna. Vi ser att medianen knappast förändras alls. När vi drar datapunkterna så kan man inte placera dem direkt som heltal så därför få vi nu ett decimaltal som medianvärde. Alternativet är då att gå in i kalkylarket och ändra. För att få en mer drastisk ändring av medianen så får man flytta lite fler datapunkter. Här bli nu medianen större än medelvärdet. Dra nu i en punkt i något av diagrammen. Hur förändras då medelvärde och median? 1 Vi har alltså konstaterat att medianen är mer okänslig för förändringar av enskilda värden. Medianen kan vara ett lämpligt mått om observationerna har en sned fördelning med många höga eller låga värden. I motsats till medelvärdet påverkas inte medianen av sådana extremvärden. Vi kan konstatera att medelvärde och median tillsammans inte alltid ger en bra och sammanfattande beskrivning av ett datamaterial. Det ska vi undersöka närmare. Först kommer ett lite tips hur man gör om de data man har redan är ordnade i en frekvenstabell.

Problem 2 Ibland har man sina data i frekvenstabeller. Vi har här nu samma data som vi ursprungligen hade i problem 1 men nu är de ordnade i en frekvenstabell. Man kan fortfarande beräkna medelvärde och median. Då kan man i en ledig cell skriva =mean(värden,frekvens) för att beräkna medelvärdet. Problem 3 Nu ska titta lite närmare på ett begrepp som heter spridning. Ofta så räcker ju inte medelvärde och median till för att ge en bra bild hur ett datamaterial ser ut. I kalkylarket nedan visar vi resultatet på ett prov för två klasser. Både medelvärde och median är lika (18 poäng) i båda klasserna. Vi har här plottat punktdiagram för båda klasserna och vi ser att spridningen är större i klass b. kan man få ett bra mått på detta. Vi ser att differensen mellan största och minsta värdet i de två klasserna är 20 poäng i klass a och 29 poäng i klass b. Detta kallas variationsbredd och ger ett mått på spridningen. Utifrån frekvenstabellen kan man inte rita punktdiagram men det finns ett knep att fixa detta. Man använder då en speciell instruktion som visas nedan. Instruktionen finns i katalogen som du når från Dokumentverktygslådan: Ett sätt att visa detta är att rita lådagram. Klicka i diagrammet och välj då denna diagramform. Så här blir nu listan med värden. Den är sorterad i stigande ordning. Här få man också en bra bild av spridningen. Man ser ju inte alla enskilda datavärden som i ett punktdiagram utan får en sammanfattande bild. Strecket mitt i lådan är medianen och lådans kanter är undre respektive övre kvartilen. 2

Ett mått som nästan alltid används som mått på spridningen är standardavvikelsen. Man kan säga att standardavvikelsen ger ett mått på den genomsnittliga avvikelsen från medelvärdet. Här har vi nu öppnat en ny sida och plottat värdena för klass a i ett punktdiagram. Vi har också plottat linjer enligt formeln Mean(klass_a)+ stdevpop(klass_a) respektive Mean(klass_a) - stdevpop(klass_a) Instruktionen för standardavvikelsen finns i katalogen som du når från Dokumentverktygslådan. Då inhägnar vi ett område inom en standardavvikelse från medelvärdet. Vi ser att standardavvikelsen är nästan precis 6. Här har vi packat ihop observationerna för klass b. Vi har samma medelvärde som förut men standardavvikelsen är betydligt mindre. De lodräta linjerna hänger ju med när du flyttar punkterna. Elegant! Problem 4: Hur beräknas standardavvikelsen egentligen? TI-Nspire har ju en inbyggd funktion för att direkt beräkna standardavvikelsen från ett datamaterial. Det gäller båda data som ligger i en lista med värden och data som finns i en frekvenstabell. Vi visar nu i steg hur det går till. Vi gör likadant med klass b: I kolumn a har vi våra data. I kolumn b har vi för varje värde avvikelsen från medelvärdet. I kolumn c kvadrerar vi avvikelserna för att summan av avvikelserna i de fortsatta beräkningarna inte ska bli noll. Vissa värden är ju negativa och summerar man värdena i kolumn b blir det ju 0 som resultat. I kolumn d på rad 1 så har vi till sist beräknat standardavvikelsen som summan av avvikelserna i kvadrat 20 Markera cellen så ser du formeln i inmatningsfältet. Standardavvikelsen är nu ungefär 9, betydligt större än den för klass a alltså. Sammantaget ger nu dessa två diagram ger alltså en väldigt bra bild av resultaten på provet. Pröva nu att dra i punkter i diagrammen för att öka eller minska standardavvikelsen. 3

Problem 5: I detta problem har vi i kalkylarket två listor. Det är datapunkter i kolumnen värden vi ska titta på. Den andra kolumnen har vi bara med för att vi ska kunna plotta datavärden på ett tydligt sätt i ett diagram. Här har vi plottat datapunkterna på olika nivåer i ett xy-diagram. Vi har också lagt in linjer för medelvärdet och linjer på avståndet en standardavvikelse från medelvärdet. När vi flyttar punkter så flyttar sig också dessa tre linjer. I diagrammet ser vi att tre datapunkter ligger utanför gränsen för en standardavvikelse. Här har vi dragit iväg med en punkt och vi ser att standardavvikelsen ändras mycket. Den är ca 4 nu. 8 punkter finns i intervallet medelvärde en standardavvikelse. Här en extremsituation. Både medelvärde och median ligger ungefär på 7,5 och nästan alla punkter ligger inom gränserna. Standardavvikelsen är drygt 6. Försök nu att flytta en punkt i taget så att t.ex. 6 punkter ligger utanför dessa gränser. Vad händer då med linjerna? Jo, linjerna flyttas och andra punkter som ligger utanför gränserna riskerar att hamna innanför och vi får börja om igen. Detta säger något om vad standardavvikelse är. Vi har ju bara 10 punkter och en stor förflyttning av bara en punkt från centrum i diagrammet gör att medelvärde och standardavvikelse ändras tillräckligt mycket för att åter de flesta punkterna ska ligga innanför gränsen för en standardavvikelse. 4

Här en annan datauppsättning som ser helt annorlunda ut trots att de statistiska måtten är ungefär lika. 4 datapunkter ligger nära medelvärdet. Medelvärde, median och standardavvikelse säger alltså inte allt! I många datamaterial är ofta fördelningen ungefär normalfördelad och då ligger ca 2/3 av datapunkterna inom en standardavvikelse från medelvärdet. Här ser vi både medianer och medelvärden för respektive population. Punkterna till vänster och höger är s.k. utliggare, värden som ligger långt ifrån lådans kanter. Problem 6: Vi avslutar denna aktivitet med att visa ett kalkylark med insamlade data från den verkliga världen. Det handlar om näbbstorlekar i mm hos en koloni av finkar på Galapagosöarna och vilka som överlevde en svår torka. Man kan konstatera att finkar med kraftigare näbbar överlevde i högre grad. I punktdiagrammen har vi lagt in linjer för medelvärdena. Vi har också delat upp variabeln näbbstorlek efter kategorier, i detta fall överlevnad. Vi ser den symmetriska fördelningen för de som inte överlevde. Fördelningen för de som överlevde är inte lika symmetrisk. Om vi klickar i diagrammet kan vi ändra till visning av lådagram också. 5