Datorlaboration 2 Konfidensintervall & hypotesprövning



Relevanta dokument
FACIT (korrekta svar i röd fetstil)

*****************************************************************************

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Statistik och epidemiologi T5

Datorlaboration 7. Simuleringsbaserade tekniker

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Uppgift 1. Deskripitiv statistik. Lön

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Laboration: Att inhägna ett rektangulärt område

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Analytisk statistik. Tony Pansell, optiker Universitetslektor

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

Linjär regressionsanalys. Wieland Wermke

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN KVANTITATIV METOD (100205)

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Instruktion arbeta med rapportmallen

Statistik och epidemiologi T5

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Grundläggande statistik kurs 1

MSG830 Statistisk analys och experimentplanering - Lösningar

Survey&Report steg för steg: Skapa rapport

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

Diskussionsproblem för Statistik för ingenjörer

Repetition och ANOVA. nbib44

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

PLATINA 1(23) Platina, för nya nämndsekreterare

Lösningsförslag

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

CSN-rapportering, gymnasiet

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Installationsanvisning för Su Officemallar 2003 För PC

Tentamen i Matematisk statistik Kurskod S0001M

Handledning för utskrift av Grafisk antavla

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

SurveyXact version 6.10

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Diagram. I detta kapitel lär du dig: m Diagrammets beståndsdelar. m Att skapa både inbäddat diagram och diagramblad. m Att ändra diagramform.

19. Skriva ut statistik

Statistik Lars Valter

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Lösningar till Tentafrågor

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Mobilapplikation htp:/aktjon.argentum.se/activitymobile

Att göra investeringskalkyler med hjälp av

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Mer om Outlook. Extratexter till kapitel 4 Mejla. I avsnittet lär du dig: vad Outlook idag är och kan användas till

Lösningar till SPSS-övning: Analytisk statistik

Steg 1 Starta Outlook 2013 och öppna konfigurationsguiden

Tentamen i Matematisk statistik Kurskod S0001M

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Semester och arbetstidsförkortning

Lär dig sökmöjligheterna i Disgen 8

Multipel regression och Partiella korrelationer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Gäddan i Hammarsjön en inledande fiskeribiologisk undersökning

Lathund till Dexter IUP

Tentamen för kursen Statististik för naturvetare 16 januari

Övningar till avsnitt 3 - Leva inifrån och ut

Är sjukvården jämställd och går det åt rätt håll?

Användarmanual Mina sidor Timvärden

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Datorövning 2 Statistik med Excel (Office 2003, engelska)

Hur skriver man statistikavsnittet i en ansökan?

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Avd. Matematisk statistik

Rutin Löneöversyn AcadeMedia Det är i denna rutin som du gör din årliga löneöversyn av dina medarbetares löner.

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

, s a. , s b. personer från Alingsås och n b

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Instruktion 5. Talonger och tabeller. Övning 25. Hur man gör en talong? Börja med att ställa in ett styckeavstånd på en tomrad.

Optimering. Optimering av transportproblem. Linköpings universitet SL. Campusveckan VT2013

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Användarhandledning Rapportgenerator Version: 1.1

RIGMOR SANDER POWERPOINT XP START Sid 1 (12) !" # " $ % &

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Transkript:

Statistik, 2p PROTOKOLL Namn:...... Grupp:... Datum:... Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta den statistiska bearbetningen av samma öringdata som under laboration 1. Denna gång kommer ni att prova på några vanligt förekommande statistiska tester och skattningsmetoder. Mer information om dessa finns under flik 13 i kurspärmen samt i "röda boken" (Vejde & Leander, 2000). Arbeta gärna två och två. Öppna er datafil som ni sparade under första datorlaborationen, eller hämta en ny kopia av filen från samma adress som förut: www.zoologi.su.se/~popgen/statistik2p Utför nedanstående uppgifter och svara på frågorna. Även denna gång ska protokollet lämnas in. Uppgifter/frågor 1. Konfidensintervall för en kontinuerlig variabel. Följande formel används: 1a. Beräkna ett 95 % konfidensintervall för variabeln WEIGHT (kroppsvikt). Använd totalmaterialet, d.v.s. alla fiskar (=n). Börja med att räkna ut medelvärde ("x-bar") och stickprovsvarians (s 2 ) för denna variabel (repetition från laboration 1): Stickprovsstorlek:... Medelvärde:... Varians:... 1b. Beräkna därefter standard error (S.E.), d.v.s. följande del av ovanstående uttryck: S.E. för WEIGHT (kroppsvikt) är:......

2. Tips: För att dra kvadratroten ur ett tal används funktionen =ROT(tal), där tal representerar det värde man vill dra roten ur. Prova t.ex. att skriva =ROT(9) i någon valfri cell (följt av ENTER) och kontrollera att det stämmer... 1c. Ta nu reda på värdet av t df, d.v.s. "t-faktorn" för det aktuella antalet frihetsgrader (df = n 1) och den önskade konfidensnivån. Detta gör ni antingen genom att använda funktionen =TINV(sannolikhet; frihetsgrader) i Excel, där sannolikhet representerar den sökta konfidensgränsen (i detta fall 5 %, skriv in 0,05), eller med hjälp av en t-tabell. Vad är df respektive t df i det aktuella fallet? Observera att stickprovsstorleken (n) är det totala antalet fiskar i stickprovet (d.v.s. honor+hanar). df :...... t df :..... 1d. Ni har nu den information som behövs för att räkna ut ett 95 % konfidensintervall för kroppsvikt med hjälp av formeln på föregående sida. Vad blev resultatet? nedre 95% gräns: övre 95% gräns:.... 1e. Beskriv innebörden av det konfidensintervall ni just räknat ut:... 2. Hypotesprövning - test för medelvärdesskillnad (två medelvärden, t-test) 2a. Beräkna medellängden bland öringarna (båda könen) fångade i Blanktjärnen respektive i Flyn (repetition från laboration 1). Medellängder (mm): Blanktjärnen:.... Flyn:.... 2b. Återspeglar den observerade medellängdsskillnaden i stickprovet en verklig ("sann") skillnad mellan de båda tjärnarnas öringar? För att angripa denna fråga statistiskt ska vi utföra ett så kallat t-test. I Excel används modulen Dataanalys (den som ni använde för att framställa histogram tidigare; återfinns under menyn Verktyg). "Rulla" ner mot slutet av listan med alternativ och välj t-test: Två sampel antar lika varians.

3. Tryck OK och följande dialogruta öppnas: I fälten Variabel 1 område och Variabel 2 område skriver ni in de cellområden som innehåller kroppslängderna för Blanktjärnen respektive för Flyn (era data måste alltså vara sorterade med avseende på lokal). I rutan märkt Alfa står inskrivet 0.05 (5 %). Detta är den signifikansnivå som t-testet kommer att utföras på, och detta värde kan ändras om man så önskar (men låt det stå denna gång). Innan ni trycker OK och utför testet, svara på följande : Vilken är nollhypotesen (H 0 ) som skall testas?................ Vilken är alternativhypotesen (H 1 ) vid ett dubbelsidigt test?.............. Tryck på OK. Vilket blev resultatet? Vi bryr oss endast om det som står på följande rader i tabellen: Antal frihetsgrader ("fg"):..... t-värde ("t-kvot"):.... p-värde, dubbelsidigt test ("P(T<=t) tvåsidig"):..

4. Föreligger det en statistiskt signifikant skillnad i medellängd mellan insamlingslokalerna? 3. Konfidensintervall för en relativ frekvens. Följande formel används: 3a. Beräkna konfidensintervall för andelen honor i totalmaterialet. Under laboration 1 (fråga 5) beräknade ni ett punktestimat för denna relativa frekvens i ert stickprov. Vilket var detta estimat? Andelen honor i stickprovet (p honor ) är:... Beräkna ett 95% resp. 99% konfidensintervall. (Se fråga 1 för hur man med hjälp av Excel drar kvadratroten ur tal och bestämmer värdet för t df.) Åter är antalet frihetsgrader df = n 1. 95% konfidensintervall för andelen honor:.... 99% konfidensintervall för andelen honor:.... 3b. Vilket av intervallen är "bredast" och varför?... 3c. Fundera över om det verkar troligt att den sanna frekvensen honor (P honor ) är 0.5, d.v.s. att jämn könskvot råder i populationen:.....

5. 4. Hypotesprövning test av relativa frekvenser (χ 2 "a priori") Testa de observerade absoluta frekvenserna honor/hanar mot de som förväntas vid jämn könskvot med hjälp av ett s.k. χ 2 test. I Excel gör ni detta med hjälp av funktionen =CHI2TEST(obs;förv), där obs och förv representerar två cellområden där ni skrivit in de observerade resp. förväntade antalen honor/hanar. Funktionen CHI2TEST skriver då ut det aktuella p-värdet. Vilken är nollhypotesen (H 0 )?............. Vilken är alternativhypotesen (H 1 )?.............. Vad blev p-värdet?... Vilken slutsats drar ni?.......... 5. Hypotesprövning Linjär regression Finns det ett samband mellan kroppslängd och -vikt (WEIGHT och LENGTH)? En naturlig startpunkt för att analysera denna typ av frågeställning är att först illustrera sina data grafiskt. Under datorlaboration 1 gjorde ni ett punktdiagram över dessa variabler, vilket bör ha sett ut så här (den räta linjen får man genom att högerklicka på någon av punkterna i diagrammet och därefter välja "infoga trendlinje"):

6. Föreligger ett verkligt (linjärt) samband mellan variablerna kroppslängd och vikt i populationen? Eller är det synbarliga sambandet i ovanstående figur endast orsakat av slumpen i ett stickprov av begränsad storlek? Åter bör frågan analyseras statistiskt, och vi gör det denna gång med hjälp av s.k. linjär regression. Använd modulen Dataanalys och välj alternativet Regression. Följande dialogruta öppnas: I fälten Y-indataområde och X-indataområde skriver ni in de cellområden (-referenser) som innehåller längder respektive vikter. Innan ni trycker OK och utför testet, svara på följande: Vilken är nollhypotesen (H 0 )?........ Vilken är alternativhypotesen (H 1 )?........... Tryck OK. Vilket blev resultatet? (Bry er endast om det p-värde som står utskrivet på nedersta raden i nedersta deltabellen, d.v.s. raden märkt X-variabel 1). p-värde:...... Föreligger det ett statistiskt signifikant (linjärt) samband mellan vikt och längd? Glöm ej att lämna in protokollet!