P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann.
Vi har en ursprungspopulation/-fördelning med medelvärde µ. Population mean = μ µ x
Samplingsfördelningen för medelvärdet är också normalfördelat och har μ x = μ x Samplingsfördelningen har lägre variation än ursprungsfördelningen (kurvan är inte lika bred). Stickprovet storlek avgör samplingsfördelningens snävhet. Om standardavvilkelsen i ursprungspopulationen är σ blir samplingsfördelningens standardavvikelse enligt nedan. Den kallas även standard error (S.E.) σ x µ x σ x = x = µ x =µ σ x n Standard error = S.E.
Vi drar ett stort antal stickprov av en viss storlek ur denna fördelning. I varje stickprov räknar vi ut medelvärdet. Vi får en fördelning av medelvärden samplingsfördelning av medelvärden (sampling distribution of a mean) µ x x = µ x =µ
Om σ är okänd skattas standard error, S.E från s n Men vi kan då inte använda normalfördelningen utan vi måste använda t-fördelningen.
Om σ är känd används normalfördelningen och z Om σ inte är känd utan skattas den via s och t-fördelning används
t-fördelningen t-fördelningen liknar normalfördelningen men är plattare. Ju lägre stickprovsstorlek (n) desto plattare kurva. När n ökar närmar sig t- fördelningen normalfördelningen. Det finns en t-fördelning för varje antal s.k. frihetsgrader. Antalet frihetsgrader är kopplat till stickprovets storlek. Ju större stickprov desto fler frihetsgrader.
Frihetsgrader degrees of freedom, df Svårt begrepp men kan betraktas som en matematisk restriktion som måste användas då vi skattar parametrar från stickprov. Antalet värden i den slutliga beräkningen av en statistika som är fria att variera. Icke-statistisk illustration: Antag att vi har 100 kronor att dela ut till fyra olika barn som var och en knackar på hemma hos oss för att önska glad påsk. Om vi ger 30 kronor till barn 1, 20 till barn 2 40 till barn 3 så är vi låsta till att ge det fjärde barnet 10 kronor eftersom totalsumman inte kan överstiga 100 kronor. De tre första summorna är vi fria att variera men de sista är låst av att totalbeloppet inte får överstiga 100 kronor. Vi har 4-1=3 frihetsgrader.
Test av medelvärde när är okänd - den sanna populationens standardavvikelse skattas från standardavvikelsen i stickprovet - s Standard error (S.E.) skattas från s n och z ersätts med t
Observerade vikter 3.2 3.6 3.9 4.2 4.3 4.4 4.9 5.2 x = 4.3 Median = 4.3 Typvärde = 5.2 Vikt hos 5 veckor gamla vargvalpar Stickprov n 3.2 4.2 5.2 4.4 3.6 5.2 4.9 3.9 3.2 4.3 5.2 Variansen = s = (x i -x) 2 n-1 2 = 0.588 Antal obseravtioner 3 2 1 0 0.60 Standardavvikelsen = s = s 2 = 0.7668 0.80 3.2 3.6 3.9 4.2 4.3 4.4 4.9 5.2 Vikt
Konfidensintervall Ett intervall som med en viss sannolikhet täcker den parameter vi är intresserade av att skatta (t.ex. µ). Ett 95% konfidensintervall täcker med 95% sannolikhet populationens µ.
Med hjälp av konfidensintervall kan vi med viss säkerhet fastställa medelvärdet för populationen Beräkningen av konfidensintervall bygger på centrala gränsvärdessatsen. Den centrala gränsvärdessatsen möjliggör användande av normalfördelningen för att skapa konfidensintervall för populationsmedelvärdet. Den centrala gränsvärdessatsen säger att om stickprov av en given storlek dras ur en population så kommer fördelningen av stickprovsmedelvärdena (samplingsfördelningen) att likna en normalfördelning. Denna fördelning blir mer lik normalfördelningen ju större stickprovet det är. Om stickprovet är litet används t-fördelningen som liknar normalfördelningen men justerar för små stickprov (se t-tabellen).
Hypotesprövning två medelvärden - t-test Diastoliskt blodtryck hos behandlad grupp och kontrollgrupp Testet bygger på antagandena: OSU ur NF-populationer Lika varians i populationerna
Fröhandlaren
Fröhandlaren Hypotesprövningen kan även göras med chi2- aprior
Conservation Genetics 2013 Är populationerna olika i något avseende?
Antag: Vi undersöker förekomsten av en viss typ av parasit hos öring från de två populationerna. Är det någon skillnad i förekomst av parasiter hos fisk från de två olika populationerna? Observationer Population A Population B Med parasit 13 44 Utan parasit 25 29 H 0 : parasitförekomst är oberoende av population H 1 : parasitförekomst är inte oberoende av population SE VIDARE SEPARAT FIL!