Minitab-lösningar till lämpliga uppgifter för NDAB01, vt2011, 17 januari 2011.

Relevanta dokument
7.5 Experiment with a single factor having more than two levels

Följande resultat erhålls (enhet: 1000psi):

Statistik för teknologer, 5 poäng Skrivtid:

Tentamen i matematisk statistik

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Metod och teori. Statistik för naturvetare Umeå universitet

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Ledtrådar till utvalda uppgifter för NDAB01, vt2011, 17 januari 2011.

Tentamen i matematisk statistik

Introduktion och laboration : Minitab

Tentamen i matematisk statistik

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Laboration med Minitab

DATORÖVNING 3: MER OM STATISTISK INFERENS.

7.5 Experiment with a single factor having more than two levels

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

8.1 General factorial experiments

TAMS28 DATORÖVNING VT1

7.3.3 Nonparametric Mann-Whitney test

TENTAMEN I MATEMATISK STATISTIK

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

Examinationsuppgifter del 2

Tentamen i matematisk statistik

2.1 Minitab-introduktion

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

DATORÖVNING 3: EXPERIMENT MED

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Obligatorisk uppgift, del 1

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Räkneövning 3 Variansanalys

Experiment med två faktorer. Treatment Population. Balanced och ortogonal design. Graph of means. Table of means

Datorövning 1 Enkel linjär regressionsanalys

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Skrivning i ekonometri torsdagen den 8 februari 2007

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

ANOVA Mellangruppsdesign

DATORÖVNING 2: STATISTISK INFERENS.

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Laboration med MINITAB, Del 2 Om Fyris ns global uppv rmning

LABORATION 1. Syfte: Syftet med laborationen är att

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Laboration 2 Inferens S0005M VT18

Tentamen MVE301 Sannolikhet, statistik och risk

DATORÖVNING 4: DISKRETA

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Skrivning i ekonometri lördagen den 29 mars 2008

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Tentamen MVE301 Sannolikhet, statistik och risk

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Tentamen i matematisk statistik

Uppgift 1. Produktmomentkorrelationskoefficienten

DATORÖVNING 2: BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA. STATISTISK INFERENS.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Lösningar till SPSS-övning: Analytisk statistik

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

MINITAB i korthet. release 16. Jan-Eric Englund. SLU Alnarp Kompendium Swedish University of Agricultural Sciences Department of Agrosystems

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Regressions- och Tidsserieanalys - F4

Elementa om Variansanalys

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

DATORÖVNING 2: TABELLER OCH STANDARD-

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

TAMS38 Datorövning 4

OBS! Vi har nya rutiner.

3.1 Beskrivande statistik

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

Tentamen MVE302 Sannolikhet och statistik

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00. English Version

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Transkript:

Minitab-lösningar till lämpliga uppgifter för NDAB01, vt2011, 17 januari 2011. Här kommer jag att försöka ge Minitab-lösningar till i stort sett alla uppgifter som har listats som rekommenderade uppgifter. Man kan ge instruktioner till Minitab både genom att klicka sig fram i menyerna och genom att skriva kommandon. Kommandospråket är intressant om man vill kunna programmera i Minitab och också vanlig användning blir snabb om man kan kommandon. I den här lösningen kommer jag i huvudsak använda menyer så långt möjligt förutom när det blir för tjatigt, men jag kommer också att visa hur man kan göra med kommandon. Jag har i de flesta fall inte skrivit dessa kommandon utan det visar kod som genereras automatiskt när man klickar sig fram, i vissa fall en lite klumpig kod, vilket är vanligt med automatgenererad kod. Efter kommandosekvensen visas den utskrift som skapas av de menyval som visas eller av de kommandon som visas (utskriften blir densamma oavsett om du klickar dig fram eller skriver kommandon). För att starta möjligheten att skriva kommandon och för att se genererad kod, aktivera Sessionfönstret och välj Editor Enable Commands Om du följer mina förslag till hur man kan klicka fram en lösning och känner dig osäker på vad som beräknas och vad alla val är avsedda för så föreslår jag att du försöker klura ut det genom att klicka på help-knappen och läsa. Mängden hjälp som finns att tillgå är mycket stor. Du kan också gå till menyn Help och klicka dig fram på olika sätt beroende på vilken sorts hjälp du söker. Det finns massor av hjälp, det svåra är nog att avgränsa till bara sånt ni kan ha nytta av på den här kursen (om det nu är den avgräsningen som är rätt). Det finns ofta flera sätt att få fram samma resultat. Här visas ett, men det betyder inte att det på något sätt kan anses vara det bästa sättet. Jag kommer inte generellt att peka på var i utskriften som själva svaret finns, men kan göra det i fall där jag uppfattar utskriften som svår att läsa. Jag har inte kopierat dialogrutor som bilder utan istället försökt avbilda dem genom enkel text. En avskrift av en dialogruta markeras med indrag (4 steg) och om en knapp då öppnar ytterligare en ruta så markeras det med längre indrag (8 steg). S.k. radioknappar markeras ( ), med speciellt (*) för den som är vald. Rutor där man kan bocka av/för saker skrivs [ ] resp [v]. Jag använde punkt som decimaltecken. Om du använder komma så måste du anpassa skrivsättet i de fall decimaltal matas in. Minitab läser av den inställning som du har i Windows. Vill du byta generellt så välj Start Settings Control Panel Regional and Language Options Customize... Fliken Numbers Decimal Symbol: Jag använder punkt List Separator: Jag använder komma Tänk på att dethär påverka andra program också och jag kan såklart inte garantera att andra program kommer att funka störningsfritt om du byter decimaltecken eller annat. Man kan ställa in mängden utskrift i Minitab med kommandot BRIEF, där 0 betyder ingen utskrift och sen mer och mer utskrift ju högre siffra man väljer inom vissa gränser. Kolla i Help för bättre info. Jag kör med värdet 1. Jag har också gett kommandot NOTITLE för att slippa få en liten rubrik till varje del av utskriften. Minitab skiljer inte mellan stor och liten bokstav i kommandon och inte heller när man anropar kolumner, konstanter eller matriser med deras nummer. Jag kommer att försöka skriva kolumner som C1, C2 o.s.v. men det funkar lika bra med c1, c2 o.s.v. Jag kommer också att använda K för konstanter och M för matriser om det dyker upp. Färdiga resultat som plockas direkt från utskriften markeras med grön färg. Om man bara kan ta delresultat från beräknignen som sen processas med t.ex. miniräknare så visas delresultaten med röd färg. I den här versionen kan man inte se på de gröna delarna exakt vilken delfråga de är svar på. Uppgift 3.1cd sida 32 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan. (c) Calc Column Statistics... (*) Sum ( )Median ( ) Mean..... input variable [C1 ] MTB > Sum C1. Sum of C1 = 17.8 1

(d) Samma som ovan Uppgift 3.2 sida 32 Mata in data på samma sätt som uppg 3.1 ovan. Notera att man här uttalar att det handlar om vikter. I 3.1 var det underförstått genom att man hade fått enheten kg. (a) Samma som 3.1 men välj nu (*) Mean MTB > Mean C1. Mean of C1 = 3.56 (b) Samma som 3.1 men välj nu (*) Median MTB > Median C1. Median of C1 = 3.6 Uppgift 3.3ab sida 32 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan. Det går att klicka sig fram till samma ruta som i 3.1 men jag tänkte här visa ett annat sätt som tar fram flera beskrivande mått på en gång. (a)(b) Stat Basic Statistics Display Descriptive Statistics... Variables [C1 ] By Variables [ ] Statistics... [v] Mean [ ] Trimmed mean. [ ] SE of mean..... [v] Median.. MTB > Describe Age ; SUBC> Mean; SUBC> Median. Variable Mean Median Age 46.63 46.30 DET HADE OCKSÅ FUNKAT MED MTB > Desc C1; SUBC> Mean; SUBC> Medi. Variable Mean Median Age 46.63 46.30 2

DET RÄCKER ALLTID MED 4 TECKEN I KOMMANDON (IBLAND FÄRRE) MAN KAN ANROPA KOLUMNER MED KOLUMNNUMER ISTÄLLET FÖR NAMN. DETTA KOMMER EJ ATT DISKUTERAS I FOTSÄTTNINGEN Uppgift 3.5 sida 32 Uppgiften är mest teoretisk och avser att man ibland kan beräkna median och liknande även om man inte har tillgång till alla exakta uppgifter. Det räcker att inse att det i det här fallet går att beräkna medianen (värdet i mitten efter sortering) trots att två värden är okända. Ingen mer lösning visas här. Uppgift 4.1ab sida 48 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan Detta är mest en miniräknareövning. Jag föreställer mig att det är varianserna man är ute efter, och beräkning av kvadratsumma är bara ett steg på vägen. Jag beräknar delarna X, X och X 2 genom Stat Basic Statistics Display Descriptive Statistics... Variables [C1 ] By Variables [ ] Statistics... [v] Mean [ ] Trimmed mean. [ ] SE of mean [v] Sum.... [ ] First Quartile [v] Sum of squares. MTB > Describe Weight ; SUBC> Mean; SUBC> Sums; SUBC> SSQ. Sum of Variable Mean Sum Squares Weight 70.22 351.10 24810.27 OBS ATT DET FINNS EN TVETYDIGHET I SPRÅKET HÄR! MINITAB: SUM OF SQUARES= X 2 BEN: SUM OF SQUARES= ( (X X) 2) RAD 3, KAPITEL 4.4 SIDA 37, med lite detaljer om ifall man diskuterar SS för ett stickprov eller för en population. Övriga steg går att beräkna i Minitab eller med miniräknare. Om man t.ex. vill tillämpa (4.19) sida 39 så är Sample SS = Xi 2 ( X i) n = 24810.27 351.10 5 = 156.028. Det finns enklare sätt om man vill göra det datoriskt, visas ej här men kommer att visas i uppgift 4.2. Uppgift 4.2abcd sida 48 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan (a)(c)(d) Samma som 4.1, se till att få med [v] Range [v] Variance [v] Standard Deviation MTB > Describe Concentration ; SUBC> StDeviation; SUBC> Variance; SUBC> Range. Variable StDev Variance Range Concentration 2.77 7.70 8.40 3

(b) Man kan fixa dethär i två steg 1 Skapa en ny variabel som innehåller (X-medel(X)), lagra i C2 2 Beräkna summan av de kvadrerade värdena hos C2 Calc Standardize... Input Column [C1 ] Store Results in [C2 ] ( ) Subtract mean and divide by standard deviation (*) Subtract mean ( ) Divide by standard deviation ( ) Subtract o.s.v. MTB > Center Concentration C2. MTB > Center Concentration C2; SUBC> Location. Calc Column Statistics...... (*) Sum of squares.... Input Variable [C2 ] MTB > SSQ C2. Sum of squares (uncorrected) of C2 = 46.1886 Uppgift 5.10 sida 65 Mata in data (jag har lagt blodgrupp i C1 och antal i C2) eller tanka från kurswebbsidan. (a)(b) Man vet (uppg 5.8) att det är 5400 observationer i materialet, vilket annars enkelt går att beräkna. Jag ska skapa en ny kolumn, C3, som är C2/5400 och sen visa innehållet i C1-C3. Calc Standardize... Input Column [C2 ] Store Results in [C3 ] ( ) Subtract mean and divide by standard deviation ( ) Subtract mean ( ) Divide by standard deviation (*) Subtract first value, then divide by second First [0 ] Second[5400 ] ( ) Make range o.s.v. 4

Data Display Data... Markera alla 3 kolumnerna och välj Select MOTSVARANDE KOMMANDOND OCH UTSKRIFT för båda klick-sekvenserna ovan MTB > Center Frequency C3; SUBC> Location 0.0; SUBC> Scale 5400. MTB > Print Type -C3. Row Type Frequency C3 1 0 2672 0.494815 2 A 2041 0.377963 3 B 486 0.090000 4 AB 201 0.037222 Svaret till (a) : 0.377963 (2:a raden) Svaret till (b) : 0.377963+0.037222=0.415185 (2:a och 4:e raden) Anmärkning: Resultatet från andra raden i tabellen är både resultat till (a) och delresultat till (b) och färgkodningen grön/röd för resultat/delresultat går ej att använda entydigt. Anmärkning: Jag hittade inte på nåt namn till tredje kolumnen. Har du nåt förslag? Uppgift 5.13 Uppgiften är lite för enkel för att man ska vinna mycket på att lösa den datoriskt. Jag visar tänkbara lösningsmetoder nedan, men påstår inte att de är väldigt effektiva. Man kan konstruera en kortlek genom att mata in färg i C1 1:hjärter 2:spader 3:ruter 4:klöver och valör i C2 1 13 Du kan mata in det eller tanka från kurswebbsidan. Inmatning av så här enkla serier är väl förberett. Calc Make Patterned Data Simple Set of Numbers... Store patterned data in [C2 ] From first value [1 ] To last value [13 ] In steps of [1 ] Number of times to list each value [1 ] Number of times to list the sequence[4 ] Calc Make Patterned Data Simple Set of Numbers... Store patterned data in [C1 ] From first value [1 ] To last value [4 ] In steps of [1 ] Number of times to list each value [13 ] Number of times to list the sequence[1 ] MTB > Set C1 DATA> 1( 1 : 4 / 1 )13 DATA> End. MTB > Set C2 DATA> 4( 1 : 13 / 1 )1 DATA> End. 5

Förutsatt att varje kort har lika stor sannolikhet att dras så räcker det med att nu räkna hur stor andel av korten som har en viss egenskap. (a) Här skulle man kunna göra en tabell över färger och valörer och se hur stor andel som hör till varje kombination. Stat Tables Cross tabulation Categorilcal variables: For rows: [C2 ] For columns:[c1 ] For layers: [ ] Frequencies are in [ ] (Optional) Display [ ] Counts [ ] Row Percents [ ] Column Percents [v] Total Percents MTB > XTABS C2 C1; SUBC> Layout 1 1; SUBC> TotPercents; SUBC> DMissing C2 C1. Rows: C2 Columns: C1 1 2 3 4 All 1 1.923 1.923 1.923 1.923 7.692 2 1.923 1.923 1.923 1.923 7.692 3 1.923 1.923 1.923 1.923 7.692 4 1.923 1.923 1.923 1.923 7.692 5 1.923 1.923 1.923 1.923 7.692 6 1.923 1.923 1.923 1.923 7.692 7 1.923 1.923 1.923 1.923 7.692 8 1.923 1.923 1.923 1.923 7.692 9 1.923 1.923 1.923 1.923 7.692 10 1.923 1.923 1.923 1.923 7.692 11 1.923 1.923 1.923 1.923 7.692 12 1.923 1.923 1.923 1.923 7.692 13 1.923 1.923 1.923 1.923 7.692 All 25.000 25.000 25.000 25.000 100.000 Cell Contents: % of Total Tydligen är det 1.923% som hör till kombinationen klöver OCH dam (b) Skapa en indikator som visar med 1 om det är en svart dam, 0 annars. Beräkna sen medelvärdet i den kolumnen för att få andelen kort som är svart dam och därmed sannolikheten för att dra en svart dam. Lagra indikatorn i C3 Calc Calculator... Store results in variable [C3 ] Expression: [( Färg = 2 Or Färg = 4 ) And Valör = 12 ] Calc Column Statistics 6

( ) Sum ( )Median (*) Mean..... Input variable [C3 ] MTB > Let C3 = ( Färg = 2 Or Färg = 4 ) And Valör = 12 MTB > mean C3 Mean of C3 = 0.0384615 (c) Samma som ovan men med Expression: [( Färg = 2 Or Färg = 4 ) And ( Valör >= 11 And Valör <= 13)], här skrivet med kolumnummer istf namn MTB > Let C3 = (C1 = 2 Or C1 = 4 ) And (C2 >= 11 And C2 <= 13) MTB > mean C3 Mean of C3 = 0.115385 Anmärkning: Valör <= 13 är eg onödigt eftersom 13 är det högsta värdet så som jag skrivit in valörerna. Man kunde tänka sig att Ess hade regisrerats som kod 14 istf 1, då hade Valör <= 13 behövts. Uppgift 6.2 sida 95 Man snappar upp att det handlar om en normalfördelning med väntevärde 63.5 och standardavvikelse 12.2. (a) Beräkna sannolikheten att få ett värde mindre än 78.0 och spara den i konstanten K1, beräkna K2=1-K1, visa K2 på displayen. Calc Probability Distributions Normal... ( ) (*) Cumulative Probability ( ) Mean [63.5 ] Standard Deviation [12.2 ] ( ) [ ] [ ] (*) Input constant [78 ] Optionla storage [k1 ] Calc Calculator... Store results in variable [K2 ] Expression [1-K1 ] Data Display data Välj K2 MOTSVARANDE UTSKRIFT OCH KOMMANDON för hela klicksekvensen ovan 7

MTB > CDF 78.0 k1; SUBC> Normal 63.5 12.2. MTB > Let k2 = 1-k1 MTB > Print K2. K2 0.117313 (b) Svaret finns mellanlagrat som K1 efter att man beräknat (a) Data Display data Välj K1 MTB > Print K1. K1 0.882687 (c) Ca 117 gm att ta svaret från (a) och multiplicera med 1000. (d) Calc Probability Distrinutions Normal... ( ) (*) Cumulative Probability ( ) Mean [63.5 ] Standard Deviation [12.2 ] ( ) [ ] [ ] (*) Input constant [41.0 ] Optionla storage [ ] MTB > CDF 41.0; SUBC> Normal 63.5 12.2. Normal with mean = 63.5 and standard deviation = 12.2 x P( X <= x ) 41 0.0325725 Uppgift 6.3 sida 95 Man kan klicka sig fram steg för steg på samma sätt som i 6.2. Jag visar inte det utan passar istället på att visa hur jag skulle göra det. Det förutsätter förstås att man har haft tid och lust att lära sig kommandospråket. # används som kommentartecken (gäller tecknet självt och resten av raden) i Minitabs programspråk. KOMMANDON OCH UTSKRIFT MTB > set C1 # mata in data i C1 DATA> 50:70/10 # 50 t.o.m. 70 med steglängd 10 DATA> cdf C1 C2; # Beräkna sannolikhet X < värde i C1, spara i C2 SUBC> norm 63.5 12.2. # om fördelnngen är N(63.5, 12.2) MTB > lag C2 C3 # skjut ned C2 ett steg, lagra i C3 MTB > subt C3 C2 C4 # beräkna C4=C2-C3 MTB > prin C1-C4 # visa på skärmen Row C1 C2 C3 C4 1 50 0.134243 * * 2 60 0.387100 0.134243 0.252857 3 70 0.702909 0.387100 0.315809 8

Svaren syns i C4, notera ordningen * används ej 0.252857 svar (b) 0.315809 svar (a) Uppgift 6.4 sida 95 Medelvärdet standardavvikelse beräknas och lagras i K1, därefter bevaras frågorna. (a) Calc Calculator... Store results in variable [K1 ] Expression [12.2 / SQRT(10) ] Data Display data Välj K1 MTB > Let k1 = 12.2 / SQRT(10) MTB > Print K1. K1 3.85798 (b)(c) Det blir lite tjatigt så jag räknar här ut sannolikheten att få medelvärden 65.0, 60.0 och 62.0 och beskriver bara i ord hur man sen svarar på frågorna. Matat in talen 65 60 62 i C1 Calc Probability Distrinutions Normal... ( ) (*) Cumulative Probability ( ) Mean [63.5 ] Standard Deviation [K1 ] ( ) Input Column [C1 ] Optionla storage [ ] ( ) Input constant [ ] Optionla storage [ ] MTB > CDF C1; SUBC> Normal 63.5 K1. Normal with mean = 63.5 and standard deviation = 3.85798 x P( X <= x ) 65 0.651290 60 0.182148 62 0.348710 9

Svaret till (b) är 1 0.651290 = 0.34871 Svaret till (c) är 0.348710 0.182148 Uppgift 6.5 sida 95 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan Situationen beskrivs som att standardavvikelsen för medelvärdet är känd och lika med 0.24, en möjlig men ovanlig situation. Det vanliga hade varit att man säger att standardavvikelsen i populationen är känd och lika med 1.018, och det är utifrån den skrivningen jag fortsätter med lösningen. Vi har bara rådata, inga sammanställda data, som underlag för stickprovsmedelvärdet. (a)(b) Stat Basic Statistics 1-Sample Z... (*) Samples in Column [C1 ] ( ) Summarized data Standard deviation [1.018] [v] Perform hypothesis test Hypothesized mean:[10 ] Options... Confidence level: [95.0 ] Alternative: Greater MTB > OneZ C1; SUBC> Sigma 1.018; SUBC> Test 10; SUBC> Alternative 1. Test of mu = 10 vs > 10 The assumed standard deviation = 1.018 95% Lower Variable N Mean StDev SE Mean Bound Z P C1 18 10.429 0.140 0.240 10.035 1.79 0.037 Svar till (a): förkasta H 0 eftersom P-värdet 0.037 är mindre än risknivån 0.05 Svar till (b): 10.035 (utskriften ovan ger bara Lower Bound). Anmärkning: Man ser på bokens facit till (b) att det var ett enkelsidigt konfidensintervall som efterfrågades, men det är inte tydligt i frågans formulering sida 96. Anmärkning: Jag hade inte gett C1 nåt namn. Har du nåt förslag? Uppgift 6.6 sida 96 Man behöver standardavvikelsen som uppgift till Minitab, men har fått variansen. Spara standardavvikelsen i K1, sen är allt förberett för en snabb lösning. Calc Calculator... Store results in variable [K1 ] Expression [SQRT(89.06) ] MOTSVARANDE KOMMANDON, ger inte någon utskrift MTB > Let k1 = sqrt(89.06) (a) Stat Basic Statistics 1-Sample Z... 10

( ) Samples in Column [ ] ( ) Summarized data Sample size:[24 ] Mean :[61.4 ] Standard deviation [K1 ] [ ] Perform hypothesis test Hypothesized mean:[ ] Options... Confidence level: [95.0 ] Alternative: [Not equal ] MTB > OneZ 24 61.4; SUBC> Sigma k1; SUBC> Confidence 99. The assumed standard deviation = 9.43716 N Mean SE Mean 99% CI 24 61.40 1.93 (56.44, 66.36) (b)(c) Bara konfidensnivån ändras. Här visas bara... KOMMANDON OCH UTSKRIFT MTB > OneZ 24 61.4; SUBC> Sigma k1. The assumed standard deviation = 9.43716 N Mean SE Mean 95% CI 24 61.40 1.93 (57.62, 65.18) MTB > OneZ 24 61.4; SUBC> Sigma k1; SUBC> Confidence 90. The assumed standard deviation = 9.43716 N Mean SE Mean 90% CI 24 61.40 1.93 (58.23, 64.57) Uppgift 7.2 sida 128 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan. Man ska alltså testa H 0 : µ 32, H 1 : µ < 32 Aktivera sessionfönstret Stat Basic Statistics 1-Sample t... (*) Samples in columns [C1 ] ( ) Summarized data. [v] Perform hypothesis test Hypothesized mean:[32 ] 11

Options... Confidence level[95] Alternative[Less than] MTB > Onet C1; SUBC> Test 32; SUBC> Alternative -1. Test of mu = 32 vs < 32 95% Upper Variable N Mean StDev SE Mean Bound T P Concentration 13 29.769 1.787 0.496 30.652-4.50 0.000 Anmärkning: Valet av konfidensnivå under Options är ej viktigt eftersom inget konfidensintervall efterfrågats. Anmärkning: Uppgiften anger inte någon önskad risknivå, men det är nog ändå rimligt här att man drar slutsatsen att H 0 ska förkastas därför att P-värdet är så litet. Uppgift 7.3 sida 128, konfidensintervalldelen (a) Det enda trixiga här är att få fram en gräns i t-fördelningen. Här söker jag två värden, t l som har 2.5% nedanför sig, och t u som har 2.5% ovanför sig eller m.a.o. 97.5% nedanför sig. Symmetrin i t-fördelningen ger att tl = tu så jag kan räkna ut en av dem och fix teckenbytet i huvudet. Jag räknar ut t u. Calc Probability Distrinutions t... ( ) Probability density ( ) Cumulative Probability (*) Inverse Cumulative Probability Noncentrality patameter[0 ] Degrees of freedom:[12] ( ) Input Column: [ ] Optional storage: [ ] (*) Input constant: [0.975 ] Optional storage: [ ] MTB > InvCDF 0.975; SUBC> T 12. Student s t distribution with 12 DF P( X <= x ) x 0.975 2.17881 Svar till(a) beräknas som 0.458 ± 2.17881 0.026 vilket ger 0.458 ± 0.056649 eller, med annan redovisningsform, 0.401 0.515 efter avrudning till 3 decimaler. (b)(c) Samma steg som ovan, visas ej här. Anmärkning: Det känns som mer vanligt att man får sammanställda data som ger standardavvikelsen, inte standard error. Om man hade fått uppgifterna med en sån sammanställning så skulle det vara lätt att lösa hela uppgiften genom. Stat Basic Statistics 1-Sample t... Fyll i medelvärde, standardavvikelse, antal som summarized data och välj rätt konfidensnivå under Options... 12

Vilken skulle standardavvikelsen vara i (a)? Svar 0.0937. Varför? Hör av dig om det trasslar. Uppgift 7.4a sida 128 Beräkna och spara standardavvikelsen i K1, sen är allt underlag klart för snabb beräkning av svaret. (a) Calc Calculator... Store results in variable [K1 ] Expression [SQRT(6.4512) ] Stat Basic Statistics 1-Sample t... ( ) Samples in columns [ ] ( ) Summarized data Sample size: [18 ] Mean: [13.5] Standard deviation: [k1 ] [ ] Perform hypothesis test Hypothesized mean:[ ] Options... Confidence level[95] Alternative[Not equal] för hela klick-sekvensen MTB > Let k1 = sqrt(6.4512) MTB > Onet 18 13.55 k1; SUBC> Confidence 95. N Mean StDev SE Mean 95% CI 18 13.550 2.540 0.599 (12.287, 14.813) Anmärkning: I facit har man valt en anna redovisningsform. (b)(c)(d) Dethär är en fråga som inte har en bra lösning. Givet att man har en viss uppfattning om variation så kan man beräkna ett antal för en förväntad vidd på intervallet men inte för en exakt vidd på intervallet. Jag gillar inte frågan i den mening att man får intrycket att det finns ett exakt svar när man borde betona att man bara kan få fram approximativt svar. Därefter skickas problemet vidare till nåt ekvationslösnigsprogram. Mer diskussion fanns i första labben. Uppgift 7.5 Sida 128 Spara standardavvikelsen i K1 först Calc Calculator... Store results in variable [K1 ] Expression [SQRT(8.44) ] Fortsättningen av lösningen: Använd dialogrutorna för att beräkna styrka, minsta differens eller antal. Fyll i alla uppgifter utom en så löser programmet vilket tal som ska stå där (om det finns en lösning). Jag föreslår att man inte ritar nån bild över styrkefunktionen. (a) Stat Power and sample size 1-Sample t... 13

Sample size: [ ] Difference: [2.0 ] Power values:[0.95] Standard Deviation:[k1] Graph... [ ] Display power curve Options... ( ) (*) Not equal ( ) Significance level [0.05] MTB > Power; SUBC> TOne; SUBC> Difference 2; SUBC> Power.95; SUBC> Sigma K1. 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.05 Assumed standard deviation = 2.90517 Sample Target Difference Size Power Actual Power 2 30 0.95 0.953826 (b) Stat Power and sample size 1-Sample t... Sample size: [ ] Difference: [2.0 ] Power values:[0.95] Standard Deviation:[k1] Graph... [ ] Display power curve Options... ( ) (*) Not equal ( ) Significance level [0.01 ] MTB > Power; SUBC> TOne; SUBC> Difference 2; SUBC> Power 0.95; 14

SUBC> Sigma k1; SUBC> Alpha 0.01. 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.01 Assumed standard deviation = 2.90517 Sample Target Difference Size Power Actual Power 2 41 0.95 0.950170 (c) Stat Power and sample size 1-Sample t... Sample size: [ ] Difference: [2.0 ] Power values:[0.99] Standard Deviation:[k1] Graph... [ ] Display power curve Options... ( ) (*) Not equal ( ) Significance level [0.05 ] MTB > Power; SUBC> TOne; SUBC> Difference 2; SUBC> Power 0.99; SUBC> Sigma k1. 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.05 Assumed standard deviation = 2.90517 Sample Target Difference Size Power Actual Power 2 41 0.99 0.990360 (d) Stat Power and sample size 1-Sample t... Sample size: [25 ] Difference: [ ] Power values:[0.95] Standard Deviation:[k1] Graph... 15

[ ] Display power curve Options... ( ) (*) Not equal ( ) Significance level [0.05 ] MTB > Power; SUBC> TOne; SUBC> Sample 25; SUBC> Power 0.95; SUBC> Sigma k1. 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.05 Assumed standard deviation = 2.90517 Sample Size Power Difference 25 0.95 2.18414 (e) Stat Power and sample size 1-Sample t... Sample size: [25 ] Difference: [2.0 ] Power values:[ ] Standard Deviation:[k1] Graph... [ ] Display power curve Options... ( ) (*) Not equal ( ) Significance level [0.05 ] MTB > Power; SUBC> TOne; SUBC> Sample 25; SUBC> Difference 2; SUBC> Sigma k1. 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0.05 Assumed standard deviation = 2.90517 16

Sample Difference Size Power 2 25 0.910121 Uppgift 7.7abcd sida 128 (a)(b) Stat Basic statistics 1 Variance... [Enter Variance ] ( ) Samples in columns (*) Summarized data Sample size: [18 ] Sample Variance: [6.4512 ] Options... Konfidence level: [95] Alternative: [Not equal] MTB > OneVariance 18 6.4512; SUBC> Confidence 95.0; SUBC> Alternative 0. Method The standard method is only for the normal distribution. The adjusted method cannot be calculated with summarized data. Statistics N StDev Variance 18 2.54 6.45 95% Confidence Intervals CI for CI for Method StDev Variance Standard (1.91, 3.81) (3.63, 14.50) (c) Stat Basic statistics 1 Variance... [Enter Variance ] ( ) Samples in columns (*) Summarized data Sample size: [18 ] Sample Variance: [6.4512 ] [v] Perform hypothesis test Hypothesized variance:[4.4 ] Options... Konfidence level: [95] 17

Alternative: [Greater than] MTB > OneVariance 18 6.4512; SUBC> Test 4.4; SUBC> Confidence 95.0; SUBC> Alternative 1. Method Null hypothesis Sigma-squared = 4.4 Alternative hypothesis Sigma-squared > 4.4 The standard method is only for the normal distribution. The adjusted method cannot be calculated with summarized data. Statistics N StDev Variance 18 2.54 6.45 95% One-Sided Confidence Intervals Lower Bound for Lower Bound Method StDev for Variance Standard 1.99 3.98 Tests Method Chi-Square DF P-Value Standard 24.93 17 0.096 Förkasta ej H 0 eftersom P-värdet är större än risknivån. (d) Här är det lite elakt för man har blandat så att den observerade utspriddheten ges som varians men hypotesen ges som standardavvikelse. Man kan välja i dialogrutan vilken form man vill ha men det avser då båda uppgifterna och inte att man ska blanda som man gjort här. Jag ser att det enklaste sättet är att formulera om hypoteserna i huvudet så det blir H 0 : σ 2 9, H 1 : σ 2 < 9 Stat Basic statistics 1 Variance... [Enter Variance ] ( ) Samples in columns (*) Summarized data Sample size: [18 ] Sample Variance: [6.4512 ] [v] Perform hypothesis test Hypothesized variance:[9 ] Options... Konfidence level: [95] Alternative: [Less than] 18

MTB > OneVariance 18 6.4512; SUBC> Test 9; SUBC> Confidence 95.0; SUBC> Alternative -1. Method Null hypothesis Sigma-squared = 9 Alternative hypothesis Sigma-squared < 9 The standard method is only for the normal distribution. The adjusted method cannot be calculated with summarized data. Statistics N StDev Variance 18 2.54 6.45 95% One-Sided Confidence Intervals Upper Bound for Upper Bound Method StDev for Variance Standard 3.56 12.65 Tests Method Chi-Square DF P-Value Standard 12.19 17 0.211 Förkasta ej H 0 eftersom P-värdet är större än risknivån. Uppgift 8.1 sida 177 Läs in data i 2 kolumner så som de visas i boken (jag har lagt dem i C1 och C2) eller i en kolumn med alla värden och en andra med grupptillhörighet (jag har lagt dem i C3 och C4) eller tanka från kurswebbsidan Ett steg för att bestämma sig exakt vilken analys som till slut ska väljas är att bestämma sig för om man tror att stickproben kan vara dragna ur populationer med samma varians eller inte. Nedan visas hur det blir om man antar att populationerna har samma varians. Analys om man har data på den form som jag ovan använder i C1 och C2: Stat Basic Statistics 2-Sample t... ( ) Samples in one column Samples: [ ] Subscripts: [ ] (*) Samples in different columns First: [C1 ] Second: [C2 ] ( ) Summarized data Sample Size Mean Standard deviation First [ ] [ ] [ ] Second [ ] [ ] [ ] [v] Assume equal variances Options... 19

Confidence level [95.0 ] Test difference [0 ] Alternative [Not equal] MTB > TwoSample C1 C2; SUBC> Pooled. Two-sample T for Male vs Female N Mean StDev SE Mean Male 7 224.24 4.25 1.6 Female 6 225.67 3.87 1.6 Difference = mu (Male) - mu (Female) Estimate for difference: -1.42 95% CI for difference: (-6.42, 3.58) T-Test of difference = 0 (vs not =): T-Value = -0.63 P-Value = 0.544 DF = 11 Both use Pooled StDev = 4.0829 Analys om man har data på den form som jag ovan använder i C3 och C4 Stat Basic Statistics 2-Sample t... (*) Samples in one column Samples: [C3 ] Subscripts: [C4 ] ( ) Samples in different columns First: [ ] Second: [ ] ( ) Summarized data Sample Size Mean Standard deviation First [ ] [ ] [ ] Second [ ] [ ] [ ] [v] Assume equal variances Options... Confidence level [95.0 ] Test difference [0 ] Alternative [Not equal] MTB > TwoT C3 C4; SUBC> Pooled. Two-sample T for Cholesterol MaleFemale N Mean StDev SE Mean 1 7 224.24 4.25 1.6 2 6 225.67 3.87 1.6 Difference = mu (1) - mu (2) Estimate for difference: -1.42 95% CI for difference: (-6.42, 3.58) 20

T-Test of difference = 0 (vs not =): T-Value = -0.63 P-Value = 0.544 DF = 11 Both use Pooled StDev = 4.0829 Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att inte förkasta H 0 därför att P-värdet är så stort. Uppgift 8.4 sida 177 Det är ovanligt att man får kvadratsumma som underlag. Jag räknar ut standardavvikelse i första stickprovet och lagrar i K1, standardavvikelse i andra stickprovet och lagrar i K2. kvadratsumma frihetsgrad s = Calc Calculator... Store results in variable [K1 ] Expression: [SQRT(364.34/18) ] Calc Calculator... Store results in variable [K2 ] Expression: [SQRT(286.76/23) ] MOTSVARANDE KOMMANDON, ger ingen utskrift MTB > Let K1 = SQRT(364.34/18) MTB > Let K2 = SQRT(286.76/23) Jag visar här lösningen om man antar att stickproven är dragna ur fördelningar med samma varians. Stat Basic Statistics 2-Sample t... ( ) Samples in one column Samples: [ ] Subscripts: [ ] ( ) Samples in different columns First: [ ] Second: [ ] (*) Summarized data Sample Size Mean Standard deviation First [24 ] [349.8 ] [K2 ] Second [19 ] [334.6 ] [K1 ] [v] Assume equal variances Options... Confidence level [95 ] Test difference [10 ] Alternative [Greater ] MTB > TwoT 24 349.8 K2 19 334.6 K1; SUBC> Pooled; SUBC> Test 10.0; SUBC> Alternative 1. Sample N Mean StDev SE Mean 1 24 349.80 3.53 0.72 2 19 334.60 4.50 1.0 21

Difference = mu (1) - mu (2) Estimate for difference: 15.20 95% lower bound for difference: 13.14 T-Test of difference = 10 (vs >): T-Value = 4.25 P-Value = 0.000 DF = 41 Both use Pooled StDev = 3.9850 Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att förkasta H 0 därför att P-värdet är så litet. Anmärkning: Det kan se lite mysko ut att sammanställda data matades in med andra stickprovet först men det beror på att bokens fråga gäller (µ 2 µ 1 ) medan Minitabs test avser (µ första µ andra ) så jag får antingen anpassa inmatningen till Minitabs ordning eller gå in och göra en stor omformulering av frågan, vilket verkar svårare. Anmärkning: Frågan är illa formulerad. Det är H 0 som testas, och hypoteserna här är H 0 : (µ 2 µ 1 ) 10, H 1 : (µ 2 µ 1 ) > 10 eller H 0 : (µ 1 µ 2 ) 10, H 1 : (µ 1 µ 2 ) < 10 Uppgift 8.8 sida 177 Ladda in data på samma sätt som du gjorde till 8.1. Analys med data på den form de sparades i C1 och C2 Stat Basic Statistics 2 Variances... ( ) Samples in one column Samples: [ ] Subscripts: [ ] (*) Samples in different columns First: [C1 ] Second: [C2 ] ( ) Summarized data Sample Size Mean Standard deviation First [ ] [ ] [ ] Second [ ] [ ] [ ] Options... Confidence level [95 ] Titel [ ], ngt nedklippt MTB > VarTest C1 C2; SUBC> Unstacked. 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Male 7 2.58580 4.25475 10.7029 Female 6 2.26713 3.86661 11.0622 F-Test (Normal Distribution) Test statistic = 1.21, p-value = 0.852 Analys med data på den form de sparades i C3 och C4 22

Stat Basic Statistics 2 Variances... (*) Samples in one column Samples: [C3 ] Subscripts: [C4 ] ( ) Samples in different columns First: [ ] Second: [ ] ( ) Summarized data Sample Size Mean Standard deviation First [ ] [ ] [ ] Second [ ] [ ] [ ] Options... Confidence level [95 ] Titel [ ], ngt nedklippt MTB > VarTest C3 C4. 95% Bonferroni confidence intervals for standard deviations MaleFemale N Lower StDev Upper 1 7 2.58580 4.25475 10.7029 2 6 2.26713 3.86661 11.0622 F-Test (Normal Distribution) Test statistic = 1.21, p-value = 0.852 Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att inte förkasta H 0 därför att P-värdet är så stort. Anmärkning: Om man kollar t-testen uppg 8.1 så ser man att valet mellan de två inmatningsformerna gör att man måste välja mellan kommandona TWOS eller TWOT. Ovan väljer man istället genom att ta med eller inte ta med underkommandot STACKED. Anmärkning: Den som kan komma på hur man gör för att slippa få en bild och först mejlar det till mig kommer att bli bjuden på glass. Uppgift 8.12 sida 178 Mata in datat på samma sätt som till uppgift 8.1 Stat Nonparametrics Mann-Whitney... First sample [C1 ] Second sample [C2 ] MTB > Mann-Whitney 95.0 C1 C2; SUBC> Alternative 0. N Median Male 7 224.10 Female 6 224.05 Point estimate for ETA1-ETA2 is -1.40 96.2 Percent CI for ETA1-ETA2 is (-6.70,5.00) W = 44.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.5203 23

Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att inte förkasta H 0 därför att P-värdet är så stort. Anmärkning: Av nån anledning som jag inte vet tillåter Minitab bara data på icke-stackad form till MannWhitney Uppgift 9.1 sida 188 Mata in data så som de visas (jag har lagt dem i C1, C2 och C3) eller tanka från kurswebbsidan. Egentligen behövs inte C1. (a)(b) Stat Basic Statistics Paited t... (*) Samples in columns First: [C2 ] Second: [C3 ] ( ) Summarized data. Options... Confidence level [95 ] Test difference [0 ] Alternative [Not equal] MTB > Paired C2 C3. Paired T for NOx - HC N Mean StDev SE Mean NOx 11 83.73 16.89 5.09 HC 11 85.82 16.44 4.96 Difference 11-2.09 4.28 1.29 95% CI for mean difference: (-4.96, 0.78) T-Test of mean difference = 0 (vs not = 0): T-Value = -1.62 P-Value = 0.136 svar till (b) Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att inte förkasta H 0 därför att P-värdet är så stort. Uppgift 9.2 sida 188 Mata in data på samma sätt som till uppgift 9.1 Här förväntar sig programmet att man först räknar ut skillnaden mellan de två variablerna och lagrar den, sen anropar Wilcoxons test. Calc Calculator... Store results in [ C4 ] Expression [C2-C3 ] Stat Nonparametrics 1-sample Wilcoxons... Variables [C4] ( ) Confidence interval (*) Test median [ 0 ] Alternative [Not equal] MTB > Let C4 = C2-C3 MTB > WTest 0.0 C4; SUBC> Alternative 0. 24

Test of median = 0.000000 versus median not = 0.000000 N for Wilcoxon Estimated N Test Statistic P Median C4 11 11 16.0 0.142-2.000 Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att inte förkasta H 0 därför att P-värdet är så stort. Uppgift 10.1 sida 225 Läs in data i 4 kolumner så som de visas i boken (jag har lagt dem i C1 t.o.m. C2) eller i en kolumn med alla värden och en andra med grupptillhörighet (jag har lagt dem i C5 och C6) eller tanka från kurswebbsidan. Data på den form de lagts i C1 t.o.m. C4 Stat ANOVA One-Way (unstacked)... Responses (in separate columns): [C1-C4 ] MTB > AOVOneway C1-C4. Source DF SS MS F P Factor 3 2.3065 0.7688 22.08 0.000 Error 18 0.6267 0.0348 Total 21 2.9332 S = 0.1866 R-Sq = 78.64% R-Sq(adj) = 75.07% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- Feb 5 4.8200 0.1304 (----*----) May 6 4.3333 0.1751 (----*---) Aug 6 4.6667 0.1506 (---*----) Nov 5 5.2400 0.2702 (----*----) -+---------+---------+---------+-------- 4.20 4.55 4.90 5.25 Pooled StDev = 0.1866 Anmärkning: Om man vill göra något med en grupp kolumner i följd så kan man ange den första följt av bindestreck följt av den sista. Det används ovan när gruppen kolumn 1 t.o.m. kolumn 4 anropas med C1-C4. Data på den form de lagts i C5 och C6 Stat ANOVA One-Way... Response:[C5 ] Factor: [C6 ] MTB > Oneway C5 C6. Source DF SS MS F P Month 3 2.3065 0.7688 22.08 0.000 Error 18 0.6267 0.0348 Total 21 2.9332 25

S = 0.1866 R-Sq = 78.64% R-Sq(adj) = 75.07% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- 1 5 4.8200 0.1304 (----*----) 2 6 4.3333 0.1751 (----*---) 3 6 4.6667 0.1506 (---*----) 4 5 5.2400 0.2702 (----*----) -+---------+---------+---------+-------- 4.20 4.55 4.90 5.25 Pooled StDev = 0.1866 Data på den form de lagts i C5 och C6 med ett menyval/kommando som är bättre förberett för att generalisera till mer komplicerade modeller. Stat Anova Balanced ANOVA... Responses: [C5 ] Model: [C6 ] Random Factors: [ ] MTB > ANOVA C5 = C6. Factor Type Levels Values Month fixed 4 1, 2, 3, 4 Analysis of Variance for Weight Source DF SS MS F P Month 3 2.30652 0.76884 22.08 0.000 Error 18 0.62667 0.03481 Total 21 2.93318 S = 0.186587 R-Sq = 78.64% R-Sq(adj) = 75.07% Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att förkasta H 0 därför att P-värdet är så litet. Anmärkning: Jag tror att det är bäst att vänja sig vid det 3:e sättet enligt förslagen ovan då det går att bygga vudare tillstörre och mer komplicerade modeller. Uppgift 10.2 sida 225, 10.3 sida 225 och 10.4 sida 225 Styrkeberäkning så som den beskrivs med formel (10.32) och (10.33) sida 208 samt texten runtomkring är bra, men tyvärr ger inte Minitab stöd för det så vitt jag vet. Däremot finns stöd för den förenklade beräkningen så som den beskrivs med formel (10.34) sida 208 och texten runtomkring. Uppgifterna 10.2 10.4 har den formen och kommer att gå att lösa. Liksom tidigare styrkeberäkningar gäller det att hitta ett menyval där man fyller i alla uppgifter utom en och sen försöker programmet beräkna den. Uppgift 10.2 sida 225 Se kommentaren om uppgifterna 10.2 10.4 ovan Spara standardavvikelsen i K1 först KOMMANDO, ger ingen utskrift MTB > let k1=sqrt(1.54) Stat Power and sample size One-Way ANOVA... 26

Number of levels [5 ] Specify values for any two of the following Sample Sizes [12 ] Values of the maximum difference between means [2.0 ] Power values [ ] Standard deviation [K1 ] Options... Signifcance level [0.05] Store... [ ]. Graph [ ] Display power curve MTB > Power; SUBC> OneWay 5; SUBC> Sample 12; SUBC> MaxDifference 2; SUBC> Sigma k1. One-way ANOVA Alpha = 0.05 Assumed standard deviation = 1.24097 Number of Levels = 5 SS Sample Maximum Means Size Power Difference 2 12 0.874223 2 The sample size is for each level. Uppgift 10.3 sida 225 Se kommentaren om uppgifterna 10.2 10.4 ovan. Texten finns precis innan uppgift 10.2. Spara standardavvikelsen i K1 först, se uppgift 10.2 Stat Power and sample size One-Way ANOVA... Number of levels [5 ] Specify values for any two of the following Sample Sizes [ ] Values of the maximum difference between means [2.0 ] Power values [0.95 ] Standard deviation [K1 ] Options... Signifcance level [0.05] Store... [ ]. Graph [ ] Display power curve 27

MTB > Power; SUBC> OneWay 5; SUBC> MaxDifference 2; SUBC> Power 0.95; SUBC> Sigma k1. One-way ANOVA Alpha = 0.05 Assumed standard deviation = 1.24097 Number of Levels = 5 SS Sample Target Maximum Means Size Power Actual Power Difference 2 16 0.95 0.959594 2 The sample size is for each level. Uppgift 10.4 sida 225 Se kommentaren om uppgifterna 10.2 10.4 ovan. Texten finns precis innan uppgift 10.2. Spara standardavvikelsen i K1 först, se uppgift 10.2 Stat Power and sample size One-Way ANOVA... Number of levels [5 ] Specify values for any two of the following Sample Sizes [10 ] Values of the maximum difference between means [ ] Power values [0.95 ] Standard deviation [K1 ] Options Signifcance level [0.05] Store... [ ]. Graph [ ] Display power curve MTB > Power; SUBC> OneWay 5; SUBC> Sample 10; SUBC> Power 0.95; SUBC> Sigma k1. One-way ANOVA Alpha = 0.05 Assumed standard deviation = 1.24097 Number of Levels = 5 Sample Maximum Size Power SS Means Difference 10 0.95 3.17945 2.52169 The sample size is for each level. Uppgift 10.5 sida 225 Mata in data på samma sätt som tilluppgift 10.1 Stat Nonparametrics Kruskal-Wallis... 28

Response: [C5 ] Factor: [C6 ] MTB > Kruskal-Wallis C5 C6. Kruskal-Wallis Test on Weight Month N Median Ave Rank Z 1 5 4.800 13.9 0.94 2 6 4.350 3.9-3.35 3 6 4.700 10.3-0.55 4 5 5.200 19.7 3.21 Overall 22 11.5 H = 17.06 DF = 3 P = 0.001 H = 17.26 DF = 3 P = 0.001 (adjusted for ties) Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att förkasta H 0 därför att P-värdet är så litet. Anmärkning: Här finns inget menyalternativ för data på icke-stackad form. Uppgift 11.2 sida 247 Läs in data i 4 kolumner så som de visas i boken (jag har lagt dem i C1 t.o.m. C4) eller i en kolumn med alla värden och en andra med grupptillhörighet (jag har lagt dem i C5 och C6) eller tanka från kurswebbsidan. Data på den form de lagts i C1 t.o.m. C4 Stat ANOVA One-Way (unstacked)... Responses (in separate columns): [C1-C4 ] Comparisons [v] Tukey s, family error rate [5 ] [ ] Fisher,s, individual error rate [ ] [ ] Dunnet s, family error rate [ ] Control group level [ ] [ ] Hsu s MCB, family error rate [ ] ( ) ( ) MTB > AOVOneway C1-C4; SUBC> Tukey 5. Source DF SS MS F P Factor 3 2.3065 0.7688 22.08 0.000 Error 18 0.6267 0.0348 Total 21 2.9332 S = 0.1866 R-Sq = 78.64% R-Sq(adj) = 75.07% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- Feb 5 4.8200 0.1304 (----*----) May 6 4.3333 0.1751 (----*---) Aug 6 4.6667 0.1506 (---*----) Nov 5 5.2400 0.2702 (----*----) -+---------+---------+---------+-------- 29

4.20 4.55 4.90 5.25 Pooled StDev = 0.1866 Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 98.89% Feb subtracted from: Lower Center Upper --------+---------+---------+---------+- May -0.8062-0.4867-0.1671 (----*----) Aug -0.4729-0.1533 0.1662 (----*---) Nov 0.0862 0.4200 0.7538 (----*----) --------+---------+---------+---------+- -0.70 0.00 0.70 1.40 May subtracted from: Lower Center Upper --------+---------+---------+---------+- Aug 0.0286 0.3333 0.6380 (----*---) Nov 0.5871 0.9067 1.2262 (----*----) --------+---------+---------+---------+- -0.70 0.00 0.70 1.40 Aug subtracted from: Lower Center Upper --------+---------+---------+---------+- Nov 0.2538 0.5733 0.8929 (---*----) --------+---------+---------+---------+- -0.70 0.00 0.70 1.40 Data på den form de lagts i C5 och C6 Stat ANOVA One-Way... Response:[C5 ] Factor: [C6 ] Comparisons [v] Tukey s, family error rate [5 ] [ ] Fisher,s, individual error rate [ ] [ ] Dunnet s, family error rate [ ] Control group level [ ] [ ] Hsu s MCB, family error rate [ ] ( ) ( ) MTB > Oneway C5 C6; SUBC> Tukey 5. Source DF SS MS F P Month 3 2.3065 0.7688 22.08 0.000 Error 18 0.6267 0.0348 Total 21 2.9332 S = 0.1866 R-Sq = 78.64% R-Sq(adj) = 75.07% 30

Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- 1 5 4.8200 0.1304 (----*----) 2 6 4.3333 0.1751 (----*---) 3 6 4.6667 0.1506 (---*----) 4 5 5.2400 0.2702 (----*----) -+---------+---------+---------+-------- 4.20 4.55 4.90 5.25 Pooled StDev = 0.1866 Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of Month Individual confidence level = 98.89% Month = 1 subtracted from: Month Lower Center Upper --------+---------+---------+---------+- 2-0.8062-0.4867-0.1671 (----*----) 3-0.4729-0.1533 0.1662 (----*---) 4 0.0862 0.4200 0.7538 (----*----) --------+---------+---------+---------+- -0.70 0.00 0.70 1.40 Month = 2 subtracted from: Month Lower Center Upper --------+---------+---------+---------+- 3 0.0286 0.3333 0.6380 (----*---) 4 0.5871 0.9067 1.2262 (----*----) --------+---------+---------+---------+- -0.70 0.00 0.70 1.40 Month = 3 subtracted from: Month Lower Center Upper --------+---------+---------+---------+- 4 0.2538 0.5733 0.8929 (---*----) --------+---------+---------+---------+- -0.70 0.00 0.70 1.40 Anmärkning: Här får man jämförelserna uttryckta som konfidensintervall, inte som test. Tukey-delarna är lätta att få ut som test i Minitab genom några andra menyval. Det känns ändå som att lösningen ovan är tillräckligt bra. Uppgift 11.4 sida 247 Läs in data i 4 kolumner så som de visas i boken (jag har lagt dem i C1 t.o.m. C4) eller i en kolumn med alla värden och en andra med grupptillhörighet (jag har lagt dem i C5 och C6) eller tanka från kurswebbsidan. Data på den form de lagts i C1 t.o.m. C4 Stat ANOVA One-Way (unstacked)... Responses (in separate columns): [C1-C4 ] Comparisons [ ] Tukey s, family error rate [ ] [ ] Fisher,s, individual error rate [ ] [v] Dunnet s, family error rate [5 ] Control group level [C1 ] 31

[ ] Hsu s MCB, family error rate [ ] ( ) ( ) MTB > AOVOneway C1-C4; SUBC> Dunnett 5 C1. Source DF SS MS F P Factor 3 338.94 112.98 12.04 0.000 Error 15 140.75 9.38 Total 18 479.69 S = 3.063 R-Sq = 70.66% R-Sq(adj) = 64.79% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ Feed_1 5 64.620 3.345 (-----*-----) Feed_2 5 71.300 3.068 (-----*----) Feed_3 4 73.350 3.414 (------*-----) Feed_4 5 63.240 2.416 (----*-----) ---------+---------+---------+---------+ 65.0 70.0 75.0 80.0 Pooled StDev = 3.063 Dunnett s comparisons with a control Family error rate = 0.05 Individual error rate = 0.0195 Critical value = 2.61 Control = Feed_1 Intervals for treatment mean minus control mean Level Lower Center Upper -+---------+---------+---------+-------- Feed_2 1.614 6.680 11.746 (-------*--------) Feed_3 3.357 8.730 14.103 (--------*--------) Feed_4-6.446-1.380 3.686 (--------*-------) -+---------+---------+---------+-------- -6.0 0.0 6.0 12.0 Data på den form de lagts i C5 och C6 Stat ANOVA One-Way (unstacked)... Responses (in separate columns): [C1-C4 ] Comparisons [ ] Tukey s, family error rate [ ] [ ] Fisher,s, individual error rate [ ] [v] Dunnet s, family error rate [5 ] Control group level [1 ] [ ] Hsu s MCB, family error rate [ ] ( ) ( ) 32

MTB > Oneway C5 C6; SUBC> Dunnett 5 1. Source DF SS MS F P Diet 3 338.94 112.98 12.04 0.000 Error 15 140.75 9.38 Total 18 479.69 S = 3.063 R-Sq = 70.66% R-Sq(adj) = 64.79% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ 1 5 64.620 3.345 (-----*-----) 2 5 71.300 3.068 (-----*----) 3 4 73.350 3.414 (------*-----) 4 5 63.240 2.416 (----*-----) ---------+---------+---------+---------+ 65.0 70.0 75.0 80.0 Pooled StDev = 3.063 Dunnett s comparisons with a control Family error rate = 0.05 Individual error rate = 0.0195 Critical value = 2.61 Control = level (1) of Diet Intervals for treatment mean minus control mean Level Lower Center Upper -+---------+---------+---------+-------- 2 1.614 6.680 11.746 (-------*--------) 3 3.357 8.730 14.103 (--------*--------) 4-6.446-1.380 3.686 (--------*-------) -+---------+---------+---------+-------- -6.0 0.0 6.0 12.0 Anmärkning: Här får man jämförelserna uttryckta som konfidensintervall, inte som test. Det känns ändå som att lösningen ovan är tillräckligt bra. Anmärkning: Detta stämmer inte med facit sida 878. Jag förstår inte vad de gjort i facit. Där ger man att medelvärdena ska vara 60.62... 100.35 men data till exempel 10.1 visas med medelvärden på sida 191 och det stämmer inte alls. Vad har de räknat på i facit? Uppgift 12.1abc sida 284 mata in data (jag har lagt observationerna i C1, kön i C2 och Species i C3) eller tanka från kurswebbsidan. Uppgiften ger inte tydlig information om ifall species ska betraktas som fix eller slump. Jag tycker det är rimligt att betrakta den som slump och räknar så i mina svar nedan. Författaren har räknat species som fix i facit sida 878 879. Stat ANOVA Balanced Anova... Responses: [C1 ] Model: [C2 C3 C2*C3] Random Factors: [C3 ] 33

Options [v] Use the restricted form of the model MTB > ANOVA C1 = C2 C3 C2*C3; SUBC> Random C3; SUBC> Restrict. Factor Type Levels Values Sex fixed 2 0, 1 Species random 3 1, 2, 3 Analysis of Variance for Concentration Source DF SS MS F P Sex 1 138.720 138.720 40.26 0.024 Species 2 55.261 27.630 13.08 0.000 Sex*Species 2 6.891 3.445 1.63 0.223 Error 18 38.018 2.112 Total 23 238.890 S = 1.45330 R-Sq = 84.09% R-Sq(adj) = 79.67% Risknivåer ges ej i uppgiften. För vart och ett av testen: förkasta H 0 om P-värdet är mindre än den önskade riksnivån, förkasta ej H 0 om P-värdet är större än den önskade riksnivån. Uppgift 12.2 sida 284 Mata in data (jag har lagt observationerna i C1, block i C2 och Variety i C3) eller tanka från kurswebbsidan Stat ANOVA Balanced Anova... Responses: [C1 ] Model: [C2 C3 ] Random Factors: [ ] MTB > ANOVA C1 = C2 C3. Factor Type Levels Values Block fixed 6 1, 2, 3, 4, 5, 6 Variety fixed 4 1, 2, 3, 4 Analysis of Variance for Height Source DF SS MS F P Block 5 19.793 3.959 9.10 0.000 Variety 3 188.538 62.846 144.44 0.000 Error 15 6.527 0.435 Total 23 214.858 S = 0.659630 R-Sq = 96.96% R-Sq(adj) = 95.34% 34

Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att förkasta H 0 därför att P-värdet är så litet. Anmärkning: Det framgår inte av texten om block är slump eller fix faktor, men här kommer valen i dialogrutorna och utskrift och resultat bli oförändrade även om block skulle ändras till att vara slump Uppgift 12.3 sida 285 Använd samma data som till 12.2 Stat Nonparametrics Friedman... Response: [C1 ] Treatment: [C3 ] Blocks: [C2 ] MTB > Friedman C1 C3 C2. S = 18.00 DF = 3 P = 0.000 Sum of Variety N Est Median Ranks 1 6 17.972 18.0 2 6 21.022 24.0 3 6 15.234 12.0 4 6 13.359 6.0 Grand median = 16.897 Risknivån ges ej i uppgiften. Slutsatsen bör rimligen vara att förkasta H 0 därför att P-värdet är så litet. Uppgift 12.4 sida 285 Utgår, Minitab inte ger ej bra stöd för att lösa uppgiften. Uppgift 13.1 sida 295 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan. Calc Calculator... Store results in variable:[c2 ] Expression[LOGTEN(C1+1) ] Jag har kört bas 10 ovan, klura själv ut hur du ska göra om du vill köra naturlig logaritm. Stat Basic Statistics 1-sample t... (*) Samples in columns [C2].. MTB > Let C2 = LOGTEN(C1+1) MTB > Onet C2. Variable N Mean StDev SE Mean 95% CI C2 8 0.68339 0.01027 0.00363 (0.67480, 0.69198) Nu får du upp intervallet på skärmen men räknat på transformerade data. Sista steget, att återtransformera gränserna, går att göra i Minitab men det verkar minst lika enkelt att göra det med miniräknare. Här gör jag det med kommandon i Minitab utan att visa motsvarande klick-alternativ. 35

MTB > set C3 DATA> 0.67480, 0.69198 DATA> end # detta end-kommando krävs ej, se motsv i uppgift 13.3 MTB > let C4=10**C3-1 MTB > prin C4 C4 3.72933 3.92017 Uppgift 13.3 sida 295 Mata in data (jag har lagt dem i C1) eller tanka från kurswebbsidan. Calc Calculator... Store results in variable:[c2 ] Expression[SQRT(C1+0.5) ] Stat Basic Statistics 1-sample t... (*) Samples in columns [C2].. MTB > Let C2 = SQRT(C1+0.5) MTB > Onet C2. Variable N Mean StDev SE Mean 95% CI C2 6 2.428 0.570 0.233 (1.829, 3.027) Nu får du upp intervallet på skärmen men räknat på transformerade data. Sista steget, att återtransformera gränserna, går att göra i Minitab men det verkar minst lika enkelt att göra det med miniräknare. Här gör jag det med kommandon i Minitab utan att visa motsvarande klick-alternativ. MTB > set C3 DATA> 1.829, 3.027 DATA> let C4=C3**2-0.5 MTB > prin C4 C4 2.84524 8.66273 Uppgift 14.1 sida 306 Mata in data (jag har lagt observationerna i C1, faktor A i C2, faktor B i C3 och faktor C i C4) eller tanka från kurswebbsidan. OBS för att få med mer saker så har jag tänkt mig att övningen blir bättre om man anger att faktorerna ska vara blandade. Här kör jag med att A är en slumpfaktor medan B och C är fixa faktorer. Detta gavs ej av uppgiften utan är något jag har hittat på. Stat ANOVA Balanced Anova... Response [C1 ] Model [C2 C3 C4 C2*C3 C2*C4 C3*C4 C2*C3*C4] Random Factors [C2 ] Options [v] Use the restricted form of the model 36