Datorövning 1 Introduktion till Minitab och Excel

Relevanta dokument
DATORÖVNING 2: STATISTISK INFERENS.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Datoro vning 1-2 Statistisk analys av kodade svar

DATORÖVNING 2: TABELLER OCH STANDARD-

DATORÖVNING 2: BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA. STATISTISK INFERENS.

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

Datorövning 1 Statistik med Excel (Office 2007, svenska)

Datorövning 1 Statistik med Excel (Office 2010, svenska)

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

Datorövning 1 Enkel linjär regressionsanalys

Marknadsinformationsmetodik Inlämningsuppgift

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Laboration med Minitab

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

DATORÖVNING 1: INTRODUKTION TILL DATORSYSTEMET. BESKRIVANDE STATISTIK. SANNOLIKHETSLÄRA.

Intro till SPSS Kimmo Sorjonen (0811)

Hämtning av sekundärdata och introduktion till Excel

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

*****************************************************************************

En introduktion till och första övning for Excel

INNEHÅLL DEL 2 FORMATERA KALKYL DEL 1 SKAPA KALKYL

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Marknadsinformationsmetodik Inlämningsuppgift

Syfte Syftet med den här laborationen är att du ska lära dig använda några grundfunktioner i Microsoft Excel.

Ett enkelt Kalkylexempel - Fruktaffären

Richard Öhrvall, 1

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Handledning för konstruktion av tabeller och diagram med Excel

Grundläggande statistik kurs 1

Laborationer i statistik för A:1, Lab 1

Valresultat Riksdagen 2018

Datorövning 5 Exponentiella modeller och elasticitetssamband

Datorövning 2 Multipel regressionsanalys, del 1

Datorövning 1 Calc i OpenOffice 1

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Manual till funktionen Rapport/Export (beta) i Compos - Föräldrastöd February 2, 2016

Excel-guide. Introduktion

4 Kolumn Kalkylbladet är uppdelat i rader (horisontellt) och kolumner (vertikalt). Där dessa möts finns alltid en cell.

FK2005 Datorövning 3

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Att göra före det schemalagda labpasset.

DATORÖVNING 3: EXPERIMENT MED

Universitetskanslersämbetets Högskoleutforskare. En introduktion till analysvyn exemplet måluppfyllelse

6 PIVOTTABELLER SKAPA PIVOTTABELL. Skapa pivottabell

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

Word Grunderna 1. Om du kan det allra enklaste i Word, hoppa över uppgifterna A-E.

Extramaterial till Matematik X

Excel Online Version 1.0 Skolkontoret

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

LABORATIONER. Det finns en introduktionsfilm till Minitab på

INSPIRA. Microsoft. Excel 2007 Grunder

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Introduktion till. Minitab version 14

Mata in data i Excel och bearbeta i SPSS

samma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel med Resampling-pluginet, välj Resampling Stats for Excel i Start-menyn.

2.1 Minitab-introduktion

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Obligatorisk uppgift, del 1

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

SurveyXact version 6.10

LABORATION 1. Syfte: Syftet med laborationen är att

Extramaterial till Matematik Y

Introduktion till Word och Excel

Information efter genomgång av Microsoft Excel 2010

Introduktion och laboration : Minitab

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

DATORÖVNING 4: DISKRETA

Arbeta med normalfördelningar

Ett litet kompendium om Excel 2003 som statistiskt verktyg

Kom igång. Readyonet Lathund för enkelt admin. Logga in Skriv in adressen till din webbsida följt av /login. Exempel:

Katedralskolan Lena Claesson MICROSOFT EXCEL

Efter att ha gjort ett urval av patienter i förlossningsliggaren kan du göra en rapport som visar de uppgifter du är intresserad av.

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Lathund Excel Nytt utseende. Skapa Nytt. Flikar

Introduktion till Winbas. excel till Winbas

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

EXCEL. Pivottabeller

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Kopplingar via datalänk från Winbas till Excel samt Pivottabell 1 (13)

Statistik för Brandingenjörer. Laboration 1

Om Publisher Publisher är ett program som passar bra att använda när du vill sammanställa bild och text för att skapa tillexempel broshyrer,

Excel Övning 1 ELEV: Datorkunskap Sida 1 Niklas Schilke

Beskrivande statistik

Medelvärde, median och standardavvikelse

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

Manual

1. DEFINIERADE TABELLER. 1.1 Definiera en Excel-tabell

Steg för Steg Att använda Statistics explorer med data från SKLs databas

Laboration 2 multipel linjär regression

Statistik i Excel en introduktion

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Laboration 1 Introduktion till Visual Basic 6.0

Transkript:

Datorövning 1 Introduktion till Minitab och Excel Allmänt Hittills under statistikkursen har vi ägnat oss åt metoder för att illustrera och beskriva datamaterial. Du har kanske börjat öva på att räkna för hand (med hjälp av räknedosa) på små datamaterial för att få förståelse för metoderna, och då har du säkert upptäckt att arbetet ändå blir ganska omfattande. Och hur blir det då inte om vi har realistiska datamängder med kanske flera tiotals variabler och många tusen observationer! Då är datorn med ett lämpligt statistikprogram ett helt nödvändigt verktyg. Vi skall därför på datorövningarna arbeta med realistiska datamaterial och se hur rationellt vi kan genomföra alla analyser. Om de program vi kommer att använda Minitab är ett program för statistisk analys av data. Det är speciellt konstruerat för att vara lätt att använda, men är ändå kraftfullt och innehåller de flesta av de mest använda statistiska analysmetoder. Skillnaden mot andra statistikprogram såsom SAS och SPSS är främst att Minitab inte klarar av lika stora datamängder, i alla fall inte att hantera sådana effektivt. För de flesta syften, även på professionell nivå, är dock Minitab oftast fullt tillräckligt. Många av de saker vi gör på våra datorövningar kan man också göra i Excel, ett program som du troligen känner till sedan tidigare. Minitab är starkare på vissa saker, Excel på andra. I synnerhet är Excel bättre på att rita diagram: de blir både snyggare och enklare att anpassa så som vi vill ha dem, medan Minitab är bättre på att räkna med statistiska metoder. Därför kommer vi i datorövningarna att arbeta både med Minitab och Excel, men tyngdpunkten ligger på Minitab. Minitab kommer även att ha en central roll i kommande statistikkurser i er utbildning. Minitabs fönster Öppna Minitab. Två fönster öppnas automatiskt. I det undre, dataarket (Worksheet), kan man läsa och/eller lägga in data i kolumner C1, C2 etc. I det övre fönstret, Sessionfönstret, hanterar man kommandon och här får man också ut resultaten från beräkningarna man gör. Observera att dataarket är ett rent dataark och inte ett kalkylblad, dvs man kan inte som i Excel lägga in formler etc. Man kan välja mellan att skriva kommandon i Sessionfönstret eller att arbeta från menyerna. I början kan det vara enklare att använda menyerna som i stort sett är självinstruerande. När man blir mera van går det snabbare att skriva kommandon. Se till att alltid ligga på kommandonivå 1

(dvs att ha prompten MTB i Sessionfönstret) genom att under Editor ha Enable Commands markerat (det kan du göra när du befinner dig i Sessionfönstret). När du kör via menyerna kan du då i Sessionfönstret se motsvarande kommandon, vilket förstås är lärorikt. Något om menyerna i Minitab Menyerna finns i översta raden i Minitabfönstret. I raden under finns också några funktioner direkt tillgängliga, sådana som man använder ofta. Denna första gång är det nyttigt att orientera sig om vad som finns i Minitab. Gå igenom de olika menyerna enligt nedan: File innehåller de vanliga kommandona för att öppna, spara och skriva ut. Det vanligaste kommandot att skriva ut finns också som snabbknapp. Edit innehåller traditionella editeringsfunktioner som klippa ut, klistra in, ångra etc. Flera av funktionerna har också en snabbknapp. Data döljer ett flertal kommandon för att manipulera data, som att t.ex. kopiera kolumner, sortera, koda om etc. Display Data skriver ut data i Sessionfönstret. Calc är en användbar meny. Calculator är vad namnet lovar, och där ser man vilka matematiska funktioner som Minitab har definierat (olika logaritmer, exponentiering, medelvärde, standardavvikelse etc.). Column Statistics ger möjligheter att beräkna de vanligaste statistiska måtten för varje kolumn. I Row Statistics kan man göra samma statistiska beräkningar för varje rad, vilket är aktuellt i datafiler som har rader som variabler och kolumner som observationer. Stat är en meny för en stor mängd statistiska analyser. I första hand kommer vi att använda Basic Statistics och Tables. Titta under Basic Statistics. Här kan vi ta fram beskrivande statistik och göra de vanligaste testen och konfidensintervallen. Tables kommer vi att använda för att ta fram och analysera frekvenstabeller. Graph erbjuder en stor mängd plottar och diagram. Kolla igenom listan och notera att alla diagramtyper som vi studerat finns med i listan (spridningsplottar, lådagram, stam- och bladdiagram, histogram, stapeldiagram) Editor innehåller en del funktioner som är självinstruerande, men som vi nog knappast behöver utnyttja. Undantaget är Enable Commands som vi kommenterade ovan. Window ger ett antal möjligheter att förändra/hantera fönster och ikoner. Även denna meny är sådan att vi knappast behöver använda den. 2

Help är hjälpmenyn för Minitab. Hjälpmenyn i Minitab är väldigt instruktiv, så använd den om du kör fast! Håll nu pilen över var och en av snabbknapparna för att se vad de innehåller. Slutligen något om att spara och hämta filer. Det går att spara på flera sätt, men det bästa sättet brukar vara att under File-menyn utnyttja Save Project As. Filen får då extensionen.mpj. Utskrift från Minitab I snabbfunktionsraden finns en symbol för en printer, som skriver ut det aktiva fönstret, oavsett om det är en plott, Sessionfönstret eller dataarket. Om du låter pekaren vila en sekund på symbolen innan du klickar, så ser du vilket fönster Minitab tänker skriva ut. I Sessionfönstret ser man, förutom kommandona, resultaten av de utförda analyserna. Då man är färdig med analyserna bör man innan utskrift ta bort sådant som är felaktigt eller onödigt. Enklast gör man detta genom att markera aktuell text i Sessionfönstret och klippa bort med saxsymbolen i snabbfunktionsraden. Självklart kan man också skriva in förtydligande text. Utloggning ur Minitab För att avsluta Minitab, tryck precis som vanligt på kryss-symbolen längst upp i Minitabfönstret. Glöm inte att spara arbetet på din hemkatalog. Datainmatning i Minitab Datainmatning i Minitab gör man enklast direkt i dataarket. Ställ pekaren på första raden i aktuell kolumn och skriv helt enkelt in data. Om man har data i någon annan fil, så kan man importera dessa på flera olika sätt. Det enklaste är oftast att klippa och klistra. Vi skall på denna övning utnyttja ett hyggligt stort datamaterial, som avser försäljning av bostadshus i en stad i USA. Filen finns inlagd på hemsidan i Excelformat och heter HUS.xls. Öppna Excelfilen och kopiera hela datafilen. Ställ dig sedan högst upp och längst till vänster (i den grå raden i kolumn C1) i Minitabs datablad och klistra in. Då bör data ramla in i arket med 11 kolumner och 522 observationer (rader). Något mera om datamaterialet: det avser alltså försäljning av bostadshus i USA år 2002, och man var främst intresserad av att se samband mellan försäljningspriserna och ett antal variabler som beskriver huset och dess omgivning. I filen ingår följande variabler i tur och ordning 1. Löpnummer (identifikationsnummer) 3

2. Försäljningspris (dollar) 3. Bostadsyta (kvadratfot) 4. Antal sovrum 5. Antal badrum 6. Förekomst av luftkonditionering, 1 = luftkonditionering finns, 0 annars 7. Antal bilar som garaget är konstruerat för 8. Förekomst av pool, 1 = pool finns, 0 annars 9. Byggår 10. Byggkonstruktionens kvalitet, 1 = hög, 2 = medium, 3 = låg 11. Tomtstorlek (kvadratfot) Uppgifter Nu skall du utnyttja datafilen för att göra en del enkla analyser av den typ du tidigare gjort för hand. 1. Bestämma variabeltyp. Låt oss börja med att arbeta i Excel, så gå tillbaka till Excelbladet. När man ställs inför ett nytt datamaterial är det alltid en god idé att börja med att plotta (rita diagram över) varje variabel, för att skapa sig en bild över respektive variabels fördelning. För att veta vilken typ av diagram som är lämpligt måste man dock veta vilken typ (kvalitativ eller kvantitativ) vi har att göra med. Fundera för respektive variabel över vilken typ den är. 2. Att rita diagram för en kvalitativ variabel: stapeldiagram. Du har nu antagligen kommit fram till att variabeln Pool är en kvalitativ variabel: den antar ju inte naturligt siffervärden, även om man här har kodat variabeln som förekomst av pool, 1 = pool finns, 0 annars (detta att översätta en kvalitativ variabel till siffror kallas i förbigående sagt för att man skapar en dummyvariabel). Vi vet från föreläsning och kursbok att en kvalitativ variabel lämpligen åskådliggörs i stapeldiagram. Nu ska vi skapa ett sådant: 4

Markera hela kolumnen som innehåller variabeln Pool, och gå till Insert-menyn, tryck på PivotTable och välj PivotTable. En dialogruta öppnas. Kontrollera att kolumn H (det står HUS!$H:$H. Vad betyder det?) är markerat och klicka OK. Du får nu upp följande skärmbild. Ta nu tag i variabeln Pool och dra den till rutan Drop Row Fields Here. Ta tag i Pool en gång till och dra den till rutan Drop Data Items Here. Du har nu skapat en tabell, och denna typ av tabell kallas i Excel för en PivotTable, men vi känner ju igen den som en vanlig frekvenstabell med absoluta frekvenser (absoluta frekvenser har vi eftersom tabellen innehåller Count of Pool). I tabellen ser vi att av de totalt 522 husen hade 36 pool (ettor) och 486 hade det inte (nollor). Istället för att det ska stå 1 och 0, ställ dig i respektive cell (0 och 1) och skriv Pool respektive Ej pool istället. Vi vet dock att i ett bar chart har vi de olika klasserna (pool eller ej pool i vårt fall) på x- axeln och andelar på y-axeln. Vi måste alltså göra om tabellen från en frekvenstabell med absoluta frekvenser till en frekvenstabell med relativa frekvenser. Dubbelklicka i cellen där det står Count of Pool. Nu öppnar sig en ruta. Välj fliken Show values as och 5

ändra från i rullgardinsmenyn från Normal till % of column. Klicka OK. Nu har tabellen blivit en frekvenstabell med relativa frekvenser! Nästa steg blir förstås att rita ett bar chart. Tryck med pekaren var som helst i din tabell. Du hamnar då i en meny Options i listen ovanför excelbladet. Tryck på knappen PivotChart. Nu dyker det upp en ruta där man får välja diagramtyp. Gör lämpligt val och klicka OK. Vi ser dock att vi fått med en extra stapel (även om den är tom), nämligen (blank). För att få bort denna, tryck var som helst i diagrammet, varpå det dyker upp en ruta PivotChart Filter Pane. I rullgardinsmenyn Axis Fields, avmarkera alternativet (blank) och tryck OK. Nu ser det bra ut! Pröva nu på egen hand att ändra diagrammets utseende, lägga till axelrubriker med mera. Slutligen kan vi förstås klippa ut vårt bar chart och klistra in det i ett Word-dokument. Prova! 3. Att rita diagram för en kvantitativ variabel: stolpdiagram och histogram. Du har i dina funderingar kanske också kommit fram till att variabeln Byggår är en kvantitativ variabel (en diskret kvantitativ variabel till och med eftersom den bara kan anta heltalsvärden, om vi vill vara noga). Från föreläsningen vet vi att kvantitativa variabler oftast åskådliggörs i stolpdiagram (diskret kvantitativ variabel) eller i histogram (kontinuerlig kvantitativ variabel). Lås oss nu pröva att rita ett histogram! Första steget måste då bli att klassindela variabeln byggår. Detta är något som vi får göra manuellt, och vi får fundera lite på vad som kan vara lämpliga klasser. För att hitta lämpliga klasser, gå nu in i Minitab. Vi ska ta fram beskrivande statistik över variabeln byggår! För detta utnyttjar man Stat-Basic Statistics-Display Descriptive Statistics. Använd denna funktion för att ta fram beskrivande statistik över variabeln byggår. Titta på resultatet. Visst känner du igen alla saker som skrivs ut, förutom N* som anger antal saknade värden och SE Mean som är medelfelet. Här har du på ett enda bräde en sammanfattning av beskrivande mått för variabeln! Vilket är det yngsta respektive äldsta huset i datamaterialet? Nu vet vi lite mer om data, men det är fortfarande svårt att veta hur pass stora klasser vi ska välja. Låt oss därför rita ett stam-och-blad-diagram, där vi lätt kan se hur de olika byggåren fördelar sig. Gå in i Graph och välj Stem-and-leaf. Under Graph variables, välj byggår. Klicka Ok. Försök att tolka diagrammet. Vad betyder de olika kolumnerna och raderna? Titta i Minitabs hjälpfil. 6

Nu har vi blivit lite klokare, men låt oss pröva en diagramtyp till innan vi ger oss på klassindelningen. Gå åter in i Graph-menyn i Minitab och välj Dotplot. Här har vi en axel där de olika årtalen finns med, och sedan en prick för varje hus som är byggt respektive år. Känn efter att du förstår diagrammet. Låt oss nu gå tillbaka till Excel. Baserat på hur variabeln ser ut tycker jag det verkar lämpligt att ordna klasserna såhär: -1920 1921-1930 1931-1940 1941-1950 1951-1960 1961-1970 1971-1980 1981-1990 1991-2000 Hur ska vi då skapa dessa klasser? Gå tillbaka till fliken med rådata i Excel och markera alla kolumner. Tryck sedan på knappen Sort & Filter. Välj Custom Sort. I Sort by, välj Byggår. Klicka OK. Nu ska data ha blivit sorterade i stigande ordning efter byggår. Infoga nu en ny kolumn till höger om Byggår genom att markera kolumn J, trycka med höger musknapp och välja Insert. Döp den nya kolumnen till Byggår-klasser i cell J1. Nu ska du helt enkelt skriva -1920 i ruta J2 och J3, markera dessa, fatta de markerade rutorna i det nedre högra hörnet (en svart fyrkant) och dra nedåt så långt byggår faktiskt är mindre än eller lika med 1920. Upprepa för klassen 1921-1930, 1931-1940 osv! Nu är vi redo att rita ett histogram! Vi kan då använda oss av PivotTable-funktionen som beskrevs under punkt 2. Försök att följa dessa instruktioner men för variabeln Byggår-klasser och skapa ett histogram. Kom ihåg att vi i histogrammen oftast har absoluta frekvenser på y-axeln och att avståndet mellan staplarna brukar vara noll (så att kolumnerna står sida vid sida ). 4. Histogram i Minitab. Låt oss nu fokusera på Minitab, så gå in dit igen. Om vi tittar under Graph-menyn så ser vi att det finns en funktion för att direkt rita histogram här, och i Minitab behöver vi inte själva göra klassindelningen (vi kan alltså be om ett histogram direkt från variabeln Byggår). Prova det! Det är förstås en fördel att vi slipper klassindela 7

själva, men som du säkert håller med om blir histogrammet i Minitab inte alls lika snyggt som det i Excel. Hur har Minitab gjort klassindelningen? 5. Grafisk sammanfattning av variabel. Gå nu in i menyn Basic Statistics och välj Graphical Summary. Här kan du också få en del av den tidigare sammanfattande statistiken (från punkt 3) och en hel del annat som vi ännu inte pratat om. Men det finns också ett par trevliga figurer som du känner igen. Genomför denna analys för variablerna försäljningspris, bostadsyta och tomtstorlek. 6. Jämförelse med hjälp av beskrivande statistik. Vi vill nu se hur försäljningspriset beror på om huset har luftkonditionering eller inte. Utnyttja Display Descriptive Statistics och rutan by variables för denna analys. Finns det några skillnader i försäljningspris beroende på om huset har luftkonditionering eller ej? 7. Korrelationskoefficient. Vi kan också enkelt beräkna korrelationskoefficienten under Basic Statistics-Correlation. Intressant kan ju vara korrelationen mellan försäljningspris och bostadsyta, men också korrelationen mellan försäljningspris och tomtstorlek. Vidare kan man undra om det finns någon korrelation mellan tomtstorlek och bostadsyta. Ta fram dessa korrelationer och kommentera resultaten. 8. Frivillig inlämning för kontroll av lösningar. De som så önskar kan, företrädesvis i den grupp som man gjort datorövningen, som frivillig inlämningsuppgift i ett Worddokument ta lösningarna till uppgifterna 2, 3, 6 och 7. Förse de olika utskrifterna med lämplig rubrik och kommentarer som förklarar hur de ska tolkas. Inlämningsuppgiften ska läggas i facket utanför Wahlins kontor senast fredag den 1 april. Kom ihåg att skriva namn. Kommentar Som statistiker arbetar man oftast på det här sättet: hoppar mellan olika program för att i respektive program dra nytta av dess styrkor. 8