Föreläsningsanteckningar till: F1 introduktion, deskriptiv statistik 1 Välkomna till Statistik och a undersökningar Lars Bohlin 021-103198 lars.bohlin@mdh.se Syfte: Att ge studenten insikter i grunderna för planering, genomförande och tolkning av statistiska undersökningar inom det företags- och samhällsekonomiska tillämpningsområdet. Lärandemål Efter genomgången kurs ska studenten kunna: - redogöra för grundläggande begrepp och betraktelsesätt i statistiken - redogöra för de teoretiska villkor varpå statistiska undersökningar vilar, och då särskilt sådana med anknytning till ekonomens verksamhetsfält - visa förmåga att tillämpa några statistiska metoder för insamling, bearbetning och beskrivning av a och kvalitativa data, och då särskilt sådana med anknytning till ekonomens verksamhetsfält - visa förmåga att tillämpa något standardprogram för datorbearbetning av statistiska data Lärandemål forts. Efter genomgången kurs ska studenten kunna: - visa förmåga att granska undersökningsrapporter och statistiskt baserade slutsatser kritisk. - visa förmåga att med hjälp av ett urval grundläggande statistiska metoder dra korrekta slutsatser från observerade a och kvalitativa data. - visa förmåga att med hjälp av dator kartlägga och beskriva samband mellan variabler. - visa på ökad färdighet i att tolka och redovisa resultat av statistiska undersökningar. Litteraturen på kursen består av: Lind, Douglas A.; Marchal, William G.; Wathen, Samuel Adam; Statistical techniques in business & economics 16. ed. : New York : McGraw-Hill Education Kapitel 1-12 samt 15-17 Femtonde upplagan; Kapitel 1 12, 15, 17, 18 Andersson G, Jorner U, Ågren A, Regressions- och tidsserieanalys. - Studentlitteratur, Tredje upplagan; kapitel 1 4 Bryman och Bell Företagsekonomiska forskningsmetoder, kapitel 6, 7, 9, 10, (14, 15) Dessutom några texter som ni kan ladda ner från blackboard Examination Tre inlämningsuppgifter samt en skriftlig tentamen vid kursens slut. Undervisning: Laborationer Tre laborationer ingår i kursen. Varje laboration består av en övningsuppgift och en inlämningsuppgift. För varje laboration finns två eller tre schemalagda tillfällen i datasal för arbete under handledning. För inlämningsuppgift 1 krävs dessutom deltagande i minst två av de tre räknestugorna. 1
Undervisning: Salsföreläsningar - föreläsningsanteckningar på hemsidan Inspelade föreläsningar scalable learning Frågestunder - kompletterar de inspelade föreläsningarna Räknestugor - kommer att läggas ut på hemsidan. Övningsgenomgångar kommer att lägga ut anslag om vad jag ska gå igenom. OBS ta med frågor och lösningsförslag, jag skriver inte allt på tavlan. Något om studieteknik Fråga mycket i början av kursen. Läs igenom litteraturen före föreläsningarna. Räkna igenom uppgifterna före räknestugorna, under räknestugorna jämför ni era lösningar. Försök göra övningarna före övningsgenomgångarna så ni vet var svårigheterna är och vad ni behöver fråga om. Använd formelsamlingen hela tiden. Lär för livet inte bara för tentan. Disposition På schemat anges de olika momenten. Jag har planerat 15 föreläsningar. (Varav en del i scalable learning) I studiehandledningen framgår vilken litteratur som ska läsas inför varje föreläsning. Dessutom finns en repetitionsföreläsning och en frågestund. Det finns 3 räknestugor på schemat. Dessa är examinerande. För att bli godkänd på inlämningsuppgift 1 krävs deltagande i minst 2 av de 3 räknestugorna. Därutöver finns laborationstillfällen i datasal. För varje laboration finns 2 tillfällen i datasalen, ett för övningslabben och ett för inlämningsuppgiften. (i Eskilstuna tre tillfällen för lab 2) Laborationerna Före första övningstillfället på laboration 1 bör ni ha läst igenom kapitel 1 4 och 17 i Lind. Det är naturligtvis också bra om ni har börjat titta lite på laborationsuppgifterna. Före övningstillfället till Lab 2 bör ni ha läst igenom de kapitel som ingår i regressionsboken. Före övningstillfället till Lab 3 bör ni ha läst all kurslitteratur. För att utnyttja tiden på bästa sätt vid handledningstillfället till inlämningsuppgifterna är det bra om ni försökt göra inlämningsuppgiften på egen hand mellan övningstillfället och inlämningstillfället så att ni vet var svårigheterna är och vad ni behöver fråga om. Info om Scalable Learning: Vad är statistik? Kursvärderingen: Och ni har väl inte glömt utvärderingen av FOA122 Ordet statistik kan ha två innebörder: 1. Statistiska uppgifter 2. Statistiska metoder - metoder för att producera statistiska uppgifter - metoder för att analysera statistiska uppgifter Är statistik ett mikroskåp som hjälper oss att se verkligheten? Eller är statistik ett filter som bara ger oss en begränsad bild? 2
Deskriptiv statistisk undersökning Hur mycket väger en svensk i genomsnitt? Hur mycket läsk dricker en svensk i genomsnitt? Hur stor andel av svenska elitskidåkare äter antioxidanter? Hur fort åker svenska elitskidåkare? Population versus Urval Populationen är alla objekt eller individer som vi vill uttala oss om. Urvalet är några som vi väljer ut för att studera Analytisk statistisk undersökning Är läskdrickande en viktig orsak till övervikt? Kan elitskidåkare höja sin prestationsförmåga genom att äta antioxidanter? Population De personer, händelser, föremål som vi vill uttala oss om. Hur mycket väger en svensk i genomsnitt? Hur mycket läsk dricker en svensk i genomsnitt? Hur stor andel av svenska elitskidåkare äter antioxidanter? Hur fort åker svenska elitskidåkare? I de två första frågeställningarna är populationen alla svenskar. I de två senare alla svenska elitskidåkare. Population / Urval / Inferens Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning och mäter den tid det tar innan byxorna går sönder. Populationen är alla byxor som företaget tillverkar och kommer att tillverka av denna modell. Urvalet är de 100 par man väljer att testa Inferens handlar om hur man med hjälp av information från ett urval kan dra slutsatser om populationen. Varför göra ett urval istället för att undersöka hela populationen? 1. Kostnaderna är lägre 2. Objekten kanske förstörs av undersökningen 3. Det kanske är omöjligt att undersöka alla individerna. Variabler En variabel är en egenskap hos individerna eller objekten i populationen/urvalet. När vi gjort ett urval kan vi samla in data över olika variabler. På nästa slide visas en del av ett datamaterial som vi ska använda i laboration 1 och 2. Varje rad motsvarar ett objekt i urvalet, i det här fallet en restaurang. Varje kolumn motsvarar en variabel. 3
Kedja läsk Pommes frittes huvudrätt Öppettid timmar Antal anställda Roy Roger 1,12 1,06 1,02 16 27,5 Burger King 1,06 0,91 0,95 16,5 21,5 Burger King 1,06 0,91 0,98 18 30 Roy Roger 1,12 1,02 1,06 16 27,5 Burger King 1,06 0,95 1,01 15 17,5 Burger King 1,17 0,95 0,95 16 22,5 Roy Roger 1,17 1,02 1,06 17 18,5 Burger King 1,18 1,02 1,06 17 17 Roy Roger 1,17 1,12 1,02 18 27 King Fried Chicken 1,06 1,02 2,34 12 11 Wendys 1,06 1,05 1,06 15,5 20 King Fried Chicken 1,05 0,95 2,74 13,5 17 Burger King 1,17 1,06 1,17 15 7,5 Olika typer av variabler och skalor Kvalitativ variabel -variabeln antar inte numeriska värden utan bara olika kategorier. Exempelvis olika bilmärken, eller man, kvinna. Kvantitativ variabel Antar numeriska värden som är resultat av beräkning eller mätning. variabel Kan anta alla värden. Ex, kroppslängd Diskret variabel Kan enbart anta vissa värden, (oftast heltal). Ex, antal barn. En variabel kan mätas på 4 olika typer av skalor: 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Varför behöver vi veta vilken skala en variabel är mätt på? Skaltypen avgör vilka beräkningar, diagram och statistiska test som vi kan använda. Nominalskala En kvalitativ variabel där de olika utfallen inte har en specifik ordningsföljd mäts på nominalskala. Exemel: Bilmärke: Kön: Volvo, BMW, VW, Peugot man, kvinna Ordinalskala Vi kan rangordna olika observationer men inte avgöra avståndet mellan dem. Exempel: I en kursutvärdering frågas studenterna vad de anser om litteraturen och har följande alternativ att välja på. Mycket bra, bra, medel, dålig Intervallskala Vi kan mäta avståndet mellan två variabelvärden men kvoter har ingen meningsfull tolkning och nollan kan ej tolkas som avsaknad av egenskapen. Temperatur mätt i grader Celsius är ett exempel. På söndag är det 0 grader. På måndag är det 1 grad varmt. På tisdag är det 2 grader varmt. På onsdag är det 21 grader varmt. På torsdag är det 22 grader varmt. På söndag är det 273 K. På måndag är det 274 K. På tisdag är det 275 K. På onsdag är det 294 K. På torsdag är det 295 K. 4
Det är meningsfullt att beräkna kvoter och noll betyder att egenskapen saknas. Respondenters värdering på en numerisk skala ger ordinalskala Kurslitteraturen var lämplig för att uppnå kursens syfte: 5 4 3 2 1 5 står för håller helt med och 1 för håller inte alls med. Exempel kroppslängd. Om Lisa är 80 cm lång och hennes mamma 160 så är mamma dubbelt så lång. Det är meningsfullt att dividera mammas längd med Lisas och beräkna en kvot. Om Kalle är 0 cm lång så finns han inte. Nollan betyder avsaknad av egenskapen. Frågan genererar ordinaldata, man brukar anse att respondenter inte på ett likvärdigt sätt bedömer avståndet mellan 1 och 2 respektive 2 och 3 så vi har inte intervallskala. Frågan kunde ju också ha formulerats: Kurslitteraturen var lämplig för att uppnå kursens syfte: Håller helt med Håller delvis med Vet inte har ingen åsikt Håller inte med Håller inte alls med Exempel på populationer, variabler och skalor. population variabel Typ av variabel skala Exempel på populationer, variabler och skalor. Population Variabel Typ av variabel skala Alla svenska bilar Antalet dörrar Diskret färg Kvalitativ Nominalskala märke Kvalitativ Nominalskala Sånger i Eurovision song contest 2010 Längd Kvalité (poäng i omröstningen) Diskret Ordinalskala Alla svenska kvinnor mellan 25 och 35 år Ålder kroppsvikt (Ålder diskret?) kvotskala Yrke Kvalitativ Nominalskala (ordinal?) Utbildningsnivå Kvalitativ (typ av utbildning) (antal år) Nominal, Ordinal kvotskala Musikstil Kvalitativ Nominalskala Sjöar i Sverige Storlek (km 2 ) Vatten temperatur djup Intervallskala 5