TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp)
|
|
- Simon Andersson
- för 6 år sedan
- Visningar:
Transkript
1 Uppsala universitet Statistiska institutionen TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp) UPPLYSNINGAR A. Tillåtna hjälpmedel: Kursspecifik formelsamling (utan anteckningar) Språklexikon Miniräknare B. Skrivtid: Skrivningen omfattar 5 uppgifter, om sammanlagt 100 poäng. C. För varje uppgift anges den maximala poäng som kan erhållas. Om en uppgift är uppdelad på deluppgifter anges den maximala poängen för varje deluppgift. Ibland kan inte deluppgifterna bedömas oberoende av varandra, vilket kan innebära att poäng inte utdelas på en senare uppgift om inte tidigare deluppgift lösts på ett i princip riktigt sätt. Dock gäller att utdelad poäng för varje deluppgift aldrig kan vara negativ. D. Om Du känner Dig osäker på någonting (skrivningens genomförande, någon formulering i en uppgift, om något hjälpmedel är otillåtet), fråga då jourhavande skrivningsvakt eller den skrivningsansvariga läraren. E. Efter skrivningens slut får Du behålla sidorna med frågeställningarna (de ska inte lämnas in!). Preliminära lösningar anslås på Pingpong. UPPMANINGAR A. Följ noga de anvisningar som finns på skrivningsförsättsbladet. B. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång! (Det dunkelt uttryckta förutsätts av rättaren vara dunkelt tänkt.) Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar. C. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna insätts. Verbal slutsats av det framräknade intervallet krävs för full poäng. D. Vid hypotesprövning måste Du utöver vad som sägs i punkt B ovan ange vad hypotesprövningen avser att testa, hypoteserna i symbolform (då så är möjligt), signifikansnivå, testfunktion (inklusive antal frihetsgrader då detta är aktuellt) både i symbolform och med numeriska uppgifter, beslutsregel, resultat samt verbal slutsats. E. Vid standardvägning ska metod anges och kalkylerna ska följas av en verbal slutsats för full poäng. 1/14
2 Uppsala universitet Statistiska institutionen Uppgift 1 Facebook ger en mängd statistik på sin hemsida som i detalj beskriver tillväxten och populariteten hos webbplatsen. Ett exempel på sådan statistik är att den genomsnittliga användaren har 130 vänner (på Facebook). På ett större universitet gjordes ett slumpmässigt urval om 30 Facebookanvändare där de utvalda fick ange hur många vänner de har på Facebook. Resultatet av undersökningen finns i form av en Minitabkolumn på sista sidan i denna skrivning. Kontrollera att du har den! Vidare har vi följande sammanfattning i nedanstående Minitabutskrift. Descriptive Statistics: Friends Variable Mean SE Mean StDev Friends (4) A Ange vad som är individ/element och vad som är variabel i den här situationen. Ange dessutom den aktuella variabelns datanivå samt huruvida den är diskret eller kontinuerlig. För full poäng måste svaren rörande datanivå och diskret/kontinuerlig motiveras. (5) B Ge en ordentlig förklaring av innebörden av värdena i ovanstående sammanfattning. (7) C Åskådliggör materialet grafiskt genom att konstruera ett lådagram/boxplot. (8) D Använd resultatet i detta urval för att konstruera ett intervall som med 95% säkerhet täcker in medelvärdet för antal Facebookvänner gällande Facebookanvändare vid universitetet. (4) E Intervallet i D-uppgiften ansågs som alldeles för brett. Hur stort stickprov behövs för att bredden av ett 95% konfidensintervall för populationsmedelvärdet ska bli högst 10 vänner brett. Använd information från detta stickprov för att göra beräkningen. (1) F Anta att vi istället tolkar genomsnittligt som att mediananvändaren har 130 vänner på Facebook. Undersök med ett hypotestest angående p om mediananvändaren (vad det gäller antal vänner på Facebook) vid detta universitet avviker från mediananvändaren i allmänhet. Använd en signifikansnivå på 5% och utför testet enligt klassisk metod. 1/14
3 Uppsala universitet Statistiska institutionen Uppgift På en stormarknad ville man undersöka hur försäljningen i 1000-kronor (y) av en vara påverkas av exponeringsytan i kvadratmeter (x). Man gjorde ett experiment under sju veckor då exponeringsytan varierade mellan och 4 kvadratmeter. Resultatet sammanfattas via summorna x 1, y 56.7, x 67, y 46.51, xy 17.5 (6) A Skatta den linjära regressionsmodellen som visar hur försäljningen beror på exponeringsytan. Uppskatta med hjälp av regressionsmodellen den försäljning vi förväntar oss vid en exponeringsyta på 3 kvadratmeter. (4) B Tolka på ett begripligt sätt (dvs utan att använda statistiska facktermer) de båda regressionskoefficienterna i ord. Ange en orsak till varför tolkningen av interceptet bör tas med en nypa salt. Uppgift 3 Elva anställda i ett företag fick träffa företagets sjuksköterska på grund av höga kolesterolvärden. Sköterskan informerade dem om farorna med höga kolesterolvärden och satte dem på en ny diet. I tabellen nedan finner du kolesterolvärden för de elva anställda i undersökningen både innan dieten påbörjades och även en månad efter att den påbörjats. Kan det i och med detta resultat, i statistisk mening, påstås att behandlingen uppnår sitt mål? Anställd Före Efter (3) A Valet av testfunktion i den här situationen avgörs av om den för inferensen så nödvändiga sannolikhetsbedömningen kan baseras på normalfördelningen eller inte. Vad är det som måste vara normalfördelat och varför är det nödvändigt i det här fallet? Förklara. Observera att du inte behöver göra någon normalfördelningskontroll. (1) B Anta att normalfördelningsantagandet som diskuterades i A-uppgiften kan anses vara uppfyllt. Utför ett fullständigt hypotestest enligt p-värdesmetoden som utnyttjar detta antagande. Använd en signifikansnivå på 1% (1) C Anta nu att normalfördelningsantagandet som diskuterades i A-uppgiften inte anses vara realistiskt. Utför ett fullständigt hypotestest på 1% signifikansnivå där du använder det test som utifrån förutsättningarna utnyttjar informationen på bästa sätt. 1/14
4 Uppsala universitet Statistiska institutionen Uppgift 4 I ett visst slumpförsök studeras de tre händelserna A, B och C. Venn-diagrammet nedan beskriver utfallsrummet för detta slumpförsök. (3) A Beskriv med mängdlärans symboler (dvs union, snitt och komplement) den händelse som är gråmarkerad i Venn-diagrammet. (3) B Anta att de tre händelserna A, B och C är oberoende och att det dessutom gäller att Pr(A)Pr(B)Pr(C)0.3. Visa att sannolikheten för den händelse som är gråmarkerad i Venn-diagrammet är (6) C Anta vidare att vi utför detta slumpförsök vid 5 tillfällen. Bestäm sannolikheten att den händelse som är gråmarkerad i Venn-diagrammet inträffar vid åtminstone två av dessa 5 tillfällen. Var noga med att ordentligt motivera dina beräkningar. Uppgift 5 MyTVLab är en onlinetjänst som bl a tillåter användare att ladda upp och dela egna klipp. För att attrahera och behålla besökare på webbplatsen, måste man se till att användarna snabbt kan ladda ner önskade videoklipp. Tidigare data indikerar på att medelvärdet för nedladdningstiden av videoklipp är 7 sekunder med en standardavvikelse på sekunder samt att ungefär två-tredjedelar av videoklippen laddas ner på mellan 5 till 9 sekunder. (3) A Vi avser att i beräkningarna nedan använda normalfördelningen. Ange vad i de angivna förutsättningarna som ger stöd för detta val av sannolikhetsfördelning och ange även vad som mer måste till för att vi ordentligt ska kunna motivera dess användning. (4) B Beräkna sannolikheten att nedladdningstiden för ett slumpmässigt valt videoklipp ligger mellan 8 och 9 sekunder. (4) C MyTVLab arbetar kontinuerligt med att minska nedladdningstiden. Det närmsta målet är att 75% av alla videoklipp ska kunna laddas ner på under 7 sekunder. Vilket medelvärde för nedladdningstid måste man rikta in sig på för att målet ska nås (förutsatt att standardavvikelsen förblir oförändrad)? 1/14
5 Uppsala universitet Statistiska institutionen Bilaga till Uppgift 1 1/14
6 Lösning A4/A /14 Thommy Perlinger 1. Statistik i samband med Facebookanvändande. (a) I den här situationen är det facebookanvändare vid universitetet som är individer/element och antal facebookvänner som är variabel. Eftersom denna variabel endast kan anta heltalsvärden gäller att den är diskret. Vidare gäller exempelvis att 4 vänner är dubbelt så många som vänner varför det för denna variabels värden är meningsfullt att göra relativa jämförelser. Således mäts variabeln på kvotskalan. (b) Utifrån minitabutskriften finner vi att det för de undersökta i gruppen Facebookanvändare gäller att sammanfattningen fås att För de Facebookanvändare som var med i undesökningen gäller alltså att det genomsnittliga antalet Facebookvänner var 119. Samtliga i gruppen hade dock inte lika många Facebookvänner utan detta antal avvek med i genomsnitt ca 30 vänner från det genomsnittliga antalet. Begreppet SE Mean betyder Standard Error of the Mean och översätts av oss till medelfelet. Stickprovsmedelvärdet används för att skatta populationsmedelvärdet och medelfelets uppgift är att ge oss en uppskattning av det genomsnittliga felet i denna skattning. Enligt denna uppskattning gäller således att stickprovsmedelvärdet (vid upprepade stickprov av denna storlek) i genomsnitt kommer att avvika från populationsmedelvärdet med 5 4 vänner. 1
7 Lösning A4/A /14 Thommy Perlinger (c) För att kunna konstruera ett lådagram behöver vi median och kvartiler. Utifrån informationen i appendix finner vi att µ 1 Värdet på observation (99 97) 98 5 µ Värdet på observation (118 11) 115 µ 3 (30 + 1) 3 Värdet på observation ( ) Ett och ett halvt kvartilavstånd ges av varför uteliggare är observationer under och över 1 5 ( ) Det finns därmed inte några uteliggare i vårt material. Lådagrammet får följande utseende Friends
8 Lösning A4/A /14 Thommy Perlinger (d) Vi ska konstruera ett 95% konfidensintervall för där Medelvärde för antal Facbookvänner för Facbookanvändare vid universitetet Iochmedatt har vi ett någorlunda stort stickprov men inte tillräckligt stort för att utan vidare använda Centrala gränsvärdessatsen. Vi bör därför göra en inledande kontroll av vårt material och försäkra oss om att variabeln, dvs antral facebookvänner, är (någorlunda) symmetriskt fördelad. Vi kan exempelvis jämföra medelvärde och median och även studera lådagrammet från -uppgiften. Vi konstaterar att det inte är ett helt symmetriskt material men samtidigt inte alarmerande asymmetriskt. Alltså borde vi kunna gå vidare och utgå från att stickprovsmedelvärdet approximativt kan betraktas som normalfördelat. Då detta är ett större universitet utgår vi från att antal Facebookanvändare vid universitetet är så pass många att ändlighetskorrektion kan bortses från. Vidare står i uppgiften att de 30 studenterna i urvalet är slumpmässigt valda vilket innebär att vi kan använda konfidensintervallet ± 1 Här gäller att det aktuella tabellvärdet blir vilket innebär att konfidensintervallet efter insättning av våra värden blir eller som ett intervall ± μ 130 Med 95% säkerhet befinner sig, dvs genomsnittligt antal Facebookvänner hos Facebookanvändare vid universitetet, någonstans mellan 108 och 130. (e) För att kunna bestämma hur stort stickprov som ska tas för att intervallet ska bli maximalt 10 vänner brett måste vi ha en uppfattning om standardavvikelsen i populationen. Stickprovet ovan gav oss en möjlighet att skatta denna via b 9 57 Eftersom och halva bredden 5 följer att den sökta stickprovsstorleken blir För att uppfylla kraven krävs alltså ett stickprov om minst 135 Facebookanvändare vid universitetet. 3
9 Lösning A4/A /14 Thommy Perlinger (f) Vi börjar med att konstatera att frågan huruvida mediananvändaren av Facebook vid universitetet har 130 Facebookvänner kan ställas upp som en frågeställning angående. Låtervi Andel Facebookanvändare vid universitetet som har färre än 130 Facebookvänner formuleras hypoteserna utifrån frågeställningen på följande sätt: 0 : : Detta test ska utföras på 5% signifikansnivå. Stickprovet är ett slumpmässigt urval och precis som tidigare antar vi att antal Facebookanvändare vid universitetet är så pass många att ändlighetskorrektion kan bortses från. Eftersom 0 (1 0 ) är stickprovet (med liten marginal) tillräckligt stort för att normalapproximation av binomialfördelningen ska vara tillåten. Därmed ska vi använda testfunktionen b 0 q 0 (1 0 ) I och med att vi använder en signifikansnivå på 5% samtidigt som att mothypotsen är 1 : följer att nollhypotesen ska förkastas först om eller I urvalet blev andelen Facebookanvändare med färre än 130 Facebookvänner b vilket alltså ger ett tillsynes starkt stöd åt att mediananvändaren av Facebook vid universitetet inte har 130 Facebookvänner. Frågan är hur övertygande resultatet är? Vi sätter in i testfunktionen q och eftersom har vi hamnat i det kritiska området och därmed förkastas nollhypotesen. Det är alltså på 5% signifikansnivå statistiskt säkerställt att, andel Facebookanvändare vid universitetet som har färre än 130 Facebookvänner, inte är 50%. Alltså är det på 5% signifikansnivå statistiskt säkerställt att mediananvändaren av Facebook vid universitetet inte har 130 Facebookvänner. 4
10 Lösning A4/A /14 Thommy Perlinger. Utifrån den givna informationen börjar vi med att bestämma de tre nyckelsummorna X ( ) X ( ) X ( )( ) (a) Utifrån nyckelsummorna ovan finner vi först att och sedan att Regressionslinjens ekvation blir således by x Utifrån regressionsekvationen uppskattar vi den förväntade försäljningen vid en exponeringsyta på 3 kvadratmeter till b dvs kronor. (b) Vi tolkar -koefficienten som att en extra kvadratmeters exponeringsyta i genomsnitt ökar försäljningen med 600 kronor. Interceptet, dvs -koefficienten, anger att den genomsnittliga försäljningen då varan överhuvudtaget inte exponeras bör vara ungefär kronor. Eftersom denna situation inte förekom i undersökningen blir detta en extrapolation och tolkningen av resultatet bör därför tas med en nypa salt. 5
11 Lösning A4/A /14 Thommy Perlinger 3. Parvisa observationer. (a) Det är differenserna, dvs den effekt dieten har på kolesterolvärdet som måste vara approximativt normalfördelad i den bakomliggande populationen. Med population avser vi i det här fallet antingen personer med högt kolesterolvärde i företaget eller mer allmänt personer med höga kolesterolvärden. Om vi, rent hypotetiskt, kunde placera ut alla i populationen på en skala utifrån den effekt dieten har på just deras kolesterolvärde ska den resulterande kurvan vara mycket lik en normalfördelningskurva. Detta är ett nödvändigt antagande eftersom vi i b-uppgiften ska utföra ett hypotestest angående medeldifferensen i populationen och stickprovet är inte tillräckligt stort för att vi utan antaganden kan förutsätta att medeldifferensen i stickprovet är approximativt normalfördelad. (b) Vi har ett litet stickprov med endast 11 observationer (anställda) men eftersom differenserna antas vara normalfördelade löses många problem. Om vi vidare kan betrakta personerna i undersökningen som slumpmässigt utvalda ur den bakomliggande populationen (möjligtvis tveksamt) och inte på något sätt påverkar varandras resultat (också det något tveksamt) kan ett parametriskt - test användas. Låter vi formuleras hypoteserna som Den genomsnittliga effekten av dieten 0 : 0 1 : 0 där vi här mäter effekten som Före Efter vilket betyder att ett positivt värde innebär att kolesterolvärdet gått ner. Det går givetvis lika bra att ta differenserna i omvänd ordning men då förstås med olikheten i mothypotesen vänd åt andra hållet. Vi ämnar utföra testet med en signifikansnivå på 1% vilket innebär att nollhypotesen ska förkastas först om testets -värde understiger 1%. Eftersom detta handlar om parvisa observationer börjar vi med att bestämma differenserna, vilket vi som nämnts ovan gör genom att beräkna Före Efter så att positiva värden är bra för påståendet att dieten har en önskad effekt. Anställd Före Efter Före Efter
12 Lösning A4/A /14 Thommy Perlinger Utifrån stickprovsdifferenserna beräknas medelvärde och standardavvikelse till s Den aktuella testfunktionen rör populationens medelvärde och då den tänkta populationen bestående av personer med högt kolesterolvärde kan betraktas som stor kan ändlighetskorrektion bortses från. Med specifika beteckningar för parvisa observationer kan formeln skrivas som varför vi efter insättning av värden får som skall jämföras med 10 -fördelningen. Eftersom drar vi slutsatsen att % -värde 0 5% och då -värdet understiger den uppsatta signifikansnivån på 1% förkastas nollhypotesen. Det är på 1% signifikansnivå statistiskt säkerställt att dieten, i genomsnitt (med avseende på medelvärde), sänker kolesterolvärdet för personer som före dieten hade en hög kolesterolnivå. 7
13 Lösning A4/A /14 Thommy Perlinger (c) Vi har ett litet stickprov med endast 11 observationer och eftersom differenserna inte kan antas vara normalfördelade måste vi använda ett icke-parametriskt test. Vi förutsätter som i föregående uppgift (det något tveksamma) att personerna i undersökningen är slumpmässigt utvalda och inte på något sätt påverkar varandras resultat. Detta tillsammans med det faktum att variabeln mäts på kvotskala innebär att ett teckenrangtest kan användas. I detta icke-parametriska test undersöks om fördelningen vad det gäller testresultat är samma i de båda populationerna (dvs före och efter genomgången diet), eller om medianen för differenserna är noll, dvs 0 : Fördelningen för kolesterolvärde är samma både före och efter dieten 1 : Fördelningen för kolesterolvärde efter dieten är förskjuten nedåt Vi får Anställd Före Efter Före Efter Rang Tecken Vi ser att det inte förekommer några ties, dvs observationer med samma resultat vid båda mätningarna. Vi förväntar oss låga rangtal på dom negativa differenserna vilket innebär att vi som testfunktion använder.detföljeratt och eftersom har vi hamnat i det kritiska området och förkastar (nu även med den ickeparametriska testmetoden) nollhypotesen. Det är alltså på 1% signifikansnivå säkerställt att dieten, i genomsnitt (med avseende på median), sänker kolesterolvärdet för personer som före dieten hade en hög kolesterolnivå. 8
14 Lösning A4/A /14 Thommy Perlinger 4. Det aktuella Venn-diagrammet har följande utseende. (a) Det gråmarkerade området är. (b) Enligt förutsättningarna gäller att Pr ( ) Pr( ) Pr( ) 0 3. Eftersom händelserna dessutom är oberoende av varandra följer att Pr Pr Pr ( ) Pr ( ) [1 Pr ( )] Pr ( ) Pr ( ) (c) Vi börjar med att låta Antal gånger det gråmarkerade området inträffar Vi förutsätter att slumpförsöken utförs oberoende av varandra, dvs att resultatet i ett slumpförsök inte påverkar resultatet i något annat slumpförsök. Eftersom det är samma slumpförsök som utförs om och om igen bör vi hela tiden ha samma sannolikhet att det gråmarkerade området inträffar. Eftersom dessutom räknar hur många gånger det inträffar följer att är ( ). Därmed följer att Pr ( ) 1 Pr ( 1) 1 [Pr ( 0)+Pr( 1)] ( )
15 Lösning A4/A /14 Thommy Perlinger 5. Vi betraktar nu slumpvariabeln Nedladdningstid för ett slumpmässigt vald videoklipp som (7 ) där enheten är sekunder. (a) Det fakum att ungefär två-tredjedelar av nedladdningstiderna ligger inom en standardavvikelse från medelvärdet stämmer bra överens med vad som gäller för normalfördelningen. Dock säger det inget om att fördelningen är symmetrisk. Vi skulle alltså behövs se en graf över det historiska materialet för att kunna göra en symmetribedömning. (b) Vi söker µ 8 7 Pr (8 9) Pr 9 7 Pr(0 5 1) Pr( 1) Pr ( 0 5) (c) Enligt Tabell 5..B gäller att vilket vi tolkar som att den angivna tiden på 7 sekunder ska befinna sig standardavvikelser över medelvärdet. Med bibehållen standardavvikelse på sekunder betyder detta att vi får ekvationen vilket innebär att man ska sikta in sig på medelvärdet
16 Uppsala universitet Statistiska institutionen TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp) UPPLYSNINGAR A. Tillåtna hjälpmedel: Kursspecifik formelsamling (utan anteckningar) Språklexikon Miniräknare B. Skrivtid: Skrivningen omfattar 5 uppgifter, om sammanlagt 100 poäng. C. För varje uppgift anges den maximala poäng som kan erhållas. Om en uppgift är uppdelad på deluppgifter anges den maximala poängen för varje deluppgift. Ibland kan inte deluppgifterna bedömas oberoende av varandra, vilket kan innebära att poäng inte utdelas på en senare uppgift om inte tidigare deluppgift lösts på ett i princip riktigt sätt. Dock gäller att utdelad poäng för varje deluppgift aldrig kan vara negativ. D. Om Du känner Dig osäker på någonting (skrivningens genomförande, någon formulering i en uppgift, om något hjälpmedel är otillåtet), fråga då jourhavande skrivningsvakt eller den skrivningsansvariga läraren. E. Efter skrivningens slut får Du behålla sidorna med frågeställningarna (de ska inte lämnas in!). Preliminära lösningar anslås på Pingpong. UPPMANINGAR A. Följ noga de anvisningar som finns på skrivningsförsättsbladet. B. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång! (Det dunkelt uttryckta förutsätts av rättaren vara dunkelt tänkt.) Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar. C. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna insätts. Verbal slutsats av det framräknade intervallet krävs för full poäng. D. Vid hypotesprövning måste Du utöver vad som sägs i punkt B ovan ange vad hypotesprövningen avser att testa, hypoteserna i symbolform (då så är möjligt), signifikansnivå, testfunktion (inklusive antal frihetsgrader då detta är aktuellt) både i symbolform och med numeriska uppgifter, beslutsregel, resultat samt verbal slutsats. E. Vid standardvägning ska metod anges och kalkylerna ska följas av en verbal slutsats för full poäng. 9/14
17 Uppsala universitet Statistiska institutionen Uppgift 1 Histogrammet nedan visar beloppen som ett slumpmässigt urval om 184 kunder spenderade i en viss affär Belopp (SEK) För enkelhets skull används vid beräkningarna de angivna gränserna som de faktiska klassgränserna, dvs vi använder 0, 500, 1000 osv.. () A När vi utför beräkningarna nedan görs ett antagande. Vilket är detta antagande? Anmärkning: Antagandet i fråga är inte nödvändigt för att lösa deluppgift E. (7) B Beräkna medelvärde och standardavvikelse för den aktuella variabeln. Ge en ordentlig förklaring av innebörden av dessa båda värden. (4) C Beräkna den tredje kvartilen i stickprovet. Ge en ordentlig förklaring av innebörden av detta värde. (7) D Åskådliggör den kumulativa frekvensfördelningen i materialet med ett lämpligt diagram. Använd diagrammet (en formell beräkning är redan gjord i C-uppgiften) till att göra en uppskattning av värdet på den första kvartilen för den aktuella variabeln. (8) E Använd det aktuella urvalet för att konstruera ett 90 % konfidensintervall för andelen kunder som spenderar mindre än kronor vid ett köptillfälle. (1) F Är det i och med resultatet i vårt stickprov statistiskt säkerställt att det genomsnittliga köpbeloppet överstiger 1 00 kronor? Utför ett fullständigt hypotestest enligt p-värdesmetoden där du använder en signifikansnivå på 5%. (8) G Vi fortsätter nu med situationen i F-uppgiften. Låt oss betrakta det aktuella hypotestestet innan resultatet av undersökningen sammanställdes, dvs vi har ännu inte några resultat från undersökningen. Anta att vi, baserat på tidigare undersökningar, har skattningen 700. Vad är med denna förutsättning testets styrka då µ1 300? För full poäng måste situationen beskrivas grafiskt. 9/14
18 Uppsala universitet Statistiska institutionen Uppgift Vid tre företag A, B och C inom samma bransch ämnar man jämföra olycksfallsrisken under det senaste kalenderåret. Då olycksfallsrisken uppvisar stora skillnader mellan verkstadsarbetare, lagerarbetare och kontorsanställda och då de tre företagen har olika personalsammansättning, är det önskvärt att eliminera effekten av denna snedvridande faktor. För respektive företag känner man antalet olyckor under året samt antalet anställda i varje yrkeskategori. Dessutom vet man att olycksfrekvensen (antal olyckor/ antal anställda) för branschen som helhet är 0.5, 0.14 och 0.03 för verkstadsarbetare, lagerarbetare respektive kontorsanställda. Antal anställda Företag Verkstadsarbetare Lagerarbetare Kontorsanställda Antal olyckor A B C (10) Gör en jämförelse mellan de tre företagen med avseende på olycksfallsfrekvensen på ett sådant sätt att resultatet blir oberoende av olikheter i fördelning över olika personalkategorier. (Av svaret ska framgå hur många procent under/över branschgenomsnittet företagen ligger). Uppgift 3 (OBS! Denna uppgift ingår inte längre på kursen) En tjänstemannaorganisation med totalt medlemmar (av vilka 000 är i åldersgruppen under 45 år) önskade undersöka medlemmarnas inställning till flexibla arbetstider. För undersökningen utvaldes slumpmässigt två stickprov bestående av 300 medlemmar från åldersgruppen under 45 år och 150 medlemmar från åldersgruppen 45 år eller äldre. De utvalda fick uppge sin inställning till flexibla arbetstider. Det visade sig att 5 personer i åldersgruppen under 45 år och 108 personer i åldersgruppen 45 år eller äldre var positiva till flexibla arbetstider. (1) A Avgör med hypotesprövning enligt klassisk metod om andel medlemmar som är positivt inställda till flexibla arbetstider skiljer sig mellan de båda åldersgrupperna. Använd 5% signifikansnivå. (5) B Beräkna p-värdet för testet i A-uppgiften. Ge en ordentlig tolkning av detta p-värde genom att börja med Om det är så att andelen medlemmar i tjänsteorganisationen som är positivt inställda till flexibla arbetstider är. Observera att tolkningen inte skall gälla huruvida nollhypotesen skall förkastas (detta är redan gjort i A-uppgiften). 9/14
19 Uppsala universitet Statistiska institutionen Uppgift 4 En tulltjänsteman gör stickprovsundersökningar bland väskor. (3) A Studera situationen i B-uppgiften nedan. För att finna den sökta sannolikheten används en slumpvariabel. Ange den aktuella slumpvariabeln och, med motivering, dess sannolikhetsfördelning. (4) B Ett visst parti om 50 väskor innehåller 6 väskor med illegalt innehåll. Sin vana trogen väljer tulltjänstemannen slumpmässigt 5 väskor ur partiet. Beräkna sannolikheten att tulltjänstemannen hittar åtminstone en väska med illegalt innehåll. Uppgift 5 Längden av en graviditet (hos människor) kan betraktas som approximativt normalfördelad med ett medelvärde/väntevärde på 66 dagar och en standardavvikelse på 16 dagar. Anmärkning. Den aktuella variabeln är kontinuerlig. (4) A Bestäm sannolikheten att längden av graviditeten hos en slumpmässigt vald gravid kvinna understiger 40 dagar, dvs att den, grovt räknat, understiger 8 månader. (3) B Bestäm värdet på den första kvartilen. (6) C Anta att vi studerar 1 slumpmässigt valda gravida kvinnor. Bestäm sannolikheten att mer än hälften av dessa går över tiden, dvs har en graviditet som varar längre än förväntat. För full poäng måste beräkningarna ordentligt motiveras. (5) D Vi får reda på att en gravid kvinna har gått fyra dagar över tiden. Bestäm sannolikheten att det går ytterligare fyra dagar (eller mer) innan kvinnan föder sitt barn. 9/14
20 Lösning A4/A /14 Thommy Perlinger 1. Vi börjar med att återge (och utöka) frekenstabellen där vi enligt anvisningarna (för enkelheten) använder de klassgränser som står givna. Klassbeteckningarna ser förbryllande ut men innebörden är, för att exemplifiera, att den exakta skiljelinjen mellan de båda första klasserna är 500 kronor. Köpbelopp (SEK) Mitt ( ) (a) Eftersom vi endast har tillgång till klassindelat material måste vi förutsätta att observationerna är jämnt fördelade i klasserna för att kunna göra våra beräkningar. (b) Vi beräknar medelvärde och standardavvikelse till s De 184 kunderna i undersökningen handlade i genomsnitt för 191 kronor. Alla kunder handlade dock inte för lika mycket utan köpbeloppen avvek med i genomsnitt 78 kronor från medelvärdet. (c) Den första kvartilen är värdet på observation med observartionsnummer vilken befinner sig i klassen Därmed får vi att vilket innebär att det i undersökningen var så att en fjärdedel av kunderna handlade för mer än 183 kronor. 1
21 Lösning A4/A /14 Thommy Perlinger (d) En summapolygon används för att beskriva den kumulativa frekvensfördelningen. Vi använder därför dom kumulerade frekvenserna från vår frekvenstabell och får på så sätt följande diagram Antal kunder Belopp (SEK) Anmärkning. Här blev det ett litet tryckfel i uppgiften. Det står att man i diagrammet ska uppskatta den första kvartilen men det är förstås den tredje kvartilen som ska uppskattas. Båda varianterna accepteras. Genom att på -axeln utgå från observation och dra en horisontell linje fram till summapolygonen och sedan därifrån dra en lodrät linje ner till -axeln får vi en uppskattning av köpbeloppet för den första kvartilen. Beräknas den första kvartilen fås 710 kronor vilket verkar rimligt utifrån diagramuppskattningen. Den tredje kvartilen är värdet på observation Enligt resultatet i c-uppgiften ska denna bli 183 kronor vilket verkar rimligt. (e) Vi ska konstruera ett 90% konfidensintervall för där Andelen kunder som spenderar mindre än 1000 kronor vid ett köptillfälle Vi förutsätter att kunderna i urvalet kan betraktas som ett slumpmässigt urval bland alla (potentiella) kunder och att populationen (av potentiella kunder) kan antas vara stor vilket betyder att vi kan bortse från ändlighetskorrektion. Det var 68 av de 184 kunderna i urvalet som handlade för under 1000 kronor varför det följer att vår punktskattning ges av Eftersom b (1 b ) 184 b
22 Lösning A4/A /14 Thommy Perlinger är stickprovet med god marginal tillräckligt stort för att normalapproximation av binomialfördelningen ska vara tillåten. Vi använder därför konfidensintervallet r b (1 b ) b ± Eftersom följer efter insättning av våra stickprovsvärden att konfidensintervallet blir r ± eller som ett intervall p 0 48 Med 90% säkerhet befinner sig, dvs andelen kunder som spenderar mindre än 1000 kronor vid ett köptillfälle, någonstans mellan 31% och 43%. (f) Låter vi först Medelköpbeloppet för kunderna i populationen följer av frågeställningen i uppgiften att hypoteserna ska formuleras som 0 : : 100 Detta ska nu undersökas med ett test på 5% signifikansnivå vilket innebär att vi ska förkasta nollhypotesen först om -värdet understiger 5%. Viförutsätter som ovan att kunderna i urvalet kan betraktas som ett slumpmässigt urval bland alla (potentiella) kunder och att populationen (av potentiella kunder) kan antas vara stor vilket betyder att vi kan bortse från ändlighetskorrektion. Eftersom vi dessutom har att följer att vi kan använda testfunktionen 0 I b-uppgiften fann vi att och Insättning av dessa värden ger oss följande värde på testfunktionen vilket utifrån utseendet på mothypotesen innebär att -värde Pr( 1 69) Eftersom -värdet understiger den uppsatta signifikansnivån på 5% förkastas nollhypotesen. Det är således på 5% signifikansnivå statistiskt säkerställt att medelköpbeloppet för kunderna i populationen överstiger 100 kronor. 3
23 Lösning A4/A /14 Thommy Perlinger (g) Detta är en uppgift som måste lösas i två steg. Först måste vi under nollhypotesantagendet, dvs att 100,taredapåförvilkavärdenpåstickprovsmedelvärdet nollhypotesen kommer att förkastas och sedan måste vi under den nya förutsättningen, dvs att 1300, ta reda på sannolikheten att detta kommer att inträffa (vilket är testets styrka). i. För vilka värden på kommer nollhypotesen att förkastas? Nollhypotesen förkastas om vilket vi översätter till ii. Vad blir Pr under den nya förutsättningen att 1300,dvs att är På vanligt normalfördelningsmanér uttrycker vi detta i standardavvikelser, dvs Pr µ Pr Testets styrka, dvs sannolikheten att förkasta en felaktig nollhypotes, blir i den här situationen ca Chansen att vi under dessa omständigheter kommer att få tillräckligt övertygande bevis om att medelköpbeloppet bland kunderna (i populationen) överstiger 100 kronor är alltså lite drygt 61%. Hela situationen beskrivs väl med följande graf 4
24 Lösning A4/A /14 Thommy Perlinger. Standardvägning enligt kapacitetsmetoden. För att jämförelsen av olycksfallsfrekvensen på de tre företagen ska bli rättvis använder vi kapacitetsmetoden som är en indirekt standardvägningsmetod. På så sätt kan vi eliminera den (eventuella) snedvridande effekt som följer av skillnader i företagens fördelning över olika personalkategorier. Vi finner först de faktiska olycksfallsfrekvenserna för de tre företagen till Man bör dock vara försiktig med att jämföra dessa värden eftersom de eventuellt är missvisande. För en bättre jämförelse beräknar vi först kapacitetstal, dvs hypotetiska olycksfallsfrekvenser, vilket ger oss de olycksfallsfrekvenser kontoren skulle haft om de följt branschgenomsnitt varför det följer att respektive kapacitetsindex ges av Vi får alltså att branchen 100 Efter att vi tagit hänsyn till skillnader i fördelning över personalkategori finner vi att olycksfallsrisken är störst i företag A (ca 7 7% över branschgenomsnittet) och minst i företag B (ca 6 % under branschgenomsnittet). Företag C ligger ca 1 5% under branschgenomsnittet. 5
25 Lösning A4/A /14 Thommy Perlinger 3. Skiljer sig andelen medlemmar som är positivt inställda till flexibla arbetstider i de båda åldersgrupperna? (a) Låter vi 44 och 45 representera den andel av respektive åldersgrupp som är positivt inställda till flexibla arbetstider ska våra hypoteser utifrån frågeställningen formuleras på följande sätt: 0 : : vilka vi tänker undersöka med ett hypotestest på 5% signifikansnivå. Vi har enligt uppgiften två slumpmässiga stickprov, OSU, och förutsätter att dom är dragna oberoende av varandra. Eftersom 44 b 44 (1 b 44 ) b 45 (1 b 45 ) är stickproven tillräckligt stora för att normalapproximation ska kunna användas. Eftersom de båda urvalen utgör 15% av respektive delpopulation är det enligt tumregeln inte tillåtet att bortse från ändlighetskorrektion. Vi använder därmed testfunktionen b 1 b r ³ 1 b (1 b ) som approximativt är (0 1) då nollhypotesen är sann. Eftersom vi här använder den klassiska metoden på 5% signifikansnivå och mothypotesen är tvåsidig blir vår beslutsregel att nollhypotesen ska förskastas först om obs 1 96 dvs om obs 1 96 eller obs Den polade stickprovsandelen ges av b vilket innebär att testfunktionen får värdet obs q Eftersom 1 96 obs har vi hamnat i acceptansområdet och nollhypotesen accepteras. Vi har på 5% signifikansnivå inte kunnat statistiskt säkerställa att det är någon skillnad i de båda åldersgrupperna vad det gäller andelen medlemmar som är positivt inställda till flexibla arbetstider. 6
26 Lösning A4/A /14 Thommy Perlinger (b) Vi finner testets -värde till -värde Pr ( 0 74) Om det är så att andelen medlemmar i tjänsteorganisationen som är positivt inställda till flexibla arbetstider är densamma i de båda åldersgrupperna är sannolikheten att få ett så pass här avvikande (eller ännu mer avvikande) stickprovsresultat ca 46%. Det är alltså inte på något sätt ovanligt att få ett sådant här resultat och det är förstås därför vi (på 5% signifikansnivå) accepterar nollhypotesen. 4. Hypergeometrisk fördelning. (a) Den aktuella slumpvariabeln är Antal väskor med illegalt innehåll bland de utvalda En väska har antingen illegalt innehåll eller inte. Antalet väskor i partiet är ändligt och tulltjänstemannen väljer förstås väskor utan återläggning. Vidare gäller att vår slumpvariabel räknar antalet väskor med illegalt innehåll bland de utvalda. Detta gör att är (b) Sannolikheten att tulltjänstemannen hittar åtminstone en väska med illegalt innehåll ges av Pr ( 1) 1 Pr ( 0) Det är alltså ungefär att tulltjänstemannen hittar (åtminstone) en väska med illegalt innehåll. 7
27 Lösning A4/A /14 Thommy Perlinger 5. Vi betraktar nu slumpvariabeln Längdenavengraviditet som enligt den givna informationen kan betraktas som approximativt (66 16) där enheten är dagar. (a) Vi söker nu Pr ( 40) Pr µ Pr ( 1 65) Vi tolkar detta som att ungefär var tjugonde graviditet är kortare än 40 dagar. (b) Enligt Tabell 5..B gäller att vilket innebär att den första kvartilen ges av Vi tolkar detta som att var fjärde graviditet är kortare än 55 dagar. (c) Låt Antal gravida kvinnor i urvalet som går över tiden Sannolikheten att en slumpmässigt vald gravid kvinna går över tiden är 0 5. En gravid kvinna går antingen över tiden eller gör det inte. Vi utgår från att gravida kvinnor går över tiden (eller gör det inte) oberoende av varandra. Vidare gäller att vår slumpvariabel räknar antalet gravida kvinnor i urvalet som går över tiden vilket innebär att är (1 0 5). Visöker Pr ( 7) 1 Pr ( 6) (d) Här söker vi en betingad sannolikhet. Eftersom händelsen { 74} ingår i händelsen { 70} följer att Pr ({ 74} { 70}) Pr( 74) Formeln för betingad sannolikhet ger därmed att Pr ( 74) Pr ( 74 70) Pr ( 70) Pr Pr Pr ( 0 5) Pr ( 0 5)
28 Uppsala universitet Statistiska institutionen A4 & A TENTAMENSSKRIVNING PÅ KURSERNA Grundläggande statistik A4, 15 hp Statistik för ekonomer A8, 15 hp UPPLYSNINGAR A. Tillåtna hjälpmedel: Kursspecifik formelsamling (utan anteckningar) Språklexikon Miniräknare B. Skrivtid: Skrivningen omfattar 6 uppgifter, om sammanlagt 100 poäng. C. För varje uppgift anges den maximala poäng som kan erhållas. Om en uppgift är uppdelad på deluppgifter anges den maximala poängen för varje deluppgift. Ibland kan inte deluppgifterna bedömas oberoende av varandra, vilket kan innebära att poäng inte utdelas på en senare uppgift om inte tidigare deluppgift lösts på ett i princip riktigt sätt. Dock gäller att utdelad poäng för varje deluppgift aldrig kan vara negativ. D. Om Du känner Dig osäker på någonting (skrivningens genomförande, någon formulering i en uppgift, om något hjälpmedel är otillåtet), fråga då jourhavande skrivningsvakt eller den skrivningsansvariga läraren. E. Efter skrivningens slut får Du behålla sidorna med frågeställningarna (de ska ej lämnas in!). Preliminära lösningar anslås på Pingpong. UPPMANINGAR A. Följ noga de anvisningar som finns på skrivningsförsättsbladet. B. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång! (Det dunkelt uttryckta förutsätts av rättaren vara dunkelt tänkt). Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar. C. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna insätts. Verbal slutsats av det framräknade intervallet krävs för full poäng. D. Vid signifikansanalys måste Du utöver vad som sägs i punkt B ovan ange vad hypotesprövningen avser att testa, hypoteserna i symbolform (då så är möjligt), signifikansnivå, testfunktion (inklusive antal frihetsgrader då detta är aktuellt) både i symbolform och med numeriska uppgifter, beslutsregel, resultat samt verbal slutsats. E. Vid standardvägning ska metod anges och beräkningarna ska följas av en verbal slutsats för full poäng. Lycka till! 54/14
29 Uppgift 1 Följande datamaterial är från USA och beskriver BMI (Body Mass Index) för 40 slumpmässigt utvalda män från en viss population. Tabell 1.1 BMI, män 3,8 3, 4,6 6, 3,5 4,5 1,5 31,4 6,4,7 7,8 8,1 5, 3,3 31,9 33,1 33, 6,7 6,6 19,9 7,1 3,4 7,0 1,6 30,9 8,3 5,5 4,6 3,8 7,4 8,7 6, 6,4 3,1 19,6 0,7 6,3 6,9 5,6 4, Tabell 1. BMI, män (sorterade data) 19,6 19,9 0,7 1,5 1,6,7 3, 3,3 3,4 3,5 3,8 3,8 4, 4,5 4,6 4,6 5, 5,5 5,6 6, 6, 6,3 6,4 6,4 6,6 6,7 6,9 7,0 7,1 7,4 7,8 8,1 8,3 8,7 30,9 31,4 31,9 3,1 33,1 33, X: BMI Beräkningshjälp xi 1039, 9 x 40 i 1 40 i i, (6) A Beräkna standardavvikelse och medelfel (standard error) för BMI. Vilket av dessa två mått är lämpligast att använda som ett deskriptivt mått för spridningen? Motivera ditt svar kortfattat. (10) B Illustrera fördelningen med ett lådagram (box-plot). (8) C Gränsen för övervikt sägs vara vid ett BMI på 5 eller högre. Beräkna ett 90% konfidensintervall för andelen överviktiga män i den aktuella populationen. (6) D I en rapport baserad på denna studie angavs den statistiska felmarginalen för andelen överviktiga män till 0,180. Vilken konfidensnivå motsvarar det? Uppgift En viss typ av förkylning för med sig vissa symptom. Det har visat sig att den som råkar ut för denna förkylning får feber med 35% sannolikhet och halsont med 80% sannolikhet. Sannolikheten att den som fått förkylningen råkar ut för båda symptomen är 18%. (4) A Beräkna sannolikheten att en person som råkar ut för denna förkylning varken får feber eller halsont. (4) B En person som fått förkylningen har halsont. Beräkna sannolikheten att personen dessutom har feber. 54/14
30 Uppgift 3 De årliga intäkterna från en viss del av statsbudgeten kan beskrivas av en normalfördelning med genomsnittet 140 miljoner kronor och standardavvikelsen 0 miljoner kronor. (3) A Vad är sannolikheten att intäkterna ett år överstiger 160 miljoner kronor? (4) B Vad är sannolikheten att intäkterna överstiger 10 miljoner kronor fyra år i rad? Intäkterna under dessa år kan anses vara oberoende av varandra. (3) C Bilda ett symmetriskt intervall kring genomsnittet som med 99% sannolikhet kommer att innehålla årets intäkter. Uppgift 4 Inom ett pedagogiskt projekt på universitet ville man analysera ett eventuellt samband mellan hur studenterna uppfattar kursen och studieresultatet för studenten. I en pilotstudie på Statistiska institutionen valdes 10 studenter slumpmässigt. En av institutionens doktorander samlade i slutet av kursen in dessa studenters helhetsomdömen om kursen med försäkran om att ej avslöja resultatet före det att kursbetygen var inrapporterade. Omdömena gavs som värden på en 10-gradig skala (Från 1Mycket dålig till 10Mycket bra). Tabellen nedan visar studenternas bedömning av kursen samt dessa studenters tentamensresultat (antal poäng 1-0). Student Omdöme Tentamens resultat () A Ange datanivå (skalnivå) för de två variablerna omdöme och tentamensresultat. (10) B Beräkna och tolka korrelationen mellan de två variablerna. 54/14
31 Uppgift 5 Skolverket ville före midsommar 014 ha din hjälp med att snabbt utröna om kommunala grundskolor har förbättrad lärartäthet 013 jämfört med 01. Eftersom statistik för lärartäthet ännu inte hade inrapporterats till Skolverket ringde du upp 13 kommuner vilka valts ut med ett obundet slumpmässigt urval från Sveriges 90 kommuner. Du bad att få ta del av tillgängliga uppgifter och kunde sedan för dessa kommuner beräkna lärartätheten (som definieras som antal lärare per 100 elever). Med hjälp av inrapporterad data från föregående år kunde du sedan konstruera Tabell 1. Tabell 1. Lärartäthet (antal lärare/100 elever) år 01 och 013. Huvudman: Kommun Lärartäthet 01 Lärartäthet 013 Hagfors 1,3 1,7 Sollentuna 1,4 1,3 Gnosjö 9,5 10,0 Knivsta 14,1 14, Gnesta 10,3 11,7 Kungsbacka 1, 1,6 Vadstena 10,8 11,3 Kinda 1,1 1,3 Hedemora 11,5 11,5 Lilla Edet 13,9 14,5 Grums 11,1 10,8 Borlänge 1,5 11,4 Ljusnarsberg 11,8 11,3 Källa: Skolverket Vi vet från tidigare år, baserat på statistik för samtliga 90 kommuner, att variabeln lärartäthet är approximativt normalfördelad (se Figur 1 på nästa sida). Vi antar därför att lärartäthet är approximativt normalfördelad även år 013. (14) A Avgör med hjälp av klassisk hypotesprövning om den genomsnittliga lärartätheten i Sveriges kommuner har ökat från 01 till 013. Använd signifikansnivån 10 %. Var noga med att redogöra för testförfarandets alla steg. () B I oktober 014, när statistik från alla kommuner var inrapporterad, visade det sig att den genomsnittliga ökningen i lärartäthet var 0,091 tjänster per 100 elever. Har vi i testet ovan gjort ett felbeslut? Om så är fallet, vad kallas detta fel? (7) C Beräkna testets styrka givet att den genomsnittliga ökningen i lärartäthet i populationen faktiskt var 0,091. Tolka ditt framräknade resultat med ord och kommentera värdet på den framräknade styrkan. Vilken slutsats kan du i efterhand göra gällande lämpligheten av din undersökning? (Utan ett statistikprogram kan du inte att beräkna styrkan exakt. För att möjliggöra en approximation får du därför lov att i denna deluppgift anta att populationsstandardavvikelsen är känd och lika med standardavvikelsen i stickprovet, dvs s σ. Ledning: Tänk på att du nu har en ny testfunktion med en ny beslutsregel.) (3) D Utgå från situationen i uppgift C. Beräkna testets styrka om stickprovsstorleken utökas med ytterligare 14 observationer. 54/14
32 Frekvens Forts Uppgift 5 Histogram of Lärartäthet 01 Normal 50 Mean 11,56 StDev 1,178 N ,5 9,0 10,5 1,0 13,5 15,0 Lärartäthet 01 Figur 1. Histogram samt probability plot för lärartäthet år 01 i Sveriges 90 kommuner. Källa: Skolverket Uppgift 6 (14) Rosén et al. (014) undersöker i sin artikel Priority setting in Swedish health care: Are the politicians ready? om det finns något samband mellan olika aktörer inom sjukvården och uppfattning om resurstilldelning. För att få svar på sin frågeställning skickade artikelförfattarna ut en enkät till ett slumpmässigt urval av politiker, administratörer och läkare i Region Skåne. Enkäten innehöll flera frågor om resurser och kvalitet. En utav frågorna löd: Do you think today s health care resources are sufficient to meet all the health care needs? De insamlade svaren för denna fråga (exklusive respondenter som svarat Vet ej ) redovisas i Tabell 1. Använd p-värdesmetoden för att undersöka om det finns ett samband mellan aktör och uppfattning om dagens resurser är tillräckliga. Använd en signifikansnivå på 5%. Var noga med att redogöra för testförfarandets alla steg. Tabell 1. Do you think today s health care resources are sufficient to meet all the health care needs? (Siffror inom parentes indikerar antal) Politiker Adminstratörer Läkare Ja 3 % (36) 13 % (6) 10 % (119) Nej 77 % (119) 87 % (174) 90 % (1039) 100 % (155) 100 % (00) 100% (1158) Källa: Rosén et al. (014) 54/14
33 Preliminära lösningar till tentamensskrivning på kurserna Grundläggande statistik, A4 och Statistik för ekonomer, A rev /LH, RP A Uppgift 1 Variable N Mean SE Mean StDev Min Q1 Median Q3 Max BMI_M 40 5,998 0,54 3,431 19,600 3,575 6, 7,700 33,00 x ( x ) i i / n 7493,8 1039,9 / 40 Standardavvikelse: s 3,431 n 1 39 s 3,431 Medelfel (Standard Error): SE ˆ s x 0,54 n 40 För att beskriva spridningen i ett datamaterial används standardavvikelsen då värdet på medelfelet i stor grad speglar stickprovsstorleken. B För att konstruera ett lådagram behövs median samt kvartiler. Medianen är medelvärdet av de två mittersta observationerna då observationerna är ordnade i storleksordning: dvs medelvärdet av observation nr 0 ( x 0 6, ) och x0 + x1 6, + 6, observation nr 1 ( x 1 6, ) Md 6, 1 1 Första kvartilen: q 1: Observation nr. ( n + 1) ( 41) 10, x10 3, 5 q 1 3,5 + 0,5( 3,8 3,5) 3,575 3, 6 x11 3, Tredje kvartilen q 3 : Observation nr. ( n + 1) ( 41) 30, x30 7, 4 q 3 7,4 + 0,75( 7,8 7,4) 7, 7 x31 7, 8 Eventuella extremvärden: Kvartilavståndet fås som: q q 7,7 3,6 4, Gränser för extremvärden: Nedre gräns: q 1 1,5( q3 q1) 3,6 1,5 4,1 17, 45 Övre gräns: q 3 + 1,5( q3 q1) 7,7 + 1,5 4,1 33, 85 Värden lägre än den nedre gränsen eller högre än den övre gränsen klassas som extremvärden (uteliggare). Då vi inte har något BMI under 17,45 eller över 33,85 har vi har således inga extremvärden. Lådagrammet kan då ritas, där lådan begränsas av första och tredje kvartilen och medianen markeras i lådan. Morrhåren dras då ut till minsta värdet x min 19,6 respektive högsta värde x max 33, Figur 1: BMI för 40 slumpmässigt utvalda män BMI 34 55/14
34 C p andelen överviktiga män (med BMI 5) i en viss population. Av de 40 männen i stickprovet hade 4 stycken ett BMI på 5 eller högre. 4 n 40 (stickprovsstorlek) Stickprovsandelen: p ˆ 0, % konfidensintervall för andelen överviktiga män dvs för p α 0,10 z 1, 6449 z α / 0,05 ( 1 pˆ ) pˆ pˆ ± z α / ÄK 1 antages (mycket stor population) n Förutsättningar: Slumpmässigt urval av de 40 männen ur populationen. Stort stickprov. n pˆ ( 1 pˆ ) > 5 Kontroll: n pˆ ( 1 pˆ ) 40 0,60 0,40 9,6 > 5 OK! 0,60 0,40 KI blir: 0,60 ± 1, ,60 ± 0,174 ung. 0,60 ± 0,13 Med 90% säkerhet innefattar intervallet från 47% till 73% andelen överviktiga män (med BMI 5) i denna population.. D ( 1 pˆ ) pˆ Statistiska felmarginalen (vid KI för p): z 0,180 där z z α n 0,180 0,180 z,33 pˆ ( 1 pˆ ) 0,6 0,4 n 40 Tabell 5..A ger P ( z <,33) 0,9901 0, 99 (alternativt använd tabell 5..B) så α / P( z >,33) 1 P( z <,33) 1 0,99 0, 01 α 0,01 0, 0 Konfidensnivå: ( 1 α ) 100% ( 1 0,0) 100% 98% Konfidensnivå är ca 98% Uppgift Låt F Feber H Halsont Pr ( F ) 0, 35 Pr ( H ) 0, 8 Pr ( F H ) 0, 18 Additionssatsen ger att sannolikheten för minst ett av symptomen blir: ( F H ) Pr( F ) + Pr( H ) Pr( F H ) 0,35 + 0,8 0,18 0, 97 Pr Den sökta sannolikheten är komplementet till detta dvs sannolikheten att en förkyld varken får feber eller halsont blir: ( ) Pr ( F H ) 1 0, 97 Pr sökt 0,03 55/14
35 Alternativ lösning Fyll i de givna sannolikheterna i en fyrfältstabell: Komplettera tabellen med resterande sannolikheter så att marginalsannolikheterna stämmer. F F H 0,18 0,80 H 0,35 1,00 F F H 0,18 0,6 0,80 H 0,17 0,03 0,0 0,35 0,65 1,00 Den sökta sannolikheten fås direkt ur tabellen: ( sökt) Pr( F H ) B ( ) Pr( F H ) ( F H ) Pr( H ) 0, 8 Pr 0,18 Pr sökt 0,5 Pr 0,03 Uppgift 3 X: Intäkterna från en viss del av statsbudgeten. X är N ( µ 140 ; σ 0) Pr X > 160 Pr z > Pr z > 1 1 Pr z < 0, A ( ) ( ) ( 1) 1 0, Pr X > 10 Pr z > Pr z > 1 Pr z < 1 0, (tabell) 0 B ( ) ( ) ( ) 8413 Y: Antal år (av fyra) då intäkterna överstiger 10 miljoner kronor. Y är Bi ( 4 ; p 0,8413) Pr n Pr Y y p 1 p y y y n ( ) ( ) ( Y 4) 0,8413 ( 1 0,8413) 1 0, ,8413 0, 50 Sannolikheten att intäkterna överstiger 10 miljoner fyra år i rad är ca 50% n C Med 99% sannolikhet kommer årets intäkter att hamna i intervallet: µ z α σ där α1%0,01 och α/0,005 z, 5758 enligt tabell 5..B 0,005 ± / dvs 140 ±, ± 51, 5 Med 99% sannolikhet kommer årets intäkter att hamna i intervallet 88,5 till 191,5 55/14
36 Uppgift 4 A Omdöme: ordinalskala Tentamensresultat: kvotskala B Då variabeln Omdöme är på ordinalnivå så ska Spearmans rangkorrelations- koefficient ( r S ) beräknas. Beräkningen baseras på rangerna (ordningstalen). Medelranger vid ties. x y R x R R y x R y R x R y ,5 95, , ,5 1 4,5 0, , , , , ,5 5,5 0, ,5 57, , , , Summa ,5 384,5 n RxRy Rx Ry r S 0,51 ( n R ( R ) )( n R ( R ) ) (10 38,5 55 )(10 384,5 55 ) x x y y Tolkning: Korrelationskoefficienten visar på ett positivt samband mellan de två variablerna. Vi har dock ett mycket litet stickprov här. Studenter som ger höga värden på variabeln omdöme har höga tentamensresultat. Låga omdömen - låga tentamenspoäng. Notera: I detta exempel har vi ties så koefficienten kan ej beräknas enligt formel r S 6 di 1 där d i Rx Ry n( n 1) 55/14
37 Uppgift 5 A. Frågeställning Vi vill veta om kommunala grundskolor har förbättrad lärartäthet 013 jämfört med 01. Hypoteser Frågeställningen leder fram till hypoteserna H 0 :µ 013 µ 01 µ 0 0, H 1 :µ 013 µ 01 µ 0 > 0, där µ 013 anger genomsnittlig lärartäthet i alla kommuner 013 och µ 01 anger genomsnittlig lärartäthet i alla kommuner 01. Förutsättningar Vi drar ett obundet slumpmässigt urval (OSU) bestående av n 13 kommuner och låter X 013,i och X 01,i beteckna lärartätheten respektive år i en slumpmässig vald kommun, i. Parvisa observationer innebär att variabeln av intresse är D i X 013,i X 01,i, som enligt nollhypotesen har väntevärde µ d och standardavvikelse σ d. Standardavvikelsen i populationen är dock okänd och vi måste således använda s d för att skatta σ d. Eftersom stickprovsstorleken är liten måste vi anta att D i är normalfördelad. Visserligen har data från tidigare år visat att X 01,i är approximativt normalfördelad (vilket gör att vi antar att även X 013,i är approximativt normalfördelad), men eftersom X 01,i och X 013,i inte är oberoende innebär det inte nödvändigtvis att även D i är approximativt normalfördelad. En lösning för att ge stöd för vårt antagande om D i :s normalitet är naturligtvis att titta på dierenser från tidigare år. Dock hade uppgiften i så fall i för stor utsträckning hjälpt er med en viktig del i uppgiften, nämligen att identiera att analysen måste baseras på dierenserna. Bara för att övertyga er om en approximativ normalitet redovisar jag en graf över dierenserna för alla kommuner baserat på data från 013 och 01. 1
38 Testfunktion Förutsättningarna innebär att vi som testfunktion använder oss av t D µ 0 s/ n, där D (1/n) n i1 D i. Enligt nollhypotesen är µ 0 0 och om nollhypotesen är sann så är testfunktionens fördelning en t-fördelning med n 1 frihetsgrader. Beslutsregel Vi bestämmer oss för signikansnivån 10%, dvs vi sätter α 0, 1. Testet är ensidigt och enligt mothypotesen nns ett kritiskt område enbart i höger svans. Tabell 5.3 ges oss att den kritiska punkten är t krit 1, 356. Beslutsregeln blir att vi förkastar H 0 om t obs > 1, 356. Datainsamling Data samlades in med OSU och presenteras i Tabell 1. Beräkning Vi inleder med att beräkna dierenserna för alla observerade parvisa lärartätheter, d i, där skillnaden mellan 013 och 01 för exempelvis Hagfors är µ 1 x 013,1 x 01,1 1, 7 1, 4 0, 4. På samma vis erhålls övriga dierenser: -0,1; 0,5; 0,1; 1,4; 0,4; 0,5; 0,; 0,0; 0,6; -0,3; -1,1; -0,5. Vi beräknar de aktuella nyckelsummorna 13 i1 d i 4, 41 och 13 i1 d i 4, 75. Medeldierensen samt standardavvikelsen för dierenserna, d, är di 4, 41 d 0, 16, n 13 (di s d) d i ( 4, 41 d i ) /n 4, n 1 n , Insättning av värden i testfunktionen ger att t obs 0, 16 0, 6063/ 13 0, 963 < 1, 356 t krit vilket enligt beslutsregeln innebär att vi inte förkastar H 0. Slutsats Vi kan inte förkasta nollhypotesen på 10% signikansnivå. Undersökningen ger alltså inte stöd för att lärartätheten i genomsnitt har förbättrats från 01 till 013.
39 B. Vi har gjort ett felbeslut. I det här fallet har vi begått ett Typ-II-fel, dvs vi har förkastat en mothypotes som sann. Lärartätheten har ju faktiskt ökat! C. Eftersom σ d s d 0, 6063 nu är känd använder vi nu testfunktionen Z D µ 0 σ d / n som är Z N(0, 1) vilket ger den nya kritiska punkten z krit 1, 8. Givet att nollhypotesen är sann så är µ 0 0. Dessutom vet vi att n 13. För att beräkna styrkan börjar vi med att lösa ut D ur den nya testfunktionen, efter insättning av värden får vi att 0, 6063 d krit 0 + 1, 8 0, Vi har genom denna transformation omformulerat beslutsregeln till att vi förkastar nollhypotesen om d > 0, 16 d krit. Denna kritiska punkt redovisas i den blå grafen nedan. Nu visade det sig att den genomsnittliga skillnaden i lärartäthet faktiskt var µ 0, 091. Detta innebär att verkligheten ( är den röda ) grafen, inte den blåa. Det innebär således att att D 0, 6063 är N 0, 091, och inte att D är ( 13 0, 6063 N 0, ). För att beräkna styrkan beräknar vi sannolikheten för att en 13 observation från den röda fördelningen hamnar i det kritiska området, dvs i det här fallet till höger om 0,16. 3
40 1 β Pr(F örkasta H 0 H 1 sann) Pr( D > 0, 16 H 1 sann) Pr( D 0, 091 0, 6063/ 0, 16 0, 091 > 13 0, 6063/ 13 ) 0, 16 0, 091 Pr(Z > 0, 6063/ 13 ) Pr(Z > 0, 743) 1 Pr(Z 0, 743) 1 0, , 3. Styrkan illustreras av det gråa fältet i grafen nedan. Slutsats Sannolikheten att ha upptäckt att det nns en skillnad när vi antog att nollhypotesen var sann var 0,3, dvs styrkan är 3%. Det innebär att om vi tänker oss att vi upprepar undersökningen utifrån samma förutsättningar (men med hypotetiska nya stickprov) så kommer vi endast i 3% av fallen förkasta den falska nollhypotesen. Således är 3% att betrakta som en liten styrka och i studier är det i regel önskvärt att styrkan är 80%. Undersökningen är därför inte lämplig att genomföra (eftersom det eventuellt är ett slöseri med resurser) då vi förmodligen inte kommer upptäcka att det faktiskt skett en ökning i lärartätheten. Stickprovet är helt enkelt för litet! D. Om vi ökar stickprovsstorleken till n individer så får vi att det kritiska området i termer av D nu ges av 0, 6063 d krit 0 + 1, 8 0, Vi har genom denna transformation omformulerat beslutsregeln till att vi förkastar nollhypotesen om d > 0, 150 d krit. Återigen så får vi att ( den sanna genomsnittliga dierensen var µ 0, 091. Det innebär att D 0, 6063 N 0, 091, ). 7 Vi utför samma beräkning som förut 4
TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp)
Uppsala universitet Statistiska institutionen TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp) 2015-03-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Kursspecifik
Tentamen Tillämpad statistik A5 (15hp)
Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling
Tentamen Tillämpad statistik A5 (15hp)
Uppsala universitet Statistiska institutionen A5 2015-08-25 Tentamen Tillämpad statistik A5 (15hp) 2015-08-25 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling
Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer
Tabell- och formelsamling A4 Grundläggande Statistik A8 Statistik för ekonomer Observera att inga anteckningar får finnas i formelsamlingen vid tentamenstillfället Thommy Perlinger 17 september 2015 Innehåll
Tentamen Tillämpad statistik A5 (15hp)
Uppsala universitet Statistiska institutionen A5 2013-01-14 Tentamen Tillämpad statistik A5 (15hp) 2013-01-14 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling
TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp)
Uppsala universitet Statistiska institutionen TENTAMENSSKRIVNING PÅ KURSERNA GRUNDLÄGGANDE STATISTIK A4 (15 hp) STATISTIK FÖR EKONOMER A8 (15 hp) 2013-03-22 UPPLYSNINGAR A. Tillåtna hjälpmedel: Kursspecifik
Tentamen Tillämpad statistik A5 (15hp)
Uppsala universitet Statistiska institutionen A5 2015-01-13 Tentamen Tillämpad statistik A5 (15hp) 2015-01-13 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling
Föreläsning 5. Kapitel 6, sid Inferens om en population
Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik (sid 53 i E) III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 II. Beskrivande statistik,
Tentamen Tillämpad statistik A5 (15hp)
Tentamen Tillämpad statistik A5 (15hp) 2016-05-31 Statistiska institutionen, Uppsala universitet Upplysningar 1. Tillåtna hjälpmedel: Miniräknare, A4/A8 Tabell- och formelsamling (alternativ Statistik
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl
Karlstads Universitet Avdelningen för Nationalekonomi och Statistik Tentamen i Statistik, STG A0 och STG A06 (3,5 hp) Torsdag 5 juni 008, Kl 4.00-9.00 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen
Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
Hur man tolkar statistiska resultat
Hur man tolkar statistiska resultat Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Varför använder vi oss av statistiska tester?
Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 2 Statistik; teori och tillämpning i biologi 1 Normalfördelning Samplingfördelningar och CGS Fördelning för en stickprovsstatistika (t.ex. medelvärde) kallas samplingfördelning. I teorin är
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl
Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15
Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl 14.00-19.00
Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl 14.00-19.00 Tillåtna hjälpmedel: Bifogad formelsamling, tabellsamling (dessa skall returneras). Miniräknare. Ansvarig lärare: Jari Appelgren,
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum Skrivtid
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum 2008-01-19 Skrivtid 0900 1400 Tentamen i: Statistik AI, 10p Antal uppgifter: 6 Krav för G: 11 Lärare: Robert Lundqvist,
Kapitel 10 Hypotesprövning
Sannolikhetslära och inferens II Kapitel 10 Hypotesprövning 1 Vad innebär hypotesprövning? Statistisk inferens kan utföras genom att ställa upp hypoteser angående en eller flera av populationens parametrar.
Tentamen Tillämpad statistik A5 (15hp)
Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Upplysningar 1. Tillåtna hjälpmedel: Miniräknare, A4/A8 Tabell- och formelsamling (alternativ Statistik
Föreläsning G60 Statistiska metoder
Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala
Stockholms Universitet Statistiska institutionen Termeh Shafie
Stockholms Universitet Statistiska institutionen Termeh Shafie TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2011-10-28 Skrivtid: 9.00-14.00 Hjälpmedel: Miniräknare utan lagrade formler eller text, bifogade
Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl
Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A0 samt STA A3 9p 4 augusti 005, kl. 08.5-3.5 Tillåtna hjälpmedel: Ansvarig lärare: Övrigt:
Hypotestestning och repetition
Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att
Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 22 mars 2018 TEN1, 9 hp Tillåtna hjälpmedel: Miniräknare
Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl
Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 1 januari 006, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel-
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl 14.00-19.00
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 004, kl 14.00-19.00 Tillåtna hjälpmedel: Bifogad formelsamling, approimationsschema och tabellsamling (dessa skall returneras). Egen miniräknare.
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27
Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 23 e mars 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
2 Dataanalys och beskrivande statistik
2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik A1, 15 hp Antal uppgifter: 6 Krav för G: 13 Lärare:
Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng
Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-29 Tid:
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 10 e januari 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
Föreläsning 4. Kapitel 5, sid Stickprovsteori
Föreläsning 4 Kapitel 5, sid 127-152 Stickprovsteori 2 Agenda Stickprovsteori Väntevärdesriktiga skattningar Samplingfördelningar Stora talens lag, Centrala gränsvärdessatsen 3 Statistisk inferens Population:
Analytisk statistik. Tony Pansell, optiker Universitetslektor
Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp
Gamla tentor (forts) ( x. x ) ) 2 x1
016-10-10 Gamla tentor - 016 1 1 (forts) ( x ) x1 x ) ( 1 x 1 016-10-10. En liten klinisk ministudie genomförs för att undersöka huruvida kostomläggning och ett träningsprogram lyckas sänka blodsockernivån
TMS136. Föreläsning 13
TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra
Hur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-08-22 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Jourhavande lärare: Mykola
EXAMINATION KVANTITATIV METOD vt-11 (110204)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig
Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek
OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER
STOCKHOLMS UNIVERSITET Statistiska institutionen Termeh Shafie OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2012-04-16 Skrivtid: 15.00-20.00 Hjälpmedel: Miniräknare utan lagrade formler eller text,
Studietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 16 e januari 2015 Tillåtna hjälpmedel: Miniräknare
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.
D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.
1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga
Analytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)
1. a) F1(Sysselsättning) F2 (Ålder) F3 (Kön) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) nominalskala kvotskala nominalskala ordinalskala ordinalskala b) En möjlighet är att beräkna
Examinationsuppgift 2014
Matematik och matematisk statistik 5MS031 Statistik för farmaceuter Per Arnqvist Examinationsuppgift 2014-10-09 Sid 1 (5) Examinationsuppgift 2014 Hemtenta Statistik för farmaceuter 3 hp LYCKA TILL! Sid
2. Test av hypotes rörande medianen i en population.
Stat. teori gk, ht 006, JW F0 ICKE-PARAMETRISKA TEST (NCT 15.1, 15.3-15.4) Ordlista till NCT Nonparametric Sign test Rank Icke-parametrisk Teckentest Rang Teckentest Teckentestet är formellt ingenting
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:
Föreläsning 1. 732G60 Statistiska metoder
Föreläsning 1 Statistiska metoder 1 Kursens uppbyggnad o 10 föreläsningar Teori blandas med exempel Läggs ut några dagar innan på kurshemsidan o 5 räknestugor Tillfälle för individuella frågor Viktigt
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2008-12-22 Skrivtid 0900 1400 Tentamen i: Statistik 1, 7.5 hp Antal uppgifter: 5 Krav för G: 11 Lärare: Jour: Robert Lundqvist,
732G01/732G40 Grundläggande statistik (7.5hp)
732G01/732G40 Grundläggande statistik (7.5hp) 2 Grundläggande statistik, 7.5 hp Mål: Kursens mål är att den studerande ska tillägna sig en översikt över centrala begrepp och betraktelsesätt inom statistik.
Uppgift a b c d e Vet inte Poäng
TENTAMEN: Dataanalys och statistik för I2, TMS135 Fredagen den 12 mars kl. 8:45-11:45 på V. Jour: Jenny Andersson, ankn 8294 (mobil:070 3597858) Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på
Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 HP Ten1 9 HP 19 e augusti 2015 Tillåtna hjälpmedel: Miniräknare
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2009-06-05 Skrivtid 0900 1400 Tentamen i: Statistik 1, Undersökningsmetodik 7.5 hp Antal uppgifter: 6 Krav för G: 12 Lärare:
EXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng
Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-08-31 Tid:
TENTAMEN I STATISTIKENS GRUNDER 2
STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-01 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:
b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)
Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 27:E OKTOBER 2014 KL 08.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66, Björn-Olof Skytt, 08-790 86 49.
Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson, Mykola
Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 2 Tillåtna hjälpmedel: Miniräknare (Formelsamling
Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.
Lägesmått Det kan ibland räcka med ett lägesmått för att beskriva datamaterial Lägesmåttet kan vara bra att använda då olika datamaterial skall jämföras Vilket lägesmått som skall användas: Typvärde Median
Parade och oparade test
Parade och oparade test Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning: möjliga jämförelser Jämförelser mot ett
D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.
1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga
Tentamen i Statistik, STA A13 Deltentamen 2, 5p 4 mars 2006, kl. 09.00-13.00
Karlstads universitet Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 4 mars 006, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel- och tabellsamling (skall returneras) samt
Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.
UMEÅ UNIVERSITET Institutionen för matematisk statistisk Statistiska metoder, poäng TENTAMEN -8 Per Arnqvist TENTAMEN I MATEMATISK STATISTIK Statistiska metoder, poäng Tillåtna hjälpmedel: Kursboken med
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl
Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A0 och STA A3 (9 poäng) 6 januari 004, kl. 4.00-9.00 Tillåtna hjälpmedel: Bifogade formel-
Laboration 2 Inferens S0005M VT18
Laboration 2 Inferens S0005M VT18 Allmänt Arbeta i grupper om 2-3 personer. Flertalet av uppgifterna är tänkta att lösas med hjälp av Minitab. Ett lärarlett pass i datorsal finns schemalagt. Var gärna
π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.
Stat. teori gk, vt 006, JW F0 ICKE-PARAMETRISKA TEST (NCT 13.1, 13.3-13.4) Or dlista till NCT Nonparametric Sign test Rank Teckentest Icke-parametrisk Teckentest Rang Teckentestet är formellt ingenting
Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0
Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2016-06-03 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2008-06-04 Skrivtid 0900 1400 Tentamen i: Statistik 1, Undersökningsmetodik 7.5 hp Antal uppgifter: 5 Krav för G: 15 Lärare:
1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)
1a) F1 och F3 nominalskala, enbart olika saker F kvotskala, Riktiga siffror, 0 betyder att man inte finns och avståndet mellan två värden är exakt definierat F4 och F5 ordinalskala, vi kan ordna svaren
TENTAMEN I STATISTIKENS GRUNDER 2
STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-20 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:
Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl
Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen 1, 4p 1 november 005, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel-