LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING



Relevanta dokument
Föreläsning G60 Statistiska metoder

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

TMS136. Föreläsning 13

Kapitel 10 Hypotesprövning

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Konfidensintervall, Hypotestest

Föreläsning G60 Statistiska metoder

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 12: Regression

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Regressionsanalys. Mats Wilhelmsson. Priserna inom en region

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsningsanteckningar till kapitel 9, del 2

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Multipel Regressionsmodellen

Om statistisk hypotesprövning

Industriell matematik och statistik, LMA /14

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

8 Inferens om väntevärdet (och variansen) av en fördelning

Hur man tolkar statistiska resultat

TMS136. Föreläsning 11

FACIT (korrekta svar i röd fetstil)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

F22, Icke-parametriska metoder.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Medicinsk statistik II

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

, s a. , s b. personer från Alingsås och n b

import totalt, mkr index 85,23 100,00 107,36 103,76

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

TENTAMEN I STATISTIKENS GRUNDER 2

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Stockholms Universitet Statistiska institutionen Termeh Shafie

Regressionsanalys av lägenhetspriser i Spånga

Facit till Extra övningsuppgifter

Repetitionsföreläsning

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Tentamen i Matematisk statistik Kurskod S0001M

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Repetition 2, inför tentamen

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

TAMS65 - Föreläsning 6 Hypotesprövning

Statistik och epidemiologi T5

TAMS65 - Föreläsning 6 Hypotesprövning

F3 Introduktion Stickprov

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

a) Facit till räkneseminarium 3

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Hypotestestning och repetition

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Hur skriver man statistikavsnittet i en ansökan?

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Skriftlig tentamen Grundläggande statistik (ST100G), 15 högskolepoäng. Datum: Lördag

tentaplugg.nu av studenter för studenter

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Omtentamen i Metod C-kurs


Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

TENTAMEN GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Laboration 2 multipel linjär regression

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Matematisk statistik, Föreläsning 5

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Transkript:

LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga urval bedömer trovärdigheten i hypoteser antaganden angående populationen. Inferens - hypotesprövning Testa hypotesen att β = 0 mot någon av mothypoteserna β 0, β < 0 eller β > 0. Tre alternativ för statistisk hypotesprövning:.klassisk hypotesprövning 2.Konfidensintervallmetoden 3.p-värdesmetoden. Excel rapporterar alla tre alternativen. Men värdena för alternativ 2 och 3 som presenteras i Excel är det för tvåsidiga hypotestester. För ensidiga tester rekommenderas att använda alternativ. Låt oss välja signifikansnivå 5% (vanligt). Tvåsidig hypotesprövning H 0 : β = 0 H : β 0. 2

Alt klassisk hypotesprövning Nollhypotesen förkastas om absolutbeloppet av den observerade t-kvoten (värdet på testfunktionen) är större än det kritiska värdet hämtat från t-tabell: Tumregel (mer eller mindre fin/grov) för att förkasta nollhypotes: H 0 förkastas om b t = > t ( t-kvoten ska vara > 2 för 0,025 n ( k + )) tillräckligt många observationer sb (jmf frihetsgrader) Språkbruk (gäller alla tester): Om H 0 inte kan förkastas säger man vi kan inte förkasta H 0 på 5% signifikansnivå (men vi säger aldrig att H 0 accepteras på 5% signifikansnivå.) Man kan också säga att variabeln x är inte statistisk signifikant. Om H 0 däremot kan förkastas säger man att variabeln x är statistisk signifikant. Alt 2 konfidensintervallmetoden Studera om det 95-procentiga konfidensintervallet innehåller talet 0. H 0 kan förkastas om 0 inte ingår i intervallet. Alt 3 p-värdesmetoden H 0 förkastas om p-värdet < 0,05. 3

Tillämpning av hypotesprövning på enkel linjär regressionsanalys. Exempel : samband huspriser och ålder. Problem: Kalle P hävdar att det inte finns något kasualt samband mellan ålder (här definierad som försäljningsår minus värdeår) och huspriser för hus sålda i Norra och Södra Ängby. Lena Q hävdar å andra sidan att det finns ett sådant samband, dock osäker på om ålder har en negativ eller positiv inverkan på husspriser. Urval: 04 försäljningar ett visst år. Enkel linjär regressionsmodell: Populationen: pris = β 0 + β *ålder + u Vill skatta β 0 och β med urval (04 sålda hus): Skattad linje baserad på urvalet (OBS! Annan notation för skattad parameter): pris = b 0 + b *ålder 4

Ålder 80 70 60 50 40 Ålder 30 20 0 0 0 2 000 000 4 000 000 6 000 000 8 000 000 0 000 000 Tvåsidig hypotesprövning: H 0 : β = 0 H : β 0. Regressionsstatistik Multipel-R 0,080 R-kvadrat 0,006 Justerad R-kvadrat -0,003 Standardfel 20723,733 Observationer 04 ANOVA fg KvS MKv F p-värde för F Regression 9,69633E+ 9,69633E+ 0,6654396 0,4654963 Residual 02,48629E+4,4575E+2 Totalt 03,49599E+4 Koefficienter Standardfel t-kvot p-värde Nedre 95% Övre 95% Konstant 3 525 628 00673 3,49 0,00 520964 5530293,36 Ålder -3 376 6397-0,82 0,42-45900 948,2793 pris = b 0 + b *ålder =3 525 628 3 376*Ålder 5

t = b 3376 = = s b 6397 0,82 Vi kan direkt konstatera att absolutbeloppet av det observerade värdet på t-kvoten (0,82) är mindre än det kritiska värdet 2 (,98), vilket innebär att vi inte kan förkasta nollhypotesen på 5% signifikansnivå. Resultatet är icke-signifikant. Med andra ord, vi konstaterar att ålder inte har någon inverkan på försäljningspris. 6

Exempel 2: samband huspriser och värdeyta Problem: Undersöka om det finns ett kasualt samband mellan värdeyta och huspriser för hus sålda i Norra och Södra Ängby. Urval: 04 försäljningar ett visst år (2000). Enkel linjär regressionsmodell: Populationen: pris = β 0 + β *Värdeyta + ε Vill skatta β 0 och β med urval (04 sålda hus): Skattad linje baserad på urvalet: pris = b 0 + b *Värdeyta Samband värdearea och pris Värdearea 350 300 250 200 50 00 50 0 0 2 000 000 4 000 000 6 000 000 8 000 000 0 000 000 Pris Varea 7

. Formulera hypoteser Enkelsidig hypotesprövning: H 0 : β = 0 H : β > 0. t = b s b Regressionsstatistik Multipel-R 0,827 R-kvadrat 0,683 Justerad R-kvadrat 0,680 Standardfel 68504,52 Observationer 04,000 ANOVA fg KvS MKv F p-värde för F Regression,02E+4,02E+4 2,20E+02 3,22E-27 Residual 02 4,74E+3 4,64E+ Totalt 03,50E+4 Koefficienter Standardfel t-kvot p-värde Nedre 95% Övre 95% Konstant 2665 8795 0,60 0,55-258636 483966 Värdearea 23 46 578 4,84 0,00 20285 26546 pris = b 0 + b *värdearea =2 665 + 23 46*Värdearea t = b 2346 = = s b 578 4,84 8

Resultatet är signifikant (t-kvoten är större än 2). Nollhypotesen förkastas därmed på 5% signifikansnivå till förmån för mothypotesen. Med andra ord, vi konstaterar att värdearea har inverkan på försäljningspris. OBS! Vi har ovan inte studerat - hur du slår upp kritiska värden i en t- tabell mht antal frihetsgrader. - Vi har heller inte i detalj studerat enkelsidiga- och tvåsidiga hypotesprövningar. - Etc. 9