Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9, 8-5-4 EXEMPEL: Hur mycket kunder förlorar vi om vi höjer biljettpriset? I en undersökning i USA ck 6 bussbolag ange sin senaste ökning (%) av biljettpriset samtidigt som de noterade minskningen i resandeantal (%). avgiftsökning (%) 5 35 5 4 6 8 3 minskning i resor (%).5. 7.5 6.3..7 7. 8. avgiftsökning (%) 38 8 7 7 3 7 3 minskning i resor (%). 3.6 3.7 6.6 4.4 4.5.8 8. 4 resandeminskning (%) 8 6 4 5 5 5 3 35 4 avgiftsokning (%) (a) Hur stor procentandel av kunderna förlorar vi för varje ny procentandels ökning av biljettpriset? (b) I bussbolag B tänker man höja biljettpriset med %. Ange ett intervall där kundförlusten för detta bolag med 95% säkerhet kommer att nnas.
EXEMPEL: (biljettpris, forts). En linjär regressionsmodell anpassas 5 resandeminskning 5 5 5 5 5 3 35 4 avgiftsokning.95.9.75 3 4.5.5..5
EXEMPEL: I ett radhusområde nns radhus av fyra olika hustyper med olika bostadsyta. Vid en undersökning av energiförbrukningen ett visst år hos dessa utvaldes två hus av vardera typen och man ck följande värden: Bostadstyp A A B B C C D D Bostadsyta (m ) 96 96 6 6 36 36 46 46 Förbr (MWh). 8..8.8 4..5 4.3 4. 5 4 3 energiforbrukning 9 8 9 3 4 5 bostadsyta En naturlig modell är att förbrukningen beror linjärt av bostadsytan bortsett från oberoende slumpfel. (a) Hur stor är energiökningen per m? Gör inte enbart en skattning av ökningen utan även ett kon- densintervall. (b) Gör ett 95% kondensintervall för förväntad förbrukning i hus av typ B med användande av samtliga data.
EXEMPEL: energiförbrukning (forts). En linjär regressionsmodell anpassas. 5 energiforbrukning 4 3 9 8 9 3 4 5 bostadsyta.95.9.75 8 4 6.5.5..5
EXEMPEL: energiförbrukning (forts). Kondensintervall för linjen (streck-prickat), prediktionsintervall för observationer (streckat). 8 6 4 energiforbrukning 8 6 4 9 3 4 5 bostadsyta Kondensintervall för linjens läge: I µ = (α + β x ± t a/ (n )s n + (x x) (xi ) x) För x = m blir ett 95% intervall (.6,.7) MWh. Prediktionsintervall för ett enstaka värde: I Y (x ) = (α + β x ± t p/ (n )s + n + (x x) (xi x) ) För x = m blir ett 95% prediktionsintervall (8.5, 4.7) MWh.
Intressanta frågeställningar, enkel linjär regression: I: Skatta α och β i regressionslinjen α + β x Skatta också σ i modellen, dvs variationen kring linjen. Beräkna I α och I β, är det troligt att β=, dvs att X inte påverkar Y? biljettpris: Hur stor procentandel av kunderna förlorar vi för varje ny procentandels ökning av biljettpriset? Om β= innebär det att kundtillströmning inte påverkas av biljettpris. energiforbr: Hur stor är energiökningen per m? II: Förväntat Y -värde: Givet ett x, vad är det förväntade värdet på Y? Vi söker alltså µ = α + β x, linjens läge i punkten x. Beräkna ett intervall för µ. biljettpris: Vad är den förväntade kundförlusten (procent) om vi höjer priset med %? energiförbr Vad är förväntad energiförbrukning i radhus med bostadsyta m?
III: Prognos (prediktion): Givet ett x, var kan en enstaka (ofta framtida observation) av Y hamna? Om denna observation betecknas Y (x ), gör ett prediktionsintervall för Y (x ). biljettpris I bussbolag B tänker man höja biljettpriset med %. Ange ett intervall där kundförlusten för detta bolag med 95% säkerhet kommer att nnas. energiförbr Mitt hus är på m. Vad är energiförbrukningen för just detta hus? Ange ett intervall där energiförbrukningen för mitt hus med 95% säkerhet kommer att nnas. IV: Hur bra passar modellen till data? V: Hur mycket av den totala variationen i y-led har vi förklarat med modellen?
EXEMPEL: Residualanalys används för att hitta rätt modell! Anpassa modellen y i = α + β x i + ɛ i. Inte bra ty trend i residualerna...8.6 y.4...5.5.5.5 x.95.9.5.75.5.5.5.5.5..5.5.5 Anpassa istället modellen y i = α + β x i + β x i + ɛ i. Nu blev det bättre!..8.6 y.4...5.5.5.5 x..95.9..75...5.5.5.5..5....
Anpassa modellen y i = β x i + β x i + ɛ i. Inte bra ty variansen ökar med x. 3 5 y 5 5.5..5..5.3.35.4 x.999.997.98.99.95.9.75.5.5..5...3....3.4 Anpassa istället modellen ln y i = α+β ln x i +ɛ i. Mycket bättre! 6 lny 5 4 3 3.5 3.5.5.5 lnx.999.997.98.99.95.9.75.5.5..5...3. 3.5.5