Statistik för igejörer MS8 Föreläsig Kursmål: För godkät betyg på kurse skall studete käa till ett flertal metoder och tekiker för visualiserig av datamaterial; kua geomföra ekla beräkigar av saolikheter; ha grudläggade kuskaper om stokastiska variabler och ågra valiga saolikhetsfördeligar; förstå iebörde av cetrala gräsvärdessatse; Jesper Rydé VT Uppsala uiversitet ha utvecklat e ituitiv förståelse för slump och slumpmässigt beteede; förstå avädig av pukt- och itervallskattigar för ågra statistiska typproblem; käa till regressiosmetodik för apassig av mätdata; ha käedom om ågra typiska igejörstillämpigar av saolikhet och statistik, eempelvis tillförlitlighet och kvalitetstekik. Load Eempel: Belastigsdata 3 Belastig över tid, Lastbils bakael Eempel: Tidsjämförelser i system ABC 8. De första svesktillverkade persodator Jämförelser av olika tider: Kompilerigstider? Överförigstider? Beräkigstider? Vätetider? 3 6 time / s Två datamaterial: 3 3 3 3 Föreligger ågo skillad? Kofidesitervall Eempel: Paketförluster Problem: Buffertöverflöde. Router C: Saolikhet, Router D: Saolikhet, Router E: Saolikhet, Router F: Saolikhet, Beräka saolikhete att ågo av de fyra routrara är drabbad av bufferöverflöde vid ett slumpvis valt tillfälle. Beräka saolikhete att ett paket ka komma frå A till B över ågo av de två vägara. (Saolikheter, hädelser m.m. )
Eempel: klimatdata Mätigar av ederbörd vid Maiquetia flygplats, Veezuela. Vad är ormalt? Regmägder: vad är ormalt? Maimal daglig ederbord (mm) 6 8 6 9-998 9 96 97 98 99 Ar Histogram, regmägder 9-998..8.6....8.6.. 6 8 6 8 Nederbord (mm) Regmägder 9-999 Maimal daglig ederbord (mm) 3 3 9 96 97 98 99 Ar Histogram, regmägder 9-999.8 gapmider.org.6....8.6.. 3 3 Nederbord (mm)
Behov att beskriva datamaterial OBSERVATIONER? LÄGESMÅTT : Hur preciserar vi medelvärdet i e datamägd? SPRIDNINGSMÅTT : Hur stor är spridige krig medelvärdet? BEROENDEMÅTT : Om vi studerar flera storheter som varierar slumpmässigt, vad ka sägas om deras (evetuella) samvariatio? KVANTITATIVA: Numeriska observatioer. Mätbara, uttryckt i ågo form av mått. Observatioer ka jämföras med varadra. KVALITATIVA: I stället för siffror aväds ord eller aa ickeumerisk beskrivig. Ka i vissa fall omvadlas till kvatitativa för statistisk aalys. Aalys av data för igejörer DESIGN : Fastslå/beräka värde i diverse ormer och tabeller. MODELLERING I ALLMÄNHET: Ta had om variatio/mätfel (atur, tekik) RISKHANTERING : Beräka saolikheter för oöskade hädelser (risker) BESLUTSFATTANDE : Förädrig gjorts. Uttala sig på ett statistiskt sut sätt om det verklige skett e förädrig. Kurses struktur: SANNOLIKHETSLÄRA: Begreppet saolikhet. Förfiade matematiska verktyg för att beskriva spridigs-, läges- och beroedemått samt allmäa metoder att beräka saolikheter. STATISTIK (INFERENS) : Dra slutsatser om e större populatio, baserat på ett atal observatioer därur. Beskrivade statistik Beskrivade statistik Några begrepp: Lägesmått: Medelvärde, media Spridigsmått: Stadardavvikelse, varias, variatiosbredd Grafiska hjälpmedel: Histogram (kotiuerliga data klassidelas) Lådagram (bo plot ) Spridigsdiagram (scatterplot ) 3
Tidigt eempel: Florece Nightigale Florece Nightigale, e piojär i flera avseede. Nightigales aalys Aalys gjord efter Krimkriget, 8-6 Eempel på LÄGESMÅTT Syfte: sammafatta tygdpukte av data i ett umeriskt värde. Medelvärde (stickprovsmedelvärde) Media Typvärde BERÄKNING av lägesmått Observatioer :,, K, (Atalet observatioer beteckas med ) + + L+ MEDELVÄRDE : = MEDIAN : Orda värdea i storleksordig. Udda : Jämt : Mediae är mittersta värdet Mediae är medelvärdet av de mittersta värdea. SPRIDNINGSMÅTT Syfte: Sammafatta spridige hos data. BERÄKNING av stadardavvikelse Observatioer :,, K, (Atalet observatioer beteckas med ) Variatiosbredd Kvartilavståd Stadardavvikelse och varias STANDARDAVVIKELSE, beteckas med s : s = i i= här VARIANS : Helt ekelt s
Stadardavvikelse Lägg märke till att stadardavvikelse alltid är ickeegativ är relaterad till aritmetiska medelvärdet har samma ehet som de betraktade observatioera HISTOGRAM (försälj. Bromma) 9 8 7 8 6 6 3 Boyta (m ) SPRIDNINGSDIAGRAM, pris & boyta Lådagram (boplot) 8 6 8 Samvariatio. 33 radhus i Bromma. Ju större boyta, desto högre pris! Lådagrammets upphovsma: Joh W TUKEY (9 - ) 6 6 8 Boyta (m ) Preseterades i boke Eploratory Data Aalysis (977) Försäljigar, Bromma Grudbegrepp: 8 6 8 6 Boyta (m ) 9 8 7 6 Låda visar kvartiler (%, 7%) och media (%). Lägg märke till morrhår och etrema värde ( outliers )