LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg Simulering i MINITAB Det finns goda möjligheter att utföra olika typer av simuleringar i Minitab. Gemensamt för dessa är att man börjar med att välja Calc > Random Data. Detta ger följande möjligheter: Under Calc > Random Data kan man sedan välja från vilken statistisk fördelning man vill att slumptalen skall komma. Som vi ser ovan finns det 27 olika möjligheter av vilka två skiljer sig från de övriga. Detta beroende på att för dessa alternativ så måste man ha vissa värden redan färdiginmatade i en eller flera kolumner. Dessa båda alternativ är för det första Sample from Columns och för det andra Discrete. Sample from Columns innebär att man slumpmässigt väljer att antal värden från en redan existerande kolumn. Detta kan ske med eller utan återläggning. Discrete innebär att man måste specificera två kolumner. En som innehåller de värden som skall vara möjliga att få och en som innehåller sannolikheter för respektive värden.
2 Övriga alternativ är olika statistiska fördelningar där det bara behövs att man specificerar någon/några parametrar som bestämmer hur fördelningen ser ut. Vi skall här kortfattat beskriva några av de möjligheter som finns. Diskreta fördelningar a) DISCRETE Väljer slumpmässigt värden från en kolumn beroende på sannolikheter för de olika värden i en annan kolumn. Ex. Antag att i en stor population av hushåll finns följande fördelning för antalet brandvarnare i hushållet. Antal brandvarnare Procentuell fördelning 0 25 1 55 2 15 3 5 Mata in värdena i kolumnerna C1 och C2 enligt följande: Välj nu slumpmässigt 100 hushåll ur populationen (Calc > Random Data > Discrete).
3 Vi kan här observera en del saker som är gemensamma för alla dialogrutor under Calc > Random Data. För det första finns det en ruta där man anger antalet slumptal och för det andra en ruta där man anger i vilken/vilka kolumner som slumptalen skall hamna. Det är här möjligt att ange flera kolumner t ex C1-C10. I kolumn C3 hittar vi nu värdena. Med hjälp av Data > Display Data skrivs de ut i Sessionfönstret. Data Display C3 1 1 1 1 2 0 2 1 1 0 1 2 2 1 0 3 1 1 2 0 1 0 1 1 2 2 0 1 1 3 2 1 2 1 1 3 1 0 1 1 1 1 2 3 1 2 1 1 1 2 1 1 0 1 0 1 2 1 0 1 0 1 1 1 1 1 1 1 3 1 0 2 3 1 1 1 0 1 0 0 2 1 2 0 1 2 1 2 2 1 1 0 2 1 3 0 1 1 2 0 Vi sammanfattar resultatet med hjälp av Stat > Tables > Tally Tally for Discrete Variables: C3 C3 Count 0 19 1 53 2 21 3 7 N= 100 Andra diskreta fördelningar: b) INTEGER Anger att man slumpmässigt vill dra ett heltal mellan a och b där alla värden har samma sannolikhet att komma med. Ex. Tärningskast: a = 1, b = 6. c) BERNOULLI En Bernoulli-fördelning är en fördelning med bara två värden, 0 (failure) och 1 (success). Fördelningen bestäms av parametern p = sannolikheten för success (SD kap 3.4). d) BINOMIAL En binomialfördelning är summan av n Bernoulli-fördelade variabler. Två parametrar behövs specificeras, dels n = hur många gånger försöket upprepas och p = sannolikheten att lyckas i varje försök. Variabeln anger hur många gånger försöket lyckas av de totalt n gångerna (SD kap 3.5). e) POISSON Poisson-fördelade slumptal med medelvärdet = (SD kap 3.6).
4 Kontinuerliga fördelningar a) NORMAL Normalfördelade slumptal från en normalfördelning med ett visst medelvärde (, Mean) och en viss standardavvikelse (, Standard deviation), SD kap 5.2. Ex: Antag att vikten i en population är normalfördelad med medelvärdet 70 kg och standardavvikelsen 15 kg. Välj slumpmässigt 100 personer ur denna fördelning. Sammanfattat med hjälp av Stat > Basic Statistics > Display Descriptive Statistics: Descriptive Statistics: C1 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 C1 100 0 70,34 1,83 18,33 22,79 58,63 67,86 80,02 Variable Maximum C1 116,81 Ett histogram får detta utseende (Graph > Histogram): 25 20 Histogram of C1 Normal Mean 70,34 StDev 18,33 N 100 Frequency 15 10 5 0 20 40 60 C1 80 100 120
5 Övriga kontinuerliga fördelningar har sina speciella användningsområden men vi nämner dem här bara vid namn. b) UNIFORM Likformig fördelning i intervallet från a till b. c) T Student s t-fördelning som beror på ett visst antal frihetsgrader. d) F F-fördelning beror på ett visst antal frihetsgrader i täljaren och ett visst antal i nämnaren. e) CAUCHY Cauchy-fördelning med lägesparameter a (medianen) och en skalparameter b. f) LAPLACE Laplace-fördelning med lägesparameter a (medelvärdet) och skalparameter b. g) LOGISTIC Logistisk fördelning med medelvärde a och skalparameter b. h) LOGNORMAL* X har en lognormal-fördelning om Log(X) är normalfördelad. Ange då medelvärdet och standardavvikelsen i denna normalfördelning. i) CHISQUARE En chi-två-fördelning med v frihetsgrader. j) EXPONENTIAL* Exponential-fördelning med medelvärdet b. k) GAMMA* Gamma-fördelning med formparameter a och skalparameter b. l) WEIBULL* Weibull-fördelning med formparameter a och skalparameter b. m) BETA Beta-fördelning med formparametrar a och b. * = Dessa fördelningar har även en tröskelparameter (treshold), en konstant som adderas till värdena. Normalt är tröskelvärdet noll.
6 Ett praktiskt exempel Exempel: Dimensionering av hiss. Antag att vikten i en population är normalfördelad med medelvärdet 70 kg och standardavvikelsen 15 kg. Vad är sannolikheten att 4 slumpmässigt valda personer tillsammans väger mer än 320 kg? Simulera 1000 slumptal i var och en av fyra kolumner (C1-C4). Betrakta varje rad som ett urval av fyra personer. Bilda sedan summan av C1-C4 i kolumn C5 (Calc > Row Statistics). Alternativt kan summan beräknas under Calc > Calculator. Resultat: Descriptive Statistics: C5 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 C5 1000 0 279,81 0,938 29,65 195,62 259,98 281,18 299,52 Variable Maximum C5 376,13 300 Histogram of C5 250 200 Frequency 150 100 50 0 200 240 280 C5 320 360 I simuleringen blev summan över 320 i 83 fall av 1000. Detta motsvarar alltså en sannolikhet på 0,083. Kan du räkna ut den exakta sannolikheten? (Tips: Statistisk dataanalys kapitel 5.3) Det är naturligtvis möjligt att bilda vilka kombinationer som helst, inte bara summor.