Slumpen och hur vi uppfattar den - med och utan tärning Ingemar Holgersson Högskolan Kristianstad grupper elever Gr, 7, 9 och. grupp lärarstudenter inriktning matematik Ca i varje grupp Gjord i Israel Fischbein, E. and Schnarch, D.: 997, The evolution with age of probabilistic intuitively based misconceptions, Journal for Research in Mathematics Education 8, 9. Lotto I Lotto satsar man på 7 nummer Kalle satsar på,,,,,, 7 och Lisa satsar på, 8, 7,, 7,, 9 Vem har störst chans att vinna? Kalle störst chans Lisa störst chans Så 7 Så Båda samma chans 78 Singla slant Lisa singlade slant gånger och fick klave alla gångerna. Hur stor är chansen att få klave i hennes :e kast Mindre än att få krona Så Så Lika som krona 7 9 9 Större än krona Andra svar
Kasta tärning Om du kastar tärningar, vilket är mest sannolikt, att få och eller och? Att få och Så Så Att få och Båda samma chans 7 7 7 7 78 Andra svar I en stad med ett mindre sjukhus och ett större, föds det i genomsnitt barn om dagen på det mindre och barn om dagen på det större. Man räknar dagar då mer än % (dvs 9 resp 7) av de födda barnen är flickor. Vilket sjukhus kommer att ha flest sådana dagar? A B barn/dag barn/dag Antal dagar > % flickor Det stora sjukhuset, dvs B Det lilla sjukhuset dvs A Båda lika många dagar Andra svar Inget svar Så Barnfödslar 7 Så 8 89 Jämför sannolikheten att få klave på åtminstone av mynt när du singlar mynt samtidigt Sannolikheten att få klave åtminstone gånger av när du singlar en slant Singla slant eller gånger Mindre chans vid gånger Lika chans Större chans vid gånger Andra svar Så Så 7 Inget svar
Falkfenomenet Kalle och Lisa har varsin låda med två vita och två svarta kulor. Så Så Kalle drar en kula från sin låda och ser att den är vit. Utan att lägga tillbaka den drar han en ny kula. Är sannolikheten att denna kula är vit större, mindre eller lika med att den är svart? Båda rätt Första rätt Andra fel 7 9 Lisa dra en kula från sin låda och lägger den åt sidan utan att titta på den. Därefter drar hon en ny kula och ser att den är vit. Är sannolikheten att den första kulan hon drog är vit större, mindre eller lika med att den är svart? Båda fel Andra 7 Kasta tärning gånger och notera udda eller jämnt Gissa hur en sådan serie kommer att se ut Utför experimentet Jämför resultaten Verkligheten har längre serier än vad man tror 8 Gissa Ex pr 7 8 Vilken siffra är vanligast? Om man studerar data från något område och gör statistik över vilken siffra som talen börjar med, hur blir då fördelningen? Ja, det beror ju på. Men om data har en hög grad av slumpmässighet över sig? Vilken siffra är vanligast? De flesta av oss förväntar sig säkert att siffrorna till 9 förekommer ungefär lika ofta Men 88 Newcomb logaritmtabeller 98 Benford föreslog logaritmisk fördelning Exempel
Vilken siffra är vanligast? Egna undersökningar Typ av Städer Städer Kommuner Fonder Benfords lag data area täthet area 9 9 7 8 8 9 9 7 8 9 7 7 9, 8 9, Antal 9 877 Vilken siffra är vanligast? Fibonaccitalen följer däremot Benford närmast perfekt Typ av data Fibonaccital Benfords lag,, 7, 7,,, 9, 9,7 8, 7,9,,7 7,8,8 8,, 9,, Antal Hur förklara lagen? Fördelning av första siffra bör vara oberoende av enhet Normering ger då att P(x)dx= och P(kx)d(kx)= vilket medför att P(kx)=(/k)*P(x) Derivera med avseende på k och sätt k= ger xp (x) = - P(x) som har lösningen P(x) = /x Om x täcker många -potenser blir då P(D) = log(+/d) vilket är Benfords lag Siffra 7 8 9 Benfords lag utvidgad Första Andra Tredje,,8,,, 7,,9,,,, 9,7,, 7,9 9,7 9,98,7 9, 9,9,8 9, 9,9, 8,8 9,8, 8, 9,8 Fjärde,8,,,, 9,998 9,99 9,99 9,98 9,98 Användning? Progressiv analys Benfords lag har använts för att upptäcka förfalskningar i ekonomiska data Redovisningar Deklarationer Valresultat? Numbers Första siffran Andra siffran Första två siffrorna Första tre siffrorna
BENFORD'S LAW First Digit BENFORD'S LAW Second Digit Count 8 7 7 8 9 Count 7 8 9 Digit Sequence Digit Sequence ACTUAL EXPECTED HIGHBOUND LOWBOUND ACTUAL EXPECTED HIGHBOUND LOWBOUND Count BENFORD'S LAW First Two Digits 7 8 Digit Sequence ACTUAL EXPECTED HIGHBOUND LOWBOUND Count BENFORD'S LAW First Three Digits 8 7 7 8 8 Digit Sequence ACTUAL EXPECTED HIGHBOUND LOWBOUND Centrala gränsvärdessatsen i statistik Om ett slumpmässigt experiment upprepas tillräckligt många gånger närmar den sig en och samma typ av fördelning - Normalfördelningen Formulerades först av Abraham de Moivre på 7-talet För slantsingling (binomialfördelningen) brukar man räkna med n= För allmän fördelning n= Normalfördelningen Dess matematiska form beskrevs först av Gauss N(μ,σ) = exp(-(x-μ) /σ) bild
Hur illustrera satsen? Otympligt med binomialfördelningen som grund Kan man inte använda tärning istället för mynt? Mödosamt att bestämma fördelningen för mer än kast Normalt görs detta via genererande funktioner (x+x +x +x +x +x ) n för n kast Men detta är inte så enkelt Antal kombinationer vid tärningskast Två kast sätt sätt sätt sätt sätt sätt sätt sätt sätt etc Tre kast sätt sätt sätt sätt sätt sätt sätt 7 sätt sätt sätt sätt etc Fyra kast sätt sätt sätt sätt!/(!*!) 7 sätt sätt!/(!*!*!) sätt 8 sätt sätt sätt sätt sätt etc kast kast kast Hur fortsätter det? kast kast 7 7 etc kast 8 etc Finns det ett mönster? Upprepade kast med en tärning Summor om värden ger värdena i nästa kolumn 7 8 7 7 7 78 78 7 8 7 9 777
,,8,,, 7 7 8 9 Antal kombinationer för n=,,, 8 7 8 9 7 8 7 8 9 7 8 9 Hypotes Antag att vi kastar en tärning n gånger. Då ges antalet kombinationer K n (p) för att få p poäng av K n- (p-)+k n- (p-)+ +K n- (p-) p antar värden mellan n och n och K n (p) sätts = utanför dessa värden Bevis Induktion Hypotesen är sann för n= och n=. Detta är lätt att kolla. Antag att den gäller för n- kast. Om man kastar ytterligare en gång kan man få p poäng på följande sätt: (p-)+, (p-)+,, (p-)+. Därför fås K n (p) som summan av kombinationer för dessa fall. Är detta speciellt för tärningar? Inget i beviset är specifikt för sidor Går att generalisera till s sidor, där s antar värden från och uppåt Justering för s sidor Summorna innehåller s termer som går från K n- (p-s) till K n- (p-) Att jämföra med normalfördelningen har en inbyggd funktion =NORMFÖRD(x;medelvärde;standardavvi kelse;falskt) Bestäm medelvärde och standardavvikelse för fördelningen Gör om fördelningen till en sannolikhetsfördelning Generera motsvarande normalfördelning Mått avvikelse absolut differens Hur är det med fördelningar som ej är likformiga? Ex Kast med tärningar notera differensen - Fördelningen blir alltså Från till blir det 8 Vilket kan reduceras till Vad händer om man upprepar experimentet? För blir vikten * = 9 För *+* = För *+*+* = 9 För *+*+*+* = 8 För *+*+*+*+* = 8 Weights Score 7 7 8 7 8 9 7 8 9 7
9 8 7 7 8 9 7 8 7 8 9 7 8 9 7 8 9 Mönster? Modifiera beviset för en tärning Upprepa experimentet n gånger. p antar värden mellan och n och V n (p) sätts = utanför dessa värden Antag att den gäller för n-. Om man kastar ytterligare en gång kan man få p poäng på följande sätt: p+, (p-)+,, (p-)+ Då ges vikterna V n (p) för att få p poäng av V n- (p)*v () + V n- (p-)*v () + + V n- (p-)*v () Upprepade kast med två tärningar och addera differenserna Viktade summor med termer ger värdena i nästa kolumn Differens tärningar Vikter 8 87 78 9 7 98 87 9 9 7 9 78 78 8 888 88 878 8 889 97 9 77 9 9 8 798 7 7 97 9 98 7 78 88 8 8 987 8 7 8 8 97 8898 Fördelningar differens tärningar Jämförelse med normalfördelningen Görs på motsvarande sätt som för en tärning Slutsatser Det går att illustrera centrala gränsvärdessatsen ganska enkelt för olika diskreta fördelningar Schemat för en tärning är en generalisering av Pascals triangel och gäller för alla likformiga fördelningar Schemat för differensen av tärningar är en ytterligare generalisering och gäller för alla diskreta fördelningar För slantsingling (binomialfördelningen) brukar man räkna med n= För allmän fördelning n= För tärning räcker det med n=8 8