FK2002- FK2004 (HT2011) Datorövning 2 - Självständigt arbete med assistent Under denna dataövning arbetar vi med histogram i OpenOffice Cal och undersöker effekten av olika binstorlekar. I slutet lägger resultathistogrammen i ett OpenOffice Writer dokument. 1 Histogram 1) Börja med att ladda ner från webben en mätserie: http://www.physto.se/~clement/teaching/fysexp/2011/datalab2/ ArbetaMedHistogramStudent.ods Öppna denna fil med hjälp av OpenOffice Calc. Där hittar man på den första sidan två kolumner Jämnfördelning och Normalfördelning. Vi börjar med att studera innehållet av dokumentet ArbetaMedHistogramStudent.ods. Den första kolumnen Jämnfördelning innehåller slumptal mellan 0 och 1. Detta kan åstadkommas med hjälp av funktionen RAND(). RAND() funktionen ger tillbaka ett slumptal mellan 0 och 1 och behöver inget argument. Den andra kolumnen Normalfördelning innehåller slumptal som är normalfördelade kring noll, dvs med ett medelvärde av noll och en standardavvikelse av 2. Det är bra att observera hur man kan få fram normalfördelade slumptal med hjälp av OpenOffice Calc. Den andra kolumnen bygger på den första. Vi använder funktionen NORMINV(S;M,STD), där S är en sannolikhet mellan 0 och 1, M är medelvärde, och STD är standardavvikelsen, och NORMINV returnerar x- koordinaten som är lösningen till S=F(x) där F är integralen utav 1
normalfördelningen med angiven standardavvikelsen. Genom att lösa denna ekvation för ett antal jämnfördelade S värden mellan 0 och 1 (den första kolumnen) får man en Gauss fördelad uppsättning av lösningar x. 2) Vi börjar med att räkna meddelvärdet och standardavvikelsen för normalfördelning kolumnen. Lägg till en ny ruta som kallas för medelvärde och lägg till medelvärdet bredvid. I denna uppgift vill man kontrollera att AVERAGE funktion i OpenOffice ger rätt svar, därför ska man försöka implementera medelvärdet själv (man kan begränsa sig till 5 stycken normalfördelade värden och behöver inte betrakta hela kolumnen). Vi gör samma sak med standardavvikelsen, skapa en ruta som heter standardavvikelsen och därefter lägg till formeln för standardavvikelsen. (Man kan igen begränsa sig till 5 stycken normalfördelade värden och behöver inte betrakta hela kolumnen). Jämför resultatet med resulatet av STDEV i OpenOffice Calc. 3) Nu vill vi göra ett histogram av normalfördelade värden. Denna gång vill vi kunna lätt ändra binstorleken, och vill därför förbereda litet mer. Man kan först skapa en ruta som innehåller den önskade binstorleken, och värdet för den lägsta klassen. Man skapar även en kolumn som innehåller heltal från 1 till antalet klasser som önskas och med hjälp av dessa 2 celler (binstorleken, lägsta värdet) och kolumnen kan man generera klasserna. Generera kolumnen med heltal genom att skriva en första CELL X med noll. Därefter fyller man följande cell i kolumen med innehållet CELL X +1. Sedan fortplantar man resultatet ner genom att dra på den lilla fyrkanten. 2
Man kan skapa en ny kolumn som heter Binserie (Klasser) och som innehåller klasserna för histogrammet. Man vill räkna fram denna kolumn från: binstorleken, lägsta värdet och heltal från I=1 till N. Varje klass ska vara lika med I*BinStorleken+FörstaBin. Man lägger in denna formel motsvarande cellnummer i den första cellen högst upp i Binserie kolumnen, och därefter fortplantar man resultatet neråt genom att dra den lilla fyrkanten. 4) Vi kan nu definiera en ny kolumn som ska heta Frekvens och som ska innehålla hur ofta varje klass inträffar. Lägg till motsvarande kolumn, man börjar som vanligt att lägga in formeln för den först cellen i kolumnen. Där skriven man: =FREQUENCY(A:B;C:D) där A är första cellen med mätvärden (här kolumn C med normalfördelade värden), B är den sista cellen med mätvärden. C är den första cellen med klassvärden och D är sista cellen med klassvärden. 3
5) Nu har vi allt som behövs för att rita normalfördelningen i ett histogram. Man börjar med att gå till Insert - > Chart. Man kan välja XY scatter. I rubriken dataseries, trycker man på Add, och därefter väljer X- Values, och fyller cell intervallet för klasserna som kommer att bygga X- axeln i histogrammet. Intervallet skrivs tex som B2:B10. Sedan väljer man Y-Values och lägger in cellintervallet som innehåller frekvensvärden. Man kan avsluta med Finish. 4
6) När man fått fram ett histogram så kan man prova sig fram med litet olika binstorlekar. Prova på binstorlekar 1, 5, 0.1. Vilken verkar passa bäst? Varför? 7) Klistra alla 3 histogrammen (med binstorlekar 1, 5, 0.1) in i ett OpenOffice Writer dokument. Varje histogram ska ha en egen bildtext med egen numrering. Lägg till en enkel brödtext som refererar till alla tre histogrammen. 5