4. Kunna orientera sig mellan de olika fönstren



Relevanta dokument
Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

(a) Lära sig beräkna sannolikheter för binomial- och normalfördelade variabler (b) Lära sig presentera binomial- och normalfördelningen gra skt

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Alla filer som bearbetar PHP script ska avslutas med ändelsen.php, exempelvis ska en indexsida till en hemsida heta index.php

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

1.1 Skapa ett Inline-Script som skapar filen För att skapa ett inline script drar man InLine till där man vill ha själva scriptet.

HI1024 Programmering, grundkurs TEN

KPP053, HT2016 MATLAB, Föreläsning 1. Introduktion till MATLAB Skript Inläsning och utskrift av variabler Ekvationssystem Anonyma funktioner

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

DATORÖVNING 2: STATISTISK INFERENS.

Extramaterial till Matematik Y

Linjär algebra med tillämpningar, lab 1

Kom igång med Stata. Introduktion

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

KPP053, HT2015 MATLAB, Föreläsning 1. Introduktion till MATLAB Skript Inläsning och utskrift av variabler Ekvationssystem Anonyma funktioner

Datorövning 2 Statistik med Excel (Office 2007, svenska)

HI1024 Programmering, grundkurs TEN

HI1024 Programmering, grundkurs TEN

Från PCAXIS till Statistikatlasen

Import från Excel 3L Pro Import från Excel. Copyright VITEC FASTIGHETSSYSTEM AB

Programmering, grundkurs, 8.0 hp, Elektro, KTH, hösten Programmering: att instruera en maskin att utföra en uppgift, kräver olika språk:

Föra över ett befintligt register via importfil

Instruktion för laboration 1

Innehåll i detta dokument

HI1024 Programmering, grundkurs TEN

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

Lathund import Ladoklista i Ping Pong

Instruktion för laboration 1

NetBeans 5.5. Avsikt. Projektfönster

1. Allmänt. 2. Logga in till hemsidan. Manual

Introduktion till användning av linux-servern sledge och några övningsuppgifter

Laboration 1 Introduktion till Visual Basic 6.0

Kom igång med TIS-Office

EVALD manual. Evald version

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

Digitalt lärande och programmering i klassrummet. Introduktionsworkshop - Interaktiva berättelser med Twine

TIPS OCH TRIX MED ENTERPRISE GUIDE JESPER ARNFLO NORDIN BI-KONSULT, SAS XPERIENCE

Chapter 3: Using Classes and Objects

Lägg märke till skillnaden, man ser det tydligare om man ritar kurvorna.

DD1311 Programmeringsteknik för S1 Laborationer läsåret

Uppgifter teknik HT17 (uppdaterad v. 40)

Statistik för Brandingenjörer. Laboration 1

Introduktion till programmering SMD180. Föreläsning 2: Variabler, uttryck och satser

OEvent Manual. Version 1.2. ÅID-orientering

Pass 5: Dokumentation av forskningsdata

Handledning för Installation av etikettskrivare

Inferensstatistik. Hypostesprövning - Signifikanstest

samma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel med Resampling-pluginet, välj Resampling Stats for Excel i Start-menyn.

Omsorgen Användarhandledning

Eclipse. Avsikt. Nu ska ett fönster liknande figuren till höger synas.

InStat Exempel 4 Korrelation och Regression

Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata.

NetBeans 7. Avsikt. Projektfönster

Handledning Octo Anmälan

Inlä sning äv bokfo ringsorder viä Excelerätor

Intro till SPSS Kimmo Sorjonen (0811)

SND:s användarguide för Colectica for Excel

Richard Öhrvall, 1

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

Skapa fil som ska exporteras

Användarhandledning Version 1.2

Lathund för BankID säkerhetsprogram

Design av interaktiv multimedia. Läs i förväg om det som övningarna kommer att beröra. Träna hemma både före och efter övningarna.

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Objektorienterad programmering i Java I

Programmeringsteknik med C och Matlab

Se till att posten är i Ändringsläge. Gå till rullgardinsmenyn under Föremål och välj Lägg in bild.

Flex - Manual. Innehåll

Kennelklubbens Omakoira-medlemstjänst Instruktion angående adresslistor för kenneldistrikten

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Handledning till Eurofins Onlinetjänst

Inloggning till Treserva via extern dator

PNSPO! Använda NJ med NS System Memory. 14 mars 2012 OMRON Corporation

Labb i Datorsystemteknik och programvaruteknik Programmering av kalkylator i Visual Basic

Universitetskanslersämbetets Högskoleutforskare. En introduktion till analysvyn exemplet måluppfyllelse

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

Vanliga frågor för VoiceXpress

Inläsning av bokföringsorder via Excelerator

VÄLKOMNA FRITID JÖNKJ

Labora&on 1 Introduk&on &ll utvecklingsmiljön övningar/uppgi<er

SNABBGUIDE TILL MEDLEMSREGISTRET ANKKURI

Mata in data i Excel och bearbeta i SPSS

Att hämta raps-data via Internet

Användarmanual Timvärde El o Fjärrvärme

OBS!!! Anslut ej USB kabeln till dator eller GPS innan du först har installerat drivrutinerna för USB kabeln i din dator.

Medieteknologi Webbprogrammering och databaser MEB725, 5p (7,5 ECTS) Klientprogrammering JavaScript Program på flera sidor

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Beskrivning av tjänsten Egna rader

Transkript:

Datorövning 1 Statistikens Grunder 1 Syfte 1 Lära sig läsa in data i SAS 2 Importera data från Excel 3 Lära sig skriva ut data med proc print 4 Kunna orientera sig mellan de olika fönstren Exempel Att läsa in data När vi vill skapa ett nytt data-set måste vi skriva kod i SAS All kod skrivs in i fönstret "Editor" Koden som omfattar inläsning av data kallar jag "datasteget" Detta på grund av att data-steget börjar med kommandot "data" Alla procedurer i SAS, inklusive data-steget avslutas alltid med "run" Vad som måste anges emellan "data" och "run" är vad data-setet ska heta vilka variabler som nns samt själva observationerna, variabelvärdena Här är ett exempel på hur ett data-steg kan se ut data worklangd input namn$ langd Karin 162 Termeh 175 Bertil 181 Daniel 192 Maria 173 Vi har 5 personer som vi har noterat längden hos Dessa observationer vill vi spara i ett data-set som vi kallar "langd" De variabler som ska ingå i data-setet är "namn" och "langd" Namnen på variablerna anger vi efter kommandot "input", och det är ni själva som bestämmer vad ni vill att variablerna ska heta Eftersom SAS inte läser "å", "ä" eller "ö", döper jag variabeln längd till 1

"langd" Variabeln "namn" är inte numerisk, så vi måste tala om för SAS att observationerna kommer bestå av text Detta gör vi genom att sätta ett " $" efter variabelnamnet Innan observationerna radas upp behöver vi kommandot "datalines" Därefter skriver vi in observationerna Observationerna läses in radvis och ska komma i samma ordning som variabelnamnen är skrivna Observation 1 är alltså "Karin 162" namnet först, eftersom vi har angivit den variabeln först, och längden efter det På nästa rad kommer observation 2 osv Inläsningen av observationerna avslutats genom att skriva ett ensamt semikolon på en ny rad Därefter kommer "run" för att avsluta data-steget Observera att alla rader ska avslutas med ett semikolon (utom efter raderna med observationer) Det går även bra att läsa in observationerna horisontellt Om vi betraktar exemplet ovan, så kan vi läsa in samma data-set så här data worklangd input namn$ langd @@ Karin 162 Termeh 175 Bertil 181 Daniel 192 Maria 173 Vi använder alltså två snabel-a, @@, efter variabelnamnen, för att ange att observationerna kommer läsas in på en lång rad Vad som är viktigt även här är att variabelvärdena för observationerna följer samma ordning som variabelnamnen i input kommandot Vi kan manipulera variabelvärden direkt i data-steget, utan att behöva läsa in observationerna Låt oss säga att vi har en variabel X, som har tio värden som går från 1 till 10 Vi vill även läsa in variabeln X 2 Vi kan göra det enkelt 2

utan att behöva skriva in alla värden på X 2 data worknummer input x xsquare = x**2 1 2 3 4 5 6 7 8 9 10 Efter input kommandot anger vi namnet på den nya variabeln "xsquare" samt vad den ska vara lika med Vi ser att X 2 skrivs som x**2 i SAS Vi kan även välja att logaritmera X Då skriver vi data worknummer input x xsquare = x**2 lnx = log(x) 1 2 3 4 5 6 7 8 9 10 Det här data-setet, som jag döpt till "nummer", har nu alltså tre variabler "x", "xsquare" och "lnx" Har man väldigt många observationer som ska registreras, och värdena dessutom återkommer, kan det vara bra att skapa en variabel som anger frekvensen för hur många gånger ett visst utfall inträ ar Säg att vi har undersökt hur många 3

studenter som röker på en viss skola Vi har även undersökt deras föräldrars rökvanor Utfallet av undersökningen blev så här Nu vill vi läsa in detta i SAS data worksmoke input students$ parents$ Studenter röker Studenter röker ej Båda föräldrarna röker 400 1380 En förälder röker 416 1823 Ingen förälder röker 188 1168 Att skriva in 400 observationer där studenten röker och där båda föräldrarna röker, för att fortsätta skriva in de andra 4975 observationerna, är lite jobbigt Istället läser vi in det så här data worksmoke input student$ parents$ frequency 400 not_ 1380 smoke one 416 not_smoke one 1823 smoke none 188 not_smoke none 1168 Variabeln "student" har alltså två utfall - "smoke" och "not_smoke" Variablen "parents" har tre utfall - "both", "one" och "none" (Båda variablerna är kvalitativa) Det ger oss 6 kombinationer för vilka vi registrerar frekvensen Frekvenserna skriver vi in under variabelnamnet "frequency" 4

Att importera data från Excel Vi har samma längd data som ovan sparat i en excel- l som heter "langd2xls" För att importera data len från excel till SAS använder vi koden proc import out=worklangd2 datafile = "C:\Documents and Settings\karinstal\Mina dokument\statistikens grunder\dataövingar\langd2xls" dbms=excel replace getnames=yes Proceduren vi använder kallas "proc import" Det första vi ska ange är namnet på len i SAS Jag kallar den "worklangd2 " På nästa rad, efter komandot "data le", ska vi ange var excel- len ligger på datorn Här ovan kan ni se att, på min dator, ligger len på C:n osv Efter det kommer komandot "dbms" där vi anger att det är en excel- l vi vill importera Efter det skriver vi replace om det är så att vi vill skriva över en redan be ntlig SAS l med detta namn Sista komandot som kan vara bra att inkludera är "getnames" Vi väljer "yes" här om vi vill ta med oss variabelnamnen från excel till SAS Att skriva ut data Vi kan använda proceduren "proc print" för att granska vårt data-set i fönstret "Output" Vi börjar med att titta på det första exemplet proc print data=worklangd Detta är en av de många procedurerna som nns i SAS Koden för de olika procedurerna måste börja med "proc" Efter att vi har angett vilken procedur vi vill köra i SAS (här proc print) ska vi tala om vilket data-set vi göra det för "Data=worklangd" talar om att vi vill jobba med len "langd" Skriver vi denna kod i SAS får vi följande utskrift: Obs namn langd 1 Karin 162 2 Termeh 175 3 Bertil 181 4 Daniel 192 5 Maria 173 Vi kan även skriva ut data-setet "nummer" Det gör vi med koden proc print data=worknummer 5

Vi får utskriften Obs x xsquare lnx 1 1 1 000000 2 2 4 069315 3 3 9 109861 4 4 16 138629 5 5 25 160944 6 6 36 179176 7 7 49 194591 8 8 64 207944 9 9 81 219722 10 10 100 230259 Att orientera sig mellan de olika fönstren Vi har sett att man skriver koden i fönstret "Editor" och att vi kan titta på datat genom proceduren "proc print" i fönstret "Output" Det tredje fönstret i SAS är "Log" och där registreras allt vi skriver och säger till SAS att göra Det är bra att alltid vara uppmärksam på vad som skrivs i loggen Om det är något fel med koden man skrivit syns det i loggen Kom ihåg: Blå text betyder att koden gick att köra Grön text betyder varning Röd text betyder att något är fel och att koden inte kunde köras Uppgifter För alla uppgifter gäller det att titta i "loggen" så att det blev rätt Ha för vana att göra detta efter varje körning av kod Basuppgifter 1 För att testa ut prestanda hos en ny bilmodell har ett urval om 10 bilar provkörts och bensinförbrukningen har uppmätts Följande mätvärden (liter per mil) erhölls: 0:76 0:74 0:72 0:75 0:72 0:77 0:78 0:73 0:74 0:71 Skapa ett data-set i SAS och använd "proc print" för att titta på datasetet 2 Manipulera data-setet ovan för att göra en ny variabel som anger bensinförbrukningen i centiliter (multiplicera med 100) Skriv ut data-setet igen 3 Kasta ett mynt 10 gånger och registrera utfallen Gör ett data-set där du anger dina utfall Använd "proc print" för att granska data-setet 4 Gå till hemsidan och ladda ner len "rokdataxls" Spara len på datorn och notera sökvägen Använd "proc import" för att importera excel- len till SAS 6

Extra uppgifter 1 En person simmar 1800 meter i en simbassäng Efter simturen registrerar han tiden (minuter) och pulsen (slag/minut) Han har nu gjort 23 träningspass i poolen med resultatet Tid Puls 34:12 152 35:72 124 34:72 140 34:05 152 34:13 146 35:72 128 36:17 136 35:57 144 35:37 148 35:57 144 35:43 136 36:05 124 34:85 148 34:70 144 34:75 140 33:93 156 Läs in datat och granska det sedan med "proc print" 2 För att studera könsskillnader i konsumentbeteende ck 100 slumpmässigt utvalda kvinnor och 100 slumpmässigt utvalda män svara på frågan om vilken av fyra nämnda butiker de helst besöker Följande resultat erhölls Clas Ohlson H&M Teknikmagasinet MQ Kvinnor 11 57 6 26 Män 46 4 32 18 Läs in datat i SAS Filen ska innehålla tre variabler Granska datat med hjälp av "proc print" 7