EKVIVALERING AV HÖGSKOLEPROVET
|
|
- Margareta Fredriksson
- för 6 år sedan
- Visningar:
Transkript
1 EKVIVALERING AV HÖGSKOLEPROVET En jämförande studie av olika ekvivaleringsmetoder Jonas Jonsson, Samuel Brändström Examensarbete, 15 hp Statistik C2, 15 hp Vt 2018
2 Abstract Equating the SweSAT A study of the difference between equating methods The results of the Swedish Scholastic Assessment Test (SweSAT) are often critical to the test takers when it comes to their selection to higher education in Sweden. The raw score obtained from the number of correctly answered questions is transformed into a so called standardized score. The process that makes this transformation possible is called equating. It is done in order to make sure that a difference in test difficulty doesn t affect a test taker s chance to be selected for the desired education. This essay compares if there is a difference between modern kernel equating techniques and older traditional equating methods when it comes to equating the SweSAT. When comparing the different methods, the standard gaussian kernel and the uniform kernel resulted in the best equating performance when it came to standard deviation and other statistical measures of importance. However the difference was small and the simpler traditional equating method equipercentile equating is therefore still preferred.
3 Sammanfattning Individers resultat på högskoleprovet är i många fall avgörande när det kommer till antagning vid Sveriges olika högskolor och universitet. Råpoängen som är antal rätt besvarade frågor omvandlas till en så kallad normerad poäng. Processen som ligger bakom denna omvandling kallas för ekvivalering och genomförs för att se till att olika svåra prov inte ska påverka individernas chanser att komma in på sina sökta utbildningar. Denna uppsats undersöker om det finns någon skillnad mellan nya moderna kernelekvivaleringsmetoder och äldre traditionella metoder när det kommer till att ekvivalera högskoleprov. Kernelvarianterna standard gaussian och uniform visade sig prestera bäst utifrån statistiska mått som t.ex. standardavvikelse jämfört med övriga metoder som analyserats. Dock var skillnaderna så pass små att en enklare traditionell metod såsom ekvipercentilekvivalering istället är att föredra.
4 Populärvetenskaplig sammanfattning Vissa som skrivit högskoleprovet mer än en gång har upplevt skillnad i svårighetsgrad mellan de olika provversionerna. Detta beror inte bara på att individen kan ha blivit bättre på att skriva den typen av prov utan också på att det finns en skillnad i svårighetsgrad mellan olika högskoleprov. Detta trots att provkonstruktörerna gör sitt yttersta för att göra dem så lika som möjligt i svårighetsgrad. Detta gör att en individ som får en hög poäng på ett svårt prov egentligen presterat bättre än en person som får samma poäng på ett lättare prov. För att lösa detta problem så tillämpas så kallade ekvivaleringsmetoder som syftar till att översätta varje poäng på det ena provet till poängskalan för det andra provet. De som jobbar med högskoleprovet har under många år använt sig av ekvivaleringsmetoder för att göra proven jämförbara så att varje individ skall få ett rättvist resultat inför ansökan till högre utbildningar. Detta ger en normerad poäng som bättre representerar provtagarens faktiska kunskap och inte bara poängen på det specifika provet i fråga. Fram till nu så har primärt traditionella metoder använts för ekvivalering av högskoleprov, detta trots att modernare metoder finns att tillgå. Syftet med denna uppsats är att analysera data från två stycken nyligen skrivna högskoleprov (våren och hösten 2017) för att se om ekvivaleringsförmågan skiljer sig mellan de moderna ekvivaleringsmetoderna och de traditionella metoderna. Över skrivande och deras resultat har analyserats i denna studie. Nästan fler skrev vårens prov än höstens. Utifrån provresultaten så visade det sig att höstens prov var svårare och provtagargrupperna visade sig vara rätt lika utifrån de faktorer som beskriver personernas bakgrund. Ekvivalering utfördes för att kunna förutse vad en viss uppnådd poäng på vårens prov skulle motsvara på höstens prov. Både traditionella metoder samt de mer moderna metoderna användes så att resultatet sedan kunde jämföras. Den specifika metod som sedan visade sig vara den mest optimala för just det här datamaterialet var en av de moderna ekvivaleringsmetoderna. Även om den moderna metoden som föredras visade sig vara den bästa i analysen så spelar det i praktiken inte så stor roll då skillnaden i ekvivalerade poäng sällan skiljde sig mer än några hundradelar. Detta gör det extremt osannolikt att en specifik provdeltagare får ett annat resultat med den moderna metoden jämfört med de aningen sämre traditionella metoderna. Eftersom skillnaderna var så små kan de traditionella metoderna vara att föredra då de kräver mindre arbete samt minimerar risken för att något går fel. Därmed ses inget starkt behov för att istället använda sig av moderna metoder vid normering av högskoleprovsdata.
5 Innehållsförteckning 1. Inledning Datamaterial 2 3. Metod & teori Gruppdesigner Traditionella metoder Presmoothing Ekvivalering Jämförelse av modeller Kernelekvivalering Presmoothing Skattning av poängsannolikhet Kontinuerlig approximation Bandwidth Val av kernel Ekvivaleringstransformation Modellutvärdering Resultat Presmoothing Traditionella metoder Kernelekvivaleringsmetoder Diskussion & slutsats Referenser Appendix 21
6 1. Inledning Hur det ska gå till när två olika provtagargrupper ska jämföras med varandra på ett bra och tillförlitligt sätt har studerats en hel del. En mängd olika ekvivaleringsmetoder har föreslagits och testats genom åren. Syftet med ekvivalering är att göra resultatet på ett prov jämförbart med resultatet på ett eller flera andra prov (Kolen & Brennan, 2014). Denna uppsats syftar att belysa skillnaden i ekvivaleringsförmåga mellan traditionella ekvivaleringsmetoder och metoder inom det mer moderna ramverket kernelekvivalering. För att göra detta kommer data från de två högskoleprov som skrevs 2017 att användas. Högskoleprovet är ett viktigt prov i Sverige då det på liknande sätt som gymnasiebetygen används för att bestämma vilka studenter som ska antas vid universitet eller högskola. Historiskt så har främst den traditionella ekvivaleringsmetoden ekvipercentilekvivalering använts, med antagandet att provtagargrupperna är slumpmässiga stickprov från samma population (Stage & Ögren, 2003). Denna uppsats syftar till att jämföra denna metod, samt övriga traditionella metoder, med det mer moderna ekvivaleringsramverket kernelekvivalering. Anledningen till att det kan vara svårt att jämställa två olika provtagargrupper och provresultat beror dels på att proven i sig kan ha olika svårighetsgrad samt att de olika grupperna som skriver proven kan skilja sig rätt markant från varandra. De traditionella ekvivaleringsmetoder som används vid ekvivalering av högskoleprovet tenderar att utgå från antagandet att grupperna som skriver de olika proven kommer från samma population. Det analyserade datamaterialet består utöver själva provresultatet också av ett antal variabler gällande provtagarnas bakgrund. Högskoleprovet har både en kvantitativ del och en verbal del. I denna uppsats så kommer olika ekvivaleringsmetoder att jämföras för att se vilken av dem som fungerar bäst för att ekvivalera den kvantitativa delen av högskoleproven. 1
7 2. Datamaterial Datamaterialet som ligger till grund för denna uppsats kommer från två högskoleprov gjorda våren 2017 respektive hösten Totala antalet skrivande individer uppgick till , varav stycken skrev vårens prov och stycken skrev höstens. Totalt består proven av 160 uppgifter, hälften tillhör den verbala delen och hälften tillhör den kvantitativa delen. Dessa delar ekvivaleras separat. Individernas resultat på den kvantitativa delen av proven är variabeln av störst intresse då det är den som skall ekvivaleras. Variabeln baseras på 80 enpoängsfrågor med 4-5 svarsalternativ från provens två kvantitativa delar (40 från varje del) och hur många rätt individerna har på dessa. Detta resulterar i ett värde mellan 0 och 80. Medelvärdet för antal rätt på vårens prov låg på 44,5 medan medelvärdet på höstens prov låg på 43,7. Skillnaderna i resultat mellan vårens och höstens prov skiljer sig inte mycket åt men provpoängen på vårens prov är aningen högre, se Figur 1. Andra variabler av intresse som gjorts tillgängliga för att analyseras i denna uppsats är: Ålder, kön, pågående utbildning, utländsk utbildning och högsta avklarade utbildning, Dessa variabler är av intresse för att undersöka om grupperna som skrev de två olika proven skiljer sig markant åt eller inte. Viss skillnad kunde uppmätas gällande några av variablerna. Av vårens provtagare var 50,8% kvinnor och av höstens var 53,7% kvinnor. 79,8% av vårens provtagare var under 25 år medan de under hösten utgjorde 83%. En mindre andel individer angav att deras högsta utbildning var en avslutad gymnasieutbildning under vårens prov (37,8%) kontra höstens (43,9%). Även om skillnader kan uppmätas mellan de två provgruppernas förklarande variabler så är de inte speciellt stora. (Appendix, figur 10 13) Variabler kopplade till individens resultat på de verbala delarna av högskoleprovet anses mindre intressanta då det är den kvantitativa delen som skall ekvivaleras i denna uppsats. Variabler för varje specifik fråga tillhandahålls också vilket gör det möjligt att undersöka om något av proven har frågor som är betydligt svårare. Det visade sig att de svåraste frågorna på höstens prov var svårare och fler än de svåraste frågorna på vårens prov. Ingen individ fick dock noll poäng på något av proven. Figur 1. Poängfördelning för den kvantitativa delen av högskoleprovet. Det datamaterial som tillägnats denna uppsats är ej fullständigt. Information om individernas personnummer och härkomst har uteslutits på grund av sekretesskäl. Utöver detta så har information om högskoleprovets så kallade ankarprov ej gjorts tillgängligt för analysen då det inte ansetts nödvändigt för uppsatsens syfte. Ett ankarprov är en serie frågor som dyker upp på båda proven med syftet att se ifall kunskapsnivån hos de två grupperna ser lika ut. 2
8 3. Metod & teori 3.1 Gruppdesigner Beroende på hur datamaterialet har samlats in så blir förutsättningarna för ekvivaleringen annorlunda vilket gör att olika sorters designer föredras för att kunna göra en god ekvivalering. I denna del beskrivs designerna kortfattat. För mer utförliga beskrivningar se Kolen & Brennan (2014) och González & Wiberg (2017). Fem olika designer kan användas både för de traditionella metoderna och kernelmetoderna: Single Group Design (SG Design), Equivalent Group Design (EG Design), Counterbalanced Design (CB Design) och Non Equivalent Groups with Anchor Test Design (NEAT Design). Utöver dessa finns även en design som endast brukar användas vid kernelekvivalering: Non Equivalent Groups with Covariates Design (NEC). För att använda sig av SG Design så behöver samma grupp av provtagare göra båda proven. Ett vanligt problem med denna design är att beroende på vilket prov som skrivs först så kan provtagarnas resultat på det andra provet förändras, t.ex på grund av att de blivit bättre efter det första provet alternativt sämre på grund av t.ex utmattning. (González & Wiberg, 2017, p. 11) EG Design går att använda när två olika grupper av provdeltagare gör ett prov var. Dock kräver EG Design att grupperna är likställda i sin sammansättning och förmåga. Detta är ofta inte uppfyllt då t.ex tid kan ha passerat mellan proven vilket kan ha fått grupperna mer skilda från varandra. (Lyrén & Hambleton, 2011) CB Design försöker åtgärda de potentiella problem som SG Design skapar genom att låta olika delar av gruppen provtagare göra de två proven i olika ordning. Gruppen delas på hälften, de gör varsitt prov för att sedan byta och göra det som den andra halvan gjorde. Designen kan ses som både två stycken SG-designer eller två stycken EG-designer. (González & Wiberg, 2017, p ) Fördelen med att använda sig av NEAT Design är att provdeltagarna endast behöver göra ett prov var och att de som gör det första respektive andra provet inte behöver komma från samma population utan kan anses vara skilda från varandra. För att jämställa dem används istället ett ankarprov som tilldelas båda grupperna. Resultatet från detta ankarprov används sedan för att justera för skillnader hos de olika grupperna som sedan används vid ekvivaleringen. (Kolen & Brennan, 2014, p ) NEC Design är ett viktigt alternativ till NEAT då inget ankarprov är tillgängligt och de två provgrupperna inte kan anses komma från samma population. NEC går ut på att använda sig av kovariater av bakgrundsinformation om provtagarna för att bättre jämställa dem med individerna från det andra provet och därmed kunna ekvivalera deras poäng även fast de inte kommer från samma population. (Wiberg & Bränberg, 2015) Då de provtagare som gjort båda proven inte går att identifiera i det datamaterial som erhållits så faller möjligheten att använda sig av SG Design bort. På liknande sätt så faller även CB Design bort då sättet som högskoleprovet administreras på inte passar denna design. För att använda sig av NEAT Design så krävs ett ankarprov och något sådant har inte gjorts tillgängligt för denna rapport. EG Design passar dock relativt bra då båda proven kommer från samma år vilket gör att populationen som stickproven är tagna från 3
9 inte borde ha hunnit ändras speciellt mycket. Antagandet om att populationen är densamma är dessutom rätt vanligt vid analys av Högskoleprovet (Stage & Ögren 2003). Samtliga ekvivaleringsmetoder som undersöks i denna rapport kommer därmed att utgå ifrån en EG Design. 3.2 Traditionella ekvivaleringsmetoder De traditionella metoder som kommer att analyseras för ekvivalering av högskoleprovet är: ekvipercentil-. linär- och medelvärdesekvivalering. I detta avsnitt beskrivs dessa metoder kortfattat. För fullständiga beskrivningar se Kolen & Brennan (2014, Chapter 3, 4 & 7) Presmoothing Innan ekvivalering genomförs så är det brukligt att göra s.k. presmoothing (utjämning) på poängfrekvenserna. Detta görs för att se till att ojämnheter i de observerade provresultaten jämnas ut så att det i teorin blir mer likt den bakomliggande fördelningen för provresultaten. För att göra detta så kan t.ex. en log-linjär modell av poängfrekvenserna skapas där grad av polynom väljs så att modellen får en så god passning som möjligt. För att hitta den bästa modellen så jämförs primärt Akaike Information Criterion (AIC) där den modellen med lägst AIC föredras. Den log-linjära modellen blir då: log(r j ) = β 0 + β 1 x j + β 2 x j β Tr x j T r, (1) där r j är sannolikheten att få x j poäng på provet, j = 0, 1,, J och J är högsta antalet rätt på provet. Termen β 0 är en normaliseringskonstant och β 1 till β Tr är parametrar kopplade till polynom av individuella provpoäng x j. Termen T r är den högsta polynomgraden som bestäms med hjälp av AIC. Frekvenserna som erhålls av utjämningen används sedan som skattning av poängfördelningen för respektive prov Ekvivalering Ekvipercentilekvivalering är den ekvivaleringsmetod som kan ses som grunden som även de andra traditionella metoderna baserar sig på. (González & Wiberg, 2017, p. 43) Metoden går ut på att låta en individs poäng på det ena provet motsvaras av poängen med samma percentil på det andra provet. För ekvipercentilekvivalering så definieras två poäng, x och y som ekvivalenta om: F Y (y) = u = F X (x), (2) där F X och F Y är kontinuerliga, kumulativa fördelningsfunktioner för prov X och prov Y, y och x är observerade poäng på respektive prov samt u är den percentil som fördelningsfunktionerna antar vid sina respektive poäng (u (0,1)). Om inte funktionerna F Y ( ) och F X ( ) är kontinuerliga så är det väldigt sällan som två poäng x och y båda uppfyller ekvation (2) för samma värde på u. Detta har traditionellt lösts genom att betrakta varje poäng som likformigt fördelad över ett intervall som är 4
10 definierat ±0.5 enheter runt varje poäng. På så vis ersätts de diskreta poängvariablerna med kontinuerliga motsvarigheter. Ekvipercentilekvivalering ges av att uttrycka ekvation (2) i termer av y: y = φ(x) = F Y 1 (F X (x)), (3) där φ är ekvivaleringstransformationsformeln och F Y 1 är inversen av den kontinuerligt skattade kumulativa fördelningsfunktionen för prov Y (Kolen & Brennan 2014, 36). Linjär ekvivalering fungerar som ett specialfall av ekvipercentilekvivalering. Här antas att skillnaden mellan proven kan förklaras av de första två momenten (medelvärdet och standardavvikelsen) hos de två tkesten. För denna ekvivaleringsmetod så definieras två poäng, x och y som ekvivalenta om: x μ X σ X = y μ Y σ Y, (4) där μ X och μ Y är medelpoängen för prov X respektive prov Y samt σ X och σ Y är standardavvikelsen för prov X respektive prov Y. Linjär ekvivalering ges av att uttrycka ekvation (4) i termer av y: y = φ(x; μ X, μ Y, σ Y, σ X ) = σ Y σ X [x μ X ] + μ Y. (5) Medelvärdesekvivalering är en väldigt simplistisk metod som ekvivalerar genom att dra av eller lägga till skillnaden i medelvärde mellan de två proven. För denna metod så definieras två poäng, x och y som ekvivalenta om: x μ X = y μ Y. (6) Medelvärdesekvivalering ges av att uttrycka ekvation (6) i termer av y: y = φ(x; μ x, μ y ) = x μ X + μ Y. (7) Då en EG Design antas så behöver inga ytterligare antaganden göras eftersom de två grupperna som skriver respektive prov antas komma från samma population. Detta gör att formlerna för ekvivaleringen kan användas rakt av. Av formlerna erhålls en skattning av vad en individ skulle ha tilldelats för poäng på det ena provet givet individens poäng på det andra provet. I samtliga fall så kan parametriskt bootstrap med hjälp av log-linjära modeller appliceras för att skatta standardavvikelsen. (González & Wiberg, 2017, p ) För att undersöka hur väl de traditionella metoderna förhåller sig till kernelekvivalering så kommer ekvivalering göras för att skatta individers resultat på höstens prov givet deras resultat på vårens. Av de traditionella metoderna så är det av primärt intresse att titta på ekvipercentil- och linjär ekvivalering då medelvärdesekvivalering anses som en mycket primitiv metod som inte används speciellt ofta (González & Wiberg, 2017, p. 44). 5
11 3.2.3 Jämförelse av modeller Tre mått som kan användas för att jämföra de traditionella modellerna är Standard Error of Equating (SE), Bias och Root Mean Square Error (RMSE). För att välja vilken metod som verkar bäst behöver avvägning göras med dessa mått i åtanke. Dessa mått kan fås fram genom att utföra bootstrap på datamaterialet. (González & Wiberg, 2017, p ) SE definieras här av: SE (x j ) = 1 L L l=1, [φ l(x j ) φ (x l j )] 2 L där φ (x l j ) är det samma som 1 φ l(x L l=1 j ) och φ l(x j ) är det skattade ekvivalerade värdet för bootstrapreplikat l. L är lika med antalet bootstrapreplikat som genomförs. Bias definieras här som: bias (x i ) = 1 L [φ l(x L l=1 i ) φ(x i )], där φ(x i ) är det ekvivalerade värdet som erhålls från de ursprungliga stickproven. RMSE ges av: RMSE(X i ) = 1 L [φ l(x L l=1 i ) φ(x i )] 2. Eftersom de sanna ekvivalerade värdena saknas så ska det noteras att ovanstående utvärderingsmått belyser metodernas bias och precision givet datamaterialet. När det gäller det slutgiltiga resultatet så bör det också hållas i åtanke att ifall skillnaden mellan de ekvivalerade poängen inte skiljer sig nämnvärt mycket åt från de poäng som individen fått på det andra provet så har ekvivaleringen inte speciellt mycket att tillföra. När detta är fallet så sägs ekvivaleringen ha en låg Difference That Matters (DTM) vilket i sin tur gör resultatet rätt orelevant att använda sig av. En låg DTM kan definieras som då skillnaden mellan faktiskt resultat och ekvivalerat resultat inte överskrider/underskrider +/- 0,5. Det betyder i så fall att resultatet i praktiken är detsamma (Kolen & Brennan, 2014, p. 524). 3.3 Kernelekvivalering Detta är ett modernt ramverk inom ekvivalering som använder sig av samma idé som ekvipercentilekvivalering men använder sig av en kernelfunktion när en kontinuerlig skattning av den kumulativa poängfördelningen skall tas fram. I detta kapitel sammanfattas kernelekvivalering utifrån hur det framförs i von Davier et al. (2004) och Gonzáles & Wiberg (2017). 6
12 Kernelekvivaleringen delas vanligtvis upp i fem olika steg varav de flesta känns igen från de traditionella metoderna: 1. Presmoothing 2. Skattning av poängsannolikheter 3. Kontnuerlig approximation 4. Ekvivalering 5. Modellutvärdering Det mest speciella steget är kontinuerlig approximation som skulle kunna sägas definiera Kernelramverket Presmoothing Utjämningen i kernelekvivalering utförs på sätt som för de tradionella metoderna, dvs att försöka jämna ut observationerna så att de mer liknar den bakomliggande fördelningen. För att göra detta så kan formler som t.ex. ekvation (1) användas. Antalet polynom som bör innefattas kan undersökas som tidigare genom att jämföra AIC Skattning av poängsannolikhet Poängsannolikheter erhålls från de utjämnade poängfördelningarna i det tidigare steget. Det är viktigt att räkna ut dem eftersom de används i de olika typerna av kernelekvivalering Kontinuerlig approximation Kontinuerlig approximation handlar om att göra om de diskreta värden som getts av de tidigare stegen till en faktisk kontinuerlig kurva. Detta görs med hjälp av en kontinuerlig slumpvariabel som beror på vilken kernel som används samt en bandwidthparameter som påverkar hur utjämnad kurvan kommer bli. Specifikt så ersätts den diskreta variabeln X med en kontinuerlig motsvarighet X( h X ) som ges av: X(h X ) = a X (X + h X V) + (1 a X )μ X, där μ X = j x j r j, σ 2 X = (x j μ X ) 2 j r j, a X = σ X 2 σ 2 X +σ 2 V h2, där V är en kontinuerlig X slumpvariabel som beror på valet av kernel och h X är bandwidth-parametern. Det kan visas att fördelningsfunktionen för X(h X ) ges av: F hx (x) = r j K ( x a Xx j (1 a X )μ X j ), (8) a X h X där K ges av den valda kernelfunktionen. Den kontinuerliga approximationen av fördelningsfunktionen för Y erhålls på motsvarande sätt och betecknas F hy (y). 7
13 3.3.4 Bandwidth Bandwidth-parametern som används i den kontinuerliga approximationen av respektive fördelningsfunktion jämnar ut den skattade fördelningsfunktionen. Den bör väljas så att karaktärsdragen från den ursprungliga diskreta poängfördelningen bibehålls. von Davier et al (2004) föreslår att bandwith-parametern ska väljas så att följande ekvation minimeras: PEN (h X ) = (r j f hx (x j )) 2 j + k j ρ j, (9) där ρ j är en indikatorvariabel som antar värdet 1 om f hx(xj v) < 0 och f hx(xj + v) > 0 annars antar det värdet 0, (xj f hx ) är derivatan av f hx (x j ) som i sin tur är den skattade täthetsfunktionen för X(h X ). Termen r j är den skattade poängsannolikheten att få j poäng på provet, k är en konstant och v är en parameter som påverkar vidden av intervallet runt x. Konstanten k sätts oftast till 0 eller 1 beroende på om den följande utjämningstermen ska inkluderas eller ej. Alternativa sätt att hitta en bra bandwidth existerar. Två ytterligare varianter till ovanstående kommer undersökas i denna uppsats. Den första är baserad på Silverman s rule of thumb (Silverman 1986), men är en modifierad variant som ger ett generellt sätt att räkna ut en bandwidth för alla kernelvarianter (Andersson & von Davier 2014). Den icke modiferiade varianten fokuserar endast på att räkna ut en bandwidth för en standard gaussian kernel. Den andra varianten är en så kallad double smoothing (Häggström & Wiberg 2014). Double smoothing påminner om ekvation (9) men använder sig av en pilot bandwidth för att skatta bias så att sedan MSE kan minimeras. Den pilot bandwidth som väljs är mycket hög och ger poängsannolikheter både för hela poäng samt för halva poäng. Detta gör att de skattade poängsannolikheterna inte helt stämmer. För att förbättra detta så utförs en ny skattning av poängsannolikheterna vid de faktiska poängvärdena vilket kallas double smoothing Val av kernel Fyra olika kernelvarianter kommer undersökas: Gaussian, logistisk, uniform och standard gaussian där alla påverkar Voch K på lite olika sätt och därmed påverkar vad den slutgiltiga poängskattningen kommer bli Ekvivaleringstransformation I detta steg utförs den faktiska ekvivaleringen med hjälp av det som definierats i de tidigare stegen. Värden för en individs poäng på det prov som individen ej gjort kan nu skattas med hjälp av poängen från provet individen gjort. Beroende på vilka val som gjorts gällande kerneltyp och bandwidth-parametern så påverkas resultatet av ekvivaleringen vilket gör att en modellutvärdering bör göras för att finna den bästa metoden. Inom kernelekvivalering så skattas ekvipercentiltransformationen i ekvation (3) genom att sätta samman de skattade fördelningsfunktionerna F ˆ h X ( x ) och F ˆ h Y ( y ) enligt: φ (x; r, s) = F 1 hy (F hx (x; r ); s ) = F hy 1 (F hx (x)), 8
14 där h x och h Y är parametrar som påverkar vilken utjämningsgrad som kernelekvivaleringen skall använda. r och s är vektorer innehållande poängsannolikheterna i prov X respektive Y. r och s är deras skattade motsvarigheter Modellutvärdering Standard Error of Equating (SEE) undersöker standardavvikelsen för ekvivaleringstransformationsformeln och beräknas genom: SEE Y (x) = Var (φ (x)) = J φ J DF C, där J φ är en jacobimatris av ekvivaleringstransformationformeln, J DF är en jacobimatris av en så kallad designfunktion som styrs av valet av design (von Davier et al. 2004, Chapter 2) och C kommer från en asymptotisk kovariansmatris av de frekvenser som fås utifrån datainsamlingsdesignen innan de utjämnats. Jacobimatriser innehåller första ordningens partiella derivator av de funktioner som utgör matrisen (von Davier et al. 2004, Chapter 5). Percent Relative Error (PRE) undersöker skillnaden i momenten mellan de ekvivalerade poängen och de poäng som skall bli ekvivalerade. Ifall PRE-värdena som kopplas till momenten ligger nära noll så är fördelningarna rätt lika och därmed modellen bra. PRE definieras enligt ekvationen: PRE(p) = 100 μ p(φ(x)) μ p (Y) μ p (Y), där μ p (φ(x)) = (φ(x j )) P j r j och μ p (Y) = k (y k ) p s k, där s k är sannolikheten att få k poäng på prov Y, k = 0, 1, K, där K är maxpoäng på prov Y. Termen p är momentet som undersöks (von Davier et al. 2004, p. 66). De två första måtten bör utvärderas för att hitta den ekvivaleringsmetod som ger en så bra ekvivalering som möjligt. De traditionella metodernas SE från bootstrap kan användas som skattning för SEE. Detta gör att ifall PRE räknas ut för de traditionella metoderna så går det att göra en bra jämförelse mellan dem och de moderna kernelmetoderna utifrån de måtten. Den slutgiltiga modellen bör sedan undersökas ur ett DTM-perspektiv ifall den faktiskt ger en relevant ekvivalering samt ifall den ökade komplexiteten faktiskt ger en avsevärt bättre ekvivalering. Ifall värdena i den bästa modellen avrundas till de samma som värdena i en enklare modell så kan den enklare modellen vara att föredra. Eftersom intagningspoängen till en kurs eller ett program på unitversitet/högskola primärt är intressant för de mer populära programmen där det faktiskt är svårt att bli antagen så kan det vid modellutvärderingen vara värt att främst titta på hur väl de högre poängen blir ekvivalerade. SEE kommer därmed att studeras både över hela poängskala samt när endast poängen från den övre halvan inkluderas (40 till 80). Alla analyser och all bearbetning i denna uppsats utförs med hjälp av R (R Core Team 2018) och R-paketen equate (Albano 2016) samt kequate (Andersson, Bränberg & Wiberg, 2013). 9
15 4. Resultat 4.1 Presmoothing Två olika log-linjära modeller anpassades till data. En till antalet individer för varje totalpoäng på vårens prov och en till antalet individer för varje totalpoäng på höstens prov. Modellen som anpassades till vårens prov gav bäst AIC vid en polynomgrad av 10 (AIC = 670) och höstens prov gav bäst AIC vid en polynomgrad av 9 (AIC =643). Den utjämnade poängfördelningen samt ursprungsfrekvenserna kan ses i Figur 2 och 3. Denna utjämning används både för de traditionella metoderna samt för kernelekvivaleringsmetoderna. Figur 2. Utjämnad poängfördelning för högskoleprovets kvantitativa del, våren Figur 3. Utjämnad poängfördelning för högskoleprovets kvantitativa del, hösten
16 4.2 Traditionella metoder Ekvivalering av höstens prov givet resultatet på vårens prov utfördes på de utjämnade frekvenserna som givits av utjämningen. De tre traditionella metoderna ekvipercentil-, linjär- och medelvärdesekvivalering undersöktes först. I figuerna 4-8 samt tabellerna 1-2 så betecknas ekvipercentilekvivalering som Equip, linjär ekvivalering som Linear och medelvärdesekvivalering som Mean. Figur 4. Skillnad mellan de ekvivalerade poängen och de faktiska poängen för de traditionella metoderna. I Figur 4 så visas poängskillnaden efter att ekvivalering enligt ekvation (3), (5) och (7) utförts. Det kan ses att medelvärdesekvivalering har en konstant poängskillnad mellan proven på Linjär ekvivalering ger en högre poäng på höstens prov för provskrivare med låg poäng på vårens prov medan provtagare med hög poäng på våren har de lägre poäng på hösten. Förhållandet minskar linjärt med enheter per poäng. Ekvipercentilekvivalering är den mest flexibla modellen och får därmed problem vid de låga poängen på vårens prov då det var mycket få individer som faktiskt hade låga poäng. I övrigt så tenderar den att ge lägre poäng på höstens prov för alla poäng bortsett från de mellan 33 och 37 samt 9 till 11. Relativt stor skillnad i poängen kan ses i slutet av poängskalan även om skillnaden minskar drastiskt för de allra högsta poängen. Generellt så verkar därför höstens prov svårare. Bootstrap utfördes för att få fram standardavvikelse (SE), Bias och RMSE för de olika metoderna. I Figurerna 5-7 illustreras hur SE, Bias och RMSE varierar över de olika poängresultaten. 11
17 Figur 5. SE för de traditionella metoderna vid olika poäng. Det kan tydligt ses att ekvipercentilekvivalering har en hög standardavvikelse för de lägsta poängen samt en aning högre för de högsta poängen jämfört med de andra metoderna. Figur 6. Bias för de traditionella metoderna vid olika poäng. Bias tenderar att vara bättre för ekvipercentilekvivalering över hela poängskalan förutom vid poängen 7 9. Medelvärdesekvivalering presterar sämre gällande bias på den övre halvan av poängskalan jämfört med både linjärekvivalering och ekvipercentilekvivalering. 12
18 Figur 7. RMSE för de traditionella metoderna vid olika poäng. Överlag så presterar ekvipercentilekvivalering betydligt bättre än de övriga metoderna med avseende på RMSE, bortsett från 6 12 på poängskalan. Linjär ekvivalering presterar dålig vid både de allra högsta poängen samt de allra lägsta. Medelvärdesekvivalering ser ut att prestera sämst när endast den övre halvan av poängskalan betraktas. Figur 8. Skillnaden mellan vilka poäng de olika ekvivaleringsmetodera anser att en individ skall få givet dess poäng på det tidigare provet. 13
19 Figur 8 visar grafiskt på skillnaden mellan vilka poäng de olika ekvivaleringsmetoderna anser att en individ skall få givet dess poäng på det tidigare provet. Skillnaderna är små metoderna emellan förutom vid de lägsta poängen då ekvipercentilekvivalering ger en lägre ekvivalerad poäng, främst jämfört med linjär ekvivalering. I slutet av poängskalan så har linjär ekvivalering istället lägst ekvivalerad poäng. I Tabell 1 och 2 kan det avläsas att medelvärdet för SE är lägst för medelvärdesekvivalering medan ekvipercentilekvivalering har lägst medelvärde i Bias och RMSE både då hela och endast övre poängskalan inkluderas. Linjär ekvivalering faller någonstans i mitten gällande prestation. Den mer flexibla ekvipercentilmodellen tycks anpassa sig bättre till datamaterialet då dess Bias är mycket lägre än hos de övriga två. Detta gör att även fast dess SE är relativt hög så blir dess RMSE ändå lägre. Tabell 1. Genomsnittlig SE, bias och RMSE för de traditionella metoderna när hela poängskalan inkluderas. SE Bias RMSE Mean Linear Equip Tabell 2. Genomsnittlig SE, bias och RMSE för de traditionella metoderna när endast den övre halvan av poängskalan inkluderas. SE Bias RMSE Mean Linear Equip
20 4.3 Kernelekvivaleringsmetoder Samma grad av polynom används för utjämningen av frekvenserna vid kernelekvivalering som det gjordes i de traditionella metoderna. Från detta så tas det fram en skattning av sannolikheten att få en viss poäng på provet i fråga. Olika Bandwidth-parametrar testades: ekvation (9), double smoothing och den regelbaserade metoden baserad på Silverman s rule of thumb. Utöver detta så testades även fyra olika sorters kernelvarianter: Logistisk Kernel, Uniform Kernel, Gaussian Kernel och Standard Gaussian Kernel. Den modifierade varianten av Silverman s rule of thumb visade sig ha negativ påverkan på speciellt PRE när den användes istället för double smoothing eller ekvation (9) för att bestämma bandwidth. Därefter uteslöts logistisk kernel då den inte gav speciellt fördelaktig påverkan på SEE och PRE. De övriga jämfördes med varandra samt med de traditionella metoderna ekvipercentil- och linjärekvivalering. Resultatet kan ses nedan i Tabell 3. Tabell 3. PRE för olika ekvivaleringsmetoder vid olika moment. Moment Linjär Equip GauKernel DSGauKernel UniKernel DSUniKernel StdGKernel DSStdGKernel 1 0, ,0007-0,0006-0,0011-0,0014-0,0001-0, , ,0022-0,0019-0,0008-0,0007 0, , , ,0042-0,0036-0,0049-0,0047 0, , , ,0070-0,0062-0,0123-0,0122-0,0011 0, , ,0113-0,0098-0,0218-0,0218-0,0042 0, , ,0177-0,0151-0,0336-0,0337-0,0098-0, , ,0265-0,0224-0,0493-0,0497-0,0185-0, , ,0383-0,0319-0,0711-0,0721-0,0307-0, , ,0533-0,0439-0,1011-0,1030-0,0467-0, , ,0716-0,0586-0,1408-0,1444-0,0665-0,0375 Equip = ekvipercentilekvivalering, Gau = gaussian, Uni = uniform, StdG = standard gaussian, DS = double smoothing Tabell 3 visar att linjär ekvivalering är klart bäst vid moment 1 och 2 men förlorar starkt gentemot de andra modellerna i alla andra moment förutom moment 9 där den är tämligen 15
21 likvärdig. Gällande gaussian kernel så har double smoothing en positiv inverkan på PRE då den i samtliga moment ligger närmare 0. Däremot för uniform kernel så är resultatet av double smoothing mindre självklart då det tycks vara fördelaktigt i alla tidiga moment bortsett från moment 1 för att sedan bli sämre vid moment 5 och uppåt. Standard gaussian har överlag moment som ligger nära 0. Vid moment 1 så är dess double smoothing-variant bättre medan den helt klart inte är det vid moment 2, 3 och 4. Momenten därefter är bättre för double smoothing-varianten. I jämförelse med de andra kernelekvivaleringsmetoderna så presterar standard gaussian bäst överlag. Tabell 4. Genomsnittligt SEE för olika ekvivaleringsmetoder Linjär Ekvipercentil GauKernel DSGauKernel UniKernel DSUniKernel StdGKernel DSStdGKernel 0, , , , , , , Tabell 5. Genomsnittligt SEE för olika ekvivaleringsmetoder när endast den övre halvan av poängskalan inkluderas. Linjär Ekvipercentil GauKernel DSGauKernel UniKernel DSUniKernel StdGKernel DSStdGKernel 0, , , , , , , Figur 9. SEE för olika ekvivaleringsmetoder över hela poängskalan. 16
22 I Tabell 4 och 5 så kan den genomsnittliga SEE:n ses för samtliga metoder som jämförs och i Figur 9 kan SEE:n för de bäst presterande modellerna ses. Linjär har en låg SEE men dess SEE förbättras relativt lite då fokus endast läggs på den övre halvan av poängskalan. Gaussian kernel förbättras avsevärt gällande SEE från då den nedre halvan av poängskalan tas i beaktning jämfört med då den inte gör det. Då hela skalan är med så är dess double smoothing-variant bättre medan tvärtom råder då endast den övre halvan betraktas. Uniform kernel som redan har relativt låg SEE förbättras ytterligare då endast den övre halvan av poängskalan betraktas, speciellt då double smoothing används. Standard gaussian kernel beter sig mycket likt vanlig gaussian men presterar aningen bättre i den övre halvan av poängskalan. Figur 10. Skillnad mellan de ekvivalerade poängen och de faktiska poängen för två traditionella metoder och två metoder inom kernelramverket. I Figur 10 jämförs de två högst presterande metoderna inom kernelekvivaleringsramverket med de två högst presterande traditionella metoderna med avseende på skillnad i ekvivalerade poäng (Appendix, Tabell 6). Överlag så ligger kernelekvivaleringsmetodernas ekvivalerade poäng både väldigt nära varandra och ekvipercentilekvivalering. I inget fall så avrundas ett poäng till ett annorlunda poäng beroende på om någon av kernelekvivaleringsmetoderna används eller om ekvipercentilekvivalering används. Ifall linjär ekvivalering används kan dock en stor skillnad ses då dess mönster skiljer sig markant från de övriga. 17
23 5. Diskussion & slutsats Metoderna som används i denna uppsats kräver att grupperna som skriver proven kan antas komma från samma population. Antagandet är svårt att uppfylla till 100% då tid har passerat mellan proven vilket alltid kommer betyda att populationen har förändrats åtminstone en aning. Förändringar i samhället såsom ökad eller minskad arbetslöshet kan påverka hur sammansättningen inom provskrivaregrupperna ser ut. De två proven som ligger till grund för denna uppsats låg dock med så kort tid mellan sig som möjligt vilket minimerar risken att förändringar i populationen hinner bli drastiska. Från datamaterialet som samlats in så kan mycket små skillnader ses mellan de två grupperna. De största skillnaderna som kan ha haft påverkan var att det under hösten var en ökad andel kvinnor, en ökad andel av individer som avslutat sina gymnasiestudier samt något lägre medelålder hos provskrivarna. Ingen av skillnaderna anses dock stora nog för att ha haft en avsevärd påverkan på resultatet och populationen som individerna kommer från antas därmed vara densamma. Hade en SG Design kunnat användas så hade problemet med att grupperna måste kunna anses komma från samma population undvikits. Det är dock värt att nämna att även SG design har sina svagheter då individerna gör proven i en viss ordning samt att antalet observationer skulle bli betydligt färre då endast de individer som skrivit båda proven skulle användas. Därmed är det svårt att säga att SG Design hade varit fördelaktigt i detta fall. Orsaken till att NEC Design inte valdes till denna uppsats var att viss bakgrundsinformation som anses viktig såsom individernas härkomst ej gjorts tillgänglig. En NEC Design hade därmed inte producerat ett optimalt resultat. När dessutom populationerna inte verkar skilja sig åt speciellt mycket så bör inte en NEC Design ge ett märkbart bättre resultat jämfört med en EG Design. Eftersom inga ankarprov fanns att tillgå så fanns det ingen möjlighet att använda sig av NEAT Design. Sedan 2011 är det denna design som i huvudsak används vid ekvivalering av högskoleprovsdata. Det är också mycket möjligt att NEAT Design hade varit den mest optimala gruppdesignen även i detta fall. Dock fanns inte möjligheten att undersöka det närmare. För att utse vilken av de traditionella metoderna som presterar bäst vid ekvivalering så undersöktes SE, Bias och RMSE. Som väntat så presterade medelvärdesekvivalering dåligt på dessa mått, speciellt då endast den övre halvan av poängskalan inkluderades. Detta gav anledning att utesluta medelvärdesekvivalering som en potentiell metod. I jämförelse med ekvipercentilekvivalering så presterade linjär ekvivalering dåligt gällade RMSE, speciellt då endast den övre halvan av poängskalan inkluderades. Den har dock inkluderats som en referensmetod trots att den presterar sämre. Ekvipercentilekvivalering är den traditionella metod som föredras och den som primärt jämförs med kernelmetoderna. Här jämfördes måtten PRE och SEE hos de olika metoderna för att se vilken som har bäst ekvivaleringsförmåga för detta data. De alternativa metoderna vid kontinuerlig approximation visade sig inte vara helt entydigt positiva när det kom till PRE och SEE. Den regelbaserade varianten som baseras på Silverman s rule of thumb gav överlag ett sämre resultat när den användes och uteslöts därmed tidigt i processen. Double smoothing var ibland fördelaktigt för vissa moment i PRE och gav i vissa fall en lägre SEE. Dock var det ej entydigt och den ökade komplexiteten med att introducera double smoothing gör att det inte anses värt att tillämpa. Gällande de olika metoderna så var Standard Gaussian klart bäst när det gällde PRE. Endast traditionell linjär ekvivalering hade bättre PRE vid 18
24 några av momenten men vid de moment som den inte var bättre så var den extremt dålig. Vid analys av SEE så konstaterades att Uniform Kernel presterade bäst bortsett från när hela poängskalan inkluderades, då linjär presterade aningen bättre. Skillnaden i PRE och SEE mellan Uniform Kernel och Standard Gaussian Kernel kan inte anses speciellt stor och det blir därmed svårt att klart säga vilken av dem som är bättre. Traditionell linjär ekvivalering presterade bra på vissa mått men detta beror till stor del på att den inte behöver anpassa sig lika mycket till de få individer som fick väldigt låga poäng. Traditionell ekvipercentilekvivalering visade sig ha sämre SEE än både Uniform Kernel och Standard Gaussian Kernel både när hela poängskalan inkluderades och när endast övre halvan inkulderades. Gällade PRE så hade den traditionella metoden sämre än båda kernelmetoderna på de fyra första momenten och därefter så låg den mellan Uniform Kernel och Standard Gaussian Kernel. Eftersom de första momenten är av större vikt så anses båda kernelmetoderna vara fördelaktiga även gällande PRE. Även om skillnad kan upptäckas i PRE och SEE mellan metoderna så är skillnaden i ekvivalerade poäng nästan obefintlig. I inget fall så avrundas den ekvivalerade poängen för en metod till något annat än vad de skulle avrundats till med en annan metod. Detta betyder att för detta datamaterial så har det efter avrundning ingen betydelse om vi använder ekvipercentilekvivalering eller någon av kernelmetoderna. Ur ett DTM-perspektiv så kan därmed inte metoderna anses ha någon relevant skillnad i ekvivaleringsprestation. I fall där metoder är likvärdiga så är den enklaste att föredra, både för att det kräver mindre arbete och minimerar risken för att något går fel. Vi kan därmed inte se någon anledning till att använda någon kernelmetod istället för ekvipercentilekvivalering vid ekvivalering av högskoleprovsdata. På grund av att analysen som utförts i denna uppsats endast är baserad på två högskoleprov så finns endast två olika provsvårighetsgrader att utgå ifrån. Det är möjligt att andra metoder hade presterat bättre om skillnaden i svårighetsgrad mellan proven hade varit större eller mindre. Då ekvivalering av högskoleprov idag sker med hjälp av NEAT Design så kan det vara av värde att undersöka ifall en NEAT Design inom kernelramverket presterar bättre än det som idag används. I en sådan analys så skulle även en jämförelse mellan NEAT Design och EG Design kunna göras. Kanske att en NEAT Design inom kernelramverket skulle vara metoden att föredra i framtiden. Analysen som gjorts i denna uppsats har endast undersökt Gaussian, Logistisk, Uniform och Standard Gaussian kernels men det är fullt möjligt att andra avancerade kernel-varianter såsom Epanechnikov och adaptiv kernels hade gett ett annorlunda resultat. Då de högskoleprov som analyserats i denna uppsats har många observationer och en specifik design så bör inte resultatet generaliseras till andra prov. En skillnad när det kommer till provens struktur eller antalet provtagare kan leda till förändrade förutsättningar för de metoder som analyserats. Alltså vid analyser av andra sorters prov så bör den anpassas till just det provets förutsättningar. 19
25 6. Referenser Andersson, B & von Davier, A. A. (2014). Improving the bandwidth selection in kernel equating. Journal of Educational Measurement, 51(3), Albano A. D. (2016). equate: An R Package for Observed-Score Linking and Equating. Journal of Statistical Software, 74(8), doi: /jss.v074.i08 Andersson, B. Bränberg, K & Wiberg, M. (2013). Performing the Kernel Method of Test Equating with the Package kequate. Journal of Statistical Software, 55(6), URL González, J & Wiberg, M. (2017). Applying test equating methods using R. Springer International Publishing, Cham. Häggström, J & Wiberg, M. (2014). Optimal bandwidth selection in observed-score kernel equating. Journal of Educational Measurement, 51(2), Kolen, M. J & Brennan, R. L. (2014). Test Equating, Scaling and Linking. Methods and Practices. Third Edition. Springer International Publishing, New York. Lyrén, P-E. & Hambleton, R. K. (2011). Consequences of Violated Equating Assumptions Under the Equivalent Groups Design. International Journal of Testing 11: R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL Silverman, B. (1986). Density estimation for statistics and data analysis (Vol. 3). London: Chapman and Hall. Stage, C. & Ögren, G. (2003): Högskoleprovet våren och hösten (Pm från Enheten för pedagogiska mätningar, Umeå universitet, 193) Umeå: Umeå universitet, Enheten för pedagogiska mätningar. von Davier, A.A. (2013). Observed-Score Equating: An Overview. Psychometrika 78: von Davier, A.A. Holland, P. W. & Thayer, D. T. (2004). The Kernel Method of Test Equating. Springer International Publishing, New York. Wiberg, M. & Bränberg K. (2015). Kernel equating under the non-equivalent groups with covariates design. Applied Psychological Measurement, 39(5), Ögren, G. (2014). Högskoleprovet våren och hösten 2014: provdeltagargruppens sammansättning och resultat (BVM / Institutionen för beteendevetenskapliga mätningar, Umeå universitet). Umeå: Umeå universitet, Institutionen för tillämpad utbildningsvetenskap. 20
26 Appendix Figur 10. Högsta avslutade utbildning för individer på vårens prov. Figur 11. Högsta avslutade utbildning för individer på höstens prov. Figur 12. Ålder för individer på vårens prov. Figur 13. Ålder för individer på höstens prov. 21
27 Tabell 6. Ekvivalerad poäng för olika ekvivaleringsmetoder. Gau = gaussian, Uni = uniform, StdG = standard gaussian och DS = Double smoothing. Equip = ekvipercentil 22
Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2003
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2003 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren Pm nr 193, 2004 ISSN 1100-696X ISRN UM-PED-PM--193--SE SAMMANFATTNING Högskoleprovet
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Tentamen MVE302 Sannolikhet och statistik
Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2005
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2005 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM nr 17 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2004
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2004 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM nr 7, 2004 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Lektion 1: Fördelningar och deskriptiv analys
Density Lektion 1: Fördelningar och deskriptiv analys 1.,3 Uniform; Lower=1; Upper=6,3,2,2,1,, 1 2 3 X 4 6 7 Figuren ovan visar täthetsfunktionen för en likformig fördelning. Kurvan antar värdet.2 över
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Grundläggande matematisk statistik
Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Högskoleprovet våren och hösten 2012
Högskoleprovet våren och hösten 2012 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM Nr 56, 2013 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
att omfatta hela verksamhetsåret, vissa jämförelser med föregående år och i viss mån även från och med året 2000.
SAMMANFATTNING Högskoleprovet har nu i 25 år fungerat som urvalsinstrument för antagning till universitets- och högskolestudier. Provet genomförs en gång på hösten och en gång på våren och det är tillåtet
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Högskoleprovet våren och hösten 2008
Högskoleprovet våren och hösten 2008 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM Nr 34, 2008 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
Bilaga 6 till rapport 1 (5)
till rapport 1 (5) Bilddiagnostik vid misstänkt prostatacancer, rapport UTV2012/49 (2014). Värdet av att undvika en prostatabiopsitagning beskrivning av studien SBU har i samarbete med Centrum för utvärdering
Högskoleprovet våren 2011
Högskoleprovet våren 2011 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM Nr 49, 2011 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment Test
F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion
Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten
Introduktion till statistik för statsvetare
Stockholms universitet November 2011 Data på annat sätt - I Stolpdiagram Data på annat sätt - II Histogram För kvalitativa data som nominal- och ordinaldata infördes stapeldiagram. För kvantitativa data
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Kamratgranskning Analys Exempel: exekveringstid Hur analysera data? Hur vet man om man kan lita på skillnader och mönster som man observerar?
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2006
HÖGSKOLEPROVET VÅREN OCH HÖSTEN 2006 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM nr 25 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
Högskoleprovet våren och hösten 2013
Högskoleprovet våren och hösten 2013 Provdeltagargruppens sammansättning och resultat Gunilla Ögren BVM Nr 59, 2013 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment Test (SweSAT)
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Normering, ekvivalering eller kalibrering av delar av högskoleprovet. Christina Stage
Normering, ekvivalering eller kalibrering av delar av högskoleprovet Christina Stage Abstract The SweSAT (Swedish Scholastic Assessment Test) is used for selection to higher education in Sweden. The test
6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet
6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet Sven-Eric Reuterberg Vadar det egentligen som säger att man skallförvänta sig samma genomsnittliga resultat för manliga och kvinnliga
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Högskoleprovet våren och hösten 2014
Högskoleprovet våren och hösten 2014 Provdeltagargruppens sammansättning och resultat Gunilla Ögren BVM Nr 61, 2014 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment Test (SweSAT)
Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II
Sannolikhetslära och inferens II Kapitel 4 Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar 1 Kontinuerliga slumpvariabler En slumpvariabel som kan anta alla värden på något intervall sägs
Högskoleprovet våren och hösten 2009
Högskoleprovet våren och hösten 2009 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM Nr 40, 2009 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
Datorövning 1: Fördelningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, VT-17 Datorövning 1: Fördelningar I denna datorövning ska du utforska begreppen sannolikhet och
Antalet personer som skriver högskoleprovet minskar
STATISTISK ANALYS Nils Olsson Utredningsavdelningen 8-563 88 4 nils.olsson@hsv.se Mer information hittar du på www.hsv.se Nummer: 26/12 Antalet personer som skriver högskoleprovet minskar Antalet personer
Tentamen MVE302 Sannolikhet och statistik
Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-06-07 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande
Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...
Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
FÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Högskoleprovet våren och hösten 2010
Högskoleprovet våren och hösten 2010 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren BVM Nr 43, 2010 ISSN 1652-7313 ABSTRACT Since spring 1977 the Swedish Scholastic Assessment
Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Slump och slumptal Analys Boxplot Konfidensintervall Experiment och test Kamratgranskning Kursmeddelanden Analys Om laborationer: alla labbar
HÖGSKOLEPROVET HÖSTEN 1997
HÖGSKOLEPROVET HÖSTEN 1997 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren Charlotta Jarl Pm Nr 131, 1997 ISSN 1100-696X ISRN UM-PED-PM--131--SE Högskoleprovet har sedan
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-08-22 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Jourhavande lärare: Mykola
Forskarutbildningen i Beteendevetenskapliga
Umeå universitet Institutionen för tillämpad utbildningsvetenskap KURSPLAN Forskarutbildningen i Beteendevetenskapliga mätningar Baskurs: 37,5 hp Moment 1: Introduktion till beteendevetenskapliga mätningar,
Vad Betyder måtten MAPE, MAD och MSD?
Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning.
Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel
Finansiell Statistik (GN, 7,5 hp,, VT 009) Föreläsning Diskreta (LLL Kap 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS,
LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg
LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg Simulering i MINITAB Det finns goda möjligheter att utföra olika typer av simuleringar i Minitab. Gemensamt för dessa är att man börjar
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett
EXAMINATION KVANTITATIV METOD vt-11 (110204)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Föreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Vad är statistik?
1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Metod och teori. Statistik för naturvetare Umeå universitet
Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.
Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl
Karlstads Universitet Avdelningen för Nationalekonomi och Statistik Tentamen i Statistik, STG A0 och STG A06 (3,5 hp) Torsdag 5 juni 008, Kl 4.00-9.00 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-06-0 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 03-7725348 Hjälpmedel: Valfri miniräknare.
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data
OBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna
Tillvägaghångssätt för skattning av körkortsmodell
Siamak Baradaran sia@kth.se Tillvägaghångssätt för skattning av körkortsmodell 1 Syfte med modellen Syftet med denna forskning har varit att utveckla en beskrivande modell som kan hjälpa oss att förstå
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
4 Diskret stokastisk variabel
4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används
Ingenjörsmetodik IT & ME 2011 Föreläsning 11
Ingenjörsmetodik IT & ME 011 Föreläsning 11 Sammansatt fel (Gauss regel) Felanalys och noggrannhetsanalys Mätvärden och mätfel Medelvärde, standardavvikelse och standardosäkerher (statistik) 1 Läsanvisningar
Statistiska Institutionen Gebrenegus Ghilagaber (docent)
Statistiska Institutionen Gebrenegus Ghilagaber (docent) Lösningsförslag till skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, VT09. Onsdagen 3 juni 2009-1 Sannolkhetslära Mobiltelefoner tillverkas
Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
HÖGSKOLEPROVET VÅREN Provdeltagargruppens sammansättning och resultat
HÖGSKOLEPROVET VÅREN 1998 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren Lena Konradsson Pm Nr 139, 1998 ISSN 1100-696X ISRN UM-PED-PM--139--SE ABSTRACT The Swedish Scholastic
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
HÖGSKOLEPROVET HÖSTEN 1999. Provdeltagargruppens sammansättning och resultat
HÖGSKOLEPROVET HÖSTEN 1999 Provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren Lena Konradsson Pm Nr 159, 1999 ISSN 1100-696X ISRN UM-PED-PM--159--SE ABSTRACT The Swedish Scholastic
LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29
UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN
Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
OBS! Vi har nya rutiner.
KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare
Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin
Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,
Arbeta med normalfördelningar
Arbeta med normalfördelningar I en större undersökning om hur kvinnors längd gjorde man undersökning hos kvinnor i ett viss åldersintervall. Man drog sedan ett slumpmässigt urval på 2000 kvinnor och resultatet
Obligatorisk uppgift, del 1
Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten
Vi har en ursprungspopulation/-fördelning med medelvärde µ.
P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har
EXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering
Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT007 Laboration Simulering Grupp A: 007-11-1, 8.15-.00 Grupp B: 007-11-1, 13.15-15.00 Introduktion Syftet
Stokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle
Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Lärare: Mikael Elenius, 2006-08-25, kl:9-14 Betygsgränser: 65 poäng Väl Godkänt, 50 poäng
HÖGSKOLEPROVETS UTVECKLING UNDER ÅREN
HÖGSKOLEPROVETS UTVECKLING UNDER ÅREN 1977 2000 Provets sammansättning och provdeltagargruppens sammansättning och resultat Christina Stage Gunilla Ögren Pm nr 169, 2001 ISSN 1100-696X ISRN UM-PED-PM--169--SE
Hypotestestning och repetition
Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att
Repetitionsföreläsning
Slumpförsök Repetitionsföreläsning Föreläsning 15 Sannolikhet och Statistik 5 hp Med händelser A B... avses delmängder av ett utfallsrum. Slumpförsök = utfallsrummet + ett sannolikhetsmått P. Fredrik Jonsson
Föreläsning 8: Konfidensintervall
Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga
8 Den sociala bakgrundens betydelse för prestationer på Högskoleprovet
8 Den sociala bakgrundens betydelse för prestationer på Högskoleprovet Sven-Eric Reuter berg När högskoleprovet infördes fanns förhoppningar om att provet skulle bidra till att minska den sociala snedrekryteringe
TAMS65 - Seminarium 4 Regressionsanalys
TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet
Mälardalens Högskola. Formelsamling. Statistik, grundkurs
Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken
Föreläsning G60 Statistiska metoder
Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala