En nyttomaximerande skola i det innovationsdrivna samhället

Storlek: px
Starta visningen från sidan:

Download "En nyttomaximerande skola i det innovationsdrivna samhället"

Transkript

1 EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2016 En nyttomaximerande skola i det innovationsdrivna samhället ERIC FORNANDER SIMON PARK KTH KUNGLIGA TEKNISKA HÖGSKOLAN SKOLAN FÖR TEKNIKVETENSKAP

2

3 En nyttomaximerande skola i det innovationsdrivna samhället ERIC FORNANDER SIMON PARK Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 hp) Civilingenjörsutbildning i industriell ekonomi (300 hp) Kungliga Tekniska högskolan 2016 Handledare på KTH: Henrik Hult, Jonatan Freilich Examinator: Henrik Hult TRITA-MAT-K 2016:14 ISRN-KTH/MAT/K--16/14--SE Royal Institute of Technology SCI School of Engineering Sciences KTH SCI SE Stockholm, Sweden URL:

4

5 Sammanfattning Det här kandidatexamensarbetet inom matematisk statistik och industriell ekonomi tar fram ett underlag för hur Sverige och andra innovationsdrivna länder kan agera för att uppnå en nyttomaximerande skola. Detta genom att undersöka vilka faktorer som påverkar resultatet på PISA-testet via användning av multipel linjär regression, samt vilka faktorer som främjar innovation med hjälp av en litteraturstudie. Utifrån fyra perspektiv (generellt-, skol-, lärar- och elevperspektiv) valdes förklaringsvariabler ut för att inkluderas i regressionsanalysen. Resultatet gav att signifikanta variabler återfanns i samtliga perspektiv. Litteraturstudien utgick från två perspektiv (individ och organisation), där resultatet var i form av en omfattande översikt av innovationsdrivande faktorer. Den dragna slutsatsen var att högre lärarlöner och högre kvalitet på skolmateriel leder till effektivare kunskapsutlärning. Mindre klasstorlekar däremot påverkar inte kunskapsutlärningen, medan längre tid för elever i skolan leder till sämre sådan. Ytterligare konklusioner var att skolan bör fokusera mer på arbete i grupp istället för individuellt arbete, träna elever på att definiera problem och inte bara lösa färdiga sådana samt låta elever kombinera olika ämneskunskaper i större utsträckning.

6

7 Abstract This thesis within mathematical statistics and industrial economics forms a foundation which explains how Sweden and other innovation-driven countries can act to achieve an efficient school. Multiple linear regression is used to identify explanatory variables that affect the results on the PISA test and factors that foster innovation are examined via a literature review. The included variables in the regression analysis were chosen out of four perspectives: general, school, teaching and student. The result showed that significant variables were found in all four perspectives. Moreover, the literature review was based on an individual perspective and an organisational perspective. Result was presented as an extensive overview of factors that affect innovation. A conclusion that higher teacher salaries and better quality of equipment in schools lead to more efficient learning was drawn. However, smaller class sizes do not affect quality of learning and more time spent in school by students affects quality of learning negatively. Further conclusions were that schools should focus on group-based work instead of individual work. Students should also be taught to redefine problems and combine knowledge from different subjects to a greater extent.

8 Innehållsförteckning Tabeller 4 Figurer 5 1 Inledning Bakgrund Syfte Problemformulering Frågeställning Kunskapsbas Rapportens disposition Teori Matematisk teori Multipel linjär regression Hypotestest Eta squared Förklaringsgrad AIC Multikolinjäritet VIF Endogenitet Hetereoskedasticitet Normal Quantile-Quantile plot Residualplot Variabelselektion Variabler Teori om resultatdrivande faktorer i skolan Generellt perspektiv Skolperspektiv Lärarperspektiv Elevperspektiv Metod Datainsamling Variabler

9 3.2.1 Responsvariabel Förklaringsvariabler Antaganden Genomförande Program Struktur Variabelselektion Resultat Grundmodell VIF Resultat av regression Reduktion av modellen Slutgiltig modell Homoskedasticitet Normalfördelade residualer Diskussion Analys av slutmodell Utelämnade förklaringsvariabler Utvärdering av resultatet Generellt perspektiv Skolperspektiv Lärarperspektiv Elevperspektiv Reducerade förklaringsvariabler Innovationsdrivande faktorer Bakgrund Teoretisk referensram Innovationsfrämjande faktorer och skolan Metod Resultat Individfaktorer Organisationsfaktorer Samspelet mellan individ och organisation Diskussion Metoddiskussion Resultatdiskussion Diskussion Slutsats Förslag till fortsatta studier inom området Litteraturförteckning 42 2

10 A Regressionsspecificering 46 3

11 Tabeller 3.1 Sammanställning av de ingående variablerna Gruppindelning av jämförbara länder Beräknade VIF-värden för respektive förklaringsvariabel Resultat av regression av grundmodell Reducering av grundmodell. P-värdet samt η 2 är värden gällande den exkluderade variabeln, övriga värden ges för hela modellen Ingående variabler för slutgiltig modell Litteratursökning A.1 Resultat av regression vid exkludering av Skolstart från grundmodellen A.2 Resultat av regression vid exkludering av Prv.utgifter från modellen använd i tabell A A.3 Resultat av regression vid exkludering av Kön.lärare från modellen använd i tabell A A.4 Resultat av regression vid exkludering av Datorer från modellen använd i tabell A A.5 Resultat av regression vid exkludering av Utb.utgifter från modellen använd i tabell A

12 Figurer 2.1 QQ-plot vid normalfördelade residualer Residualplot vid homoskedasticitet Residualplot för slutgiltig modell QQ-plot för slutgiltig modell Innovationsprocess

13 Del 1 Inledning 1.1 Bakgrund Utbildningsväsendet har en central roll i ett lands utveckling. Således är det av högsta prioritet för de styrande i samtliga länder att maximera nyttan av sina tillgängliga resurser för att skapa ett välfungerande sådant. Skillnader har emellertid funnits i synen på hur det ska uppnås, som inom de flesta politiska områden. Meningsskiljaktigheter har infunnit sig i både ekonomiska och strategiska frågor. Exempelvis om hur mycket av ett lands totala budget som bör läggas på utbildningsområdet och mer specifikt hur de pengarna bör allokeras eller hur utlärningstiden ska utformas. Vidare ska det även nämnas att kulturella skillnader influerat den pedagogiska utlärningsprocessen och följaktligen gett upphov till skillnader även där. Av ovan nämnda anledningar har det genom åren gjorts många försök att identifiera drivande faktorer bakom ett framgångsrikt utbildningsväsende. Första steget i att göra detta är att försöka definiera vad som utmärker detsamma samt ta fram ett tydligt och rättvisande mått. Organisationen för ekonomiskt samarbete och utveckling (OECD) har, utifrån denna bakgrund, konstruerat en studie bestående av ett test, Programme for International Student Assessment (PISA), som 15-åriga skolungdomar gör vart tredje år. Detta test genomfördes första gången år 2000 och har sedan dess använts frekvent som måttstock för elevers kunskaper [1]. PISA-testet utförs individuellt och är uppdelat i tre olika delar: matematik, naturvetenskap och läsförståelse. I samband med att testet genomförs samlas även ytterligare information in om de skrivande eleverna via frågeformulär. Resultat tillsammans med denna ytterligare information sammanställs sedan av OECD och presenteras på deras hemsida som underlag för studier i utbildningsfrågor [1]. En del kritik har dock framförts mot att PISA-testet inte mäter alla de individuella egenskaper som är relevanta i dagens moderna samhälle. Kritiker hävdar att 6

14 detta gör resultatet från PISA-testet oanvändbart i syfte att utvärdera utbildningskvalitén. Framförallt har det lyfts fram att kvalitén på kunskaperna inom PISA:s tre områden inte säger något om individen i frågas innovationsförmåga [2]. En förmåga vilken i dagens innovationsdrivna samhälle är viktigare än någonsin (6.1 Bakgrund). Det svenska utbildningsväsendet har historiskt haft hög status och många framgångsrika innovatörer har fått sin utbildning i Sverige. Sverige presterade även initialt över genomsnittet i PISA-studien men har konstant haft en negativ trend och resultatet från senaste studien 2012 visade att Sverige låg under genomsnittet inom samtliga tre kunskapsområden [3]. Följderna av detta ras har ännu inte kunnat betraktas då de aktuella individerna fortfarande är relativt unga och ännu inte kommit ut i arbetslivet. 1.2 Syfte Syftet med kandidatexamensarbetet är att via statistiska metoder samt litteraturstudie ta fram underlag för hur Sverige och andra innovationsdrivna länder uppnår en nyttomaximerande skola. 1.3 Problemformulering För att ta fram relevanta resultat undersöks först hur skolsituationen idag kan nyttomaximeras. Detta genom att identifiera drivande faktorer och analysera på vilket sätt dessa påverkar resultatet på PISA-testet. Det ämnas genomföras med hjälp av relevanta statistiska metoder. Vidare ämnas det lyftas fram andra faktorer skolan eventuellt bör flytta fokus mot utifrån vad som efterfrågas i dagens innovationsdrivna samhälle. Därför avses en litteraturstudie genomföras av forskning kring främjande av innovation för att identifiera dessa faktorer Frågeställning De två konkreta frågeställningarna är följande: Vilka faktorer påverkar resultatet på PISA-testet och i vilken riktning? Vilka faktorer främjar innovation? 1.4 Kunskapsbas För att identifiera och analysera faktorer som tillsammans påverkar ett specifikt ting, exempelvis resultatet på PISA-testet, används ofta regressionsanalys. Regressionsanalys är en statistisk metod som kommer att beskrivas närmare i 7

15 2.1 Matematisk teori. Huvuddelen av den kunskap regressionsanalysen genomförs utifrån är inhämtad via kursen SF2930 Regressionsanalys på KTH och detta kompletteras med kunskap från två böcker i ekonometri, av Kennedy P respektive Studenmund A.H. Vilka förklaringsvariabler en regressionsanalys bör utgå ifrån bestäms med hjälp av en analys av ämnet i fråga. Denna rapport kommer att använda studier från OECD på liknande frågeställningar som grund för val av förklaringsvariabler, något som beskrivs utförligare i 2.2 Teori om resultatdrivande faktorer i skolan. 1.5 Rapportens disposition Rapporten avser behandla de två frågeställningarna separat och de presenteras i del 2 till och med 5, respektive del 6. Med en avslutande gemensam diskussion i del 7 där respektive dels resultat integreras utifrån rapportens syfte. 8

16 Del 2 Teori 2.1 Matematisk teori Multipel linjär regression Då en beroende responsvariabel ska approximeras utifrån ett antal oberoende förklarande variabler används multipel linjär regression. Modellen ställs upp enligt y i = k x ij β j + e i, i = 1,..., n (2.1) j=0 Responsvariabeln representeras av y, förklaringsvariablerna betecknas x och normalfördelade feltermen med e. β 0 utgör interceptet och β 1, β 2,..., β n, är koefficienterna för respektive förklaringsvariabel. Dessa estimeras utifrån modellen. Den uppställda modellen innefattar n antal observationer och k antal förklaringsvariabler [4]. Matrisnotation kan användas för uppställning av modellen och ger då där Y = Xβ + e y 1 1 x 11 x k1 β 0 e 1 y 2 Y =., X = 1 x 13 x k , β = β 1., e = e 2. y n 1 x 1n x kn β k e n Fem antaganden bör vara uppfyllda för att den linjära regressionen ska kunna genomföras och ge rättvisande resultat [5]. 1. En linjär modell enligt (2.1) kan formuleras, där den beroende variabeln uttrycks som en funktion av de oberoende variablerna samt en felterm. 9

17 2. E[e i ] = 0, d.v.s. att väntevärdet av feltermerna är lika med noll. 3. E[e 2 i ] = σ, d.v.s. att variansen av feltermerna är enhetliga. Dessutom är de okorrelerade, d.v.s. sinsemellan oberoende. 4. För upprepade stickprov anses värdena av de oberoende variablerna vara fixa. 5. Det existerar inte något exakt linjärt samband mellan de oberoende variablerna. För att estimera regressionskoefficienterna β, betecknat ˆβ, används Ordinary Least Squares (OLS). Det bygger på minstakvadratmetoden där summan av residualerna ê t ê = ê 2 minimeras, samt genom utnyttjande av normalekvationen X t ê = 0, där ê = Y X ˆβ. Från detta erhålls [4] ˆβ = (X t X) 1 X t Y Hypotestest En vanlig metod för analys av signifikansen av de oberoende variablerna är F-test. Utifrån detta test kan ett p-värde kalkyleras. Kort visar p-värdet sannolikheten att nästa observation ger ett värde lika extremt som tidigare observerade värde. Genom vald signifikansnivå (normalt 0,05) kan det med hjälp av p-värdet avgöras ifall en förklaringsvariabel bör behållas eller ej. Vanligtvis ställs en nollhypotes upp innebärande att koefficienten för en oberoende variabel är noll. Alternativhypotesen består av motsatsen. Matematiskt ger det H 0 : β j = 0 H A : β j 0 F-värdet för hypotesen β j = β 0 j beräknas enligt F = ( ˆβj β 0 j SE( ˆ β j ) Utifrån beräkning av P r(x > F ), där X tillhör F-distributionen ovan, erhålls p-värdet [4]. F-test kan även användas för att kontrollera hypotesen huruvida flera koefficienter är lika med noll, dv.s. β 1 = β j+1 = β j+2 =... = 0 En nollhypotes ställs således upp där r antal β sägs vara lika med noll, alltså att motsvarande oberoende variabler inte påverkar responsvariabeln. F-värdet kan, om residualerna är normalfördelade, då beräknas enligt F = n k 1 r ) 2 ( ) ê 2 ê 1 F (r, n k 1) 2 10

18 där ê är residualen i regressionen för nollhypotesen, och ê residualen för totala regressionsmodellen. n och k betecknar antalet observationer respektive antal exkluderade förklaringsvariabler. Hypotesen förkastas om F-värdet är högt [4] Eta squared Eta squared, η 2, beskriver effekten av totala regressionsmodellens varians kopplat till en specifik förklaringsvariabel. η 2 kan beskrivas matematiskt η 2 = ê ê 2 ê där ê och ê är motsvarande kvadratsumma för residualerna för den reducerade respektive den ursprungliga modellen. Lågt värde på η 2 kan anses vara en motivering varför en oberoende variabel bör reduceras ur modellen [4] Förklaringsgrad Förklaringsgraden R 2, även kallad goodness of fit, är ett mått på hur väl de oberoende förklaringsvariablerna tillsammans förklarar variansen av den beroende variabeln. Det är således ett verktyg för att avgöra regressionsmodellens validitet. Matematiskt definieras R 2 med ekvationen [4] R 2 = Var(x ˆβ) Var(y) = 1 Var(ê) Var(y) Ett så högt värde på R 2 som möjligt är eftersträvansvärt eftersom det minimerar feltermen ê och således implicerar att den estimerande modellen av responsvariabeln förbättras [4]. Vidare finns även ett justerat R 2 -värde, R2. Detta värde är anpassat så att inte onödigt många variabler tas med i modellen genom att ta hänsyn till frihetsgraden av densamma. Om enbart R 2 används premieras ett högt antal förklaringsvariabler då R 2 ökar ju fler variabler som används. Det justerade värdet däremot, sjunker om en oberoende variabel inkluderas i modellen vars förklaringsgrad är liten [5] AIC Akaike Information Criterion (AIC) är ett verktyg liksom förklaringsgrad för validering av en regressionsmodell. Syftet är att undersöka huruvida en viss förklaringsvariabel bör ingå i modellen eller inte. AIC beräknas matematiskt enligt AIC = n ln( ê 2 ) + 2k AIC beräknas för den reducerade modellen, där en oberoende variabel tagits bort, respektive för den föregående, icke reducerade, modellen. Modellen vars AIC-värde minimeras bör föredras [4]. 11

19 2.1.6 Multikolinjäritet Perfekt multikolinjäritet innebär att två eller fler förklaringsvariabler är linjärt beroende. Följden blir att koefficienterna framföra dessa variabler ej kan bestämmas entydigt. Detta problem är något som uppstår vid uppställandet av en modell och kan därför undvikas. Imperfekt multikolinjäritet däremot (hädanefter enbart refererat till som multikolinjäritet ) är ett vanligare problem som innebär att minst en av förklaringsvariablerna är starkt korrelerad med en linjärkombination av de övriga variablerna. Problematiken med bestämmandet av koefficienterna blir likartad då estimeringen i detta fall blir oprecis, vilket innebär att den aktuella variabelns standardavvikelse blir hög. En modell med multikolinjäritet kan inte användas som grund för en strukturell analys eftersom den stora osäkerheten i koefficienterna medför att det ej går att fastställa vilken effekt som ges av vilken förklaringsvariabel. Multikolinjäritet är inte en följd av en dåligt uppställd modell och kan därför inte undvikas lika enkelt. De tänkbara lösningarna som finns är antingen att ta bort en förklaringsvariabel som starkt bidrar till multikolinjäriteten eller samla in mer data om det är möjligt, eftersom standardavvikelsen minskar med fler datapunkter. Att samla in data är att föredra då exkluderandet av en tänkbar förklaringsvariabel medför förlust av presumtivt relevant information [4] VIF En metod för att identifiera multikolinjäritet hos en modell är att studera Variance Inflation Factor (VIF). VIF är ett mått på hur mycket variansen hos en förklaringsvariabels koefficient har ökat på grund av multikolinjäritet. Detta beräknas genom att utföra en regression med respektive förklaringsvariabel i den ursprungliga modellen som beroende av de övriga. Sedan från respektive regression ta fram förklaringsgraden R 2 och använda följande formel VIF(β j ) = 1 1 R 2 j Vad som är ett högt VIF-värde är ej entydigt men en ofta förekommande rekommendation är att så länge VIF < 5 kan modellen fortsätta studeras utan att vidare hänsyn tas till multikolinjäriteten [6] Endogenitet Ett av antagandena för att kunna genomföra en OLS regression är att E[e i ] = 0 (2.1.1 Multipel linjär regression). Begreppet endogenitet används om de situationer när detta antagande bryts, viket det gör till följd av att det förväntade värdet av e i beror på en eller flera av de valda förklaringsvariablerna. Med andra ord när residualen korrelerar med en eller flera förklaringsvariabler. Problemet med detta 12

20 är att det skapar felaktiga estimat för den koefficient vars förklaringsvariabel korrelerar med residualen, koefficienten överestimeras vid en positiv korrelation och underestimeras vid en negativ sådan. Detta gör att en strukturell analys ej blir tillförlitlig om den baseras på en regression vars modell innefattar endogenitet [4]. En lösning på problemet med endogenitet är att använda sig av Two Stage Least Square (2SLS) istället för OLS. Det bygger på att ersätta den korrelerade förklaringsvariabeln med en eller flera instrumentvariabler vilka är korrelerade med förklaringsvariabeln men ej med residualen [4]. Endogenitet kan uppstå i följande situationer [4] Sample selection bias - urvalet av data påverkas av något annat än förklaringsvariablernas värde i sig. Simultaneity - den beroende variabeln påverkar en eller flera av förklaringsvariablerna. Saknad av relevanta förklaringsvariabler - då kan i vissa fall dessa variabler identifieras och vid inkludering i modellen upphör endogeniteten. Mätfel i förklaringsvariablerna Hetereoskedasticitet Heteroskedasticitet innebär att residualerna e i ej har konstant standardavvikelse, vilket betyder att antagandet om homoskedasticitet inte är uppfyllt (2.1.1 Multipel linjär regression). Om modellen innefattar heteroskedasticitet men beräknas utifrån antagandet om homoskedasticitet kommer de estimerade koefficienternas standardavvikelser att vara felaktiga. Detta leder i sin tur till att signifikanstesterna för de aktuella förklaringsvariablerna ej blir tillförlitliga och således kan fel variabler exkluderas eller inkluderas i modellen. Identifieras heteroskedasticitet i modellen bör det först göras ett försök att omformulera modellen. Exempelvis genom att addera ytterligare förklaringsvariabler eller transformera de befintliga. Detta med syfte att få residualer med konstant standardavvikelse. Om detta ej löser problemet kan White s Consistent Variance Estimator användas, vilken är en alternativ metod att räkna ut kovariansmatrisen med. Den ser ut enligt följande Côv( ˆβ) = (X T X) 1 (Σ n j=1ê 2 jx t jx j )(X T X) 1 Istället för kovariansmatrisen som används vid homoskedasticitet Côv( ˆβ) = (X T X) 1 ê 2 ( n k 1 ) 13

21 I många fall är det dock svårt att med säkerhet fastställa huruvida homoskedasticitet råder eller ej och därför kan det vara fördelaktigt att använda sig av White s estimator, även om homoskedacticitet ser ut att råda [4] Normal Quantile-Quantile plot Normal Quantile-Quantile plot (hädanefter refererad till som QQ-plot ) är ett hjälpmedel för att studera antagandet om normalfördelade residualer (2.1.1 Multipel linjär regression). I den visas de estimerade kvantilerna för residualerna mot de teoretiska kvantilerna för en normalfördelning. Givet att antagandet stämmer följer punkterna en rät linje, likt Figur 2.1. Följer punkterna inte den räta linjen är residualerna troligen av en annan sannolikhetsfördelning och antagandet är således ej uppfyllt. Detta kan se ut på många sätt men det gemensamma är att det finns ett tydligt avvikande mönster för punkterna gentemot den räta linjen. Figur 2.1: QQ-plot vid normalfördelade residualer Residualplot Residaulplot används för att identifiera heteroskedasticitet. Den visar de studentiserade residualerna för respektive observation. Givet att punkterna är slumpmässigt fördelade längs hela den horisontella axeln råder homoskedasticitet, Figur 2.2. Studentisering innebär att det görs en justering för variansen för respektive residual, vilket görs för att ge en mer rättvisande bild av hur punkterna är fördelade. Ifall ett mönster identifieras innebär det att residualerna är heteroskedastiska. Vid få observationer ger ej detta en rättvisande bild då även heteroskedastiska residualer kan se ut att vara slumpmässigt fördelade då det finns så få datapunkter. 14

22 Figur 2.2: Residualplot vid homoskedasticitet Variabelselektion Givet att ett visst antal variabler är tänkbara att inkludera i modellen och antagandena för regression är uppfyllda (2.1.1 Multipel linjär regression) startas processen att välja ut den bästa modellen. Grundtanken är att först och främst eliminera variabler som ej är signifikanta på en förutbestämd nivå. Detta kan göras antingen via Backward Elimination, Forward Selection eller Stegvis regression. Vanligt förekommande är användande av Backward Elimination där en grundmodell med samtliga variabler inkluderade reduceras steg för steg Variabler De olika förklaringsvariablerna i regressionen kan bestå av två olika typer. Dessa är kvalitativa respektive kvantitativa variabler. Kvalitativa variabler kan enbart mätas enligt en nominalskala eller ordinalskala. Värdena ansätts utifrån om variabeln innehar en viss vald egenskap eller inte. Det finns diskreta och kontinuerliga kvantitativa variabler. Om det för de diskreta variablerna existerar en inbördes ordning med ekvidistanta mätsteg mellan värdena, kan dessa betraktas likvärdigt med kontinuerliga. Mätskalan är mestadels en absolutskala där det finns en naturgiven måttenhet samt nollpunkt. 2.2 Teori om resultatdrivande faktorer i skolan Kvalitén på ett lands utbildningsväsende bestäms av samverkande faktorer på flertalet olika nivåer. Därav är det ett ytterst komplext problem att identifiera 15

23 och konkretisera vilka faktorer som är de relevanta. Det går att angripa detta problem utifrån olika vinklar, gemensamt för dessa är att det första steget är att definiera olika perspektiv från vilka man kan se på problemet. OECD har tagit fram åtskilliga rapporter där de utvärderar olika länders utbildningsväsende samt försöker identifiera just drivande faktorer bakom lyckade exempel. De presenterar i dessa rapporter flertalet skilda sätt att genom olika perspektiv utforska eventuella faktorer. Denna rapport utgår ifrån indelning som gjordes i 2006 års rapport PISAT Science Competencies for Tomorrow s World, vilken utgick från ett generellt-, skol- och studentperspektiv [7]. Vidare har ett lärarperspektiv lagts till då det är allmänt accepterat att kvalitén på lärarna är av vikt samt att det har använts som perspektiv av OECD tidigare år Generellt perspektiv Inom detta perspektiv ämnas identifiera variabler som på en övergripande nationell nivå har en förklarande del i kvalitén av landets utbildningsväsende. Dessa variabler är antingen givna från tidigare generationer eller variabler som inte enkom beror på beslut gällande utbildningsväsendet. Av denna anledning är dessa svåra att påverka i syfte att förbättra utbildningsväsendet men inkluderas likväl då de kan ha en förklarande del. Exempel på en variabel som flitigt diskuterats inom detta perspektiv är föräldrars utbildningsnivå Skolperspektiv Detta perspektiv syftar till att identifiera variabler som är direkt kopplade till utbildningssystemet. Variabler som rör beslut antingen på nationell eller lokal nivå vars syfte är att givet en viss budget optimera kvalitén. Ett typexempel är variabler som rör hur resurser fördelas Lärarperspektiv Lärarperspektivet inkluderar variabler som i mångt och mycket kan beskrivas i likhet med antingen det generella- eller skolperspektivet. Det som utmärker detta perspektiv är att det inriktar sig direkt mot variabler som rör läraryrket, oavsett vilket av de andra perspektiven de ursprungligen tillhör Elevperspektiv Det avslutande perspektivet rör variabler som beskriver studenters motivation i och till skolan. Variabler inom detta perspektiv är ofta svåra att med tillförlitlighet mäta, varför det istället används variabler som hur ofta personer kommer sent till skolan eller hur många i en viss åldersgrupp som går i skolan. 16

24 Del 3 Metod 3.1 Datainsamling Den använda data erhölls i huvudsakligen från OECD, vars publikationer Education at Glance från 2015 respektive 2008 användes. Utöver detta inhämtades även viss data från Världsbankens hemsida. All relevant data gällde åren 2012 respektive 2006 eller nyast tillgängliga innan dess. Totalt antal erhållna observationer uppgick till 68 stycken. Data saknades för ett fåtal förklaringsvariabler. Eftersom antalet observationer var relativt få gjordes antaganden för saknade data. Detta kan motiveras med att det endast behövdes göras för ett litet antal observationer, även om det finns risk att uppskattningarna blir partiska [8]. 3.2 Variabler De använda variablerna i rapporten är alla kvantitativa samt har ekvidistanta mätsteg Responsvariabel Den valda responsvariabeln är PISA-resultatet. Det är i denna rapport ett lands medelvärde av resultatet på PISA-testet. Det räknades ut genom att för varje delprov beräkna medelvärdet av tjejerna och killarnas resultat och sedan beräkna medelvärdet av de tre delproven tillsammans Förklaringsvariabler Inom de fyra tidigare nämna perspektiven valdes följande förklaringsvariabler ut att ingå i den initiala modellen för regressionsanalys. Valen gjordes utifrån tillgänglig data samt via jämförelser av tidigare undersökningar från OECD. 17

25 Generellt perspektiv Utb.vuxna Beskriver andelen åringar i landet som har examen från tertiär utbildning. Anges i procent. Utb.utgifter Antal procent av BNP som lagts på icke-tertiär utbildning i landet. Prv.utgifter Antal procent av totala spenderade summan pengar inom icketertiär utbildning som utgörs av privata utgifter. Skolperspektiv Utlärningstid Antalet timmar som spenderas på utlärning till en grupp eller en klass av studenter enligt rådande skolpolicy i landet. Presenteras i totala antalet timmar per år. Klasstorlek Genomsnittsstorleken av klasserna i låg- och mellanstadiet. Mätt i antalet elever per klass gällande sammanslagning av både privata och statliga skolor. Skolstart Beskriver vid vilken ålder elever i landet börjar i grundskolan. Datorer Genomsnitt av antalet elever per skoldator i landet för låg- och mellanstadiet. Annat.utgifter Procent av grundskolans tillgängliga pengar som läggs på annat än löner för lärare och annan personal. Lärarperspektiv Lärarlön Genomsnittslön för lärare i grundskolan med 15-års erfarenhet. Anges i enheten amerikanska dollar som är justerat med köpkraftsparitet. Kön.lärare Andelen av lärarkåren i låg- och mellanstadiet som utgörs av kvinnor, mätt i procent. Elevperspektiv Inskrivningsgrad Antal procent av åringar som är inskrivna på utbildning. 18

26 Tabell 3.1: Sammanställning av de ingående variablerna Benämning Variabel Enhet Responsvariabel PISA-resultat y i Poäng Förklaringsvariabler Lärarlön x 1, i USD, $ Utb.utgifter x 2, i Procent,% Utlärningstid x 3, i Timmar Utb.vuxna x 4, i Procent,% Prv.utgifter x 5, i Procent,% Klasstorlek x 6, i Styck Skolstart x 7, i År Datorer x 8, i Styck/elev Inskrivningsgrad x 9, i Procent, % Annat.utgifter x 10, i Procent, % Kön.lärare x 11, i Procent, % 3.3 Antaganden För saknad data gjordes antaganden då all befintlig information behövdes användas och utrymme för bortfall av observationer således inte var ett alternativ. Länderna för vilka regressionen genomfördes på delades in i sju grupper baserat på geografiska, kulturella samt ekonomiska aspekter. Geografisk närhet samt kulturell likhet var framförallt avgörande för indelningen, men utöver det togs det hänsyn till de berörda ländernas BNP/capita. Målet var att de framtagna grupperna skulle innehålla så jämförbara länder som möjligt. Detta för att när data för ett land saknades kunna ta ett medelvärde av resterande länder i samma grupp och ansätta det för det saknade värdet. De sju framtagna grupperna redovisas nedan i Tabell 3.2. Tabell 3.2: Gruppindelning av jämförbara länder Grupp 1 Sverige Norge Danmark Finland Island Nya Zeeland Grupp 2 Tyskland Österrike Schweiz Luxemburg Belgien Nederländerna Grupp 3 Estland Slovakien Slovenien Tjeckien Polen Grupp 4 Mexico Chile Turkiet Grekland Ungern Grupp 5 Storbrittanien USA Canada Australien Grupp 6 Spanien Italien Portugal Frankrike Grupp 7 Korea Japan Responsvariabelns värden samt förklaringsvariablernas dito togs från samma år. Det finns en tröghet hos responsvariabeln, det vill säga att förklaringsvariablerna inte direkt påverkar utgången för värdet hos responsvariabeln. Dock ansågs de 19

27 använda förklaringsvariablerna vara stabila och trendfasta. Värdena hos desamma representerar följaktligen även åren precis efter respektive åren precis före. Därav kunde de ändå betraktas ge en rättvisande förklaring av PISA-resultaten för motsvarande år. 3.4 Genomförande För att analysera sambandet mellan responsvariabeln och de aktuella förklaringsvariablerna med hjälp av kvantitativa metoder valdes regressionsanalys Program Rapportens beräkningsarbete utfördes i mjukvaruprogrammet R. Datainsamlingen sammanställdes med hjälp av Microsoft Excel Struktur Först genomfördes ett VIF-test för att identifiera eventuella korrelationer, detta för att säkerställa att modellen gav rättvisande resultat. Vidare reducerades modellen utifrån vald selektionsprincip, Backward Elimination, till dess att en slutmodell erhölls. Avslutningsvis testades modellens validitet utifrån antagandena för multipel linjär regression med respektive relevant metod. I samtliga genomförda regressioner användes White s estimator, då kapacitet fanns för detta Variabelselektion Variabelselektionen utfördes primärt via p-värde och η 2 samt testades med hjälp av AIC. Det gick till på ett sådant sätt att efter varje genomförd regression reducerades den förklaringsvariabel med högst p-värde bort givet att även η 2 var låg. Signifikansnivån valdes till 5%. Vidare jämfördes AIC mellan modellen med samt utan den aktuella förklaringsvariabel för att bekräfta valet av reducering. Ytterligare komplement bestod av R 2 och R 2 där framförallt R 2 användes för att styrka reduceringen. 20

28 Del 4 Resultat 4.1 Grundmodell Följande avsnitt behandlar rapportens grundmodell, utförligare beskrivning av alla ingående förklaringsvariabler återfinns i metoden. PISA-resultat = β 0 + (Lärarlön)β 1 + (Utb.utgifter)β (Kön.lärare)β 11 + e VIF I Tabell 4.1 nedan presenteras de uträknade VIF-värdena för respektive förklaringsvariabel. Alla värden är klart <5, vilket indikerar att ingen allvarlig multikolinjäritet råder. Antagandet om ej existerande multikolinjäritet är således uppfyllt och därför kan regressionen utföras utan komplikationer med avseende på detta. Tabell 4.1: Beräknade VIF-värden för respektive förklaringsvariabel VIF Lärarlön Utb.utgifter Utlärningstid Utb.vuxna Prv.utgifter Klasstorlek Skolstart Datorer Inskrivningsgrad Annat.utgifter Kön.lärare

29 4.1.2 Resultat av regression De erhållna resultaten från den genomförda regressionen av grundmodellen redovisas i Tabell 4.2. Tabell 4.2: Resultat av regression av grundmodell Estimate Std.Error Eta.sq p.value (Intercept) Lärarlön Utb.utgifter Utlärningstid Utb.vuxna Prv.utgifter Klasstorlek Skolstart Datorer Inskrivningsgrad Annat.utgifter Kön.lärare Förklaringsgraden för modellen var R 2 = och den justerade förklaringsgraden R 2 = Reduktion av modellen I enlighet med vad som beskrivs i metoden genomfördes reduceringen utifrån p-värden och η 2. Tabell 4.3: Reducering av grundmodell. P-värdet samt η 2 är värden gällande den exkluderade variabeln, övriga värden ges för hela modellen R 2 R2 AIC Exkl. variabel p-värde η 2 Regression Skolstart Regression Prv.utgifter Regression Kön.lärare Regression Datorer Regression Utb.utgifter Regression Klasstorlek De första sex regressionerna gav entydiga resultat givet vald metod. Vid exkludering av förklaringsvariabeln Klasstorlek i regression sju, vilken gjordes ty p-värdet ej var < 0.05 samt η 2 låg precis på gränsen för vad som i detta sammanhang kan anses lågt, går resultatet isär. Den på förhand valda signifikansnivån indikerade att regression sju borde genomföras, däremot indikerar AIC samt den 22

30 justerade förklaringsgraden det motsatta. Gränsdragningen av signifikansnivån på exakt fem procent är godtycklig och när då p-värdet låg nära fem procent samtidigt som AIC och den justerade förklaringsgraden föredrog den tidigare modellen valdes densamma. 4.3 Slutgiltig modell Efter genomförandet av de olika regressionerna genererades följande slutgiltiga modell PISA-resultat = β 0 +(Lärarlön)β 1 +(Utlärningstid)β 2 +(Utb.vuxna)β 3 +(Klasstorlek)β 4 +(Inskrivningsgrad)β 5 + (Annat.utgifter)β 6 + e Förklaringsgraden uppgick till R 2 = , den justerade förklaringsgraden till R 2 = och genomfört F-test med nollhypotesen att alla ingående förklaringsvariabler var lika med noll gav ett värde på 52,62. Hypotesen kunde därmed förkastas. Tabell 4.4: Ingående variabler för slutgiltig modell Estimate Std.Error Eta.sq p.value (Intercept) Lärarlön Utlärningstid Utb.vuxna Klasstorlek Inskrivningsgrad Annat.utgifter Noteras bör att koefficienterna ej är standardiserade vilket gör att de inte är jämförbara. Anledningen till att förklaringsvariabeln Lärarlön har en koefficient nära noll, , är att den mäts i enheten dollar och inkluderar värden i storleksordning tiotusental, medan responsvariabeln behandlar värden i hundratal Homoskedasticitet Undersökningen för huruvida homoskedasticitet rådde resulterade i Figur 4.1 nedan. Figuren påvisar homoskedasticitet, men på grund av de få datapunkterna går det inte att helt utesluta heteroskedasticitet. 23

31 Figur 4.1: Residualplot för slutgiltig modell Normalfördelade residualer Antagandet om normalfördelade residualer är uppfyllt eftersom punkterna följer linjen väl utan systematisk avvikelse, vilket visas av Figur 4.2 nedan. Figur 4.2: QQ-plot för slutgiltig modell. 24

32 Del 5 Diskussion 5.1 Analys av slutmodell Slutmodellen testades utifrån antagandena för linjär regression (2.1.1 Multipel linjär regression) för att undersöka reliabiliteten. Antagandet om normalfördelade residualer visades med önskad tydlighet vara uppfyllt. Vidare indikerade även residualploten att antagandet om homoskedasticitet var uppfyllt, där återfinns dock en problematik då det är svårt att med säkerhet uttala sig till följd av de få observationerna. Däremot användes White s estimator i regressionen vilket innebär att resultaten är tillförlitliga även om heteroskedasticitet skulle råda. Redan för grundmodellen påvisades att ingen multikolinjäritet rådde vilket betyder att så är fallet även för den slutgiltiga modellen. I övrigt skulle en tänkbar felkälla kunna vara den ingående data. I detta fall är data tagen direkt från OECD och Världsbanken och utrymme fanns inte att dubbelkolla uppgifterna. Däremot får data betraktas tillförlitlig då den kommer från två organisationer med hög trovärdighet. Allt detta sammantaget gör att modellens reliabilitet anses vara hög. Förklaringsgraden för slutmodellen uppgick till 77.64% och den justerade förklaringsgraden till 75.40%. Detta får i sammanhanget anses vara högt, däremot är inte en hög förklaringsgrad liktydigt med att modellen på ett tillfredsställande sätt mäter det som avses mätas. Eftersom regressionen genomförs med relativt få observationer finns risken att den överestimeras, det vill säga anpassar förklaringsvariablerna väl enligt den givna data men att den ej är generaliserbart för andra datamängder. För att testa detta skulle modellen utvärderas utifrån en test-datamängd. Detta är dock inte genomförbart då tidigare PISA-studier inte samlat in data för alla inkluderade förklaringsvariabler. Därför diskuteras modellens validitet vidare utifrån andra aspekter. Modellens innehållsvaliditet anses vara hög då de ingående variablerna är sådana som OECD har använt för liknande analyser. Däremot är de relativt få datapunkterna ett problem i den benämningen att det har begränsat antalet förklaringsvariabler. Vidare har även urvalet av de ingående variablerna begränsats på grund av saknad data, vilket gjort att även om de ingående förklaringsvariab- 25

33 lerna i sig är valida så kan det saknas vissa variabler som hade varit intressanta att utforska. Den samtida validiteten anses i övrigt vara hög då de flesta av rapportens identifierade samband styrks av samtida forskningsresultat, något som kommer diskuterats vidare i 5.2 Utelämnade förklaringsvariabler Utelämnade förklaringsvariabler Som tidigare tagits upp begränsades valet av förklaringsvariabler. Detta gjorde att flertalet potentiellt relevanta variabler ej kunde analyseras. Ett exempel på en sådan variabel är andelen licensierade lärare i skolan, en variabel som helt saknade data från 2006 men som i samtida forskning diskuterats[9]. En annan variabel som skulle kunna bidra med relevant information är något form av mått på skolmatskvalitén. Detta då det är tänkbart att maten är en starkt bidragande orsak till hur länge elever orkar hålla sig fokuserade under en dag. På samma tema är det tänkbart att mängden läxor elever tilldelas i någon utsträckning kan påverka elevers prestationer. Eftersom även detta bidrar till att eventuellt förlänga tiden en elev behöver fokusera på inlärning under en dag. Ytterligare intressanta variabler skulle vara antal timmar i respektive land som läggs på olika ämnen, eftersom det diskuterats att exempelvis mer tid på fysisk aktivitet (idrott och hälsa) skulle generera bättre generella resultat[10]. 5.2 Utvärdering av resultatet De ingående förklaringsvariablerna i slutmodellen diskuteras i följande avsnitt. Även de reducerade variablerna analyseras kort. Indelningen av förklaringsvariablerna i fyra olika perspektiv visade sig vara rimlig då minst en variabel från respektive perspektiv kom att ingå i den reducerade slutmodellen. Det indikerar att urvalet av variabler var välmotiverat Generellt perspektiv Utb.vuxna Något som flitigt lyfts fram i diskussionen kring utbildning är att föräldrars utbildningsnivå är starkt korrelerad med hur väl deras barn presterar i skolan. Resultaten från denna rapports slutmodell är i enlighet med detta då det säger att det är en positiv korrelation mellan utbildningsnivån hos vuxna generellt i ett land och detta lands prestation på PISA-testet. Anledningar till varför detta samband råder är komplexa och bygger ofta på korrelation mellan hög utbildningsnivå och andra relevanta egenskaper hos föräldrar, vilket i sig krävs en egen rapport att utförligt klargöra. Kort sagt är det så att föräldrar med hög utbildningsnivå är bättre förberedda att hjälpa barnen med läxor hemma samt mer benägna att lyfta fram vikten av att prestera väl i skolan. Ytterligare en aspekt som förtjänas lyftas fram i detta sammanhang är värdet av att föräldrar 26

34 engagerar sig i sina barns skolgång [11], ett engagemang som kan antas vara mer troligt om föräldern i fråga är medveten om betydelsen av barnets prestation Skolperspektiv Utlärningstid För utlärningstid är koefficienten i den slutgiltiga modellen negativ vilket indikerar en negativ korrelation mellan antalet timmar lärare lär ut och resultat på PISA-testet. Vid en första betraktelse av det identifierade sambandet kan det kännas kontraintuitivt, däremot finns det tidigare forskning som stödjer detta samband och som också vid en djupare analys är i enlighet med vad som kan tänkas vara rimligt. En förklaring kan vara att en högre utlärnignstid påverkar utlärnignskvalitén negativt. Alltså att lärarnas prestation i klassrummet blir sämre på grund av en för hög arbetsbörda. I England exempelvis arbetar lärare i snitt 60-timmarsveckor, inklusive pappersarbete, vilket har lett till att kvalitén på det faktiska utlärandet har sjunkit [12]. Vidare är det även rimligt att anta att attraktiviteten hos läraryrket påverkas av antalet timmar som lärare förväntas arbeta, ett antagande som styrks av OECD:s rapport Education at Glance [13]. Vilket betyder att ett lägre antal timmar spenderade i skolan skulle höja attraktiviteten och i enlighet med vad som diskuteras under Lärarlön generera ett högre resultat på PISAtestet. Denna förklaring är dock delvis bristfällig då förklaringsvariabeln gäller hur många timmar lärare spenderar på att lära ut. Alltså tas inte tiden som spenderas på annat med, en tid som är relevant för den tänkbara förklaringen som diskuterats ovan. Något som däremot är direkt kopplat till den aktuella förklaringsvariabeln är kvalitén på inlärningsförmågan hos de elever som mottar utlärningen. Där det kan antas vara en avtagande inlärningsförmåga ju längre tid en elev spenderar i en inlärningssituation per dag [14]. Något som förklaras med att barn har ett begränsat fokusering- samt uppmärksamhetsspann vilket gör att det är svårare att koncentrera sig i slutet av en lång dag. Samt att även förmågan att koda in information i hjärnan försämras. Klasstorlek Resultatet från rapporten indikerar ett positivt samband mellan klasstorlek och resultat på PISA-testet. Flertalet studier har med grund i ett pedagogiskt perspektiv hävdat att det bör vara fördelaktigt med mindre klasser. Däremot har detta inte enhälligt kunnat styrkas genom empiriska studier. En tänkbar förklaring till varför det inte har kunnat göras är att andra faktorer har större betydelse, exempelvis att lärarkvalité är överordnad lärarkvantitet [15]. 27

35 Att resultaten från denna rapport visar på ett positivt samband är svårare att förklara utifrån tidigare forskning jämfört med det ovan diskuterade, att det inte är ett negativt samband trots att det bör vara det i teorin. Det som kan tänkas vara en förklaring och som också har stöd i annan forskning är faktumet att det ofta ger mer nytta att investera i annat än reducering av storleken på klasser [15]. Därav är det tänkbart att länder med stora klasser har investerat i annat (och vice versa) vilket i så fall skulle förklara den identifierade positiva korrelationen mellan klasstorlek och resultat på PISA-testet. Det bör även nämnas att inget land hade i denna rapport hade ett större klassnitt än 30 elever, så effekten av att ha ett snitt på över 30 har ej utforskats. Dessa resultat bör därför inte tolkas som att större klasser är att föredra, utan istället bör de tolkas som att det finns andra faktorer att investera pengar i än att just reducera klasstorleken. Annat.utgifter Den positiva koefficienten framför förklaringsvariabeln Annat.utgifter indikerar ett positivt samband mellan den procentuella delen pengar som läggs på annat än personal inom skolan och resultatet på PISA-testet. Detta betyder att det är viktigt att prioritera skolmateriel, det vill säga allt från böcker och pennor till whiteboardtavlor och projektorer. Tidigare forskning har varit tudelad kring detta då vissa hävdat att det är en nödvändighet för att bedriva en effektiv utlärning medan andra fört i bevis att det centrala snarare är hur man använder materielen. Empiriska studier har tidigare styrkt båda argumenten [16]. Därför bör en tolkning av just denna rapports resultat tolkas med försiktighet och den allmänna generaliseringen att mer investeringar i annat än personallöner ger bättre resultat på PISA-testet undvikas, speciellt som det även identifierats ett positivt samband mellan lärarlöner och resultatet på PISA-testet. För alla förklaringsvariabler gäller antagandet ceteris paribus vid tolkningen av resultatet. Men det blir för denna förklaringsvariabel extra viktigt då detta betyder att given en viss nivå på lärarlönerna ska en större procentuell del av den totala budgeten läggas på annat än just personallöner. Det är givetvis så att det finns en del annan personal (t.ex. skolkökspersonal) vars löner ska inkluderas i den totala budgeten, men deras lönebidrag är marginellt och bör därför inte vara det som förklarar varför både Lärarlön och Annat.utgifter har positiva koefficienter. Tolkningen bör istället vara att förklaringen är att det är bättre med en högre real budget, då det möjliggör att givet en bestämd lärarlön ska en större procentuell del av budgeten läggas på skolmateriel. Det vill säga att sambandet mellan mer investeringar i annat än personallöner och bättre resultat på PISA-testet egentligen är ett samband mellan den reala investeringen i skolan och resultatet på PISA-testet givet att lärarlönerna är konstanta. 28

36 5.2.3 Lärarperspektiv Lärarlön Koefficienten för lärarlön i den slutgiltiga modellen är positiv vilket indikerar att det råder en positiv korrelation mellan lärarlöner och resultat på PISA-testet. Detta samband är intuitivt riktigt och stärks genom åtskilliga studier på ämnet. Tänkbara förklaringar till varför detta samband existerar är att det attraherar fler presumtivt duktiga lärare. Vidare gäller att högre auktoritet i samhället för lärare genererar bättre skolresultat [17] och att göra kopplingen högre lön- högre auktoritet ligger nära till hands. Lönegapet mellan Sverige och de övriga nordiska länderna har ökat de senaste åren [18]och en jämförelse mellan Sveriges resultat 2006 och 2012 i förhållande till övriga nordiska länders resultat visar att Sverige har tappat markant. Detta samband är med andra ord helt i linje med vad regressionsanalysen indikerar. Tolkningen av detta kan göras att ett arbete mot högre lärarlöner i Sverige är en tänkbar del i ett större åtgärdsprogram Elevperspektiv Inskrivningsgrad En positiv koefficient framför förklaringsvariabeln Inskrivningsgrad tyder på att det är fördelaktigt att en stor del av ungdomarna i samhället går i skolan. Vidare tolkningar av detta resultat är begränsade då det inte finns lika mycket forskning på denna faktor som det finns på de övriga. Tanken med förklaringsvariabeln var att den skulle mäta motivationen hos ungdomar att gå i skolan. Med antagandet att den gör detta rättvisa kan en förklaring till resultatet ges med det intuitiva sambandet att en ökad motivation och glädje till skolan ger ett bättre resultat Reducerade förklaringsvariabler Följande förklaringsvariabler reducerades från modellen: Utb.utgifter, Prv.utgifter, Skolstart, Datorer och Kön.lärare. Ingen av dessa var med andra ord signifikanta och därför kan inga slutsatser dras om huruvida dessa påverkar resultatet på PISA-testet givet underlaget i denna rapport. 29

37 Del 6 Innovationsdrivande faktorer Det övergripande syftet med detta arbete är att ta fram underlag för hur Sverige och andra innovationsdrivna länder uppnår en nyttomaximerande skola. Det mer specifika syftet med denna del är att identifiera vilka faktorer skolan eventuellt bör flytta fokus mot att stimulera, genom att identifiera vilka faktorer som främjar innovation i arbetslivet. Detta med bakgrund av att dagens samhälle är starkt innovationsberoende, vilket är ett påstående som förklaras utförligt i 6.1 Bakgrund för att ge läsaren en förståelse för varför just innovationsfrämjande faktorer är de som skolan eventuellt bör flytta fokus mot. 6.1 Bakgrund Kunskapsbaserad ekonomi är ett relativt nytt begrepp där det centrala är att man lyfter fram kunskap som en essentiell del i ekonomisk tillväxt. Kunskap har alltid haft en roll i synen på ekonomisk tillväxt men det är först på senare år som dess fulla betydelse har uppmärksammats och börjat studeras [19]. En av de viktigaste komponenterna inom den moderna kunskapsbaserade ekonomin är enligt flertalet forskare innovation, där vissa går så långt som att säga att innovation och skapandet av idéer är det mest drivande i dagens ekonomi [20, 21]. Samtidigt som andra genom empirisk data fört i bevis att det på senare år har varit de kunskaps och innovationsdrivna branscherna som uppvisat högst tillväxt [22]. Även om det aktuella forskningsfältet idag inte är moget, det råder ingen konsensus om exakt på vilket sätt innovation påverkar tillväxten, så är forskare överens om att innovationen har en betydande roll och att investeringar i innovation är ett måste för att generera tillväxt på sikt. Detta gäller för alla utvecklade länder men än mer central roll beskrivs innovation ha hos länder vars industri är exportorienterad, vilket är fallet för stora delar av Europas länder generellt och för Sverige specifikt. Detta för att länderna inte har en tillräckligt stor inhemsk marknad för att driva ekonomin framåt. Vilket leder till att länderna behöver konkurrera med varandra om att få exportera en viss vara och därmed blir innovationsfaktorn viktig som konkurrensfördel för densamma [23]. Länder som varit 30

38 framgångsrika på det planet har även historiskt benämnts som innovationsdrivna ekonomier. Den totala vikten av innovation förstås dock först vid en holistisk syn på dess följder då det förutom att förändra processer och varor även påverkar människors syn på arbete och behov av varor [22]. Ett exempel på hur innovation påverkar i flera led är faktumet att befolkningen i länder blir allt äldre till följd av att innovation inom vård och omsorg gör att människor lever längre och längre. Vilket i sin tur skapar ett behov av innovation inom processer för att kunna effektivisera produktionen och skapa samma välstånd för alla människor men med mindre del arbetsför befolkning. En innovation ger alltså upphov till innovationsbehov inom andra områden givet att innovation förändrar något som tidigare varit konstant, om det så varit den allmänna livslängden eller synen på något specifikt. Oberoende av vad den totala vikten av innovation innebär så är det som tidigare nämnts en livsnödvändighet för länder att främja och skapa innovation i landet. Innovationsdrivna ekonomier har historiskt kunnat förlita sig på den enskilda innovatören för dessa innovationer. Företagen liksom hela samhällen har dragit nytta av specifika revolutionerande innovationer där en ensam individ har ansetts ansvarig för framtagandet av desamma. Tydliga exempel finns för ett historiskt innovationsberoende Sverige. Om det tidigare varit så att enskilda individer varit nyckeln i innovationsprocessen eller om den egentliga nyckeln snarare är organisationen som utvecklat och format deras idéer så är faktumet att fler människor måste bli innovatörer sant. Detta i och med att övergången till allt mer tjänstebaserade samhällen för ett stort antal utvecklade länder leder till nya utmaningar. Tidigare effektiviseringar av produktionslinor inom tillverkningsindustrin ger inte längre samma effekt ur ett tillväxtekonomiskt perspektiv. I och med att yrkena inom tjänstebranschen dessutom snabbt blir mer kunskapsbaserade resulterar det i att höga krav ställs på nya satsningar vad gäller innovationspolicyer [19]. Det vill säga att majoriteten av de anställda i framtiden inte innehar enklare jobb där de enbart blir användare av nya innovationer framtagna av enskilda personer. Snarare tvingas de bli delaktiga i skapandeprocessen själva. 6.2 Teoretisk referensram Denna rapport utgår från en etablerad teori om hur innovation skapas som säger att både individen och organisationen har en betydande roll. För att kunna skapa innovation inom en organisation behöver det finnas individer inom denna organisation som har förutsättningar för att vara kreativa. Samtidigt behöver det också finnas en organisation kring dessa individer som både stimulerar och gör skapandet möjligt [24]. 31

39 Individen De faktorer som på individnivå bestämmer förmågan till innovation delas i allmänhet upp i följande två kategorier med tillhörande definition: Egenskaper - de personlighetsdrag samt kognitiva förmågor en individ innehar Kunskaper - de erfarenheter och den information som utgör en individs explicita minne Organisationen De faktorer som på organisationsnivå bestämmer förmågan till innovation delas i allmänhet upp i följande två kategorier med tillhörande definition: Arbetsmiljö - den fysiska arbetsmiljön samt organisationskulturen Arbetsprocess - hur det faktiska arbetet inom en organisation sköts Figur 6.1: Innovationsprocess Innovationsfrämjande faktorer och skolan Grundpremissen för att de resultat som presenteras i denna del ska gå att använda som underlag för hur en nyttomaximerande skola bör utformas är att faktorer som främjar innovation också är faktorer som efterfrågas i arbetslivet. Vidare förutsätts utbildningsväsendets roll i samhället vara att förbereda individer för att aktivt kunna delta i samhällsutvecklingen, vilket delvis görs genom att bidra i arbetslivet. Av detta följer logiskt att en identifierad faktor som främjar innovation är en faktor skolan bör ta hänsyn till i sin utbildningsplan. 32

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm

Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Kungliga Tekniska Högskolan Kandidatexamensarbete i Teknisk Fysik Institutionen för Matematisk Statistik Multipel regressionsanalys av variabler som påverkar priset på bostadsrätter i stor-stockholm Författare:

Läs mer

Utbildningskostnader

Utbildningskostnader Utbildningskostnader 7 7. Utbildningskostnader Utbildningskostnadernas andel av BNP Utbildningskostnadernas andel av BNP visar ländernas fördelning av resurser till utbildning i relation till värdet av

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

PISA 2012. 15-åringars kunskaper i matematik, läsförståelse och naturvetenskap

PISA 2012. 15-åringars kunskaper i matematik, läsförståelse och naturvetenskap PISA 2012 15-åringars kunskaper i matematik, läsförståelse och naturvetenskap Vad är PISA? OECD:s Programme for International Student Assessment 15-åringar Matematik, läsförståelse och naturvetenskap 65

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Matematiken i PISA

Matematiken i PISA Matematiken i PISA 2003-2012 Matematiken i PISA 2003-2012 Matematikbiennalen 6-7 februari 2014 Anita Wester Skolverket Samuel Sollerman Stockholms universitet Vad är PISA? OECD:s Programme for International

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14

Läs mer

Tabeller. Förklaring till symbolerna i tabellerna. Kategorin är inte relevant för det aktuella landet varför data inte kan finnas.

Tabeller. Förklaring till symbolerna i tabellerna. Kategorin är inte relevant för det aktuella landet varför data inte kan finnas. 165 BILAGA A Tabeller Förklaring till symbolerna i tabellerna a m n x Kategorin är inte relevant för det aktuella landet varför data inte kan finnas. Data är inte tillgängligt. Omfattningen är endera försumbar

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

PISA (Programme for International

PISA (Programme for International INGMAR INGEMANSSON, ASTRID PETTERSSON & BARBRO WENNERHOLM Svenska elevers kunskaper i internationellt perspektiv Rapporten från PISA 2000 presenterades i december. Här ges några resultat därifrån. Projektet

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression

Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression DEGREE PROJECT, IN APPLIED MATHEMATICS AND INDUSTRIAL ECONOMICS, FIRST LEVEL STOCKHOLM, SWEDEN 2015 Analys av variabler som påverkar lönsamheten i gymbranschen med multipel linjär regression REBECCA AXELSSON,

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

PISA 2012 15-åringars kunskaper i matematik, läsförståelse, naturvetenskap och digital problemlösning

PISA 2012 15-åringars kunskaper i matematik, läsförståelse, naturvetenskap och digital problemlösning PISA 2012 15-åringars kunskaper i matematik, läsförståelse, naturvetenskap och digital problemlösning Vad är PISA? OECD:s Programme for International Student Assessment. Matematik, läsförståelse och naturvetenskap,

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng) 1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Att välja statistisk metod

Att välja statistisk metod Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

Prissättningsanalys av annonser på internet

Prissättningsanalys av annonser på internet EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2016 Prissättningsanalys av annonser på internet En analys av variabler som påverkar slutpriset GUSTAF ERLANDSSON CHRISTOFER TÄRNELL KTH KUNGLIGA

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXAMINATION KVANTITATIV METOD vt-11 (110204) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större

Läs mer

Matematik Läsförståelse Naturvetenskap

Matematik Läsförståelse Naturvetenskap PISA 212 RESULTAT 52 515 51 55 5 495 49 Matematik Läsförståelse Naturvetenskap 485 48 475 47 2 23 26 29 212 Länder med bättre resultat än Sverige Länder med liknande resultat som Sverige Länder med sämre

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression

Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Analys av lägenhetspriser i Hammarby Sjöstad med multipel linjär regression Christian Aguirre Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:17 Matematisk

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Analys av bostadsrättspriset i Stockholms innerstad

Analys av bostadsrättspriset i Stockholms innerstad Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD 6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110319)

EXAMINATION KVANTITATIV METOD vt-11 (110319) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

I fråga om problemlösning. Finland de minsta skillnaderna mellan skolorna och i fråga om elevernas familjebakgrund.

I fråga om problemlösning. Finland de minsta skillnaderna mellan skolorna och i fråga om elevernas familjebakgrund. I fråga om problemlösning uppvisade Finland de minsta skillnaderna mellan skolorna och i fråga om elevernas familjebakgrund. Poängtal i snitt för tio-i-toppländerna Inga signifikanta skillnader mellan

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

5. Högskolenivå. Svensk högskoleutbildning i ett internationellt perspektiv

5. Högskolenivå. Svensk högskoleutbildning i ett internationellt perspektiv Högskolenivå 5 5. Högskolenivå Svensk högskoleutbildning i ett internationellt perspektiv ISCED Klassificering av utbildningarna på primär-, sekundär- och tertiärskolenivå finns i utbildningsnomenklaturen

Läs mer

Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader

Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader Fatemeh Engqvist Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2017:23

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

Regressionsanalys av NHL-statistik

Regressionsanalys av NHL-statistik Regressionsanalys av NHL-statistik Av Gustav Hedén gheden@kth.se Examensarbete inom teknisk fysik, grundnivå SA104x KTH Matematisk statistik Handledare Fredrik Armerin 1 Innehållsförteckning Sammanfattning:...

Läs mer

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas

Läs mer

Fråga nr a b c d 2 D

Fråga nr a b c d 2 D Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841

Läs mer

En analys av sambandet mellan studieprestation på högskolenivå och utvalda faktorer

En analys av sambandet mellan studieprestation på högskolenivå och utvalda faktorer EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2018 En analys av sambandet mellan studieprestation på högskolenivå och utvalda faktorer PETER DAKERMANDJI DANTE FORSTÉN KTH SKOLAN FÖR TEKNIKVETENSKAP

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

EN RAPPORT FRÅN LÄRARNAS RIKSFÖRBUND. Svenska lärarlöner i ett europeiskt perspektiv

EN RAPPORT FRÅN LÄRARNAS RIKSFÖRBUND. Svenska lärarlöner i ett europeiskt perspektiv EN RAPPORT FRÅN LÄRARNAS RIKSFÖRBUND Svenska lärarlöner i ett europeiskt perspektiv Svenska lärarlöner i ett europeiskt perspektiv Innehåll Sammanfattning 6 Lönespridning för lärare 8 Lönespridning efter

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Tony Pansell, optiker Universitetslektor Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

import totalt, mkr index 85,23 100,00 107,36 103,76

import totalt, mkr index 85,23 100,00 107,36 103,76 1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen

Läs mer

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018 Statistiska analysmetoder, en introduktion Fördjupad forskningsmetodik, allmän del Våren 2018 Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

Bilaga 6 till rapport 1 (5)

Bilaga 6 till rapport 1 (5) till rapport 1 (5) Bilddiagnostik vid misstänkt prostatacancer, rapport UTV2012/49 (2014). Värdet av att undvika en prostatabiopsitagning beskrivning av studien SBU har i samarbete med Centrum för utvärdering

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Högskolenivå. Kapitel 5

Högskolenivå. Kapitel 5 Kapitel 5 Högskolenivå Avsnittet är baserat på olika årgångar av Education at a glance (OECD) och Key Data on Education in Europe (EU). Bakgrundstabeller finns i Bilaga A: Tabell 5.1 5.3. Många faktorer

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Andel av befolkningen med högre utbildning efter ålder Högskoleutbildning, kortare år år år år år

Andel av befolkningen med högre utbildning efter ålder Högskoleutbildning, kortare år år år år år 196 Bilaga A Tabeller Tabell 5.1 Andel av befolkningen med högre efter ålder 2001 Andel i procent Högskole, kortare 25 64 år 25 34 år 35 44 år 45 54 år 55 64 år Australien 10 10 10 10 9 Belgien 1 15 19

Läs mer

Kunskaper och färdigheter i grundskolan under 40 år: En kritisk granskning av resultat från internationella jämförande studier

Kunskaper och färdigheter i grundskolan under 40 år: En kritisk granskning av resultat från internationella jämförande studier Kunskaper och färdigheter i grundskolan under 40 år: En kritisk granskning av resultat från internationella jämförande studier Jan-Eric Gustafsson Göteborgs Universitet Syfte och uppläggning Huvudsyftet

Läs mer

Hur skriver man statistikavsnittet i en ansökan?

Hur skriver man statistikavsnittet i en ansökan? Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer