Utarbetad av Anna Ekegren Version 1.0 Senast redigerad 2010-06-04 Fritextsökning på studera.nu POSTADRESS BESÖKSADRESS TELEFON TELEFAX Verket för högskoleservice Karlavägen 108, plan 8 08-725 96 00 08-725 96 01 Box 24 070 E-POSTADRESS DIREKTTELEFON WEBBPLATS 104 50 Stockholm namn.efternamn@vhs.se 08-725 xx xx www.vhs.se
2(10) Innehåll Inledning... 3 1 & 2: Anmälningskod och kurskod... 4 Sökexempel Anmälningskod... 4 XML-exempel för Anmälningskod och kurs-/programkod... 4 3. Utbildningens namn... 4 Sökexempel Utbildningens namn... 5 XML-exempel för Utbildningens namn... 5 4. Fritextord... 5 Sökexempel Fritextord... 5 XML-exempel för Fritextord... 6 5 & 7 & 8 Lärosäte och studieort... 6 Sökexempel Lärosäte och studieort... 6 XML-exempel för Lärosäte och studieort... 6 6. Ämne/examen... 7 Sökexempel Ämne/examen... 7 XML-exempel för Ämne/examen... 7 9. Fritextbeskrivning från fritextsida... 7 Sökexempel Fritextbeskrivning... 7 XML-exempel Fritextsida... 8 Allmänna tips till högskolor och universitet... 8 Matchning... 8 Sökexempel Bäst matchning... 9 Varför är det viktigt att använda Fritextord... 9 Sökexempel wild card (*)... 9 Felstavning... 9 Allmänna tips till sökande... 10
3(10) Inledning Detta dokument vänder sig till dig som vill veta mer om hur kopplingen mellan vad som matas in via XML-koden och hur utbildningen visas på Studera.nu. Det beskriver kort hur sökmotorn fungerar och vad som är viktigt för att en utbildning ska visas på Studera.nu och komma högt upp i resultatlistan. När användaren på Hitta utbildning på studera.nu fyller i ett sökord i fritextfältet under SÖK visas en resultatlista med utbildningar. Dessa utbildningar sorteras efter relevans. Relevans innebär att utbildningarna kommer olika högt på resultatlistan beroende på hur väl dess data matchar sökordet. Utbildningens data anger högskolan i en xml-fil i utbildningsdatabasen. Sökfunktionen går igenom utbildningens data från punkt 1 till 9 nedan, och jämför hur väl de matchar med det inmatade sökordet: 1. Anmälningskod (vikt 17) 2. Kurskod (vikt 14) 3. Utbildningens namn - benämning på kurs/kurspaket/program (vikt: 13.1) 4. Fritextord (vikt 11) 5. Kod för lärosäte (vikt 9) 6. Ämne/examen (vikt 7) 7. Studieort (vikt 5) 8. Namn på lärosäte (vikt 3) 9. Fritextbeskrivning från fritextsida (vikt 1) Till exempel, om sökordet matchar Anmälningskod (vikt 17) kommer utbildningen högt upp, men om sökordet matchar från Fritextbeskrivning från fritextsidan (vikt 1) kommer det långt ner. Här kommer en närmare förklaring till begreppen:
4(10) 1 & 2: Anmälningskod och kurskod Om användaren skriver in en anmälningskod eller en kurs-/programkod i sökfältet visas den utbildning (ev. de utbildningarna) som är märkt (märkta) med den koden. Indexeringen sker även utan högskolans prefix, vilket gör att det blir en träff på utbildningen även om inte högskolans förkortning är med. Sökexempel Anmälningskod Användaren skriver in UU-12345 och får träff på följande utbildning Rangordning Anmkod Utbildningens namn 1 UU-12345 Språkvetenskap Användaren skriver in 67890 och får träff på Fysiologi på högskolan i Halmstad. Rangordning Anmkod Utbildningens namn Högskola 1 HH-67890 Fysiologi Högskolan i Halmstad XML-exempel för Anmälningskod och kurs-/programkod Anmälningskod: EducationEvent <applicationdetails> <applicationcode>12345</applicationcode> </applicationdetails> Kurs-/programkod <identifier>tdbb40</identifier> 3. Utbildningens namn Utbildningens namn är näst viktigast efter Anmälnings- och kurs/programkod. Om utbildningens namn matchar exakt det ord som användaren skrivit in i sökfältet kommer utbildningen högt upp i resultatlistan.
5(10) Sökexempel Utbildningens namn Användaren skriver in ordet Ekonomi i sökfältet Rangordning Utbildningens namn 1 Ekonomi 2 Industriell ekonomi Utbildningen Ekonomi får högre träff än utbildningen Industriell ekonomi. XML-exempel för Utbildningens namn <titles> <title xml:lang="sv">u-landskunskap</title> </titles> 4. Fritextord Högksolan har möjlighet att välja upp till 15 fritextord som beskriver utbildningen. Om användaren skriver in ett ord som matchar ett av fritextorden får han/hon träff på utbildningen. Det bästa är att ange få men träffsäkra fritextord. Ju färre fritextord, desto högre kommer utbildningen i resultatlistan om fritextordet matchar det användaren skrivit in. Med fler fritextord blir det oftare träff på utbildningen, men den kommer längre ned i resultatlistan. Sökexempel Fritextord Användaren skriver in ordet Dietist i sökfältet Rangordning Utbildningens namn Fritextord 1 Klinisk nutrition Dietist 2 Kostvetenskap Dietist Kostekonom Kostvetare Om användaren skriver in sökordet dietist så visas utbildningen i det här exemplet Klinisk nutrion överst i resultatlistan. Den utbildningen är märkt med endast ett fritextord och hamnar högre upp än utbildningen Kostvetenskap som är märkt med flera fritextord. Däremot visas inte utbildningen Klinisk nutrition alls när användaren skriver in sökordet kostvetare, men utbildningen Kostvetenskap visas i resultatlistan.
6(10) XML-exempel för Fritextord <extensioninfo> <nya:textualdescriptionphrase xml:lang="sv">matematik Kemi Fysik</nya:textualDescriptionPhrase> <nya:textualdescriptionphrase xml:lang="en">math Chemistry Physics</nya:textualDescriptionPhrase> </nya:textualdescription> </extensioninfo> 5 & 7 & 8 Lärosäte och studieort Studieort kommer före högskolans namn i relevans. Men en utbildning som ges på samma ort som högskolans namn får högre relevans då den får poäng i indexeringen både för träffen på studieort och på högskolans namn. Sökexempel Lärosäte och studieort Användaren skriver in Gotland i sökfältet Rangordning Utbildningens namn Högskola Studieort 1 Arbetsmiljö (Gotland) Linneuniversitetet Gotland 2 Arkeologi Högskolan på Gotland Gotland 3 Sjuksköterskeprogrammet Karolinska Institutet Gotland Om användaren söker på Gotland visas Linneuniversitetet högre upp än Högskolan på Gotland i resultatlistan. Båda utbildningarna har Gotland som studieort, men Linneuniversitetet har angett Gotland i utbildningens namn. Karolinska institutet visas längre ned då Högskolan på Gotland får både poäng för namnet och studieort. Om dessutom utbildningen hade haft Gotland i utbildningens namn t.ex. Arkeologi på Gotland så hade den utbildningen visats överst i träfflistan. XML-exempel för Lärosäte och studieort EducationEvent <location> <physical> <municipality>1480</municipality> </physical> </location> 1480 motsvarar Göteborg enligt SCB (www.scb.se)
7(10) 6. Ämne/examen Under Visa avancerad sökning på studera.nu och under rubriken Ämne hamnar de ämnesord som motsvarar de koder som skickas in i xml-filen till studera-databasen. Eftersom dessa ämnesord också indexeras, så blir det även träffar på dem vid fritextsökningen även om användaren söker på det engelska namnet. Sökexempel Ämne/examen Användaren skriver Software Engineering i sökfältet Rangordning Utbildningens namn Ämne 1 Datavetenskap Programvaruteknik Eng: software engineering Ej träff Datavetenskapligt program Datavetenskap XML-exempel för Ämne/examen <subject> <code source="vhs">10.2100.1100</code> </subject> Koden 10.2100.1100 motsvarar ämnet Franska med den engelska motsvarigheten French. 9. Fritextbeskrivning från fritextsida En utbildning kan även märkas med en länk till en webbsida med fritextord. Fritextbeskrivning från en fritextsida har lägst relevans vid indexeringen. Detta medför att om en utbildning är märkt med en webbadress och andra liknande utbildningar är märkta med fritextord som skickats in direkt i xml-filen, så visas den senare utbildningen högre upp i resultatlistan. Är utbildningen märkt på båda sätten så indexeras endast fritextorden som skickats in direkt i xml-filen. Sökexempel Fritextbeskrivning Användaren skriver in ordet Programmering Rangordning Utbildningens namn Fritextord 1 Programmeringsteknik Systemutveckling Programmering 2 Informationssystem Länk med fritextsida där programmering ingår
8(10) Den utbildning som har programmering som fritextord kommer högre upp i träfflistan än den som har programmering på en fritextsida. XML-exempel Fritextsida Fritextorden via webbsida <extensioninfo> <nya:textualdescriptionlink>http://www.vhs.se/utbildning </nya:textualdescriptionlink> </extensioninfo> Fritextord direkt i xml-filen <extensioninfo> <nya:textualdescriptionphrase xml:lang="sv">matematik Kemi Fysik</nya:textualDescriptionPhrase> <nya:textualdescriptionphrase xml:lang="en">math Chemistry Physics</nya:textualDescriptionPhrase> </nya:textualdescription> </extensioninfo> Allmänna tips till högskolor och universitet Matchning Högst i resultatlistan kommer en utbildning med exakt träff på utbildningens namn, tvåa kommer en utbildning som har märkt sökordet som fritextord. På tredje plats kommer en utbildning som har märkt sökordet i ämneslistan. En utbildning som saknar sökordet bland sina fritextord eller som ämne, och där utbildningens namn inte matchar sökordet visas inte ens i träfflistan. Detta gäller även om användaren har valt en högskola under avancerad sökning på studera.nu. Eftersom vikterna i indexeringen adderas så får en utbildning högst relevans om användarens sökord matchar utbildningens namn, ett fritextord och ämne.
9(10) Sökexempel Bäst matchning Användaren skriver in U-landskunskap Rangordning Utbildningens namn Fritextord Ämne 1 U-landskunskap Inget inget 2 Utvecklingsgeografi U-landskunskap U-landskunskap 3 Utvecklingsstudier Program U-landskunskap 0 Freds- och konfliktvetenskap Inget Inget Varför är det viktigt att använda Fritextord Sökfunktionen använder inte automatiskt wild card (*). Om utbildningens namn är programmeringsteknik så syns den inte om en sökande skriver in programmering. Om högskolan däremot lägger in programmering som fritextord eller som ämne så kommer den synas högt upp i träfflistan. Om användaren skriver in programmering* så blir det en träff på en utbildning med namnet programmeringsteknik. Sökexempel wild card (*) Användaren skriver in Programmering* Rangordning Utbildningens namn Fritextord Ämne 1 Programmeringsteknik Programmering Programmering 2 Programmeringsteknik Inget Teknik Det blir träff på båda utbildningarna men den första kommer högre upp eftersom den också har ordet programmering som fritextord och ämne. Felstavning Om man vet att felstavningar förekommer t.ex. obstretik och obstetrik så kan man lägga in även de felstavade ordet i utbildningens fritextord. Om användaren är osäker på stavningen så går det att använda ~ framför sitt sökord. Sökordet kan matcha namnet på utbildningen, utbildningens fritextord eller ämne med närliggande stavning vilket gör att utbildningen visas i träfflistan trots felstavning.
10(10) Allmänna tips till sökande Dessa råd får användaren på studera.nu för att förbättra sin sökning 1. Använd * för att hitta utbildningar som innehåller eller börjar på ett visst ord: fysik* ger träffar med 'fysik' och alla utbildningar vars titlar börjar med 'fysik'. 2. Använd OR för att hitta utbildningar som innehåller det ena eller andra ordet: pedagogik OR genus ger träff på 'pedagogik' och/eller 'genus' 3. Använd mellanslag eller AND för att hitta utbildningar som innehåller flera ord: pedagogik genus ger träff på både 'pedagogik' och 'genus' 4. Använd ~ för att få träff på närliggande ord: sjuksjöterska~ ger träff på 'sjuksköterska' - träff trots felstavning 5. Använd " " för att hitta utbildningar som innehåller en specifik fras: "linjär algebra" ger träff på frasen 'linjär algebra'