Arkivering av sociala medier. från aktivism till allmänna handlingar tankar om varför och exempel på hur

Relevanta dokument
Problem som kan uppkomma vid registrering av ansökan

Support Manual HoistLocatel Electronic Locks

Annonsformat desktop. Startsida / områdesstartsidor. Artikel/nyhets-sidor. 1. Toppbanner, format 1050x180 pxl. Format 1060x180 px + 250x240 pxl.

LDB-Centrum. Centrum för Långsiktigt Digitalt Bevarande. Östen Jonsson. Liten insats stor nytta

Schenker Privpak AB Telefon VAT Nr. SE Schenker ABs ansvarsbestämmelser, identiska med Box 905 Faxnr Säte: Borås

Registrerade / Registered 14/05/2009. No Ordförande / The President. Wubbo de Boer REGISTRERINGSBEVIS CERTIFICATE OF REGISTRATION

Statistik över publikationer med öppen tillgång

E12 "Evil is going on"

Översättning av galleriet. Hjälp till den som vill...

Integritetspolicy på svenska Integrity policy in English... 5

Hur man skyddar sig på internet

Arkiv- och informationshantering

Installation av F13 Bråvalla

Lösenordsportalen Hosted by UNIT4 For instructions in English, see further down in this document

Kulturarw 3 SVENSKA WEBBEN BEVARANDE & TILLGÄNGLIGGÖRANDE #FAI2016

Sociala medier och säkerhet

Riktlinjer för användning av sociala medier

Fackföreningsrörelsens digitala omvandling. Att bevara organisationsmaterial i den digitala tidsåldern

UTLYSNING AV UTBYTESPLATSER VT12 inom universitetsövergripande avtal

Webbplats analys akcpdistributor.de.ipaddress.com

Webbteknik. Innehåll. Historisk återblick Teknisk beskrivning Märkspråk Standardisering Trender. En kort introduktion

Riktlinjer för användning av sociala medier

Hantering av verksamhetsinformation

Vässa kraven och förbättra samarbetet med hjälp av Behaviour Driven Development Anna Fallqvist Eriksson

Beijer Electronics AB 2000, MA00336A,

Avtal/överenskommelse för leverans till K- samsök

Swedbank Mobile Loadtesting. LoadRunner Mobile App protocol

Digital arkivering och historiklagring Anastasia Pettersson och Anders Kölevik

Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

Arkivera sociala medier och hemsidor

SKÖRDNING AV LOKALA DATAKÄLLOR I XML. Marika Lundqvist Umeå universitetsbibliotek

Webbteknik II. Föreläsning 5. Restless farewell. John Häggerud, 2011

Förändrade förväntningar

Introduction to the Semantic Web. Eva Blomqvist

Authentication Context QC Statement. Stefan Santesson, 3xA Security AB

Modern webbutveckling. av Robert Welin-Berger

Projekt E-ARK stöd vid digital arkivering. Björn ES Solutions

Sparbankerna PDF. ==>Download: Sparbankerna PDF ebook By 0

Application Note SW

Schenker Privpak AB Telefon VAT Nr. SE Schenker ABs ansvarsbestämmelser, identiska med Box 905 Faxnr Säte: Borås

"HTML5 och relaterade API:er"

SVENSK STANDARD SS-EN ISO :2009/AC:2010

VAD SKULLE DU HA VALT PDF

Alternativet är iwindows registret som ni hittar under regedit och Windows XP 32 bit.

Webbplats analys akcpsensor.de.ipaddress.com

1ME323 Webbteknik 3 Lektion 6 API. Rune Körnefors. Medieteknik Rune Körnefors

Testplattformen (Webbarkivering)

Telia Centrex IP Administratörswebb. Handbok

Hur tänker KB ta hand om högskolornas e-publikationer?

METADATASTANDARDER EN ORIENTERING

Handbok SSCd. Peter H. Grasch

RIKTLINJE. Riktlinjer för sociala medier. Beslutad av kommunchefen

Webbplats analys emreemir.com

Every visitor coming to the this website can subscribe for the newsletter by entering respective address and desired city.

Isolda Purchase - EDI

LUPstudentpapers. Manual Reviewer

världsvida väven

Webbregistrering pa kurs och termin

Terms and Conditions Digital Sheet Music

Styrteknik: Binära tal, talsystem och koder D3:1

1. Unpack content of zip-file to temporary folder and double click Setup

Stockholm Open Award 2014 Meet Up 26 mars Trafik och framkomlighet

ORCID medlemskap och implementering vid Chalmers

Hämta via databaser Pröva några olika databaser. Se Hämta referenser från databaser.

Poddar, bloggar, twitter, youtube, facebook, snapchat, instagram, hemsidor och annat kul på nätet

Exemple på Tentauppgifter Webbprogrammering


xperia p manual svenska

Policy för öppen källkod RIV Tekniska Anvisningar

ISO Designing and Implementing a Records System (DIRKS/DIRS), Göran Samuelsson

Datasäkerhet och integritet


Schenker Privpak AB Telefon VAT Nr. SE Schenker ABs ansvarsbestämmelser, identiska med Box 905 Faxnr Säte: Borås

Acano cospace Solution

JavaScript in SharePoint and not just for Apps. Wictor Wilén

Kom igång på Twitter. Viktiga funktioner och tips på hur du får fler följare

Vad pratar vi om? Upphovsrätt Fildelning Tekniska skyddsåtgärder

Avståndsmätare hur användandet kan regleras. Materialet framställt i samarbete mellan: SGF:s Regelkommitté & Tävlingsenhet

Ekonomi & webben. TNMK30 - Elektronisk publicering

Råd för hantering av elektroniska handlingar vid Lunds universitet. Datum Författare Version Anne Lamér 1.0

Get Instant Access to ebook Ta Ner Manen PDF at Our Huge Library TA NER MANEN PDF. ==> Download: TA NER MANEN PDF

E-PLIKT E-PLIKT FÖR GÖTEBORGS UNIVERSITET

Bevarande av webbsidor

Sharecut. Michael De Stefano Robin Gustafsson Fredrik Warfvinge

Lehigh Valley Hospital Schuylkill Portal User Q&A

SkillGuide. Bruksanvisning. Svenska

JAG AR INTE GALEN PDF

Skattejurist för en dag på Deloitte i Malmö! 26 april 2016

Freja eid. Anders Henrikson

SVENSK STANDARD SS-EN :2007+A2:2012/AC:2013

Importera referenser till DiVA

SOA. Länkar +ll sidor om SOA h3p:// h3p://dsv.su.se/soa/

Digital inlämning av årsredovisning

JAVASCRIPT-POWERED LOADRUNNER CHRISTIAN GERDES PERFORMANCE ENGINEER LIGHTS IN LINE AB

Lyssna på nätet med Social Media Analytics

Transkript:

Arkivering av sociala medier från aktivism till allmänna handlingar tankar om varför och exempel på hur

Livscykelmodell för webbarkiv Bragg, Hanna et al (2013) https://archive-it.org/

Vision/mål Klargör målet med Arkiveringen.

Allmänna handlingar Sveriges Kommuner och Landstings promemoria, Sociala medier och handlingsoffentligheten (2010) Det sociala mediet som fenomen bör bevaras som en ögonblicksbild genom att man återkommande bevarar delar av det sociala mediet under en vald tidsperiod.

Forskning https://spraakbanken.gu.se/swe/resurser/corpus

Att äga sin data Några exempel:

Dokumentation av nuet? STOCKHOLM 2017

Livet efter detta? Become virtually immortal http://eterni.me/

Riskhantering Identifiera de risker som det kan innebära att arkivera Sociala medier

Användarvillkor Instagram "Vi förbjuder användning av spindlar, cachning och annat automatiserad tillgång till innehåll på tjänsten, inklusive men inte begränsat till användarprofiler och foton (förutom sökmotorer eller andra tekniker som används av sökmotorer som har Instagrams uttryckliga tillstånd)." "... Du samtycker till att följa alla lagar, regler och riktlinjer (t.ex. på statlig, regional och lokal nivå) som gäller för din användning av tjänsten och ditt innehåll.., t.ex. upphovsrättslig lagstiftning."

Användarvillkor Facebook "Du får inte samla in användares innehåll eller uppgifter, eller på annat sätt skaffa åtkomst till Facebook, via automatiserade metoder (t.ex. harvester-robotar, robotar, spindlar eller scrapers) utan vårt tillstånd." "Du ska följa alla gällande lagar när du använder eller kommer åt Facebook."

Användarvillkor Twitter "crawling the Services is permissible if done in accordance with the provisions of the robots.txt file" "If you provide Content to third parties, including downloadable datasets of Content or an API that returns Content, you will only distribute or allow download of Tweet IDs and/or User IDs. You may, however, provide export via non-automated means (e.g., download of spreadsheets or PDF files, or use of a save as button) of up to 50,000 public Tweets and/or User Objects per user of your Service, per day."

Användarvillkor Robots.txt # Every bot that might possibly read and respect this file. User-agent: * Allow: /*?lang= Allow: /hashtag/*?src= Allow: /search?q=%23 Disallow: /search/realtime Disallow: /search/users Disallow: /search/*/grid Disallow: /*? Disallow: /*/followers Disallow: /*/following # Wait 1 second between successive requests. See ONBOARD-2698 for details. Crawl-delay: 1

Användarvillkor Robots.txt # Notice: Crawling Facebook is prohibited unless you have express written # permission. See: http://www.facebook.com/apps/site_scraping_tos_terms.php User-agent: ia_archiver Disallow: / Disallow: /ajax/ Disallow: /album.php Disallow: /checkpoint/ Disallow: /contact_importer/ Disallow: /feeds/ Disallow: /file_download.php Disallow: /hashtag/ Disallow: /l.php

Upphovsrätt Du äger allt innehåll och all information som du publicerar på Facebook......För innehåll som skyddas av upphovsrätten, ger du oss... en icke-exklusiv, överföringsbar, vidarelicensierbar, royaltyfri, global licens att använda allt Skyddat innehåll som du publicerar på eller i anslutning till Facebook......licensen upphör att gälla när du tar bort ditt Skyddade innehåll eller ditt konto, förutsatt att innehållet inte delats med andra som inte tagit bort det.

Andra utmaningar Webbsidor är komplexa objekt med många beroenden

Bevarande Besluta om hur bevarandet av det insamlade materialet ska ske

Format Vanliga format vid webbarkivering Format Beskrivning (X)HTML Märkspråk för hypertext (RA-FS 2009:2) XML JSON Märkspråk som används för att utbyta data (RA-FS 2009:2) Textbaserat format som används för att utbyta data PDF/A-1 (RA-FS 2009:2) ARC/WARC MAFF Containerformat för paketering av arkiverade webbsidor Containerformat för paketering av arkiverade webbsidor

WARC Warc-records, kan vara av typerna: warcinfo response resource request metadata revisit conversion continuation

WARC Exempel på WARC WARCINFO WARC/1.0 WARC-Type: warcinfo WARC-Date: 2006-09-19T17:20:14Z WARC-Record-ID: <urn:uuid:d7ae5c10-e6b3-4d27-967d-34780c58ba39> Content-Type: application/warc-fields Content-Length: 381 software: Heritrix 1.12.0 http://crawler.archive.org hostname: crawling017.archive.org ip: 207.241.227.234 ispartof: testcrawl-20050708 description: testcrawl with WARC output operator: IA_Admin REQUEST WARC/1.0 WARC-Type: request WARC-Target-URI: http://www.archive.org/images/logoc.jpg WARC-Warcinfo-ID: <urn:uuid:d7ae5c10-e6b3-4d27-967d-34780c58ba39> WARC-Date: 2006-09-19T17:20:24Z Content-Length: 236 WARC-Record-ID: <urn:uuid:4885803b-eebd-4b27-a090-144450c11594> Content-Type: application/http;msgtype=request WARC-Concurrent-To: <urn:uuid:92283950-ef2f-4d72-b224-f54c6ec90bb0> RESPONSE WARC/1.0 WARC-Type: response WARC-Target-URI: http://www.archive.org/images/logoc.jpg WARC-Warcinfo-ID: <urn:uuid:d7ae5c10-e6b3-4d27-967d-34780c58ba39> WARC-Date: 2006-09-19T17:20:24Z WARC-Block-Digest: sha1:uzy6nd6cchxetfvjd2mss7zenmwf7kq2 WARC-Payload-Digest: sha1:cchxetfvjd2muzy6nd6ss7zenmwf7kq2 WARC-IP-Address: 207.241.233.58 WARC-Record-ID: <urn:uuid:92283950-ef2f-4d72-b224-f54c6ec90bb0> Content-Type: application/http;msgtype=response WARC-Identified-Payload-Type: image/jpeg Content-Length: 1902

MAFF MOZILLA ARCHIVE FILE FORMAT http://maf.mozdev.org/maff-specification.html + ZIP

JSON Javascript object notation { "feed": { "data": [ { "created_time": "2017-05-16T08:43:07+0000", "message": "Är du nyfiken på hur Göteborg växer? Besök utställningen Hela Gö Göteborg är en stad som växer, snabbt och mycket. Just nu pågår en stor satsning att Mer information och detaljerat program hittar du på https://stadsutveckling.goteborg "story": "Göteborgs Stad added an event.", "id": "297953796980527_451460041868143" }, { "created_time": "2017-05-15T13:47:16+0000", "message": "Ge oss ett par minuter av din tid och dina åsikter! Scandinavi Välkommen att besöka oss i stadens container. Du träffar oss på olika platser i Göteborg. 17 maj kl 13-17 vid Netto, Backa-Röd 18 maj kl 13.00-19.00, utanför Frölunda Torg 20 maj kl 13.00-17.00, Gustaf Adolfs Torg 24 maj kl 11.00-16.00, vid Tuve Torg 30 maj kl 10.00-18.00, i Nordstan 31 maj kl 10.00-18.00, i Nordstan Eller tyck till i formuläret på https://stadsutveckling.goteborg.se/evenemangsomrade "story": "Göteborgs Stad added an event.",

Åtkomst Besluta om och isåfall hur tillgängliggörandet av det arkiverade materialet ska ske.

Vad kan tillgängligöras? Av upphovsrättsliga skäl kan det vara omöjligt att publicera sina webbinsamlingar på det publika internet.

Med vilken teknik? Web Archive Player

Värdering/Urval Vilka specifika webbkanaler ska bevaras?

Urvalskriterier Allt som är tillgängligt via Internet från de myndigheter Regionarkivet är arkivmyndighet för förutom: interna webbsidor lösenordsskyddade webbsidor databaser bakom webbformulär

Urvalskriterier Alla stadens externa digitala kanaler ska registreras.

Datafångst Hur bevarandet ska gå till, vilka verktyg ska användas, vilka filformat ska arkiveras m.m.

Scraping, Crawling Samma lika, men skillnad Crawling - Iterativt hitta länkar och göra något med dom. Scraping - Extrahera (specifik) data från webbsidor och göra något med den

Crawling inte bästa sättet Det vanliga verktygen funkar dåligt eller inte alls Heritrix HTTrack

De enklaste lösningarna PDF + Kräver Inga särskilda kunskaper + Kräver Ingen särskild utrustning + Arkivsäkert + Sannolikt ok utifrån TOS + Bevarar utseende - Ostrukturerad data - Begränsade presentationsmöjligheter

De enklaste lösningarna MAFF + Kräver Inga särskilda kunskaper + Kräver Ingen särskild utrustning + Hyfsat Arkivsäkert + Sannolikt ok utifrån TOS + Bevarar utseende och upplevelse - Data strukturerad efter utseende - Begränsade presentationsmöjligheter

WARCPROX + Hyfsat Arkivsäkert + Bra presentationsmöjligheter + Bevarar utseende och upplevelse + Sannolikt ok utifrån TOS - Kräver särskilda kunskaper - Data strukturerad efter utseende

WARCPROX As a service

Skrapning av webbsidor + Arkivsäkert + Data strukturerad efter vad det representerar + Data strukturerad efter vad det representerar + Skräddarsydda presentationsmöjligheter - Bevarar inte utseende - Kräver särskilda kunskaper - Datastruktur kan ändras när som helst - Strider med största sannolikhet mot TOS

Skrapning av API:er + Arkivsäkert + Data strukturerad efter vad det representerar + Skräddarsydda presentationsmöjligheter - Bevarar inte utseende - Kräver särskilda kunskaper - Datastruktur kan ändras när som helst - Strider med största sannolikhet mot TOS Twitter: https://github.com/docnow/twarc Facebook: https://developers.facebook.com/tools/explorer/

Tack för uppmärksamheten Kontakt: andreas.segerberg@arkivnamnden.goteborg.se