Svenska Dagbladet API – nyhetssökning

Inför 24hbc så lanserade SvD ett API med vilket man kan söka bland tidningens alla artiklar. APIet ger tillgång till ca 450.000 artiklar och blogginlägg, för varje artikel så får man meta-data som tex vem som är författaren, när den publicerades, titel och en kort beskrivning etc. Tyvärr så får man inte tillgång till hela artikeltexten, istället får man en länk till sidan på SvD.se där artikeln finns publicerad.

API anrop och resultat

Ett anrop till Svenska Dagbladets sök-API har grundformatet http://www.svd.se/search.do?q=, en sökning efter artiklar om musik mashups ser alltså ut så här <http://www.svd.se/search.do?q=musik+mashup>. Ett sådant API-anrop är samma sak som att göra sökningen direkt på svd.se, vill man istället ha resultatet i JSON eller RSS så måste man använda parametern output, tex <http://www.svd.se/search.do?q=musik+mashup&output=json>. APIet är öppet för alla att använda, och det krävs ingen API-nyckel, enligt Johan Möller på SvD så kanske det kommer senare, det beror på hur APIet används.

Den data man får tillbaka från ett API-anrop innehåller dels lite metadata som vilken sökning som gjordes, antalet artiklar som returnerades etc. För varje artikel så får man veta vilken typ det är (tex “article” eller “blogg”), vem som är författaren och lite annat, här är ett exempel (jag har förkortat “description” av plastskäl):

"type": "article",
"title": "Världsarkivet där alla vill vara",
"url": "http://www.svd.se/kulturnoje/understrecket/artikel_543089.svd",
"description": "...smallest sales”. Som en följd är sajten också en ...",
"section": "Kultur & Nöje > Under strecket",
"author": "Pelle Snickars",
"date": "2007-10-30T09:55+02:00"

Sökparametrar

Med sökningar via APIet så har man tillgång till samma parametrar som man har via sökningar direkt från svd.se, några exempel är:

  • q – vad du egentligen söker efter, den enda parameter som måste vara med.
  • output – “json” eller “rss”, anger vilket format som APIet returnerar
  • type – tex “article”, “blogg” eller “review”
  • author – begränsa sökningen till artiklar endast av en journalist/källa, tex author=TT för att endast få fram artiklar som kommer från Tidningarnas Telegrambyrå
  • sectionX – ange vilken avdelning eller sektion av SvD som artikeln tillhör, för den första sektionen heter parametern section1, för den andra section2 etc. En sökning efter artiklar från Kultur och Nöje och avdelningen Musik har alltså parametrarna section1=Kultur %26 Nöje&section2=MusikExempel på sökfilter från SvD
  • timeRange – ange inom vilken tidsperiod från dagens datum som artikeln ska ha publicerats, tex timeRange=7day för att hitta artiklar från de senaste 7 dagarna
  • year – vilket år som artikeln publicerades

Ännu finns ingen dokumentation på APIet, så det finns fler parameterar än vad jag har nämnt här. Det bästa sättet att hitta vilka parameterar som finns och vilket format de har är att göra en sökning på svd.se och sedan ta en titt i högerspalten där man kan filtrera sin sökning. Alla parametrar som används för dessa filter kan också användas i APIet.

Om ni har använt SvDs API så hör gärna av er. Jag skriver gärna ett inlägg om er applikation och om era erfarenheter av APIet.