Denne veilederen utfases og vil ikke bli vedlikeholdt. Den var ment for å brukes sammen DCAT-AP-NO v.2.x som fases ut. Til DCAT-AP-NO v.3+ er det bestemt at det ikke skulle lages egne veiledere. |
Status: utfases
Versjon: 2.0
Publisert: 2019-06-30
Oppdatert: 2021-07-09
Gjeldende versjon: https://data.norge.no/guide/veileder-beskrivelse-av-datasett/
Forrige versjon: https://data.norge.no/guide/veileder-beskrivelse-av-datasett/v1
Redaktørens utkast: https://informasjonsforvaltning.github.io/veileder-beskrivelse-av-datasett/
Om denne veilederen
Hensikt og avgrensing
Denne veilederen skal bidra til bedre beskrivelser av datasett, datatjenester og datakataloger. For offentlige virksomheter kan dette være en del av prosessene for å skape orden i eget hus, oppnå mer gjenbruk av data mellom offentlige virksomheter og å gjøre mer åpne offentlige data tilgjengelig for næringsliv og sivilsamfunn. Se Veileder for orden i eget hus for hvordan din virksomhet skaper orden i eget hus, bl.a. hvordan kartlegge hvilke data som skal beskrives.
Denne veilederen tar utgangspunktet i at din virksomhet har kartlagt hvilke data som skal beskrives. Veilederen skal gi en hjelp i å beskrive datasett og datatjenester i henhold til Standard for beskrivelse av datasett, datatjenester og datakataloger (DCAT-AP-NO) v.2, slik at beskrivelsene lettere kan forstås og brukes av andre.
Det er ikke et mål for denne veilederen å beskrive alle klasser og egenskaper i DCAT-AP-NO. Gi oss beskjed hvis det er ting som du savner veiledning av, fortrinnsvis meldes inn på Github Issues og med konkrete eksempler på data.
Denne veilederen er ikke en teknisk og normativ spesifikasjon. For normative beskrivelser av alle klasser og egenskaper i DCAT-AP-NO, se DCAT-AP-NO og valideringsreglene (shacl). Ikke alle eksempler i denne veilederen er komplette, heller ikke med tanke på obligatoriske egenskaper.
Denne veilederen er ikke en direkte veiledning for bruk av registreringsverktøyet i Fellesdatakatalogen.
Målgruppe
Målgruppen for denne veilederen er primært deg som skal beskrive datasett, datatjenester og datakataloger i din virksomhet i henhold til DCAT-AP-NO v.2.
Sekundært kan også veilederen brukes av deg som skal utvikle/tilpasse verktøystøtte i virksomhetene for beskrivelser av datasett/datatjenester/datakataloger og/eller eksponering av slike beskrivelser i henhold til DCAT-AP-NO v.2.
Struktur
Denne veilederen forklarer hvordan du beskriver følgende i henhold til DCAT-AP-NO v.2:
-
et datasett (se under Beskrivelse av datasett)
-
en distribusjon av et datasett (se under Beskrivelse av distribusjon)
-
en datatjeneste (se under Beskrivelse av datatjeneste)
-
en (data)katalog (se under Beskrivelse av katalog)
Veilederen inneholder også veiledning ang. noen utvalgte temaer som går på tvers av ovennevnte:
Navnerom som er brukt i denne veilederen
Prefiks |
Navnerom |
Forklaring/navn |
adms |
||
cpsv |
||
cpsvno |
||
dcat |
||
dct |
||
dqv |
||
dqvno |
||
eli |
||
foaf |
||
locn |
||
modelldcatno |
Spesifikasjon for beskrivelse av informasjonsmodeller (ModellDCAT-AP-NO) |
|
oa |
||
odrl |
||
owl |
||
prov |
||
provno |
Norsk applikasjonsprofil av PROV-O |
|
rdfs |
||
skos |
||
time |
||
vcard |
||
xkos |
An SKOS extension for representing statistical classifications |
|
xsd |
Beskrivelse av datasett
Se Veileder for orden i eget hus for hvordan din virksomhet kartlegger hvilke datasett som skal beskrives.
Hovedhensikten med å beskrive et datasett er at andre (internt eller eksternt) lettere skal kunne forstå hva slags datasett du har, for bl.a. å kunne vurdere om de kan gjenbruke/viderebruke dette datasettet fra deg.
For at andre skal kunne forstå dine beskrivelser, er det visse spilleregler for hvordan et datasett skal/bør/kan beskrives.
Dette kapittelet forklarer hvordan et datasett beskrives i henhold til kravene i forvaltningsstandarden DCAT-AP-NO v.2, dog uten at du må kunne DCAT-AP-NO.
For deg som skal utvikle/tilpasse verktøystøtte for datasettbeskrivelse i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.
Eksempel på en datasettbeskrivelse
Under er et eksempel på en datasettbeskrivelse, med dummydata, hvor uthevede egenskaper er obligatoriske:
Eksemplet ovenfor i RDF Turtle:
@prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix vcard: <http://www.w3.org/2006/vcard/ns#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix : <https://example.org/> . <https://example.org/eksempeldata> a dcat:Dataset ; ### obligatoriske egenskaper: dct:identifier "https://example.org/eksempeldata"^^xsd:anyURI ; # identifikator dct:title "Eksempeldatasett"@nb ; # tittel dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/999999999> ; # utgiver, med dummy-org.nr. dct:description "Datasett med testdata"@nb ; dcat:theme <http://publications.europa.eu/resource/authority/data-theme/GOVE> ; # tema, Forvaltning og offentlig sektor ### anbefalte egenskaper: dct:subject <http://publications.europa.eu/resource/authority/dataset-type/TEST_DATA> ; # begrep, 'testdata' dct:spatial <http://publications.europa.eu/resource/authority/country/NOR> ; # dekningsområde, Norge dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/DAILY> ; # frekvens, daglig oppdatering dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ; # tilgangsnivå, offentlig ### valgfrie egenskaper: dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; # språk, norsk bokmål dcat:contactPoint [ a vcard:Organization ; # kontaktpunkt, med dummy data vcard:hasEmail <mailto:eks@direks.eks> ; # e-post vcard:organization-unit "Direktoratet for eksempler" ; # navn ] ; dcat:distribution [ a dcat:Distribution ; # distribusjon, med dummy data ### obligatoriske egenskaper: dcat:accessURL <https://example.org/eksempeldata.csv> ; # tilgangsURL, med dummy URL ### anbefalte egenskaper: dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # lisens ] ; .
Obligatoriske egenskaper i en datasettbeskrivelse
Som et minimum skal følgende tas med i en datasettbeskrivelse:
-
Datasett - beskrivelse: beskrivelse av datasettet.
-
Datasett - identifikator: identifikator til datasettet.
-
Datasett - tema: tema som datasettet kan sorteres under.
-
Datasett - tittel: navnet på datasettet.
-
Datasett - utgiver: aktør (organisasjon) ansvarlig for å gjøre datasettet tilgjengelig.
Datasett - beskrivelse
For at andre skal kunne vite hva slags datasett du har, skal du oppgi en kort og presis beskrivelse av datasettet.
-
Beskrivelsen skal være kortfattet slik at lister over datasett forståes ved å lese de første linjene.
-
Hensikten med datasettet bør komme fram (f.eks. “Løsøreregisteret inneholder tinglyste flyttbare eiendeler”).
-
Beskriv hva datasettet inneholder. Hvilke opplysninger som utgjør kjernen i datasettet bør angis.
-
Feltinnhold skal ikke listes her i beskrivelsen, men i Datasett - emneord eller Datasett - begrep.
-
Beskrivelsen er ikke en gjentakelse av Datasett - tittel.
-
Bruk folkelige ord (f.eks. “Løsøre” forklares som “flyttbare eiendeler (Løsøre)”, ev. bare folkelige uttrykk mens faguttrykket tas med som Datasett - emneord slik at det gir treff i søk).
-
Beskriv avgrensninger, hva datasettet ikke inneholder, dersom dette kan misforstås ut fra tittelen.
-
Begrens bruk av lenker og markup (formatering) i teksten. Skal man angi språk må teksten formelt sett være fri for lenker og formatering (HTML).
-
“Løsøreregisteret inneholder løsøre med unntak av skip og luftfartøy” Et lite folkelig ord (løsøre) er brukt. Avgrensningene her er greie.
-
“Løsøreregisteret inneholder tinglyste flyttbare eiendeler som biler og båter” Hva som inngår i datasettet er godt beskrevet, men unntakene her er utelatt.
-
“Løsøreregisteret inneholder tinglyste flyttbare eiendeler med unntak av skip og luftfartøy”
Dette tilsvarer Datasett: beskrivelse (dct:description
) i DCAT-AP-NO.
-
Der målform er kjent skal språkkoden "nb" (bokmål) eller "nn" (nynorsk) brukes, "no" (norsk) brukes ellers.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:description "Løsøreregisteret inneholder tinglyste flyttbare eiendeler med unntak av skip og luftfartøy"@nb .
Datasett - identifikator
For å kunne referere til et datasett er det nødvendig å tilordne datasettet en identifikator. Identifikatoren er som regel systemgenerert av verktøyet som brukes til å beskrive et datasett, slik at du som vanlig bruker ikke trenger å oppgi verdien til denne egenskapen manuelt.
Dette tilsvarer Datasett: identifikator (dct:identifier
) i DCAT-AP-NO, se Om identifikator (dct:identifier
).
Datasett - tema
For å kunne sortere datasettet inn under gitte kategorier er det nødvendig å tilordne "tema" til datasettet.
-
Ett eller flere temaer skal velges fra EUs kontrollerte liste over temaer.
-
Ett eller flere temaer bør velges fra den norske LOS.
-
Helse (
HEAL
fra EU-listen) -
Helsestasjon (
helsestasjon
fra LOS)
Dette tilsvarer Datasett: tema (dcat:theme
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:theme <http://publications.europa.eu/resource/authority/data-theme/HEAL> , # helse <https://psi.norge.no/los/ord/helsestasjon> . # helsestasjon
Datasett - tittel
For at andre lett skal kunne se hva datasettet ditt omhandler når datasettet f.eks. er listet opp blant mange andre datasett, er det nødvendig å gi datasettet ditt en tittel.
-
Tittelen skal være kortfattet, kunne stå alene og gi mening.
-
Organisasjonens navn trenger ikke å være med, med mindre det er spesielt relevant for datasettets innholdsmessige utvalg.
-
Tittelen skal gjenspeile avgrensninger dersom datasettet er avgrenset i populasjonen - populasjonen er avgrenset av geografi eller formål, f.eks. “… med støtte i Lånekassen”, “… i Oslo”, “Folketellingen av 1910”. Der populasjonen ikke er avgrenset angis IKKE dette (f.eks. valgkrets)
-
Forkortelser skal skrives helt ut (DTM10 erstattes av “Digital Terrengmodell 10m oppløsning (DTM10)” . Bruk eventuelt Datasett - emneord til forkortelser. Målgruppen er personer som ønsker å finne relevante datasett raskt, unngå derfor interne navn eller forkortelser i tittel. I det offentlige opererer man ofte med flere titler eller navn på ting. Et datasett kan ha et offisielt navn, et kortnavn og en forkortelse. For eksempel: Datasettet “Administrative enheter i Norge” har ABAS som forkortelse. Det er sjelden man bruker den fulle tittelen, så for å gjøre et datasett mest mulig søkbart er det behov for at man kan registrere kortnavn, forkortelser og/eller alternative titler.
-
Lov- eller forskriftshjemlede navn bør brukes i tittel (f.eks. Jegerregisteret)
-
“Bomstasjoner i Norge”
-
“Statens vegvesens oversikt over Bomstasjoner i Norge”
-
“Digital Terreng Modell 10m oppløsning (DTM10)”
-
“DTM10”
Dette tilsvarer Datasett: tittel (dct:title
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:title "Bomstasjoner i Norge"@nb .
Datasett - utgiver
For at andre lett skal kunne se hvem som er ansvarlig for at datasettet ditt er tilgjengelig (ikke nødvendigvis samme som den som faktisk gjør datasettet tilgjengelig), er det nødvendig å oppgi utgiver.
-
Skal peke på en virksomhet (juridisk person, organisasjonsledd, underenhet).
-
Utgiveren av datasettet forvalter sammensetning av dataene, altså datasettet, og ikke nødvendigvis selve dataene.
-
Arbeids- og velferdsetaten
Dette tilsvarer Datasett: utgiver (dct:publisher
) i DCAT-AP-NO.
Inntil https://data.brreg.no tilbyr RDF-baserte metadata basert på organisasjonsnummeret (orgnummer), skal følgende mønster benyttes: https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/{orgnummer}
.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/889640782> . #NAV
Anbefalte egenskaper i en datasettbeskrivelse
Følgende opplysninger bør du ta med i en datasettbeskrivelse hvis de finnes:
-
Datasett - begrep: begrep som er viktig for å forstå og tolke datasettet.
-
Datasett - ble generert ved: aktivitet ved hvilken datasettet ble generert.
-
Datasett - datasettdistribusjon: tilgjengelig distribusjon av datasettet.
-
Datasett - dekningsområde: geografisk område dekket av datasettet.
-
Datasett - emneord: emneord (søkeord) dekket av datasettet.
-
Datasett - følger: regelverk som datasettet følger.
-
Datasett - kontaktpunkt: kontaktpunkt ved spørsmål om datasettet.
-
Datasett - tidsrom: tidsrom dekket av datasettet.
-
Datasett - tilgangsnivå: i hvilken grad datasettet kan bli gjort tilgjengelig.
Datasett - begrep
For at andre lett skal kunne forstå typer innhold i datasettet ditt, skal du knyttet datasettet til relevante begrepsdefinisjoner hvis de finnes.
-
Innholdstyper i datasettet beskrives med referanse til begreper i begrepskatalog.
-
Dersom det ikke kan benyttes en begrepskatalog brukes Datasett - emneord.
-
Løsøre, Pant, Tinglysing
Et datasett bør knyttes til de aktuelle og sentrale begrepene i en begrepskatalog. Ved å henvise til gjennomarbeidede definisjoner som forvaltes av din virksomhet eller andre, sikrer vi at det er tydelig hvordan et begrep brukt i datasettet skal forstås og at denne forståelsen til en hver tid er riktig og oppdatert. Vi ønsker at alle datasettene skal ha lenker til de aktuelle begrepene i virksomhetens katalog, slik at det er tydelig definert hva begrepene innebærer.
I Referansekatalogen finner du relevante forvaltningsstandarder for bruksområdet "Begrepsanalyse og definisjonsarbeid".
Dette tilsvarer Datasett: begrep (dct:subject
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:subject <http://brreg.no/begrepskatalog/begep/løsøre>, <http://brreg.no/begrepskatalog/begep/pant>, <http://brreg.no/begrepskatalog/begep/tingslysning> .
Datasett - ble generert ved
Hvilken type aktivitet dine data ble generert ved, kan ha betydning for dem som skal vurdere gjenbruk/viderebruk av dine data. Du skal derfor oppgi dette hvis det er mulig.
Det anbefales å bruke en av følgende verdier:
-
ved vedtak
: datasettet ble generert som et resultat / ifm. et vedtak. Eksempel: skatteoppgjør. -
ved innhenting fra tredjepart
: datasettet ble hentet inn fra en tredjepart. Eksempel: preutfylt skattemelding. -
ved innhenting fra brukeren
: datasettet ble generert på grunnlag av data fra brukeren. Eksempel: innlevert skattemelding.
-
ved vedtak
Dette tilsvarer Datasett: ble generert ved (prov:wasGeneratedBy
) i DCAT-AP-NO.
Følgende predefinerte instanser av prov:Activity
skal brukes:
-
ved vedtak:
provno:administrativeDecision
-
ved innhenting fra tredjepart:
provno:collectingFromThirdParty
-
ved innhenting fra brukeren:
provno:collectingFromUser
Eksempel i RDF Turtle:
@prefix provno: <https://data.norge.no/vocabulary/provno#> . <etDatasett> a dcat:Dataset ; prov:wasGeneratedBy provno:administrativeDecision . # vedtak
Datasett - datasettdistribusjon
Hvis datasettet ditt er gjort tilgjengelig skal du beskrive hvor det faktiske datasettet finnes (f.eks. hvor datafilen kan lastes ned), slik at andre skal kunne få tak i datasettet ditt.
-
Det angis i utgangspunktet en distribusjon per fil, feed eller API
-
Dersom det er ett API som leverer flere filformater angis det som en distribusjon
-
Se også under Sammenheng mellom datasett, begrep, distribusjon, datatjeneste og informasjonsmodell
Dette tilsvarer Datasett: datasettdistribusjon (dcat:distribution
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:distribution <enDistribusjon> . # refererer til en beskrivelse av en distribusjon
Datasett - dekningsområde
Hvis datasettet ditt kun har innhold fra visse geografiske områder, skal du oppgi dette. Datasettet “Observert hekking av grågås i Oppdal” har f.eks. kommune Oppdal som sitt geografiske dekningsområde.
-
Minst en av verdiene skal være fra kontrollerte vokabularer Continent, Country, Place eller GenNames.
-
Administrative enheter fra Kartverket bør brukes for å angi geografiske områder i Norge.
-
Flere områder kan angis om relevant.
-
Norge (lenke: http://publications.europa.eu/resource/authority/country/NOR)
-
Oppdal (lenke: https://data.geonorge.no/administrativeEnheter/kommune/id/172879)
Dette tilsvarer Datasett: dekningsområde (dct:spatial
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:spatial <http://publications.europa.eu/resource/authority/country/NOR> , # Norge <https://data.geonorge.no/administrativeEnheter/kommune/id/172879> ; # Oppdal .
Datasett - emneord
Ord og uttrykk som hjelper brukeren til å finne datasettet og som ikke kan knyttes til publiserte begrepsdefinisjoner, inkluderes som emneord.
-
Angi synonymer til hjelp i søk
-
Angi sentralt innhold i datasettet som ikke finnes begrepsdefinisjoner for ennå
-
uførepensjon, uførepensjonister, uførereform
Dette tilsvarer Datasett: emneord (dcat:keyword
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:keyword "uførepensjon"@nb, "uførepensjonister"@nb, "uførereformen"@nb .
Datasett - følger
Hvis (oppretting og/eller forvaltning av) datasettet ditt følger gitte regelverk, skal det opplyses om.
-
Angi referanse til regelverk som datasettet følger, og derfra referanse til ev. lovhjemmel.
-
Regel for skjerming, med lenke til lovhjemmel.
-
Regel for utlevering, med lenke til lovhjemmel.
-
Behandlingsgrunnlag, med lenke til lovhjemmel.
Dette tilsvarer Datasett: følger (cpsv:follows
) i DCAT-AP-NO.
Det er predefinerte instanser av cpsv:Rule
for hhv. skjermingsregel (cpsvno:ruleForNonDisclosure
), utleveringsregel (cpsvno:ruleForDisclosure
) og behandlingsgrunnlag (cpsvno:ruleForDataProcessing
), som bør brukes ved angivelse av de aktuelle typer regelverk.
Eksempel i RDF Turtle:
@prefix cpsvno: <https://data.norge.no/vocabulary/cpsvno#> . <etDatasett> a dcat:Dataset ; cpsv:follows [ a cpsv:Rule ; dct:type cpsvno:ruleForNonDisclosure ; # skjermingsregel cpsv:implements [ a eli:eli:LegalResource ; # regulativ ressurs dct:type <lov> ; # type ressurs (obligatorisk egenskap) rdfs:seeAlso "https://lovdata.no/NL/lov/2016-05-27-14/§3-1" ; # referanse dct:title "Skatteforvaltningsloven §3-1"@nb ; # tittel ] ; ] , [ a cpsv:Rule ; dct:type cpsvno:ruleForDisclosure ; # utleveringsregel cpsv:implements [ a eli:LegalResource ; # regulativ ressurs dct:type <lov> ; # type ressurs (obligatorisk egenskap) rdfs:seeAlso "https://lovdata.no/NL/lov/2016-05-27-14/§3-3" ; # referanse dct:title "Skatteforvaltningsloven §§ 3-3 til 3-9"@nb ; # tittel ] ; ] , [ a cpsv:Rule ; dct:type cpsvno:ruleForDataProcessing ; # behandlingsgrunnlag cpsv:implements [ a eli:LegalResource ; # regulativ ressurs dct:type <lov> ; # type ressurs (obligatorisk egenskap) rdfs:seeAlso "https://lovdata.no/NL/lov/2016-05-27-14/§3-3" ; # referanse dct:title "Skatteforvaltningsloven §§ 3-3 til 3-9"@nb ; # tittel ] ; ] ; . <lov> a skos:Concept , eli:ResourceType ; # ressurstype 'lov' skos:prefLabel "lov"@nb ; # anbefalt term skos:definition "rettsregler som fastsetter rettigheter og plikter"@nb ; # definisjon .
Kommentaren til rdfs:seeAlso i DCAT-AP-NO sier "for referanse til Lovdata bør ELI-URI brukes". I RDF-eksemplet ovenfor er ELI-URI imidlertid ikke brukt. Dette fordi det p.t. ikke er knyttet funksjonalitet til ELI-URI for henvisninger til deler av en lov, f.eks. §3-3. Det vil si at det for øyeblikket er mulig å henvise til deler ved å bruke ELI, f.eks. https://lovdata.no/eli/lov/2016/05/27/14/nor/section/3-3, men oppslaget vil lede til en hel lov og ikke til §3-3.
|
Datasett - kontaktpunkt
For at andre skal kunne kontakte utgiveren av et datasett, bør kontaktinformasjonen til utgiveren oppgis.
-
Angi kontaktinformasjonen som kan brukes ved henvendelser om et datasett.
-
Vi anbefaler sterkt å bruke organisatoriske enheter og ikke enkeltpersoner som kontaktpunkt.
-
Opplysningsavdelingen, Brønnøysundregistrene
Dette tilsvarer Datasett: kontaktpunkt (dcat:contactPoint
) i DCAT-AP-NO.
Vcard benyttes for å beskrive kontaktpunktet.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:contactPoint [ a vcard:Organization ; # kontaktpunkt vcard:hasEmail <mailto:OA-fagstillinger@brreg.no> ; # e-post vcard:organization-unit "Opplysningsavdelingen, Brønnøysundregistrene" ; # navn ] .
Datasett - tidsrom
Hvis innholdet i et datasett dekker et avgrenset tidsrom, skal dette opplyses om.
-
Angi tidsmessig avgrensning dersom datasett kun har innhold fra visse perioder. For mange datasett knyttet til registerfunksjoner vil tidsrom være direkte koblet mot oppdateringsfrekvens. For andre datasett vil tidsrom være vesentlig i forhold til forståelse av bruk av dataene, f.eks. folketellinger.
-
Dersom det er angitt en periode med årstall, tolkes dette som fra og med 1. januar første år til og med 31. desember siste år.
-
Ved ett årstall på begynnelse, men ikke angitt slutt, tolkes det at datasettet har data også i en ubestemt fremtid og tilsvarende om startdatoen mangler antas det at det er ikke angitt om datasettet har en start.
-
Dersom datasettet er en av flere i en tidsserie anbefales det at det lages et overordnet datasett for tidsserien uten distribusjoner som peker på hvert datasett. Se også under Beskrivelse av tidsserie/datasettserie.
-
Det benyttes tidsstempel for registreringen av første og siste dataelement i datasettet.
-
Det kan angis flere tidsperioder per datasett, men det anbefales at periodene ikke er overlappende.
-
“1901”
Dette tilsvarer Datasett: tidsrom (dct:temporal) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:temporal [ a dct:PeriodOfTime ; dcat:startDate "1901-01-01"^^xsd:date ; dcat:endDate "1901-12-31"^^xsd:date ; ] .
Datasett - tilgangsnivå
Uansett om datasettet ditt er gjort tilgjengelig eller ikke, bør du oppgi i hvilken grad datasettet kan bli gjort tilgjengelig for allmennheten, såkalt tilgangsnivå.
-
Angi om datasettet er helt eller delvis skjermet for innsyn, ved å bruke en av verdiene fra EU sitt kontrollerte vokabular Access right: f.eks. "offentlig" (
PUBLIC
). -
Skal gjenspeile det mest begrensede feltet/opplysningen i datasettet.
-
Varianter av datasettet kan være offentlig ved at det utelater de felt som gjør at det opprinnelige datasettet er begrenset teller unntatt offentlighet.
-
Ved bruk av verdiene "begrenset offentlighet" og "unntatt offentlighet" er egenskapen Datasett - følger anbefalt.
Enhetsregisteret (hele):
-
begrenset offentlighet
Enhetsregisteret - Juridisk person (hovedenhet):
-
offentlig
Dette tilsvarer Datasett: tilgangsnivå (dct:accessRights
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> .
Valgfrie egenskaper i en datasettbeskrivelse
I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i en datasettbeskrivelse:
-
Datasett - annen identifikator: sekundær identifikator til datasettet.
-
Datasett - dokumentasjon: referanse til side eller dokument som beskriver datasettet ytterligere.
-
Datasett - eksempeldata: referanse til eksempeldata av datasettet.
-
Datasett - endringsdato: dato for siste oppdatering av datasettet.
-
Datasett - er del av: datasett som dette datasettet er en del av.
-
Datasett - er påkrevd av: datasett som er avhengig av dette datasettet.
-
Datasett - er referert av: datasett som refererer til dette datasettet.
-
Datasett - er versjon av: datasett som dette datasettet er en versjon av.
-
Datasett - erstatter: datasett som dette datasettet erstatter.
-
Datasett - erstattes av: datasett som er erstattet av dette datasettet.
-
Datasett - frekvens: oppdateringsfrekvens av innholdet i datasettet.
-
Datasett - har del: datasett som inngår i dette datasettet.
-
Datasett - har kvalitetsnote: tekstlig beskrivelse av kvalitet på datasettet.
-
Datasett - har måleresultat: kvantifiserbar beskrivelse av kvalitet på datasettet.
-
Datasett - har versjon: datasett som er versjon av dette datasettet.
-
Datasett - i samsvar med: standard/spesifikasjon (inkl. informasjonsmodell) som datasettet er i samsvar med.
-
Datasett - kilde: datasett som dette datasettet er avledet fra.
-
Datasett - krever: datasett som dette datasettet er avhengig av.
-
Datasett - kvalifisert kreditering: aktør som har en eller annen form for ansvar for datasettet.
-
Datasett - kvalifisert relasjon: beslektet ressurs (f.eks. en publikasjon)
-
Datasett - landingsside: nettside som gir tilgang til datasettet, tilleggsinfo om datasettet etc.
-
Datasett - opphav: beskrivelse av endring i eierskap og forvaltning av datasettet.
-
Datasett - produsent: aktør som har produsert datasettet.
-
Datasett - refererer til: en annen ressurs som kan være nyttig for brukere av datasettet å være oppmerksom på.
-
Datasett - relatert ressurs: annen beslektet ressurs.
-
Datasett - romlig oppløsning: minst romlig oppløsning for datasettet.
-
Datasett - språk: språk datasettet er på.
-
Datasett - tidsoppløsning: miste oppløsning i tidsperiode i datasettet.
-
Datasett - type: datasettets type.
-
Datasett - utgivelsesdato: dato for den formelle utgivelsen av datasettet.
-
Datasett - versjon: versjonsnummer eller annen versjonsbetegnelse for datasettet.
-
Datasett - versjonsnote: beskrivelse av forskjellene mellom denne og en tidligere versjon av datasettet.
Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.
Datasett - annen identifikator
<ikke beskrevet, tilsvarer Datasett: annen identifikator (adms:identifier
) i DCAT-AP-NO>
Datasett - dokumentasjon
Utdypende dokumentasjon av datasettet angis ved å peke på en side der den finnes.
Dette tilsvarer Datasett: dokumentasjon (foaf:page
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; foaf:page <https://confluence.brreg.no/display/DBNPUB/Informasjonsmodell+for+Enhetsregisteret+og+Foretaksregisteret> .
Datasett - eksempeldata
Benyttes for å gi eksempeldata for et datasett, og hvordan en faktisk distribusjon ser ut.
-
Dersom datasettet inneholder personopplysninger vil det være nyttig for bruker å se et eksempeldatasett som f.eks. viser en anonymisert rad i datasettet.
Dette tilsvarer Datasett: eksempeldata (adms:sample
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; adms:sample <distribusjonAvEksempeldata> . <distribusjonAvEksempeldata> a dcat:Distribution ; dcat:accessURL <https://example.org/eksempeldata.csv> .
Datasett - endringsdato
For at andre skal kunne vite når datasettet sist ble oppdatert angis tidspunkt for siste endring.
-
Tidspunktet angir når innholdet i datasettet sist er endret.
-
01.01.2017
Dette tilsvarer Datasett: endringsdato (dct:modified
) i DCAT-AP-NO.
-
Angis som dato (
xsd:date
) eller tidspunkt (xsd:dateTime
).
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:modified "2017-01-01"^^xsd:date .
Datasett - er del av
Brukes til å angi at det aktuelle datasettet er en delmengde at et annet datasett.
-
Der registre oppdeles i mindre datasett skal relasjonen brukes. F.eks. er datasettet Underenheter er del av datasettet Enhetsregisteret.
-
Den motsatte relasjonen Datasett - har del brukes til å uttrykke at et datasett består av andre datasett.
Dette tilsvarer Datasett: er del av (dct:isPartOf
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<underenheter> a dcat:Dataset ; dct:isPartOf <enhetsregisteret> . <enhetsregisteret> a dcat:Dataset .
Datasett - er påkrevd av
Brukes til å referere til annet datasett som det aktuelle datasettet er nødvendig for.
Dette tilsvarer Datasett: er påkrevd av (dct:isRequiredBy
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<datasettA> a dcat:Dataset ; dct:isRequiredBy <datasettB> . <datasettB> a dcat:Dataset .
Datasett - er referert av
Motsatt av Datasett - refererer til.
<ikke beskrevet, tilsvarer Datasett: er referert av (dct:isReferencedBy
) i DCAT-AP-NO>
Datasett - er versjon av
Brukes til å referere til et annet datasett som det aktuelle datasettet er en versjon av.
-
I prinsippet det samme datasettet, men hvor innholdet er blitt oppdatert f.eks. på bakgrunn av bedret datakvalitet e.l.
Dette tilsvarer Datasett: er versjon av (dct:isVersionOf
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:isVersionOf <forrigeVersjon> . <forrigeVersjon> a dcat:Dataset .
Datasett - erstatter
Motsatt av Datasett - erstattes av.
<ikke beskrevet, tilsvarer Datasett: erstatter (dct:replaces
) i DCAT-AP-NO>
Datasett - erstattes av
Brukes til å referere til et datasett som erstatter dette datasettet.
-
F.eks. kan et kodeverk bli erstattet av en nyere utgave.
Dette tilsvarer Datasett: erstattes av (dct:isReplacedBy
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:isReplacedBy <nyUtgave> . <nyUtgave> a dcat:Dataset .
Datasett - frekvens
Brukes til å beskrive hvor ofte datasettet blir oppdatert.
-
Beskriv hvor ofte datasettet har nytt innhold. For eksempel oppdateres Enhetsregisteret med nye enheter og sletting av enheter kontinuerlig, mens Inntektsdata fra likningen (Skattemelding) er årlig og Folketelling fra 1910 oppdateres aldri.
-
Begreper (og tilhørende URIer) fra EU sitt kontrollerte vokabular for Frequency skal benyttes.
-
Daglig
Dette tilsvarer Datasett: frekvens (dct:accrualPeriodicity
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:accruralPeriodicity <http://publications.europa.eu/resource/authority/frequency/DAILY> .
Datasett - har del
Motsatt av Datasett - er del av.
<ikke beskrevet, tilsvarer Datasett: har del (dct:hasPart
) i DCAT-AP-NO>
Datasett - har kvalitetsnote
Se under Beskrivelse av kvalitet.
Dette tilsvarer Datasett: har kvalitetsnote (dqv:hasQualityAnnotation
) i DCAT-AP-NO.
Datasett - har måleresultat
Se under Beskrivelse av kvalitet.
Dette tilsvarer Datasett: har måleresultat (dqv:hasQualityMeasurement
) i DCAT-AP-NO.
Datasett - har versjon
<ikke beskrevet, tilsvarer Datasett: har versjon (dct:hasVersion
) i DCAT-AP-NO>
Datasett - i samsvar med
Brukes til å beskrive at et datasett er i henhold til gitt(e) standard(er)/spesifikasjon(er)/informasjonsmodell(er)/o.l.
Se under Sammenheng mellom datasett … og informasjonsmodell for knytting av informasjonsmodell til datasett.
Datasettet er i samsvar med "Produktspesifikasjon NVE flomsoner" som innholdsstandard.
Dette tilsvarer Datasett: i samsvar med (dct:conformsTo
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:conformsTo [ a dct:Standard ; skos:prefLabel "Produktspesifikasjon NVE flomsoner 1.0"@nb ; rdfs:seeAlso <http://sosi.geonorge.no/Produktspesifikasjoner/Produktspesifikasjon_NVE_Flomsoner_1%200.pdf> ; ] .
Datasett - kilde
Brukes til å referere til et datasett som helt eller delvis er en kilde til dette datasettet.
-
Peker til datasettet som helt eller delvis er en kilde for det aktuelle datasettet.
-
Dersom et åpent datasett er basert på et annet hvor personopplysninger er fjernet, kan relasjonen brukes.
-
Et datasett som er avledet fra et annet skal ha en referanse til kilde for det aktuelle datasettet.
-
Dersom det er et utvalg fra et annet datasett bør heller Datasett - er del av brukes.
Dette tilsvarer Datasett: kilde (dct:source
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:source <kildeDatasett> . <kildeDatasett> a dcat:Dataset .
Datasett - krever
Motsatt av Datasett: er påkrevd av.
<tilsvarer Datasett: krever (dct:requires
) i DCAT-AP-NO>
Datasett - kvalifisert kreditering
<ikke beskrevet, tilsvarer Datasett: kvalifisert kreditering (prov:qualifiedAttribution
) i DCAT-AP-NO>
Datasett - kvalifisert relasjon
<ikke beskrevet, tilsvarer Datasett: kvalifisert relasjon (dcat:qualifiedRelation
) i DCAT-AP-NO>
Datasett - landingsside
Brukes til å referere til en side med dokumentasjon om datasettet, som kan beskrive datasettets innhold og struktur, og tilgang. Det anbefales at landingsside brukes der man refererer til utfyllende dokumentasjon, og Datasett - datasettdistribusjon benyttes f.eks. når man vil referere til en søkeside.
-
kan referere til datasettets hjemmeside
-
kan referere til en samleside som beskriver innhold og struktur
-
kan referere til en samleside om nedlasting/bruk/søk (tjenestene)
-
det kan refereres til flere sider
Dette tilsvarer Datasett: landingsside (dcat:landingPage
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:landingpage <https://www.brreg.no/om-oss/samfunnsoppdraget-vart/registera-vare/einingsregisteret/> .
Datasett - opphav
<ikke beskrevet, tilsvarer Datasett: opphav (dct:provenance
) i DCAT-AP-NO>
Datasett - produsent
Brukes til å angi produsent(er) av datasettet der dette er en annen enn utgiver (Datasett - utgiver).
-
Brukes unntaksvis der datasettet er satt sammen av data som andre har produsert.
-
Der produsent er en sammensatt gruppe, vil det ikke være mulig å bruke organisasjonsnummer. I så fall kan produsent oppgis som en instans av
foaf:Agent
.
-
“Samarbeidskommunene A, B og C”
Dette tilsvarer Datasett: produsent (dct:creator
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:creator <samarbeidskommunene> . <samarbeidskommunene> a foaf:Agent ; foaf:name "Samarbeidskommunene A, B og C" .
Datasett - refererer til
Her oppgir du referanse til andre ressurser som det kan være nyttig for brukere å være oppmerksom på.
Dette tilsvarer Datasett: refererer til (dct:references
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:references [ a dcat:Resource ; dct:title "Register over offentlig støtte"@nb ; rdfs:seeAlso <http://brreg.no/catalogs/974760673/datasets/ca04abdd-6327-4833-bd05-7a3dca20e6a5> ] .
Datasett - relatert ressurs
Her kan du angi referanser til andre ressurser (f.eks. andre datasett) som gir supplerende informasjon om innholdet i dette datasettet. Kan f.eks. være å relatere til et annet register.
Dette tilsvarer Datasett: relatert ressurs (dct:relation
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:relation <relatertDatasett> . <relatertDatasett> a dcat:Dataset .
Datasett - romlig oppløsning
<ikke beskrevet, tilsvarer Datasett: romlig oppløsning (dcat:spatialResolutionInMeters
) i DCAT-AP-NO>
Datasett - språk
Her kan du oppgi hvilket språk innholdet til datasettet har.
-
Det er hovedspråket benyttet i datasettets innhold som skal angis.
-
Er datasettet uten språklige tekster angis ikke språk.
-
Inneholder datasett tekster på flere språk, og det ikke er tydelig hva som er hovedspråket, angis ikke språk.
-
Norsk bokmål
Dette tilsvarer Datasett: språk (dct:language
) i DCAT-AP-NO.
-
Språk angis ved å velge fra EUs kontrollerte liste over Language.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> . # Norsk bokmål
Datasett - tidsromsoppløsning
<ikke beskrevet, tilsvarer Datasett: tidsoppløsning (dcat:temporalResolution
) i DCAT-AP-NO>
Datasett - type
Her kan du klassifisere datasettet ditt, f.eks. at datasettet er en kodeliste, slik at det blir mulig å gruppere datasettet ditt sammen med andre kodelister i f.eks. en katalog.
-
EUs kontrollerte vokabular for Dataset type bør brukes.
Dette tilsvarer Datasett: type (dct:type
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<ds1> a dcat:Dataset ; dct:type <http://publications.europa.eu/resource/authority/dataset-type/CODE_LIST> . # kodeliste <ds2> a dcat:Dataset ; dct:type <http://publications.europa.eu/resource/authority/dataset-type/SYNTHETIC_DATA> . # kunstig data <ds3> a dcat:Dataset ; dct:type <http://publications.europa.eu/resource/authority/dataset-type/TEST_DATA> . # testdata
Datasett - utgivelsesdato
Her kan du oppgi når datasettet er operativt og tilgjengelig.
-
Angi når innholdet i datasettet gjøres tilgjengelig. Dette er ikke alltid samsvarende med når den enkelte distribusjonen er tilgjengelig. Og heller ikke når beskrivelsen om datasettet utgis (katalogpostens utgivelse).
-
01.01.2017
Dette tilsvarer Datasett: utgivelsesdato (dct:issued
) i DCAT-AP-NO.
-
Angis som xsd:date eller xsd:dateTime.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dct:issued "2017-01-01"^^xsd:date .
Datasett - versjon
<ikke beskrevet, tilsvarer Datasett: versjon (owl:versionInfo
) i DCAT-AP-NO>
Datasett - versjonsnote
<ikke beskrevet, tilsvarer Datasett: versjonsnote (adms:versionNotes
) i DCAT-AP-NO>
Beskrivelse av distribusjon
En distribusjon er en spesifikk representasjon av et datasett i form av en fil som brukeren kan få tilgang til. Det vanligste scenariet er at et datasett uttrykkes i flere formater, f.eks. både i Excel og CSV. Det kan også være slik at du kan få tilgang til et datasett enten gjennom en nattlig dump eller ved oppslag mot et API. I begge disse to scenariene anser vi at det er et datasett med to forskjellige distribusjoner. Distribusjonene tilsvarer de samme dataene (samme informasjon), men i forskjellige formater eller via forskjellige tilgangsmekanismer.
Et datasett kan altså ha flere distribusjoner, men alle distribusjonene skal i prinsippet inneholde samme informasjon. I de fleste tilfeller vil transformasjoner til ulike formater være tapsløse, og dermed fullt ut informasjonsmessig likeverdige. Mindre grad av informasjonstap mellom formater kan oppstå, men dette kan likevel representeres som ulike distribusjoner av samme datasett. I slike tilfeller kan en vurdere å bruke Distribusjon - beskrivelse for å synliggjøre dette.
Datasett som tilbys som filnedlasting kan beskrives utelukkende ved hjelp av egenskapene for distribusjons-klassen. Distribusjoner som tilbys via en datatjeneste skal fra og med versjon 2.0 benytte datatjeneste-klassen for å beskrive tjenesten. Når samme datasett er tilgjengelig både som en fil og via et API, beskrives filen som en distribusjon og API-et som en datatjeneste. Relasjonen mellom distribusjonen og datatjenesten uttrykkes gjennom egenskapen Distribusjon - tilgangstjeneste. Se under Utvalgte temaer for mer informasjon om forholdet mellom datasett, distribusjon og datatjeneste.
Merk at den juridiske vurderingen av hvem som kan få tilgang til datasettet gjøres på datasett-nivå (Datasett - tilgangsnivå), mens bruksavtaler for data er knyttet leveransene av data – altså distribusjoner og datatjenester. En kan tilby det samme datasettet under ulike bruksvilkår ved å opprette flere distribusjoner med ulike lisenser/bruksvilkår. Det er krav om bruk av standardiserte bruksavtaler i form av åpne standardlisenser for åpne data som tilbys fra det offentlige (se under Beskrivelse av åpne data).
Det er datatilbyders ansvar å vurdere om forskjellige representasjoner kan forstås som distribusjoner av samme datasett, eller distribusjoner av forskjellige datasett.
For deg som skal utvikle/tilpasse verktøystøtte i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.
Eksempel på en beskrivelse av en distribusjon
Under er et eksempel på en beskrivelse av en distribusjon, hvor uthevede egenskaper er obligatoriske:
Eksemplet ovenfor i RDF Turtle:
@prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix : <https://example.org/> . <eksempelDistribusjon> a dcat:Distribution ; # distribusjon ### obligatoriske egenskaper dcat:accessURL <https://example.org/eksempeldata> ; ### anbefalte egenskaper: dct:description "Semikolonseparert nedlastbar CSV-fil uten BOM"@nb ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; ### valgfrie egenskaper: dcat:downloadURL <https://example.org/eksempeldata.csv> ; .
Obligatoriske egenskaper i beskrivelse av en distribusjon
Som minimum skal følgende tas med i beskrivelsen av en distribusjon:
-
Distribusjon - tilgangsURL: nettadresse (URL) hvor informasjon om tilgang til distribusjonen gis.
Distribusjon - tilgangsURL
Du skal oppgi nettadresse (URL) som gir tilgang til en distribusjon av datasettet. Kan også peke til en nettside som gir informasjon om hvordan en kan få tilgang til datasettet.
-
skal primært benyttes for å peke til en nettside med informasjon om hvordan man får tilgang til distribusjonen.
-
dersom en direktelenke til en fil er den eneste tilgjengelige URL-en, skal denne benyttes (denne dupliseres da fra Distribusjon: nedlastningslenke).
Dette tilsvarer Distribusjon: tilgangsURL (dcat:accessService) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dcat:distribution [ a dcat:Distribution ; # distribusjon dcat:accessURL < https://example.org/eksempel-1 > ] .
Anbefalte egenskaper i beskrivelse av en distribusjon
Følgende opplysninger bør du ta med i beskrivelsen av en distribusjon:
-
Distribusjon - beskrivelse: kort beskrivelse av distribusjonen.
-
Distribusjon - format: distribusjonens filformat.
-
Distribusjon - lisens: lisensen som distribusjonen er gjort tilgjengelig under.
-
Distribusjon - status: distribusjonens modenhet.
-
Distribusjon - tilgjengelighet: hvor lenge det er planlagt å holde distribusjonen tilgjengelig.
Distribusjon - beskrivelse
For at andre skal kunne vite hva distribusjonen gir, bør du ta med en kort fritekstbeskrivelse av distribusjonen. Denne kan gjentas for flere språk.
-
Legge gjerne vekt på å beskrive det som skiller det ulike distribusjonene fra hverandre, selv om dette overlapper med informasjonen som er oppgitt i dedikerte egenskaper
-
Fritekstbeskrivelser av distribusjoner erstatter ikke behovet for strukturerte metadata (som for eksempel formater og oppdateringsfrekvens).
-
Alle fritekstbeskrivelser bør tilbys på engelsk i tillegg til norsk
-
“Semikolonseparert CSV uten Byte Order Mark (BOM)”
-
“JSON-format via data.brreg.no. Oppdateres kontinuerlig”
Dette tilsvarer Distribusjon: beskrivelse (dct:description) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution # to distribusjoner [ a dcat:Distribution ; # distribusjon 1 dct:description "Semikolonseparert CSV uten Byte Order Mark (BOM)"@nb, "Semicolon-separated CSV without Byte Order Mark (BOM)."@en ; ] , [ a dcat:Distribution ; # distribusjon 2 dct:description "JSON-format via data.brreg.no. Oppdateres kontinuerlig."@nb , "JSON-format via data.brreg.no. Continuously updated."@en ; ] .
Distribusjon - format
Hver distribusjon har format for utveksling som bør oppgis, dvs. en maskinlesbar verdi som entydig identifiserer hvilke(t) format(er) datasettet er gjort tilgjengelig som.
-
Det skal angis filtype (f.eks. CSV, JSON) ved å benytte URI-er fra EUs kontrollerte liste over File type.
-
Primært bør en opprette en distribusjon for hvert filformat. Flere formater kan likevel benyttes ved hjelp av kommaseparerte verdier
-
Merk at det kun er mulig å oppgi en Distribusjon - nedlastningslenke pr. distribusjon. nedlastningslenke kan dermed ikke brukes i kombinasjon med at en oppgir flere filformater for samme distribusjon
Dette tilsvarer Distribusjon: format (dct:format) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dcat:accessURL <https://example.org/datasets/001> ; dct:description "Nedlastbar fil i CSV-format"@nb ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dcat:downloadURL <https://example.org/datasets/download/001-csv> ] .
Distribusjon - lisens
Lisens er påkrevd for alle åpne offentlige data. Du bør ellers også oppgi lisens hvis datasettet er gjort tilgjengelig under gitt lisens.
-
EUs kontrollerte liste over Licence skal brukes, dersom lisensen som benyttes finnes på listen.
-
For åpne data skal en av disse tre lisensene benyttes:
-
Creative Commons Navngivelse 4.0 (CC BY 4.0):
http://publications.europa.eu/resource/authority/licence/CC_BY_4_0
-
Creative Commons CC0 1.0 Universal (CC0):
http://publications.europa.eu/resource/authority/licence/CC0
-
Norsk lisens for offentlige data (NLOD):
http://publications.europa.eu/resource/authority/licence/NLOD_2_0
-
-
Creative Commons-lisensene anbefales for distribusjoner (og datatjenester) med forventet internasjonal bruk.
Se Veileder for tilgjengeliggjøring av åpne data for mer informasjon om valg av åpne standardlisenser.
Dette tilsvarer Distribusjon: lisens (dct:license) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ] .
Distribusjon - status
Distribusjonens modenhet er viktig å vite for å kunne vurdere om/når en skal benytte seg distribusjonen. Den bør derfor oppgis.
-
Asset Description Metadata Schema (ADMS) skal benyttes:
-
Fullført:
http://purl.org/adms/status/Completed
-
Utgått:
http://purl.org/adms/status/Deprecated
-
Under utvikling:
http://purl.org/adms/status/UnderDevelopment
-
Trukket tilbake:
http://purl.org/adms/status/Withdrawn
-
Dette tilsvarer Distribusjon: status (adms:status) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon adms:status <http://purl.org/adms/status/Completed> ] .
Distribusjon - tilgjengelighet
Det er viktig å vite hvor lenge distribusjonen er planlagt tilgjengelig for å kunne vurdere om en skal benytte seg distribusjonen. Den bør derfor oppgis.
-
EUs kontrollerte liste over Distribution availability skal benyttes:
-
Midlertidig:
http://data.europa.eu/r5r/availability/temporary
-
Eksperimentell:
http://data.europa.eu/r5r/availability/experimental
-
Tilgjengelig:
http://data.europa.eu/r5r/availability/available
-
Stabil:
http://data.europa.eu/r5r/availability/stable
-
Dette tilsvarer Distribusjon: tilgjengelighet (dcatap:availability) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dcatap:availability <http://data.europa.eu/r5r/availability/stable> ] .
Valgfrie egenskaper i beskrivelse av en distribusjon
I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i beskrivelse av en distribusjon:
-
Distribusjon - dokumentasjon: en side eller et dokument som beskriver distribusjonen.
-
Distribusjon - endringsdato: dato for siste endring av distribusjonen.
-
Distribusjon - filstørrelse: distribusjonens størrelse oppgitt i bytes.
-
Distribusjon - i samsvar med: et etablert skjema som distribusjonen er i samsvar med.
-
Distribusjon - komprimeringsformat: komprimeringsformatet for distribusjonen som dataene er i dersom de er i en komprimert form, f.eks. for å redusere størrelsen på den nedlastbare filen.
-
Distribusjon - medietype: medietype av distribusjonen.
-
Distribusjon - nedlastningslenke: direktelenke (URL) til en nedlastbar fil i et gitt format.
-
Distribusjon - pakkeformat: formatet til filen der en eller flere datafiler er gruppert sammen, f.eks. for å gjøre det mulig å laste ned et sett relaterte filer.
-
Distribusjon - policy: policyen som uttrykker rettighetene knyttet til distribusjonen hvis de bruker ODRL-vokabularet.
-
Distribusjon - rettigheter: rettigheter knyttet til distribusjonen.
-
Distribusjon - romlig oppløsning: minste romlig oppløsning for en datasettdistribusjon, målt i meter.
-
Distribusjon - sjekksum: sjekksuminformasjon (en mekanisme for å verifisere at innhold i en distribusjon ikke har endret seg).
-
Distribusjon - språk: språk som er brukt i distribusjonen.
-
Distribusjon - tidsoppløsning: minste tidsrom som kan utledes fra datasett-distribusjonen.
-
Distribusjon - tilgangstjeneste: datatjeneste som gir tilgang til distribusjonen.
-
Distribusjon - tittel: navn på distribusjonen.
-
Distribusjon - utgivelsesdato: dato for formell utgivelse/publisering av distribusjonen.
Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.
Distribusjon - dokumentasjon
Du kan bruke denne egenskap til å oppgi referanse til en side eller et dokument som beskriver og dokumenterer innhold og struktur som er spesifikk for distribusjonen.
Dette tilsvarer Distribusjon: dokumentasjon (foaf:page) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon foaf:page <https://confluence.brreg.no/display/DBNPUB/API> ] .
Distribusjon - endringsdato
Dato/tid sist distribusjonen sist ble endret.
-
01.01.2017
Dette tilsvarer Distribusjon: endringsdato (dct:modified) i DCAT-AP-NO.
-
Angis som dato (
xsd:date
) eller tidspunkt (xsd:dateTime
).
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # Datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dct:modified "2017-01-01"^^xsd:date ] .
Distribusjon - filstørrelse
<ikke beskrevet, tilsvarer Distribusjon: filstørrelse (dcat:byteSize) i DCAT-AP-NO>
Distribusjon - i samsvar med
Benyttes for å angi et etablert skjema som distribusjonen er i samsvar med, for eksempel et XSD-dokument.
Dette tilsvarer Distribusjon: i samsvar med (dct:conformsTo) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dct:conformsTo <https://data.norge.no/informationmodels/c23f625f-a654-3462-805e-74408cb5367a> ] .
Distribusjon - komprimeringsformat
<ikke beskrevet, tilsvarer Distribusjon: komprimeringsformat (dcat:compressFormat) i DCAT-AP-NO>
Distribusjon - medietype
Angivelse av medietypen for distribusjonen slik den er definert i IANAs register over medietyper.
-
Angivelse av Distribusjon: medietype er et valgfritt alternativ til å benytte Distribusjon: format. Kun formater som inngår i IANAs register er lovlige verdier.
-
Vi fraråder å angi format både ved hjelp av Distribusjon - medietype og Distribusjon - format for en og samme distribusjon.
-
Vi fraråder å angi flere medietyper for en og samme distribusjon ettersom du kun kan oppgi én nedlastningslenke pr. distribusjon. Opprett heller nye distribusjoner for hvert format/medietype og oppgi nedlastningslenke for hver distribusjon.
-
Benytt fullstendige https-identifikatorer, f.eks.
https://www.iana.org/assignments/media-types/text/csv
, og ikketext/csv
.
Distribusjon - nedlastningslenke
Nedlastningslenken er en type tilgangs-url som peker direkte til en fil som lastes ned lokalt.
-
Dersom nedlastningslenken er den eneste tilgjengelige lenken for distribusjonen av datasettet, skal denne dupliseres i det obligatoriske feltet Distribusjon - tilgangsURL.
Dette tilsvarer Distribusjon: nedlastningslenke (dcat:downloadURL) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dcat:downloadURL < https://data.ssb.no/api/klass/v1//versions/683.csv> ] .
Distribusjon - pakkeformat
<ikke beskrevet, tilsvarer Distribusjon: pakkeformat (dcat:packageFormat) i DCAT-AP-NO>
Distribusjon - policy
<ikke beskrevet, tilsvarer Distribusjon: policy (odrl:hasPolicy) i DCAT-AP-NO>
Distribusjon - rettigheter
<ikke beskrevet, tilsvarer Distribusjon: rettigheter (dct:rights) i DCAT-AP-NO>
Distribusjon - romlig oppløsning
<ikke beskrevet, tilsvarer Distribusjon: romlig oppløsning (dcat:spatialResolutionInMeters) i DCAT-AP-NO>
Distribusjon - sjekksum
<ikke beskrevet, tilsvarer Distribusjon: sjekksum (spdx:checksum) i DCAT-AP-NO>
Distribusjon - språk
<ikke beskrevet, tilsvarer Distribusjon: språk (dct:language) i DCAT-AP-NO>
Se tilsvarende eksempel under Datasett språk i denne veilederen for hvordan språk angis i RDF Turtle.
Distribusjon - tidsoppløsning
<ikke beskrevet, tilsvarer Distribusjon: tidsoppløsning (dcat:temporalResolution) i DCAT-AP-NO>
Distribusjon - tilgangstjeneste
Angir datatjenesten som gir tilgang til distribusjonen.
Dette tilsvarer Distribusjon: tilgangstjeneste (dcat:accessService) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dcat:accessService <https://data.brreg.no/enhetsregisteret/api> ] . # datatjeneste/API
Distribusjon - tittel
<ikke beskrevet, tilsvarer Distribusjon: tittel (dct:title) i DCAT-AP-NO>
Se tilsvarende eksempel under Datasett - tittel i denne veilederen for hvordan tittel angis i RDF Turtle.
Distribusjon - utgivelsesdato
Dato/tid når distribusjonen først ble publisert i tilknytning til et datasett.
-
01.01.2017
Dette tilsvarer Distribusjon: utgivelsesdato (dct:issued) i DCAT-AP-NO.
-
Oppgis som dato (
xsd:date
) eller tidspunkt (xsd:dateTime
).
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dcat:distribution [ a dcat:Distribution ; # distribusjon dct:issued "2017-01-01"^xsd:date ] .
Beskrivelse av datatjeneste
Nytt i DCAT-AP-NO v.2 er at standarden nå også støtter beskrivelser av datatjenester, som v.1.x av DCAT-AP-NO ikke gjorde.
Datatjeneste (dcat:DataService
) brukes til å beskrive en samling av operasjoner som er tilgjengelig via et programmeringsgrensesnitt (API) og som gir tilgang til ett eller flere datasett eller databehandlingsfunksjoner.
For deg som skal utvikle/tilpasse verktøystøtte i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.
Eksempel på en datatjenestebeskrivelse
Under er et eksempel på en datatjenestebeskrivelse, hvor uthevede egenskaper er obligatoriske:
Eksemplet ovenfor i RDF Turtle:
@prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix : <https://example.org/> . <enDatatjeneste> a dcat:DataService ; # datatjeneste ### obligatoriske egenskaper: dcat:endpointURL <https://example.org/eksAPI> ; dct:identifier "https://example.org/eksAP"^^xsd:anyURI ; dct:title "REST-API for eksempler"@nb ; ### anbefalte egenskaper: dcat:endpointDescription <https://example.org/eksAPI.json> ; dct:format <http://publications.europa.eu/resource/authority/file-type/JSON> ; dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/999999999> ; # utgiver, med dummy-org.nr. .
Obligatoriske egenskaper i en datatjenestebeskrivelse
Som et minimum skal følgende tas med i en datatjenestebeskrivelse:
-
Datatjeneste - endepunktsURL: rotplassering eller primært endepunkt for tjenesten.
-
Datatjeneste - identifikator: identifikator til datatjenesten.
-
Datatjeneste - tittel: navn på datatjenesten.
Datatjeneste - endepunktsURL
Du skal oppgi rotplassering eller primært endepunkt for tjenesten (en URI).
Dette tilsvarer Datatjeneste: endepunktsURL (dcat:endpointURL) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dcat:endpointURL <https://example.org/endpoints> .
Datatjeneste - identifikator
Brukes til å oppgi identifikator til datatjenesten.
Se under Om identifikator.
Dette tilsvarer Datatjeneste: identifikator (dct:identifier) i DCAT-AP-NO.
Datatjeneste - tittel
Du skal oppgi navnet på datatjenesten. Gjentas hvis navnet er i flere språk.
Dette tilsvarer Datatjeneste: tittel (dct:title) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dct:title "FDK API endpoints"@en , "FDK API endepunkter"@nb .
Anbefalte egenskaper i en datatjenestebeskrivelse
Følgende opplysninger bør du ta med i en datatjenestebeskrivelse hvis de finnes:
-
Datatjeneste - emneord: emneord (eller tag) som beskriver datatjenesten.
-
Datatjeneste - endepunktsbeskrivelse: beskrivelse av tjenesten.
-
Datatjeneste - format: datatjenestens filformat.
-
Datatjeneste - kontaktpunkt: kontaktpunkt med kontaktopplysninger.
-
Datatjeneste - tema: tema for datatjenesten.
-
Datatjeneste - tilgjengeliggjør datasett: datasett som datatjenesten kan distribuere.
-
Datatjeneste - utgiver: aktør (organisasjon) som er ansvarlig for å gjøre datatjenesten tilgjengelig.
Datatjeneste - emneord
Du bør oppgi emneord (eller tag) som beskriver datatjenesten.
Se beskrivelsen av tilsvarende egenskap i Datasett, Datasett - emneord.
Dette tilsvarer Datatjeneste: emneord (dcat:keyword) i DCAT-AP-NO.
Datatjeneste - endepunktsbeskrivelse
Du skal oppgi en beskrivelse av tjenesten.
Brukes primært til å lenke til en formalisert beskrivelse av tjenestene som er tilgjengelige via endepunktene, inkludert deres operasjoner, parametere osv. Beskrivelsen skal gi spesifikke detaljer om de faktiske endepunkt-instansene, mens dct:conformsTo
brukes til å indikere den generelle standarden eller spesifikasjonen som endepunktene implementerer.
Dette tilsvarer Datatjeneste: endepunktsbeskrivelse (dcat:endpointDescription) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dcat:endpointDescription <https://raw.githubusercontent.com/Informasjonsforvaltning/fdk-api-endpoints/master/specification/fdk-api-endpoints.yaml> . # peker til en OpenAPI spesifikasjon av tjenesten
Datatjeneste - format
Datatjenestens filformat.
-
EUs kontrollerte liste over File type skal brukes.
-
Kan gjentas for API-er og sluttbrukerapplikasjoner som leverer data i flere formater.
Dette tilsvarer Datatjeneste: format (dct:format) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dct:format <http://publications.europa.eu/resource/authority/file-type/JSON_LD> , # JSON-LD <http://publications.europa.eu/resource/authority/file-type/RDF_TURTLE> . # RDF Turtle
Datatjeneste - kontaktpunkt
Kontaktpunkt med kontaktopplysninger.
Se beskrivelsen av tilsvarende egenskap i Datasett, Datasett - kontaktpunkt.
Dette tilsvarer Datatjeneste: kontaktpunkt (dcat:contactPoint) i DCAT-AP-NO.
Datatjeneste - tema
Tema for datatjenesten. En datatjeneste kan assosieres med flere tema.
For å kunne sortere datatjenesten inn under gitte kategorier er det behov for tema.
-
Ett eller flere temaer skal velges fra den kontrollerte listen av EU-temaer.
-
Ett eller flere temaer bør velges fra det norske LOS-vokabularet. Merk at Los har flere nivåer og at de overordnede nivåene er implisitt når en velger tema på nivå 2 og 3 i hierarkiet.
-
Helse (HEAL fra EU-listen)
-
Helsestasjon (helsestasjon fra LOS)
Dette tilsvarer Datatjeneste: tema (dcat:theme) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dcat:theme <http://publications.europa.eu/resource/authority/data-theme/HEAL> , # helse <https://psi.norge.no/los/ord/helsestasjon> . # helsestasjon (Helse og omsorg -> Helsetjenester -> Helsestasjon)
Datatjeneste - tilgjengeliggjør datasett
Egenskapen brukes til å referere til datasett som datatjenesten kan distribuere.
Dette tilsvarer Datatjeneste: tilgjengeliggjør datasett (dcat:servesDataset) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dcat:servesDataset <https://example.org/dataset/123> , <https://example.org/dataset/456> . # peker til 2 datasett.
Datatjeneste - utgiver
Den aktøren (organisasjon) som er ansvarlig for å gjøre datatjenesten tilgjengelig.
-
Skal peke på en virksomhet (juridisk person, organisasjonsledd, underenhet) som er ansvarlig utgiver - ikke leverandør av tjenesten.
-
Det offisielle navnet på virksomheten vil bli hentet fra Enhetsregisteret, men kortform (f.eks. Digdir) kan legges inn av brukeren.
-
Utgiveren av datasettet forvalter sammensetning av dataene, altså datasettet, og ikke nødvendigvis selve dataene.
-
Arbeids- og velferdsetaten
Dette tilsvarer Datatjeneste: utgiver (dct:publisher) i DCAT-AP-NO.
Inntil https://data.brreg.no tilbyr gyldig identifikator (foaf:Agent
), skal følgende mønster benyttes: https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/{orgnummer}
.
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/889640782> . #NAV
Valgfrie egenskaper i en datatjenestebeskrivelse
I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i en datatjenestebeskrivelse:
-
Datatjeneste - beskrivelse: fritekstbeskrivelse av datatjenesten.
-
Datatjeneste - dokumentasjon: side eller dokument som beskriver datatjenesten.
-
Datatjeneste - følger: regel som definerer den juridiske rammen for datatjenesten.
-
Datatjeneste - i samsvar med: spesifikasjon eller standard som datatjenesten implementerer.
-
Datatjeneste - landingsside: nettside som gir tilgang til datatjenesten, dens distribusjoner og/eller tilleggsinformasjon.
-
Datatjeneste - lisens: lisensen som datatjenesten blir gjort tilgjengelig under.
-
Datatjeneste - medietype: datatjenestens medietype.
-
Datatjeneste - tilgangsrettigheter: informasjon angående tilgang eller begrensninger basert på personvern, sikkerhet eller andre retningslinjer.
-
Datatjeneste - type: datatjenestens type.
Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.
Datatjeneste - beskrivelse
Fritekst-beskrivelse av datatjenesten. Gjentas for flere språkversjoner. Se ellers beskrivelsen av tilsvarende felt i Datasett, Datasett - beskrivelse.
-
Kopier gjerne beskrivende informasjon fra dokumentasjonen eller landingssiden
-
Ved behov for formatering av tekst - benytt CommonMark
Dette tilsvarer Datatjeneste: beskrivelse (dct:description) i DCAT-AP-NO.
Datatjeneste - dokumentasjon
Referanse til en side eller et dokument som beskriver datatjenesten.
-
Siden eller dokumentet som det linkes til bør være en menneskelesbar ressurs, i motsetning til endepunktbeskrivelse som primært er en maskinlesbar ressurs
-
Se også beskrivelsen av Datatjeneste - landingsside, Datatjeneste - endepunktsbeskrivelse og Datatjeneste - beskrivelse.
Dette tilsvarer Datatjeneste: dokumentasjon (foaf:page) i DCAT-AP-NO.
Datatjeneste - følger
<ikke beskrevet, tilsvarer Datatjeneste: følger (cpsv:follows) i DCAT-AP-NO>
Se ellers beskrivelsen av tilsvarende felt i Datasett, Datasett - følger.
Datatjeneste - i samsvar med
Referanse til en spesifikasjon eller standard som datatjenesten implementerer.
-
En datatjeneste kan være utviklet i samsvar med en eller flere standarder og/eller spesifikasjoner.
-
Du kan knytte en informasjonsmodell til en datatjeneste ved hjelp av denne egenskapen. Se under Utvalgte temaer for sammenhengen mellom datatjeneste og informasjonsmodell.
-
Vi anbefaler at informasjonsmodellen for endepunktet også inngår som en del av endepunktbeskrivelsen.
Dette tilsvarer Datatjeneste: i samsvar med (dct:conformsTo) i DCAT-AP-NO.
Datatjeneste - landingsside
<ikke beskrevet, tilsvarer Datatjeneste: landingsside (dcat:landingPage) i DCAT-AP-NO>
Se ellers beskrivelsen av tilsvarende egenskap i Datasett, Datasett - landingsside.
Datatjeneste - lisens
Referanse til lisensen for datasett som datatjenesten realiserer, gjøres tilgjengelig under. Lisens er påkrevd for alle åpne offentlige data.
-
EUs kontrollerte liste over Licence skal brukes, dersom lisensen som benyttes finnes på listen.
-
For åpne data skal en av disse tre lisensene benyttes:
-
Creative Commons Navngivelse 4.0 (CC BY 4.0):
http://publications.europa.eu/resource/authority/licence/CC_BY_4_0
-
Creative Commons CC0 1.0 Universal (CC0):
http://publications.europa.eu/resource/authority/licence/CC0
-
Norsk lisens for offentlige data (NLOD):
http://publications.europa.eu/resource/authority/licence/NLOD_2_0
-
-
Creative Commons-lisensene anbefales for distribusjoner (og datatjenester) med forventet internasjonal bruk.
Se Veileder for tilgjengeliggjøring av åpne data for mer informasjon om valg av åpne standardlisenser.
Se ellers beskrivelsen av tilsvarende felt i Distribusjon, Distribusjon - lisens.
Dette tilsvarer Distribusjon: lisens (dct:license) i DCAT-AP-NO.
Datatjeneste - medietype
<ikke beskrevet, tilsvarer Datatjeneste: medietype (dcat:mediaType) i DCAT-AP-NO>
Se beskrivelsen av tilsvarende egenskap i Distribusjon, Distribusjon - medietype.
Datatjeneste - tilgangsrettigheter
<ikke beskrevet, tilsvarer Datatjeneste: tilgangsrettigheter (dct:accessRights) i DCAT-AP-NO>
Datatjeneste - type
Referanse til et begrep i en kontrollert liste som identifiserer datatjenestens type, for eksempel Spatial data service type.
Dette tilsvarer Datatjeneste: type (dct:type) i DCAT-AP-NO.
Beskrivelse av katalog
Datasettbeskrivelser fra f.eks. en virksomhet eller et virksomhetsområde kan samles i en datakatalog. Nytt fra v.2.0 av Standard for beskrivelse av datasett, datatjenester og datakatalog (DCAT-AP-NO), er datatjenester som også kan samles i en katalog (f.eks. en API-katalog). Ordet "katalog" brukes derfor videre i dette kapittel.
Hovedhensikten med å beskrive katalogen din er at andre lettere skal kunne forstå hva slags katalog du har.
For at andre lettere skal kunne forstå dine beskrivelser, er det visse spilleregler for hvordan en katalog skal/bør/kan beskrives.
Dette kapittelet forklarer hvordan en katalog beskrives i henhold til kravene i DCAT-AP-NO v.2, dog uten at du må kunne DCAT-AP-NO.
For deg som skal utvikle/tilpasse verktøystøtte for katalogbeskrivelse i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.
Eksempel på en katalogbeskrivelse
Under er et eksempel på en katalogbeskrivelse, med dummydata, hvor egenskaper med * foran er obligatoriske:
Eksemplet ovenfor i RDF Turtle:
@prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix : <https://dexample.org/> . <https://example.org/cat/123> a dcat:Catalog ; ### obligatoriske egenskaper: dct:title "Oversikt over datasett fra Direks"@nb ; dct:description "Katalogen inneholder beskrivelse av alle datasett som Direktoratet for eksempler forvalter."@nb ; dct:identifier "https://example.org/cat/123"^^xsd:anyURI ; dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/999999999> ; # utgiver, med dummy-org.nr. ### anbefalte egenskaper: dcat:dataset <https://example.org/eksempeldata> ; # peker til en datasettbeskrivelse dct:spatial <http://publications.europa.eu/resource/authority/country/NOR> ; # dekningsområde, Norge .
Obligatoriske egenskaper i en katalogbeskrivelse
Som et minimum skal følgende tas med i en katalogbeskrivelse:
-
Katalog - beskrivelse: beskrivelse av innholdet i katalogen.
-
Katalog - identifikator: identifikator til katalogen.
-
Katalog - tittel: navn på katalogen.
-
Katalog - utgiver: aktør ansvarlig for å gjøre katalogen tilgjengelig.
Katalog - beskrivelse
For at andre skal kunne vite hva slags katalog du har, skal du oppgi en kort og presis beskrivelse av innholdet i katalogen.
-
Katalog over alle data i Brønnøysundregistrene
Dette tilsvarer Katalog: beskrivelse (dct:description
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enKatalog> a dcat:Catalog ; dct:description "Katalog over alle data i Brønnøysundregistrene"@nb .
Katalog - identifikator
Identifikatoren er som regel systemgenerert av verktøyet som brukes til å beskrive/publisere en katalog, slik at du som vanlig bruker ikke trenger å oppgi verdien til denne egenskapen manuelt.
Dette tilsvarer Katalog: identifikator (dct:identifier
) i DCAT-AP-NO, se under Om identifikator (dct:identifier
).
Katalog - tittel
For at andre lett skal kunne se hva din katalog omhandler, skal du oppgi et kortfattet navn på katalogen.
-
Angi, uten å liste, innhold den omfatter.
-
Datakatalog for Brønnøysundregistrene
-
Katalog over datatjenester fra Brønnøysundregistrene
Dette tilsvarer Katalog: tittel (dct:title
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<kat1> a dcat:Catalog ; dct:title "Datakatalog for Brønnøysundregistrene"@nb . <kat2> a dcat:Catalog ; dct:title "Katalog over datatjenester fra Brønnøysundregistrene"@nb .
Katalog - utgiver
For at andre skal kunne vite hvem som er aktøren/organisasjonen som er ansvarlig for tilgjengeliggjøring av katalogen, skal utgiver oppgis.
-
Skal peke på en aktør (juridisk person, organisasjonsledd, underenhet).
-
For produsent av katalogen, se Katalog - produsent.
-
Digdir
Dette tilsvarer Katalog: utgiver (dct:publisher
) i DCAT-AP-NO.
Inntil https://data.brreg.no tilbyr gyldig identifikator (foaf:Agent
), skal følgende mønster benyttes: https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/{orgnummer}
.
Eksempel i RDF Turtle:
<enKatalog> a dcat:Catalog ; dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/991825827> . # Digdir
Anbefalte egenskaper i en katalogbeskrivelse
Følgende opplysninger bør du ta med i en katalogbeskrivelse hvis de finnes:
-
Katalog - datasett: datasettbeskrivelser som er oppført i katalogen.
-
Katalog - dekningsområde: geografisk område som er dekket av katalogen.
-
Katalog - endringsdato: dato for siste oppdatering av katalogen.
-
Katalog - frekvens: oppdateringsfrekvens for katalogen.
-
Katalog - hjemmeside: nettside som fungerer som hovedside for katalogen.
-
Katalog - lisens: lisens som beskriver hvordan katalogen kan viderebrukes.
-
Katalog - opphav: beskrivelse av autentisitet og integritet til innholdet i katalogen.
-
Katalog - språk: språk som brukes i tekstlige beskrivelser av innholdet i katalogen.
-
Katalog - temaer: temaer som er brukt for å klassifisere innholdet i katalogen.
-
Katalog - utgivelsesdato: dato for formell utgivelse (publisering) av katalogen.
Katalog - datasett
Hvis katalogen din er en katalog over datasett, skal datasettbeskrivelsene inkluderes i katalogen ved å bruke denne egenskapen.
-
Egenskapen brukes til å referere til datasettbeskrivelser som er oppført i katalogen.
Dette tilsvarer Katalog: datasett (dcat:dataset
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enDataKatalog> a dcat:Catalog ; dcat:dataset <http://brreg.no/catalogs/974760673/datasets/b97e7db3-8e46-4bc4-857e-77d7280b0e9e> , <http://brreg.no/catalogs/974760673/datasets/1ffcb9e4-008b-4333-a372-268f50d01482> . # peker til to datasettbeskrivelser
Katalog - dekningsområde
Dersom katalogen kun har innhold fra visse områder, skal avgrensningen oppgis.
Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - dekningsområde.
Dette tilsvarer Katalog: dekningsområde (dct:spatial
) i DCAT-AP-NO.
Katalog - endringsdato
Dersom katalogens innhold har vært endret, skal dato/tid sist katalogen ble endret oppgis.
Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - endringsdato.
Dette tilsvarer Katalog: endringsdato (dct:modified
) i DCAT-AP-NO.
Katalog - frekvens
Dersom hyppigheten for endring av innholdet i katalogen er kjent, skal den oppgis.
Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - frekvens.
Dette tilsvarer Katalog: frekvens (dct:accrualPeriodicity
) i DCAT-AP-NO.
Katalog - hjemmeside
Dersom katalogen har en egen hjemmeside som f.eks. fungerer som en hovedside for katalogen, skal den oppgis.
Dette tilsvarer Katalog: hjemmeside (foaf:homepage
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enKatalog> a dcat:Catalog ; foaf:homepage <https://example.org/cat1> . # peker til hovedsiden for katalogen
Katalog - lisens
Dersom katalogen er knyttet til en lisens som bl.a. beskriver hvordan den kan viderebrukes, skal lisensen oppgis.
Se beskrivelsen av den tilsvarende egenskap for Distribusjon, Distribusjon - lisens.
Dette tilsvarer Katalog: lisens (dct:license
) i DCAT-AP-NO.
Katalog - opphav
Hvis det er noe med opphav av katalogen og/eller katalogens innhold som potensielle brukere bør vite om, skal det oppgis.
-
Katalogen ble opprettet og utgitt første gang av Difi som nå heter Digitaliseringsdirektoratet/Digdir
Dette tilsvarer Katalog: opphav (dct:provenance
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enKatalog> a dcat:Catalog ; dct:provenance [ a dct:ProvenanceStatement ; rdfs:label "Katalogen ble opprettet og utgitt første gang av Difi som nå heter Digitaliseringsdirektoratet/Digdir"@nb ; ] .
Katalog - språk
Språk som brukes i tekstlige metadata som beskriver ressursene i katalogen, bør oppgis.
Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - språk.
Dette tilsvarer Katalog: språk (dct:language
) i DCAT-AP-NO.
Katalog - temaer
Du bør oppgi klassifiseringssystem(er) (f.eks. en taksonomi) som er brukt til å klassifisere innholdet i katalogen din.
Dette tilsvarer Katalog: temaer (dcat:themeTaxonomy
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enKatalog> a dcat:Catalog ; dcat:themeTaxonomy <http://publications.europa.eu/resource/dataset/eurovoc> , # EuroVoc <https://psi.norge.no/los/> . # LOS
Katalog - utgivelsesdato
Du bør oppgi dato/tid katalogen først ble publisert.
Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - utgivelsesdato.
Dette tilsvarer Katalog: utgivelsesdato (dct:issued
) i DCAT-AP-NO.
Valgfrie egenskaper i en katalogbeskrivelse
I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i en katalogbeskrivelse:
-
Katalog - datatjeneste: datatjeneste som er oppført i denne katalogen.
-
Katalog - er del av: katalog som denne katalogen fysisk eller logisk er inkludert i.
-
Katalog - har del: katalog som er en del av denne katalogen.
-
Katalog - katalog: annen katalog som er relevant for denne katalogen.
-
Katalog - katalogpost: katalogpost som er oppført i denne katalogen.
-
Katalog - produsent: aktør som er hovedansvarlig for å produsere katalogen.
-
Katalog - rettigheter (brukervilkår): bruksvilkår knyttet til katalogen.
Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.
Katalog - datatjeneste
Hvis katalogen din er en katalog over datatjenester (aka APIer), eller datasettene i katalogen din tilbys via datatjenester, skal beskrivelse av datatjenestene inkluderes i katalogen ved å bruke denne egenskapen.
-
Egenskapen brukes til å referere til datatjenestebeskrivelser som er oppført i katalogen.
Dette tilsvarer Katalog: datatjeneste (dcat:service
) i DCAT-AP-NO.
Eksempel i RDF Turtle:
<enKatalog> a dcat:Catalog ; dcat:service <https://example.org/dataService1>, <https://example.org/dataService2> . # peker til to datatjenester
Katalog - er del av
<ikke beskrevet, tilsvarer Katalog: er del av (dct:isPartOf
) i DCAT-AP-NO>
Se beskrivelsen av den tilsvarende egenskapen for Datasett, Datasett - er del av.
Katalog - har del
Motsatt av Katalog - er del av.
<ikke beskrevet, tilsvarer Katalog: har del (dct:hasPart
) i DCAT-AP-NO>
Katalog - katalog
<ikke beskrevet, tilsvarer Katalog: katalog (dcat:catalog
) i DCAT-AP-NO>
Katalog - katalogpost
<ikke beskrevet, tilsvarer Katalog: katalogpost (dcat:record
) i DCAT-AP-NO>
Katalog - produsent
<ikke beskrevet, tilsvarer Katalog: produsent (dct:creator
) i DCAT-AP-NO>
Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - produsent.
For utgiver av katalogen, bruk Katalog - utgiver.
Katalog - rettigheter (brukervilkår)
<ikke beskrevet, tilsvarer Katalog: rettigheter (brukervilkår) (dct:rights
) i DCAT-AP-NO>
Utvalgte temaer
Dette kapittelet inneholder noen utvalgte temaer som forklares nærmere. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for temaer som du savner nærmere forklaringer av.
Sammenheng mellom datasett, distribusjon, datatjeneste, begrep og informasjonsmodell
Figuren over viser sammenhengen mellom datasett, datatjeneste (aka API), begrep og informasjonsmodell:
-
Dataene i et datasett (
dcat:Dataset
) kan representere (eller forklares med) et eller flere begreper (skos:Concept
). Du knytter et begrep (skos:Concept
) til et datasett (dcat:Dataset
) ved å bruke egenskapen Datasett - begrep (dct:subject
) (1). -
Et datasett (
dcat:Dataset
) kan distribueres gjennom en eller flere distribusjoner (dcat:Distribution
). Du knytter en distribusjon (dcat:Distribution
) til et datasett (dcat:Dataset
) ved å bruke egenskapen Datasett - datasettdistribusjon (dcat:distribution
) (2). -
Tilgangen til en distribusjon (
dcat:Distribution
) kan gis via en eller flere datatjenester (dcat:DataService
). Du knytter en datatjeneste (dcat:DataService
) til en distribusjon (dcat:Distribution
) ved å bruke egenskapen Distribusjon - tilgangstjenesten (3). -
Et datasett (
dcat:Dataset
) kan være skapt/vedlikeholdt i samsvar med en eller flere standarder/spesifikasjoner (dct:Standard
). Du knytter en standard/spesifikasjon (dct:Standard
) til et datasett (dcat:Dataset
) ved å bruke egenskapen Datasett - i samsvar med (dct:conformsTo
) (4). Ettersom en informasjonsmodell (modelldcatno:InformationModel
) iht. Spesifikasjon for beskrivelse av informasjonsmodeller (ModellDCAT-AP-NO) er en subklasse avdct:Standard
(5), kan du på denne måten knytte en informasjonsmodell til et datasett, dvs. en informasjonsmodell som beskriver strukturen av datasettet.-
På tilsvarende måte kan du knytte en informasjonsmodell (
modelldcatno:InformationModel
) til en datatjeneste (dcat:DataService
) (6), dvs. en informasjonsmodell som beskriver strukturen av data som datatjenesten distribuerer. -
Se Spesifikasjon for beskrivelse av informasjonsmodeller (ModellDCAT-AP-NO) for hvordan en informasjonsmodell og modellelementer i en informasjonsmodell beskrives.
-
-
En datatjeneste (
dcat:DataService
) kan brukes til å gi tilgang til et eller flere datasett (dcat:Dataset
). Du knytter et datasett (dcat:Dataset
) til en datatjeneste (dcat:DataService
) ved å bruke egenskapen Datatjeneste: tilgjengeliggjør datasett (dcat:servesDataset
) (7).
Beskrivelse av kvalitet
Nytt i DCAT-AP-NO v.2 er at den nå benytter DQV (Data Quality Vocabulary) fra W3C for beskrivelse av kvalitet på f.eks. et datasett. DCAT-AP-NO spesifiserer imidlertid ikke i detalj hvordan klasser og egenskaper fra DQV skal/bør/kan brukes. Det er derfor utarbeidet en norsk applikasjonsprofil av DQV (DQV-AP-NO), som supplerer DCAT-AP-NO, hvilket betyr at klasser og egenskaper spesifisert i DQV-AP-NO kan brukes i tillegg til de i DCAT-AP-NO.
Følgende er kun noen eksempler på hvordan DQV-AP-NO brukes til å beskrive kvalitet på f.eks. et datasett.
Beskrivelse av kvantifiserbar kvalitet
Ved å bruke egenskapen Datasett: har måleresultat (dqv:hasQualityMeasurement
) kan du knytte et måleresultat (dqv:QualityMeasurement
) til et datasett (dcat:Dataset
).
Iht. DQV-AP-NO skal et måleresultat (dqv:QualityMeasurement
) videre knyttes til ett og bare ett kvalitetsmål (dqv:Metric
). Det er predefinert et sett med kvalitetsmål og disse bør brukes når relevant. Predefinerte kvalitetsmål finnes på https://data.norge.no/vocabulary/dqvno (i RDF Turtle).
Videre, iht. DQV-AP-NO skal et kvalitetsmål (dqv:Metric
) knyttes til én og bare én kvalitetsdeldimensjon (dvqno:SubDimension
) som igjen skal knyttes til én og bare én kvalitetsdimensjon (dqv:Dimension
). Ved å bruke predefinerte kvalitetsmål trenger du ikke å oppgi kvalitetsdeldimensjon og kvalitetsdimensjon ettersom de predefinerte kvalitetsmålene er allerede ferdig tilknyttet kvalitetsdeldimensjon og kvalitetsdimensjon.
Eksempler på predefinerte kvalitetsmål, i kvalitetsdeldimensjonen "underdekning" (dvqno:undercoverage
) som er i kvalitetsdimensjonen "fullstendighet" (dqvno:completeness
):
-
manglende enheter (
dqv:missingObjects
): hvorvidt det mangler enheter i datasettet. -
antall manglende enheter (
dqvno:numberOfMissigObjects
): antall enheter som ikke er i datasettet men som forventes å være med. -
andel manglende enheter (
dqvno:rateOfMissingObjects
): antall enheter som mangler i forhold til antall enheter som skulle være med i datasettet.
-
Manglende enheter: 2
-
Kommentar: To bygninger mangler i datasettet.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dqv:hasQualityMeasurement [ a dqv:QualityMeasurement ; # måleresultat dqv:isMeasurementOf dqvno:numberOfMissingObjects ; # antall manglende enheter dqv:value "2"^^xsd:nonNegativeInteger ; # antallet rdfs:comment "To bygninger mangler i datasettet."@nb ; # kommentar ] .
Beskrivelse av kvalitet i form av fritekst
Ved å bruke egenskapen Datasett: har kvalitetsnote kan du knytte en kvalitetsbeskrivelse i fritekst (dqv:QualityAnnotation
) til et datasett (dcat:Dataset
).
Iht. DQV-AP-NO er det anbefalt å knytte en kvalitetsnote (dqv:QualityAnnotation
) til en eller flere kvalitetsdimensioner (dqv:Dimension
), ved å bruke egenskapen dqv:inDimension
. Det er predefinert flere kvalitetsdimensjoner og disse bør brukes når relevant. Predefinerte kvalitetsdimensjoner finnes på https://data.norge.no/vocabulary/dqvno (i RDF Turtle).
-
Kvalitetsdimensjon: fullstendighet
-
Kvalitetsnote: Det tar i gjennomsnitt 24 dager fra en bygning står ferdig eller er revet til den er innlemmet i eller tatt ut fra datasettet.
Iht. DQV-AP-NO skal en kvalitetsnote (dqv:QualityAnnotation
) alltid ha en oa:motivatedBy
med verdi dqv:qualityAssessment
(som er en predefinert instans av oa:Motivation
). Selve teksten skal oppgis ved å bruke egenskapen oa:hasBody
som peker til en instans av oa:TextualBody
.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; # datasett dqv:hasQualityAnnotation [ a dqv:QualityAnnotation ; # kvalitetsnote oa:motivatedBy dqv:qualityAssessment ; # obligatorisk "motivasjon" dqv:inDimension dqvno:completeness ; # anbefalt kvalitetsdimensjon oa:hasBody [ a oa:TextualBody ; # selve teksten dct:format <http://publications.europa.eu/resource/authority/file-type/TXT> ; # format dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; # språk rdfs:value "Det tar i gjennomsnitt 24 dager fra en bygning står ferdig eller er revet til den er innlemmet i eller tatt ut fra datasettet."@nb ; # teksten ] ; ] .
Beskrivelse av kvalitet i form av brukertilbakemeldinger
Iht. DQV-AP-NO er en brukertilbakemelding (dqv:UserFeedback
) en type kvalitetsnote (dqv:QualityAnnotation
). Du kan med andre ord knytte en brukertilbakemelding på kvalitet (dqv:UserQualityFeedback
) til et datasett (dcat:Dataset
), på tilsvarende måte som beskrivelse av kvalitet i form av fritekst. Se også Beskrivelse av kvalitet i form av fritekst for obligatoriske og anbefalte krav som også gjelder for brukertilbakemelding (dqv:UserFeedback
) her.
-
Kvalitetsdimensjon: fullstendighet
-
Brukertilbakemelding: 24 dagers etterslep er mer enn bra nok for vårt statistiske formål.
Eksempel i RDF Turle:
<etDatasett> a dcat:Dataset ; # datasett dqv:hasQualityAnnotation [ a dqv:UserQualityFeedback ; # brukertilbakemelding oa:motivatedBy dqv:qualityAssessment ; # obligatorisk "motivasjon" dqv:inDimension dqvno:completeness ; # anbefalt kvalitetsdimensjon oa:hasBody [ a oa:TextualBody ; # selve teksten dct:format <http://publications.europa.eu/resource/authority/file-type/TXT> ; # format dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; # språk rdfs:value "24 dagers etterslep er mer enn bra nok for vårt statistiske formål."@nb ; # teksten ] ; ] .
Beskrivelse av at et datasett er autoritativt
Iht. DQV-AP-NO er et kvalitetssertifikat (dqv:QualityCertificate
) en type kvalitetsnote (dqv:QualityAnnotation
). Du kan med andre ord knytte et kvalitetssertifikat (dqv:QualityCertificate
) til et datasett (dcat:Dataset
), på tilsvarende måte som beskrivelse av kvalitet i form av fritekst. Se også Beskrivelse av kvalitet i form av fritekst for obligatoriske og anbefalte krav som også gjelder for kvalitetssertifikat (dqv:QualityCertificate
) her.
-
Autoritativ kilde: ja
Vokabularet https://data.norge.no/vocabulary/dqvno (i RDF) inneholder et predefinert kvalitetssertifikat, dqvno:isAuthoritative
, som er en "kvalitetsbeskrivelse som uttrykker at noe er autoritativt". Dette predefinerte kvalitetssertifikatet bør du bruke når du ønsker å si at et datasett er autoritativt.
Eksempel i RDF Turtle:
<etDatasett> a dcat:Dataset ; dqv:hasQualityAnnotation dqvno:isAuthoritative . # datasettet er autoritativt
Beskrivelse av at kvaliteten er i samsvar med gitt standard/spesifikasjon
Ved å bruke egenskapen Datasett - i samsvar med kan du knytte en standard/spesifikasjon (dct:Standard
) til et datasett (dcat:Dataset
), for å informere om at datasettet er generert/vedlikeholdt i henhold til gitt(e) standard(er)/spesifikasjon(er).
Se Datasett - i samsvar med for hvordan egenskapen brukes.
Beskrivelse av juridiske rammer
For å knytte f.eks. en lovhjemmel til et datasett eller en datatjeneste, er det to steg (her under med utgangspunkt i datasett):
-
Et datasett (
dcat:Dataset
) kan referere til en eller flere regler (cpsv:Rule
) ved hjelp av egenskapen Datasett: følger (cpsv:follows
). Vokabularet cpsvno inneholder p.t. følgende predefinerte instanser avcpsv:Rule
, og disse bør brukes når relevant:-
behandlingsgrunnlag (
cpsvno:ruleForDataProcessing
): regel som regulerer behandling av data, spesielt personopplysninger -
utleveringsregel (
cpsvno:ruleForDisclosure
): regel som regulerer utlevering av en ressurs (f.eks. et datasett) -
skjermingsregel (
cpsvno:ruleForNonDisclosure
): regel som regulerer skjerming av en ressurs (f.eks. et datasett)
-
-
En regel (
cpsv:Rule
) kan referere til en eller flere regulative ressurser (eli:LegalResource
) ved hjelp av egenskapen Regel: implementerer (cpsv:implements
). Et eksempel på en regulativ ressurs er en lovhjemmel.-
Egenskapen Regulativ ressurs: type (
dct:type
) er iht. DCAT-AP-NO obligatorisk for en regulativ ressurs (eli:LegalResource
).
-
Se under Datasett - følger for eksempel i RDF Turtle.
Beskrivelse av tidsserie/datasettserie
For å beskrive datasett som inneholder en serie av datasett, anbefaler DCAT-AP-NO å bruke egenskapen Datasett: har del ("består av", dct:hasPart
). Den motsatte egenskapen Datasett: er del av ("inngår i", dct:isPartOf
) kan brukes til å knytte et datasett til en datasettserie.
-
Datasettet "årsregnskap" består av datasettene "regnskap2017" og "regnskap2018"
-
Datasettet "regnskap2017" og "regnskap2018" inngår i datasettet "årsregnskap"
Eksempel i RDF Turtle:
<årsregnskap> a dcat:Dataset ; dct:hasPart <regnskap2017>, <regnskap2018> . <regnskap2017> a dcat:Dataset ; dct:isPartOf <årsregnskap> ; dct:temporal [a dct:PeriodOfTime ; dcat:startDate "2017-01-01"^^xsd:date ; dcat:endDate "2017-12-31"^^xsd:date ; ] . <regnskap2018> a dcat:Dataset ; dct:isPartOf <årsregnskap> ; dct:temporal [a dct:PeriodOfTime ; dcat:startDate "2018-01-01"^^xsd:date ; dcat:endDate "2018-12-31"^^xsd:date ; ] .
I skrivende stund holder W3C på å utarbeide v.3.0 av DCAT hvor det skal være en løsning for å kunne beskrive en "Datasettserie" mer presist. Den foreslåtte løsningen p.t. ser ut til å bruke en ny klasse "Datasettserie" (dcat:DatasetSeries ) som er en subklasse av Datasett (dcat:Dataset ), og datasettene (dcat:Dataset ) knyttes til serien (dcat:DatasetSeries ) ved å bruke en ny egenskap "Datasett - iSerie" (dcat:inSeries ) som er en subegenskap av dct:isPartOf . Det diskuteres p.t. om det også skal innføres en ny egenskap "Datasettserie - seriemedlem" (dcat:seriesMember ) som er den inverse av egenskapen dcat:inSeries og som er en subegenskap av dct:hasPart . Løsningen, når den vedtas i W3C og også tas i bruk av EU, er med andre en mer presis måte å bruke klassen Datasett (dcat:Dataset ) og egenskapen erDelAv (dct:isPartOf ). Inntil videre bruker vi dct:isPartOf eller dct:hasPart til å beskrive tidsserier/dataserier, som beskrevet ovenfor.
|
Beskrivelse av åpne data
Et datasett kan gjøres tilgjengelig via distribusjon(er) og/eller datatjeneste(r). Se ellers under Sammenheng mellom datasett, begrep, distribusjon, datatjeneste og informasjonsmodell for sammenheng mellom bl.a. datasett (dcat:Dataset
), distribusjon (dcat:Distribution
) og datatjeneste (dcat:DataService
).
Åpne data via distribusjon(er)
Åpne data kan tilgjengeliggjøres via distribusjoner. For at et datasett (dcat:Dataset
) skal kunne betraktes som et datasett med åpne data, skal følgende oppfylles:
-
Datasettet skal være offentlig tilgjengelig. Egenskapen Datasett: tilgangsnivå (
dct:accessRights
) skal med andre ord ha verdioffentlig
(http://publications.europa.eu/resource/authority/access-right/PUBLIC
). -
Datasettet er gjort tilgjengelig. Egenskapen Datasett: datasettdistribusjon (
dcat:distribution
) skal med andre ord ha minst én verdi, dvs. det skal være minst én distribusjon av datasettet. -
Datasettet er gjort tilgjengelig med minst én distribusjon som er tilknyttet en åpen lisens. Egenskapen Distribusjon: lisens (
dct:license
) til minst én av distribusjonene (hvis flere distribusjoner) til datasettet skal med andre ord referere til en åpen lisens. Se Distribusjon - lisens for mer om åpne lisenser.-
Når tilgangen til distribusjonen som er tilknyttet en åpen lisens gis via en eller flere datatjenester (
dcat:DataService
) ved hjelp av egenskapen Distribusjon: tilgangstjeneste (dcat:accessService
), skal minst én av datatjenestene (hvis flere datatjenester) i tillegg også være tilknyttet en åpen lisen. Egenskapen Datatjeneste: lisens (dct:license
) til minst én av datatjenestene (hvis flere) skal med andre ord referere til en åpen lisens. Se Distribusjon - lisens for mer om åpne lisenser.
-
Eksempel i RDF Turtle:
<etDatasettMedÅpneData> a dcat:Dataset ; # datasett dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ; # offentlig tilgjengelig (pkt.1) dcat:distribution [ a dcat:Distribution ; # en distribusjon (pkt.2) dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # en åpen lisens (pkt.3) dcat:accessService [ a dcat:DataService ; # datatjeneste dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # en åpen lisens (pkt.3a) ] ; ] .
Åpne data via datatjeneste (aka API)
En datatjeneste (dcat:Dataservice
) kan gi tilgang til åpne data. For at en datatjeneste (dcat:DataService
) skal kunne sies å gi tilgang til datasett (dcat:Dataset
) med åpne data, skal følgende oppfylles:
-
Datatjenesten (
dcat:DataService
) skal tilbys under en åpen lisens. Egenskapen Datatjeneste: lisens (dct:license
) skal med andre ord referere til en åpen lisens. Se Distribusjon - lisens for mer om åpne lisenser. -
Datatjenesten gir tilgang til data. Egenskapen Datatjeneste: tilgjengeliggjør datasett (
dcat:servesDataset
) skal med andre ord referere til minst ett datasett (dcat:Dataset
). -
Alle (hvis flere) datasett (
dcat:Dataset
) som datatjenesten gir tilgang til, skal være offentlig tilgjengelige. Egenskapen Datasett: tilgangsnivå (dct:accessRights
) til alle datasettene skal med andre ord ha verdioffentlig
(http://publications.europa.eu/resource/authority/access-right/PUBLIC
).
Eksempel i RDF Turtle:
<enDatatjeneste> a dcat:DataService ; # datatjeneste dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # en åpen lisens (pkt.1) dcat:servesDataset [ a dcat:Datasett ; # datasett (pkt.2) dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ; # offentlig tilgjengelig (pkt.3) ] .
Bruk av kontrollerte vokabularer
Til flere av egenskaper er det krav til obligatorisk eller anbefalt bruk av kontrollerte vokabularer. Dette betyr at verdiene til de aktuelle egenskapene skal (obligatorisk bruk) eller bør (anbefalt bruk) hentes fra en eller flere av angitte kontrollerte lister. Se Om bruk av kontrollerte vokabularer i DCAT-AP-NO, for hvilke kontrollerte vokabularer som skal/bør brukes for hvilke egenskaper.
Om identifikator (dct:identifer
)
Identifikatoren til en ressurs (et datasett, en datatjeneste, en katalog osv.) er som regel systemgenerert av verktøystøtte, slik at du som vanlig bruker ikke trenger å fylle ut verdien til denne egenskapen manuelt.
Beskrivelsen tar utgangspunkt i indikatoren til et datasett (tilsvarende Datasett: identifikator (dct:identifier
) i DCAT-AP-NO), men den gjelder også for de andre klassene i DCAT-AP-NO der dct:identifier
brukes.
Identifikatoren til et datasett skal være unik og varig. Se Forvaltningsstandard for pekere til offentlige ressurser på nett.
Subjektet (det første leddet) i en RDF-trippel er per definisjon en identifikator (URI). I en konkret realisering vil instanser av klassen Datasett (dcat:Dataset
) derfor få en «innebygd» identifikator.
For å ha minst mulig avvik fra EU-standarden som DCAT-AP-NO er basert på, har vi beholdt krav på at dct:identifier
er obligatorisk for dcat:Dataset
. dct:identifier
trenger ikke å inneholde den samme identifikatoren som den innebygde URIen i en trippel, men når det er den samme identifikatoren, anbefales det at hele den innebygde URIen (subjektet i en trippel) kopieres til dct:identifier
.
Eksempel i RDF Turtle:
<https://example.org/dataset/123> a dcat:Dataset ; dct:identifier "https://example.org/dataset/123"^^xsd:anyURI .