DCAT

From CS Wiki
Data Catalogue Vocabulary

공개되는 데이터를 검색 활용하기 위해 개방 유통되는 데이터에 대한 정보를 서술하기 위한 어휘 등을 규격화한 기술표준

역사

  • DCAT v1은 2014년 W3C GLD[1] 워킹그룹에서 제정
  • 2015년에는 유럽연합 집행위원회 주도로 DCAT-A[2]P를 추가로 제정하여 활용[3]
  • W3C DXWG[4]에서 2020년 2월, DCAT 모델의 기능을 대폭 확장한 DCAT v2 표준 제정 중

DCAT 의 장점

  • 여러 데이터 카탈로그에 대한 메타데이터 연계 활용을 용이하게 지원
  • 웹상에서 데이터에 대한 수집과 검색을 지원
  • 다양하고 분산된 데이터를 데이터 목록을 중심으로 쉽게 접근할 수 있도록 지원
  • 동일한 쿼리와 구조로 다양한 데이터에 접근할 수 있는 기능 제공

DCAT 구성

v2 기준

8개의 클래스

명칭 설명
Resource 리소스 데이터셋과 데이터서비스에 대한 기본/공통 정보(메타데이터)를 서술
DataService 데이터서비스 API와 같은 데이터서비스 상품에 대한 정보를 서술
Dataset 데이터셋 파일과 같은 데이터 상품에 대한 관련 정보를 서술
Distribution 배포 DataSet을 유통하기 위한 정보를 서술
ConceptScheme 분류체계 ‘주영역(주카테고리)-상세영역(부카테고리)’과 같이 플랫폼별 데이터 분류체계를 표현
Concept 카테고리 플랫폼별 데이터 분류체계 관리 속성 정보를 표현
Agent 기관 플랫폼 주관사업자 또는 센터 등 데이터 상품을 제공하는 기관에 관한 정보를 서술
Catalog 카탈로그 최종 사용자에게 제공되는 데이터 및 관련 서비스의 세부 내역을 서술 (데이서 상품 목록)

DCAT 예시

RDF 문법

dct : title "Imaginaty Catalog";
foaf : homepage <http://example.org/catalog>;
dct : publisher:transparency-office;
dct : language<http://id.loc.gov/vocabulary/iso639-1/en>;
dcat : dataset : dataset-001, : dataset-002, : dataset-003;

XML 문법

<?xml version="1.0"?>
<rdf:RDF
    xmlns:time="http://www.w3.org/2006/time#"
	xmlns:dct="http://purl.org/dc/terms/"
	xmlns:dcat="http://www.w3.org/ns/dcat#"
	xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:adms="http://www.w3.org/ns/adms#"
    xmlns:schema="http://schema.org/" ... >
<dcat:Dataset rdf:about="https://data.some.org/catalog/datasets/9df8df51-63db-37a8-e044-0003ba9b0d98">
    <dct:title>Zimbabwe Regional Geochemical Survey.</dct:title>
    <dct:description>During the period 1982-86 a team of geologists from the British Geological Survey ...</dct:description>
    <dcat:landingPage rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">http://dataset.info.org</dcat:landingPage>
    <dcat:keyword>exploration</dcat:keyword>
    <dcat:keyword>geochemistry</dcat:keyword>
    <dcat:keyword>geology</dcat:keyword>
    <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2012-05-10</dct:issued>
    <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2012-05-10T21:04</dct:modified>
...

CKAN

  • CKAN은 DCAT 표준을 사용하는 도구
  • CKAN은 데이터 게시, 공유, 찾기 및 사용을 간소화할 수 있는 도구를 제공하여 데이터에 액세스 가능

같이 보기

각주

  1. GLD(Government Linked Data) Working Group: W3C의 워킹그룹으로, 시맨틱 웹 기술을 사용하여 정부가 효과적이고, 활용 가능한 링크드 데이터로서 데이터 개방을 지원하는 표준을 개발함
  2. DCAT-AP (DCAT Application Profile) : 현재 DCAT에서 정의된 영역 외의 DataSet을 설명하기 위한 데이터 카탈로그 어휘
  3. 현재 EU에서 채택되어 European Data Portal의 기본 메타데이터 표준으로 통용
  4. DXWG(Data Exchange Working Group): 2017년부터 DCAT 규격의 확장을 진행하고 있는 W3C 워킹그룹