콘텐츠로 이동

데이터셋 검색하기

사용 가능한 데이터셋을 찾고, 원하는 데이터를 빠르게 발견하는 방법을 안내합니다.

왜 검색이 필요한가요?

KPubData는 다수의 공공데이터 기관을 지원합니다. 최신 지원 목록은 SUPPORTED_DATA.md를 참고하세요. 정확한 데이터셋 ID를 외울 필요 없이, 키워드로 검색하면 됩니다.

키워드 검색

search()는 데이터셋의 이름, 설명, 태그, ID를 모두 검색합니다:

results = client.datasets.search("예보")
for ds in results:
    print(ds.id, ds.name, ds.tags)

예상 출력:

datago.village_fcst 동네예보 ('weather', 'forecast', '기상')
datago.ultra_srt_ncst 초단기실황 ('weather', 'realtime', '기상')

정밀도 조절 (threshold)

검색 결과가 너무 많으면 threshold를 올려 엄격하게, 적으면 내려 느슨하게 조절합니다:

# 엄격한 검색 (정확한 일치에 가까운 결과만)
strict = client.datasets.search("기준금리", threshold=0.8)

# 느슨한 검색 (오타 허용)
loose = client.datasets.search("기준금리", threshold=0.3)

기본값은 0.5입니다.

검색 결과 활용

검색으로 찾은 DatasetRef는 다음 정보를 포함합니다:

속성 설명
id 정규화된 데이터셋 ID (예: bok.base_rate)
name 데이터셋 이름
description 설명 (없을 수 있음)
tags 분류 태그
source_url 원본 API 문서 링크
operations 지원 연산 (list, raw 등)

검색으로 ID를 알았으면 바로 데이터를 조회할 수 있습니다:

ds = client.dataset("datago.village_fcst")
result = ds.list(base_date="20250401", base_time="0500", nx="55", ny="127")

다음 단계