해외 주식 유료 벤더에게 데이터를 받을 때, 가격이 높은 업체는 데이터 클렌징을 덜 거쳐도 되나요?
EODHD라는 금융 자산 데이터를 공급하는 유료 벤더에게서 데이터를 샀습니다.
AMEX 거래소 몇몇 주식의 1분봉 데이터를 2004년부터 API로 수집하였습니다.
04~19년 이 기간은 꽤 예전이라 그렇다 치더라도,
20~22년 이 기간은 최근이라 데이터가 다 있을 거라고 생각했는데 생각보다 빈 곳이 너무 많았습니다.
거래량 활발한 유명 ETF인데도 불구하구요. 그래서 빈 공간을 정성 들여 채워 넣는데 현타가 왔습니다.
간단하게 forward fill, linear interpolation를 해 놓긴 했습니다만 불안합니다.
데이터 공급 업체의 비용은 월 단위 기준으로 작게는 30불, 많게는 수백 달러 하더군요.
Q1 : 가격이 높은 업체는 낮은 업체에 비해 데이터 클렌징을 덜 거쳐도 된다고 생각해도 될까요?
Q2 : 개인 투자자들이 주로 이용하는 데이터 공급 업체 중 추천할만한 업체 있으면 추천 부탁드립니다.
답변 감사합니다.
안녕하세요. 정진우 경제전문가입니다.
데이터 공급자의 가격이 높다고 해서 데이터 클렌징 작업을 덜 해야 하는 것은 아닙니다. 가격이 높은 벤더는 더 많은 데이터 포인트와 더 다양한 분석 기능을 제공할 수 있지만 데이터의 완전성과 정확성을 보장하는 것은 별개의 문제입니다.
특히 과거 데이터나 특정 거래소 데이터를 수집할 때 거래소의 데이터 품질이나 벤더의 수집 방법에 따라 빈 데이터가 발생할 수 있습니다.
이 경우, EODHD와 같은 벤더에게서 데이터를 구입했더라도 빈 데이터가 있을 수 있습니다. 빈 데이터가 많은 이유는 여러 가지가 있을 수 있습니다:
특정 시기 동안 거래량이 적거나 없었을 가능성.
데이터 전송 과정에서의 누락.
벤더의 데이터 소스 자체에 결함이 있을 수 있음.
1명 평가

