법률
에브리타임 글 스크랩핑하면 불법인가요?
에브리타임 글을 스크래핑하고 요약하여 챗봇 데이터로 쓰는 건 불법인가요? 제가 생각해도 불법인 거 같은데 불법이 안되려면 어떤 식으로 우회 해야하나요?
1개의 답변이 있어요!
안녕하세요. 최지욱 변리사입니다.
에브리타임(Everytime)의 게시물을 무단으로 스크래핑하여 챗봇 데이터로 사용하는 것은 저작권법, 부정경쟁방지법, 이용약관 위반에 따른 민·형사상 리스크가 매우 커 보입니다. 법적 리스크를 완전히 회피하는 '기술적 우회로'도 사실상 존재하지 않으며, 권리자와의 협의 또는 합법적인 데이터 수집 경로를 확보하는 것이 실무상 필수적으로 보입니다.1. 주요 법적 리스크
단순히 글을 긁어오는 행위가 왜 문제가 되는 이유는 다음과 같습니다.
저작권법 위반 (데이터베이스제작자의 권리):
근거: 저작권법 제91조 및 제93조
내용: 에브리타임과 같은 플랫폼은 데이터의 체계적 관리를 위해 상당한 인적·물적 투자를 한 '데이터베이스제작자'로 보호받습니다. 게시물 자체의 저작권과 별개로, 플랫폼의 데이터를 대량 수집하는 행위는 이 권리를 침해하는 것입니다.
부정경쟁방지법 위반 (성과물 무단 사용):
근거: 부정경쟁방지법 제2조 제1호 (파)목
내용: 타인의 상당한 투자나 노력으로 만들어진 성과를 무단으로 사용하여 경제적 이익을 침해하는 행위입니다.
서비스 이용약관 위반:
에브리타임 이용약관은 보통 자동화된 수단(크롤러 등)을 이용한 데이터 수집을 엄격히 금지합니다. 이는 민사상 손해배상 및 서비스 이용 차단의 근거가 됩니다.
2. 대응안
"불법이 안 되기 위한 우회"보다는 "법적 정당성을 확보하는 방향"으로 접근하는 것이 바람직하다고 생각합니다.
플랫폼사와 API 제휴 협의: 가장 안전한 방법입니다. 데이터 사용료를 지불하고 공식적인 API를 통해 데이터를 공급받습니다.
Open Dataset 활용: AI 허브(AI Hub) 등 정부 주도로 구축된 합법적인 한국어 대화 데이터셋이나 라이선스가 허용된 오픈소스 데이터를 사용합니다.
비식별화 및 가공: 데이터를 긁어올 때 개인정보를 즉시 삭제(De-identification)하고, 원문 그대로가 아닌 요약된 '통계적 수치'나 '추상적 개념'만 추출합니다. 단, 수집 단계에서의 침해 문제는 여전히 남습니다.
robots.txt 확인: 해당 사이트의 robots.txt에서 크롤링을 허용하는지 확인합니다. 다만, 허용하더라도 상업적 이용 시 별도 합의가 없으면 부정경쟁방지법 위반 소지가 있습니다.
3. 법률적 유의사항
현재 대한민국에서도 'AI 학습을 위한 저작물 이용(TDM)'에 관한 저작권법 개정안이 논의 중이나, 아직 상업적 목적으로 타인의 데이터베이스 전체를 무단 사용하는 것을 면책해 주는 규정은 없습니다. 특히 특정 대학 커뮤니티의 폐쇄적인 데이터를 타겟팅하는 경우, 해당 플랫폼사의 강력한 법적 대응(고소 및 가처분 신청)에 직면할 가능성을 염두에 두셔야 할 것 같습니다.