인터넷 아카이빙은 웹크롤러가 자동으로 수집하는 방식이랍니다.
웹크롤러라는 프로그램이 주기적으로 웹사이트를 방문해서
HTML CSS 이미지 같은 웹페이지 구성요소들을 저장해두는 거에요
웨이백머신은 특히 인터넷 아카이브라는 비영리단체에서 운영하는데 1996년부터
지금까지 수많은 웹페이지를 보관하고 있답니다
크롤러가 수집한 데이터는 압축해서 특별한 형태로 저장하는데 이걸 WARC파일이라고 부르구요
아카이브 투데이는 사용자가 요청할때마다 실시간으로 웹페이지를 캡쳐해서
저장하는 방식을 사용해요
두 서비스 모두 자바스크립트나 동적콘텐츠는 완벽하게 저장하기 어려워서
일부 기능이 작동안할수 있지만 기본적인 내용은 잘 보존된답니다
이런 아카이빙 덕분에 사라진 웹사이트도 다시 볼수있고 과거의 인터넷 모습도
확인할수 있어서 디지털 역사보존에 큰 도움이 되죠
재미있는건 이렇게 저장된 데이터는 여러 서버에 분산저장되어서
안전하게 보관된다는거에요
요즘은 블록체인 기술을 활용해서 더 영구적으로 보존하는 방법도 연구중이라네요..