파싱이란 문자열 혹은 바이너리 데이터에서 원하는 데이터를 뽑아와서 정리하는 기술입니다.
파싱은 주로 사이트의 내용을 가져오기 위해서 많이 사용이 됩니다.
웹사이트의 소스를 가져와서 소스 안에 필요한 데이터를 골라냅니다.
파싱의 예)
public String[] readTable(String table) {
table = table.replace("[", "").replace("]", ""); // 주어진 문자열에서 '[', ']' 문자를 없앤다
table = table.replace(" ", ""); // 주어진 문자열에서 공백도 없앤다
table = table.replace("'", ""); // 주어진 문자열에서 ''' 도 없앤다
return table.split(","); // 주어진 문자열을 ',' 을 기준으로 잘라서 배열로 반환
}
이렇게 반환한 배열이 파싱된 값입니다.
즉, 파싱이란 많은 데이터들 중에서 정렬하여 데이터를 골라내는 작업을 의미합니다.