홈
토픽
스파링
잉크
미션
전문가 신청
베리몰
나도 질문하기
생활
성실한따오기76
자격증 공부를 하다보면 더미 변수를 인코딩 하는 방법 중에 라벨 인코딩과 원핫 인코딩이 있더라고요.
그 둘은 결국 범주형의 데이터를 수치화시키는 것인데 라벨 인코딩과 원핫 인코딩 둘의 차이점은 어떤 것이며 어떤 경우에 더 적합한지 궁금합니다.
1개의 답변이 있어요!
푸른나무102
라벨 인코딩은 각 범주를 숫자로 매핑하는 방법으로, 주로 순서가 있는 범주형 데이터에 적용됩니다.
원핫 인코딩은 각 범주를 이진 벡터로 변환하여 범주 간 독립적인 특성을 나타냅니다. 주로 범주 간의 관계가 없는 경우에 사용됩니다.
적절한 인코딩 방법은 데이터의 특성과 사용하는 머신러닝 알고리즘에 따라 선택되어야 합니다.
응원하기