아핫뉴스실시간 인기검색어
아핫뉴스 화산 이미지
화산 아이콘 11
신우현 면허 없는 일상
아하

학문

기계공학

추위타는펭귄32
추위타는펭귄32

머신러닝 알고리즘이 데이터 편향으로 인해 차별적 결과를 낳는다?

안녕하세요.

학습 데이터가 한쪽 집단에 치우지게 되면 채용 등에서 불공정한 판단을 받을 수도 있습니다. 데이터의 전처리나 모델 수정, 결과 보정 등에서 어떤 접근으로 편향을 줄일 수 있을까요?

2개의 답변이 있어요!
  • 안녕하세요. 고한석 전문가입니다.

    데이터 단계에서는 대표성 있는 표본 수집과 불균형 데이터 재샘플링으로 편향을 완화합니다.
    전처리 과정에서 민감 속성 제거·가중치 부여로 특정 집단의 영향력을 조정합니다.
    모델 학습 시 공정성 제약(fairness constraints)이나 적대적 학습을 적용할 수 있습니다.
    결과 단계에서는 집단 간 예측 결과를 보정(post-processing)해 차이를 줄입니다.
    마지막으로 공정성 지표를 지속적으로 점검·감사하는 체계가 필수적입니다.

  • 안녕하세요. 조일현 전문가입니다.

    불리하게 작용될 수 있기 때문에 배포 전에 공정성이 정확해야 겠습니다.

    또한 불공정한 판단이 맞다면 재 학습이나 업데이트를 통해 모델을 개선할 필요가 있습니다.

    실제로 맞는 데이터를 재 수집하여 주기적으로 학습하여 정확한 판단을 조정해야 할 것 같습니다.