아핫뉴스실시간 인기검색어
아핫뉴스 화산 이미지
아하

학문

기계공학

탈퇴한 사용자
탈퇴한 사용자

실험을 10회 하여 실험결과의 평균값을 구할 때 제일 높은 값과 제일 낮은 값을 제외하고 나머지로 평균값을 구하나요?

실험을 10회 하여 실험결과의 평균값을 구할 때 제일 높은 값과 제일 낮은 값을 제외하고 나머지로 평균값을 구하나요? 제일 높은값이나,낮은 값이 심하게 튈경우에는 어떻게 하나요?

    3개의 답변이 있어요!
    • 안녕하세요. 서종현 전문가입니다.

      10회 실험 결과의 평균값을 구할때 가장 높은 값과 가장 낮은 값을 제외하고 나머지 값으로 평균을 내는 것은 절사평균

      이라고불리는 방법중 하나입니다. 이는 극단적인 값(이상치,OUTLIER)이 평균에 미치는 영향을 줄이기 위해 사용되는 통계적 기법입니다.

      가장 높은 값과 가장 낮은 값을 제외하는 이유 : 실험 과정에서 측정 오류, 일시적인 환경 변화, 장비 오작동으로 인해 실제 경향과 동떨어진 결과가 나올수 있습니다. 이러한 값들을 이상치라고 하는데 이상치가 평균 계산에 포함되면 전체 데이터의 대표성을 왜곡할수있습니다. 그래서 극단적인 상위 및 하위 데이터를 제거함으로써 더 신뢰할수있는 평균값을 얻으려는 목적입니다.

      심하게 튀는 값(이상치)의 처리 : 만약 가장 높은 값이나 낮은 값이 심하게 튀는 경우에는 절사 평균 방법이 매우 유용합니다.단순히 한 두개의 이상치가 전체 평균을 크게 움직이는 것을 방지할수있기 때문입니다. 그러나 데이터를 제거하기 전에 왜 그런값이 나왓는지 원인을 파악하는 것이 중요합니다. 측정 오류인지, 아니면예상치 못한 새로운 현상인지를 확인해야 합니다. 만약 이상치가 시스템적인 오류나 측정 오류로 인한 것이 명확하다면 제거하는것이 타당하지만 새로운 발견일수도 있으므로 신중하게 접근해야 합니다. 통계학적으로 이상치를 탐지하고 처리하는 더 정교한 방법들도 있습니다.

    • 안녕하세요. 김철승 과학전문가입니다.

      실험 결과의 평균값을 계산할 때 최고값과

      최저값을 제외해야 하는지 궁금하시군요.

      답변은 상황에 따라 다릅니다.

      측정 오류나 이상 값으로 인해 평균값이 왜곡될 수 있음

      정규 분포를 가정할 때 이상 값이 평균값을 왜곡하여 모집단 특성을 잘 나타내지 못할 수 있음

      최고값과 최저값만 제외

      최고값과 최저값, 그리고 그 다음으로 높고 낮은 값까지 제외 (상위/하위 25% 제외)

      Q-Q 플롯 등을 통해 이상 값을 시각적으로 확인 후 제외

      제외한 값을 포함한 전체 데이터 개수에서 제외한 값의 개수를 뺀 값으로 나누어 평균 계산

      최고값과 최저값을 제외하지 않는 경우:

      데이터 개수가 적을 경우 (5개 미만)

      이상 값이 측정 오류가 아닌 실제 값일 가능성이 높을 경우

      데이터 분포가 정규 분포를 따르지 않을 경우

      최고값과 최저값을 제외할지 여부는 데이터 개수, 이상 값의 발생 가능성, 데이터 분포, 그리고 분석 목적 등을 고려하여 결정해야 합니다.

      이상 값을 제외하는 방법은 다양하며, 상황에 따라 적절한 방법을 선택해야 합니다.

      이상 값을 제외한 후에도 평균값이 왜곡될 가능성이 있으므로, 결과 해석 시 주의해야 합니다.

      데이터 분석 전문가에게 조언을 구하는 것도 좋은 방법입니다.

      답변이 마음에 드셨다면 좋아요와 추천을 부탁드립니다.

    • 안녕하세요. 박성학 과학전문가입니다.

      어떤 실험을 했느냐에 따라 달라질수 있을텐데요. 보통은 10회 실험값을 평균하여 이평균값에서 몇% 이상 차이가 나는 값을 버리고 남은 값으로 다시 평균값을 구합니다.