아핫뉴스실시간 인기검색어
아핫뉴스 화산 이미지
아하

학문

기계공학

강력한가위
강력한가위

논문 작성시 데이터 처리를 어떻게 해야할까요?

학위 논문 처음으로 쓰고 있습니다

데이터 처리시 의문점이 있어 질문합니다

1 실험 결과중 편차를 많이 벗어난 값의 처리

ㅡ 삭제 혹은 재측정 하기엔 어려운 상황입니다

2 여러 데이터의 통계처리

ㅡ 시작점이 실험마다 다른데 변화의 추세는 비슷한 데이터를 어떻게 표현하는게 좋은지 궁금합니다

3 엑셀 외에 주로 사용하는 프로그램이 어떤게 있는지 궁금합니다

55글자 더 채워주세요.
2개의 답변이 있어요!
  • 안녕하세요. 서종현 전문가입니다.

    • 편차를 많이 벗어난 값(이상치) 처리 : 삭제나 재측정이 어려운 경우, 학위 논문에서는 해당 값을 단순히 없애기보다는 다음 방법을 고려하는것이 좋습니다.

      1. 명확히 기술 및 근거 제시 : 논문에 해당 데이터가 이상치임을 밝히고, 왜 삭제하거나 재측정하지 않았는지, 그리고 이러한 이상치가 분석 결과에 어떤 영향을 미칠수 있는지 솔직하게 기술하는 것이 중요합니다.

      2. 강건 통계 활용 : 평균 대신 중앙값을 사용하거나, 이상치의 영향을 덜 받는 통계 분석 방법을 적용하는것을 고려 해볼수있습니다.

      3. 데이터 변환 : 로그 변환 등을 통해 데이터 분포의 왜곡을 줄이는 방법도 있지만, 변환된 데이터의 해석에 유의해야 합니다.

    • 여러 데이터의 통계 처리 : 시작점이 다른 여러 데이터의 변화 추세를 비교할때는 상대적인 변화를 보여주는 것이 효과적입니다.

      1. 시작점 대비 변화율 계산 : 각 시점의 값을 해당 실험의 시작점 값으로 나누어 백분율 변화로 표시하면, 시작점의 절대적인 차이와 관계없이 추세의 유사성을 명확하게 비교하고 시각화할수있습니다.

      2. 정규화 또는 표준화 : 데이터를 동일한 척도로 변환하여 비교하는 방법도 있습니다.(예:0과 1사이로 스케일링 또는 평균0, 표준 편차 1로 맞추기)

    • 엑셀 외 주로 사용하는 프로그램 : 심화된 통계 분석 데이터 처리를 위해서는 엑셀 외에 다음 프로그램들을 주로 사용합니다.

      1. R : 통계 분석 및 시각화에 특화된 오픈 소스 프로그래밍 언어로, 다양한 통계 패키지가 있어 학술 연구에서 매우 널리 활용됩니다.

      2. 파이썬 : Pandas, NumPy,Matplotlib 등의 라이브러리를 통해 데이터 처리, 분석, 시각화 까지 폭넓게 활용되며, 특히 데이터 과학 분야에서 강력한 도구입니다.

      3. SPSS,SAS,STATA : 이들은 상업용 통계 소프트웨어로, 사용자 친화적인 인터페이스를 제공하여 복잡한 통계 분석을 수행할수있습니다.

      4. GraphPad Prism : 생명 과학 분야에서 주로 사용 되며, 그래프 작성과 통계 분석에 특화 되어 있습니다.

  • 안녕하세요. 조일현 전문가입니다.

    이상치가 결과 해석에 중요 하거나 분석 가정에 큰 영향을 줄 수 있다면 삭제하는 것이 좋을 듯합니다.

    이에 따라 삭제 이유와 삭제 전 후 결과를 기록할 필요가 있으며 만약 삭제가 어렵다면 로그나 제곱근 등 방법을 통해 이상치를 줄일 수 있어야합니다. 각 실험의 시작점이 다르더라도 변화량,증감비 등 값을 비교하는 방법이 유용하며

    데이터 특성에 따라 적합한 통계 기법을 선택하는 것이 바람직합니다.

    엑셀 외 자주 쓰이는 프로그램으로는 R/Python/SPSS/SAS/Tableau 등이 있겠습니다.