우리가 다루는 책 p.6을 보면 통계절차는 크게 기술통계와 추론통계로 나눌 수 있다고 설명한다.

이번 글에서는 각각이 무엇을 의미하는지 다룰 것이다.

 

▶기술통계(descriptive statistics)

국어사전에 명시된 '기술하다'의 정의는 '대상이나 과정의 내용과 특징을 있는 그대로 열거하거나 기록하여 서술하다'이다.

기술통계에서의 대상은 연구자가 수집한 데이터일 것이다.

따라서 기술통계데이터의 내용과 특징을 있는 그대로 서술하는 것으로,

참가자들 연령의 평균 및 변산성이나 과제의 평균 반응시간 혹은 평균 정확성 등을 떠올릴 수 있다.

 

이러한 예들은 우리가 수집한 데이터가 어떤 특성을 지니는지 있는 그대로 보여준다는 공통점을 지닌다.

 

▶추론통계(inferential statistics)

무언가를 추론하기 위해서는 추론하기 위한 근거와 추론하는 대상이 필요하다.

추론통계에서 추론하기 위한 근거표본으로부터 얻은 데이터이고,

이러한 표본 데이터를 기반으로 전집의 특성추론한다.

 

기술통계에서는 단순히 우리가 얻은 데이터의 특성이 어떠한지 보여주는 것에 그쳤다면,

추론통계에서는 표본 데이터의 특성을 기반으로 전집의 특성은 어떠할 것이다라고 판단?하게 된다.

물론 이 판단은 틀릴수도, 맞을수도 있다.

판단이 틀린 경우는 두 가지로 나눌 수 있는데 이는 1종 오류 및 2종 오류와 관련이 있다.

이 개념은 다음에 다룰 것이다.

 

추론통계에는 t-검증, ANOVA, 중다회귀 등과 같은 각종 분석법이 포함되는데,

중요한 것은 전집의 성질을 추론하기 위해서는 논리적인 이론이 필요하다는 것이다.

이는 가설 설정과 관련된 부분이기 때문에 본 포스팅에서는 자세히 다루지 않을 것이다.

어쨌든 하고 싶은 말은, 현재 다루는 부분은 통계자료분석 단계이기 때문에

이미 이론적 배경과 논리가 있는 가설을 세운 뒤에 데이터를 수집한 상황이라는 것을 가정했다는 것이다.

이러한 가정 하에서만 우리가 수집한 데이터의 분석 결과를 토대로 전집의 성질을 추론하는 것이 타당할 것이다.

 

물론 요즘에는 데이터를 어마무시하게 모아서 데이터를 기반으로 현상을 설명하는 방법이 대세인 것 같지만

나는 빅데이터나 머신러닝에 대해서는 아직 공부하지 않았으므로 이는 논외로 하자.

반응형

'통계 공부 > 기본 용어' 카테고리의 다른 글

통계절차 선택  (0) 2022.02.15
모수치와 통계치  (0) 2021.12.01
무선표집과 무선할당(random assignment)  (0) 2021.11.29
무선표본  (0) 2021.11.23
실험 설계 관련 용어-전집과 표본  (0) 2021.11.12

+ Recent posts