통계 기초 통계 용어 정리 2018/07/19 15:13 by Lynn




위키피디아에 꽤나 잘 정리되어 있다 싶어 조금만 수정 후 대부분 그대로 가지고 왔다.


오늘은 그냥 머리에 개념만 쏙쏙 집어 넣자!

그래도 읽어도 모르겠다고 하면, 앞으로 작성될 많은 포스팅을 살펴보면 좋을 것이다!


하나 팁을 주자면, 조사대상이 되는 Parameter의 값 앞에는 전형적으로 '어미 모'자를 써서 표기한다.
  • 모집단(population) : 관측 대상이 되는 전체 집단이다. 조사의 대상이 되는 자료 전체. 
  • 표본(sample) : 모 집단에서 일부만 조사한 것. 모집단에서 추출된 자료의 집합. 
  • 대푯값(representative value) : 어떤 데이터를 대표하는 값. 평균(mean), 중앙값(median), 최빈값(mode)이 있다. 
  • 기댓값(expected value) : 통계에서는 평균값이다. 가능한 값마다 확률을 곱해서 모두 더한 값이다. 
  • 산포도(degree of scattering) : 자료(data)가 흩어져 있는 정도. 범위(range), 분산(variance), 표준편차(standard deviation)이 있다. 
  • 표준 편차(standard deviation) : 분산을 제곱근 한 값. 간단하게 제곱했다가 다시 제곱근 하여 값을 만드는데 굳이 이렇게 하는 이유는 음수를 양수로 바꿔주기 위해서이다. (나중에 다시 한번 다루겠다.)
  • 절대 편차(absolute deviation) : 관측값에서 평균 또는 중앙값을 빼고, 그 차이에 절대값을 취하고 그 값들의 대푯값을 구한 것. 
  • 범위(range) : 가장 큰 측정값에서 가장 작은 측정값을 뺀 값. 

  • 모평균(population mean) : 모집단의 평균은 μ로 표시한다. 모두 더한 후 전체 데이터 수 n으로 나눈다. 확률변수의 기댓값이다. 
  • 표본 평균(sample mean) : 표본의 평균은 {\displaystyle {\bar {X}}}로 표시한다. 모두 더한 후 n으로 나눈다. 
  • 모분산(population variation) : 모집단의 분산은 σ2 로 표시한다. 관측값에서 모 평균을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다. 
  • 표본 분산(sample variation) : 표본의 분산은 s2로 표시한다. 관측값에서 표본 평균을 빼고 제곱한 값을 모두 더한 것을 n-1로 나눈 것이다. (왜 n-1로 나누는지는 나중에 다시 다루겠다.)
  • 모 표준 편차(population standard deviation) : σ으로 표시하고, 모분산에 제곱근을 씌워서 구한다. 
  • 표본 표준 편차 (sample standard deviation) : s로 표시하고, 표본 분산에 제곱근을 씌어서 구한다. 

  • 전수조사 : 조사의 대상이 되는 자료 전체를 빠짐없이 조사하는 것. 
  • 표본조사 : 조사의 대상이 되는 자료의 일부만을 택하여 조사하여 전체를 추론하는 것. 
  • 측정수준 : 양적자료, 질적 자료 등. 측정수준에 따라 통계에 이용해야 할 요약 통계량이나 통계 검정법이 다르다. 이 척도에 대해서는 나중에 따로 다루도록 하겠다.  
* 위 내용은 위키피디아의 내용을 바탕으로 했습니다!