보건통계학은 출생, 사망, 질병, 인구변동 등 인구의 특성을 연구하는 일과 생명, 건강 등 보건에 관한 여러 가지 현상과 대상물을 계측하고 이를, 정리, 분석하여 그 특성으로 밝히는 통계학의 응용 분야다.
보건 통계는 어느 지역사회 또는 한 국가의 보건 수준을 나타내거나 보건 사업의 계획에 필요한 사전 평가나 사전 진행 평가 및 결과 평가에 활용하는 등 다양하게 이용된다. 이는 인간집단, 지역사회의 질병 관리와 보건 향상을 위한 모든 연구와 조사의 분석에 있어서 길잡이가 되며 보건정책의 수립과 방향 설정의 길잡이 역할을 한다.
보건 통계의 자료원은 주로 국세조사 자료, 출생, 사망, 결혼, 이혼 등의 법적 신고자료, 법정전염병의 신고 및 조사 자료, 의료기관, 보건기관, 학교, 산업체 등의 의무기록이나 신체검사 기록, 각종 연구자의 연구 결과나 실태조사 자료 등을 사용한다.
통계에는 모집단과 표본이 필요한데 먼저 모집단은 조사의 대상이 되는 전체 집합을 말하며 모집단의 크기에 상관없이 구성원 수가 한정된 집단인 유한모집단과 모집단을 구성하는 구성요소가 무한한 무한모집단이 있다. 일반적으로 어느 사항을 조사하고자 할 때 가장 좋은 장법은 모집단을 전부 조사하고 분석하는 것이지만 시간적, 경제적 제약으로 그렇게 할 수 없기에 모집단의 일부를 추출하여 조사하게 된다. 이 추출한 일부를 표본이라 한다. 즉 표본의 정의는 모집단을 구성하는 전체 조사단위 중 일부의 조사단위를 추출하였을 때 얻는 모집단의 일부를 말한다. 표본에는 확률표본과 비확률표본이 있는데 확률표본은 모집단에서 추출된 확률이 동일한 상황에서 추출된 것이고 비확률표본은 모집단에서 표본으로 추출된 확률이 다른 상황에 이루어진 표본이다.
표본추출 방법은 모집단으로부터 그 특성을 대표할 수 있는 표본을 뽑아내는 것으로서 그 방법으로는 비확률표본추출법과 확률표본추출방법이 있는데 주로 확률표본추출법이 이용된다. 비확률추출을 하는 경우 모집단이 그 결과를 적용할 수 없고 개인의 편견이 개입되기도 하기 때문이다. 확률표본추불방법에는 단순임의추출법, 층화임의추출법, 계통추출법 및 집락 추출법이 있다.
단순임의추출법은 가장 단순하고 일반적인 추출 방법으로 모집단의 구성요소 하나하나가 뽑힐 확률이 똑같은 방법으로 모집단에 일련번호를 부여한 후 보통난수표를 이용하여 무작위로 추출한다. 층화임의추출법은 모집단이 가지고 있는 특성을 고려하여 계층으로 나누고 각 집단으로부터 표본을 무작위로 추출하는 방법이다. 계통추출법은 모집단에 일련변호를 부여한 후 표본추출 간격을 정하고 첫 번째 표본은 단순임의추출법으로 뽑은 후 이미 정한 표본추출간격으로 표본을 뽑는 것을 말한다. 이 방법은 여론 조사 등이 가장 많이 사용하는 방법이다. 집락 추출법은 모집단의 구성단위를 자연적 또는 인위적으로 몇 개의 집락으로 구분하여 무작위로 추출하여 추출된 집락을 전수조사하는 것이다. 이 방법은 임상 연구에서 확률추출보다 실제로 더 자주 활용되는 표본추출 방법으로 확률표본추출이 사실상 불가능하거나, 모집단을 정확하게 규정지을 수 없는 경우, 표본오차가 크게 문제가 되지 않거나, 반드시 확률표본 추출을 해야 할 필요성이 없는 경우에 쓰인다. 비확률표본추출법에는 연속 추출, 편의 추출, 판단추출이 있다.
척도란 조사 대상의 특성을 숫자나 기호로 표시한 것으로 변수의 척도로 특정한 내용을 수량적으로 표시한 것인데 측정척도는 명목척도, 서열척도, 등간척도, 비율척도로 나누어진다.
명목척도는 측정 대상자의 특성이나 성질을 상호 배타적인 범주로 나타낸 척도로서 가장 낮은 척도이고 서열척도는 특정 대상자가 가지고 있는 어떤 특성의 상대적 크기에 따라 순서로서 측정 대상을 구분할 수 있는 척도이다. 등간척도는 순서를 정할 수 있는 구분 이외에 서로 이웃하는 순서의 간격을 알 수 있는 척도로서 간격척도라고도 하며 비율척도는 척도 중 가장 높은 수준의 척도로서 명목, 순서, 간격척도의 구분을 가능하게 함은 물론 비교가 가능하다.
통계자료의 정리 방법에는 여러 가지가 있는데 그중 도수분포표는 자료의 특성을 요약하여 정리하는 기술통계학에서 중요한 역할을 하는 것으로서 조사된 자료의 발생빈도와 자료에 따른 어떤 규칙성이 있는가를 알기 위하여 작성되는 표이다. 도수분포표를 통해 알 수 있는 것은 측정값의 최소값이 있는 최소급과 최대값이 포함된 최대급을 알 수 있고, 측정값의 범위를 알 수 있으며 급별 빈도와 빈도가 가장 높은 급과 가장 낮은 급을 알 수 있다. 각 급의 빈도로 이루어지는 분포의 모양 또한 알 수 있다.
도표는 통계자료가 지니고 있는 뜻을 시각적으로 보고 이해할 수 있는 자료 분석의 한 표현적인 방법으로 크기순서 표나 도수분포표에서 쉽게 이해할 수 없는 통계자료의 뜻도 적절한 도표를 통해 쉽게 표현할 수 있다. 도표에는 점선 도표. 막대도표, 원 도표가 있는데 점선 도표는 시계열적으로 변화하는 값이나 측정값이 변화 경향을 시각적으로 쉽게 볼 수 있는 장점이 있다. 막대도표는 평면이 직교좌표를 모양을 쉽게 이용할 수 있고, 원 도표는 전체 중의 일부를 표현하는 데 적합하며 변수값을 서열화시킬 필요가 없다.
히스토그램은 간격척도로 측정된 변수를 범주화시켜 범주별로 빈도를 비교할 때 사용하며, 상관도표는 두 변수의 관계를 직교좌표에 표시한 도표이고, 누적도수도표는 개별 관측값의 누적된 도수가 얼마인가를 제시해 주며 누적 비율은 개별관측값이 그 집단에서 어느 정도의 위치에 있는가를 파악할 수 있게 해 준다.
출처 - 「공중보건학」-권명진 외17