본문 바로가기

카테고리 없음

두 개의 샘플을 사용한 가설 검정

반응형

두 개의 샘플을 사용한 가설 검정

연구는 종종 두 그룹을 비교합니다. 예를 들어, 연구자들은 아스피린이 심장마비를 예방하는 효과에 관심이 있습니다. 지난 몇 년 동안 신문과 잡지는 두 그룹이 관련된 다양한 아스피린 연구를 보고했습니다. 일반적으로 한 그룹에는 아스피린이 제공되고 다른 그룹에는 위약이 제공됩니다. 그런 다음 몇 년에 걸쳐 심장마비 비율을 연구합니다. 두 그룹의 비교를 처리하는 다른 상황이 있습니다. 예를 들어, 연구에서는 다양한 식단과 운동 프로그램을 비교합니다. 정치인은 자신에게 투표할 수 있는 소득 계층이 다른 개인의 비율을 비교합니다. 학생들은 SAT 또는 GRE 준비 과정이 실제로 점수를 높이는 데 도움이 되는지 여부에 관심이 있습니다. 많은 비즈니스 응용 프로그램은 두 그룹을 비교해야 합니다. 두 가지 다른 투자 전략의 투자 수익 또는 다른 관리 스타일의 생산 효율성의 차이일 수 있습니다. 두 개의 평균 또는 두 개의 비율을 비교하려면 두 그룹으로 작업합니다. 그룹은 독립적이거나 일치하는 쌍으로 분류됩니다. 독립 그룹은 독립적인 두 개의 표본으로 구성됩니다. 즉, 한 모집단에서 선택한 표본 값이 다른 모집단에서 선택한 표본 값과 어떤 식으로든 관련이 없습니다. 일치하는 쌍은 종속되는 두 개의 샘플로 구성됩니다. 일치 쌍을 사용하여 테스트한 매개변수는 모집단 평균입니다. 독립 그룹을 사용하여 테스트한 매개변수는 각 그룹의 모집단 평균 또는 모집단 비율입니다. 두 개의 독립적인 모집단 평균의 비교는 매우 일반적이며 두 그룹이 서로 다르다는 가설을 테스트하는 방법을 제공합니다. 야간 근무가 주간 근무보다 생산성이 낮습니까? 고정 자산 투자의 수익률이 보통주 투자의 수익률과 다른가요? 두 표본 평균 간의 관찰된 차이는 평균과 표본 표준 편차 모두에 따라 다릅니다. 개별 표본 간에 큰 변동이 있는 경우 우연히 매우 다른 평균이 발생할 수 있습니다. 테스트 통계는 이 사실을 설명해야 합니다. 알 수 없고 같지 않을 수 있는 모집단 표준 편차가 있는 두 개의 독립 모집단 평균을 비교하는 검정을 Aspin Welch t-검정이라고 합니다. 나중에 보게 될 자유도 공식은 Aspin-Welch에 의해 개발되었습니다. 평균과 비율에 대한 가설 검정을 개발할 때 중심 극한 정리로 시작했습니다. 우리는 표본 평균이 표본 평균의 분포에서 나오고 표본 비율이 표본 비율의 표본 분포에서 나온다는 것을 인식했습니다. 이것은 우리의 표본 매개변수, 표본 평균 및 표본 비율을 랜덤 변수로 만들었습니다. 이러한 랜덤 변수의 출처를 아는 것이 중요했습니다. 중심 극한 정리는 우리에게 정규분포라는 답을 주었습니다. Z 및 t 통계는 이 정리에서 나왔습니다. 이것은 표본 평균이 평균 또는 비율의 특정 가설 값을 갖는 분포에서 나올 확률을 측정하는 방법에 대한 우리의 질문에 대한 해결책을 제공했습니다. 두 경우 모두 다음과 같은 질문이었습니다. 표본 데이터의 평균(또는 비율)이 우리가 관심 있는 가설 값을 가진 모집단 분포에서 나올 확률은 얼마입니까? 이제 우리는 두 표본의 평균이 같은지 여부에 관심이 있습니다. 우리의 질문은 변하지 않았습니다. 이 두 표본이 동일한 모집단 분포에서 왔습니까? 이 문제에 접근하기 위해 우리는 새로운 랜덤 변수를 생성합니다. 각 데이터 세트에서 하나씩, 두 개의 표본 평균이 있다는 것을 알고 있으므로 두 개의 미지의 분포에서 오는 두 개의 랜덤 변수가 있습니다. 문제를 해결하기 위해 샘플 평균 간의 차이인 새로운 확률 변수를 만듭니다. 이 새로운 확률 변수에는 분포도 있으며, 다시 중심 극한 정리는 원래 데이터의 기본 분포에 관계없이 이 새로운 분포가 정규 분포를 따른다고 알려줍니다. 

반응형