재무 가설 검정 : 개념과 예제

제대로 시작하는 기초통계학 4-2 확률변수의 기대값과 분산 (할 수있다 2024)

제대로 시작하는 기초통계학 4-2 확률변수의 기대값과 분산 (할 수있다 2024)
재무 가설 검정 : 개념과 예제
Anonim

귀하의 투자 고문은 매달 변하기 쉬운 수익을 약속하는 월별 소득 투자 계획을 제안합니다. 평균 월 180 달러의 소득이 보장되는 경우에만 투자하게됩니다. 또한 고문은 지난 300 개월 동안 평균 190 달러, 표준 편차 75 달러의 수익을 냈다고 전합니다. 이 계획에 투자해야합니까? 가설 테스트는 그러한 결정을 내리는 데 도움이된다.

이 기사는 독자가 정규 분포표, 공식, p- 값 및 통계의 관련 기본 개념에 익숙하다고 가정합니다.

위험을 결정하기위한 데이터의 실제 적용에 대한 자세한 내용은 "뮤추얼 펀드 위험을 측정하는 5 가지 방법"을 참조하십시오.

가설 테스트

(또는 유의성 테스트)는 주장, 아이디어 또는 가설을 테스트하기위한 수학적 모델입니다 샘플 세트에서 측정 된 데이터를 사용하여 주어진 모집단 세트에서 관심있는 매개 변수에 대한 정보를 제공합니다. 전체 인구의 특성에 대한보다 결정적인 정보를 수집하기 위해 선택한 샘플에서 계산이 수행되므로 전체 데이터 세트에 대한 주장이나 아이디어를 체계적으로 테스트 할 수 있습니다. 다음은 간단한 예입니다 : (A) 교장이 학교에서 10 점 만점에 평균 7 점을받는 것으로보고합니다. 이 "가설"을 테스트하기 위해 우리는 학교 전체 학생의 30 명의 학생들 (예 : 300 명)의 마크를 기록하고 그 샘플의 평균을 계산합니다. 그런 다음 (계산 된) 표본 평균과 (보고 된) 모집단 평균을 비교하고 가설을 확인하려고 시도 할 수 있습니다.

- 또 다른 예 : (B) 특정 뮤추얼 펀드의 연간 수익률은 8 %입니다. 뮤추얼 펀드가 20 년 동안 존재했다고 가정합니다. 우리는 뮤추얼 펀드의 연간 수익률을 무작위로 샘플링하여 (예 : 5 년) (샘플) 그 평균을 계산합니다. 그런 다음 (계산 된) 표본 평균과 (주장 된) 모집단 평균을 비교하여 가설을 검증합니다. 가설 테스트를위한 다른 방법론이 존재한다. 다음의 네 가지 기본 단계가 포함된다.

1 단계 : 가설 정의 :

일반적으로보고 된 가치 (또는 청구 통계)는 가설로 제시되고 사실이라고 추정된다. 예 9 : 예 : A 학교의 학생들은 시험에서 평균 10 점을 얻었습니다.

예 B : 뮤추얼 펀드의 연간 수익률은 연간 8 %입니다.

기술은 "

Null 가설 (H 999)

"을 구성하며,

  • 사실로 간주된다. 배심원 재판은 용의자의 무죄를 가정하고 가정이 거짓인지 여부를 판단함으로써 시작됩니다. 유사하게, 가설 테스트는 "Null 가설"을 진술하고 가정함으로써 시작되며, 프로세스는 가정이 참인지 거짓인지를 결정합니다.
  • 유의할 점은 유효성에 대해 의심의 여지가 있기 때문에 귀무 가설을 테스트한다는 것입니다. 명시된 귀무 가설에 반하는 정보가 무엇이든간에

대체 가설 (H )에 기록되어있다. 학생들은 평균이 999가 아니라 뮤추얼 펀드의 연간 수익률이 가 아닌 평균 점수를 매긴다. 요약하면, 대체 가설은 귀무 가설의 직접 모순이다. 재판에서와 마찬가지로, 배심원은 용의자의 무죄를 가정합니다 (귀무 가설). 검찰은 달리 증명해야합니다 (대안). 마찬가지로 연구자는 귀무 가설이 사실인지 거짓인지를 입증해야합니다. 검찰이 대안 가설을 증명하지 못하면 배심원은 "용의자"를 놓아야합니다 (귀무 가설에 대한 결정을 근거로 함). 마찬가지로 연구자가 대안 가설을 증명하지 못하면 (또는 아무것도하지 않는 경우), 귀무 가설이 사실이라고 가정합니다. 2 단계 : 결정 기준 설정 의사 결정 기준은 데이터 집합의 특정 매개 변수를 기반으로해야하며 이것은 정규 분포에 대한 연결이 그림으로 들어오는 곳입니다. 샘플링 분포에 관한 표준 통계에 따르면, "어떤 샘플 크기 n에 대해서도 샘플이 그려지는 모집단 X가 정상적으로 분포하면 X sampling의 표집 분포는 정상이다. "그러므로, 가능한 모든 다른 표본 수단 의 확률은 정상적으로 분배 될 수있다.

e. 지. , XYZ 주식 시장에 상장 된 주식의 평균 일일 수익률이 연말 연시에 2 %를 초과하는지 확인하십시오. 대안 가설 : 평균> 2 % (이것은 우리가 증명하고자하는 바이다) H 999 : Null 가설 : 평균 = 2 % 샘플을 가져 와서 (총 500 개 중 50 개를 말함) 샘플의 평균을 계산하십시오. 정규 분포의 경우, 95 %의 값이 모집단 평균의 2 표준 편차 내에 있습니다. 따라서 샘플 데이터 세트에 대한이 정규 분포 및 중심 한계 가정은 유의 수준으로 5 %를 설정할 수있게합니다. 이 가정 하에서, 모집단 평균으로부터 2 표준 편차를 초과하는 이상치를 얻는 확률은 5 % 미만 (100-95)입니다. 데이터 세트의 특성에 따라 다른 유의 수준은 1 %, 5 % 또는 10 %로 취할 수 있습니다. 재무 계산 (행동 재무 포함)의 경우 일반적으로 허용되는 한도 인 5 %입니다. 일반적인 2 표준 편차를 초과하는 계산을 발견하면 귀무 가설을 기각할만한 특이한 사례가 있습니다.

  • 표준 편차는 통계 자료를 이해하는 데 매우 중요합니다. 표준 편차에 대한 Investopedia의 비디오를 보면서 그들에 대해 더 자세히 알아보십시오. 위의 예에서 샘플의 평균이 2 %보다 훨씬 큰 경우 (예 : 3.5 %), 귀무 가설을 기각합니다.대체 가설 (평균> 2 %)은 받아 들여지는데, 이것은 주식의 평균 일일 수익률이 실제로 2 % 이상임을 확인합니다. 그러나 샘플의 평균이 2 %보다 현저하게 크지 않다면 (그리고 약 2. 2 %로 유지되는 경우) 귀무 가설을 거부 할 수 없습니다. 이러한 가까운 거리 상황을 결정하는 방법에 대한 문제가 있습니다. 선택된 표본과 결과로부터 결론을 내리기 위해 귀무 가설에 대한 결론을 내릴 수있는 유의 수준
  • 이 결정되어야한다. 대립 가설은 이러한 근거리 사례를 결정할 때 유의 수준 또는 "임계 값"개념을 수립 할 수있게 해줍니다. 표준 정의에 따르면 "임계 값은 경계를 정의하는 한계 값으로 5 % 미만의 샘플 임계 값을 초과 한 샘플 수단은 귀무 가설을 기각하기로 결정할 것입니다. "위의 예에서 임계 값을 2.1 %로 정의하면 계산 된 평균이 2. 2 %가되면 귀무 가설을 기각하고 중요한 값은 합격 또는 거절에 대한 분명한 경계를 설정합니다. 더 많은 예를 따르십시오 - 우선, 몇 가지 주요 단계와 개념을 살펴 보겠습니다. 3 단계 : 테스트 통계 계산 :

이 단계는 선택한 샘플에 대한 테스트 통계 (평균, z- 점수, p- 값 등과 같은)로 알려진 필요한 수치를 계산합니다. 계산할 다양한 값을 다룹니다. 이후 섹션에서 예제를 참조하십시오.

4 단계 : 가설에 대한 결론을 내린다.

계산 된 값으로 귀무 가설을 결정한다. 표본 평균을 얻는 확률이 5 %보다 작 으면 결론은 귀무 가설을

거부

하는 것이다. 그렇지 않은 경우 는 를 수락하고 귀무 가설을 유지합니다.

의사 결정의 오류 유형 :

전체 인구에 대한 올바른 적용 가능성과 관련하여 표본 기반 의사 결정에는 네 가지 결과가있을 수 있습니다. 보유 결정 거부 결정 > 전체 모집단에 적용

올바른 잘못된 (TYPE 1 오류 - a)

전체 모집단에 적용되지 않음

잘못된 (TYPE 2 오류 - b)

"올바른 (correct)"경우는 표본에 대한 결정이 전체 인구에 실제로 적용될 수있는 경우입니다. 오류의 경우는 표본 계산을 기반으로 귀무 가설을 유지 (또는 거부)하기로 결정할 때 발생하지만 그 결정은 전체 인구에 실제로 적용되지 않습니다. 이러한 경우는 위 표에 표시된대로 유형 1 (알파) 및 유형 2 (베타) 오류를 구성합니다. 올바른 임계 값을 선택하는 것은 타입 -1 알파 에러를 제거하거나 허용 가능한 범위로 제한하는 것을 허용한다.

알파는 유의 수준의 오류를 나타내며 연구자가 결정합니다. 확률 계산에 대한 표준 5 % 유의 수준 또는 신뢰 수준을 유지하기 위해이 값은 5 %로 유지됩니다.

해당 의사 결정 벤치 마크 및 정의에 따라 : "이 (알파) 기준은 일반적으로 0으로 설정됩니다.05 (a = 0.05), 알파 값과 p 값을 비교합니다. 유형 I 오류 확률이 5 % 미만일 때 (P <0.05), 귀무 가설을 기각하기로 결정한다. 그렇지 않으면 귀무 가설을 유지합니다. " 이 확률에 사용되는 전문 용어는

p-value

입니다. 그것은 "귀무 가설에 명시된 값이 사실이라면 표본 결과를 얻을 확률"로 정의됩니다. 샘플 결과를 얻기위한 p 값은 유의 수준과 비교됩니다. "

유형 II 오류 또는 베타 오류는 "실제로 전체 인구에 적용 할 수없는 경우 귀무 가설을 잘못 보유 할 확률"로 정의됩니다. "

몇 가지 예가이 계산과 다른 계산을 보여줍니다.

예 1. 다양한 월별 수익을 약속하는 월 소득 투자 제도가 존재합니다. 투자자는 평균 월 180 달러의 수입이 보장되는 경우에만 투자 할 것입니다. 그는 평균 190 달러, 표준 편차 75 달러 인 300 개월 반품 샘플을 가지고있다. 그 또는 그녀가이 계획에 투자해야합니까? 문제를 설정합시다. 투자자는 자신이 원하는 평균 180 달러의 수익을 보장 받으면 계획에 투자 할 것입니다. 가설 가설 : 평균 = 180 9 999 : 대안 가설 : 평균> 180 999 방법 1 - 999 임계 값 접근법 : 귀무 가설을 기각 할만큼 충분히 큰 표본 평균에 대한 임계 값 X L 을 확인한다 - i. 이자형. 만약 H ^ 999가 주어진다면, 샘플 평균> = 임계 값 X = 999 P (타입 I 알파 에러를 식별) = P (거부 H = 999)라면 귀무 가설을 기각한다. 사실 임),

는 표본 평균이 임계 한계를 초과 할 때 달성된다. 이자형. 알파 = 0.05 (즉, 5 % 유의 수준), Z9 = 0을 취함으로써, 그래픽 적으로, α = 0.05 (즉, H999가 참이라면) = α9이다. (Z-table 또는 정규 분포표로부터) 999 = 1. 645 (L-999 = 180 +1). 표본 평균 (190)이 임계 값 (187. 12)보다 크기 때문에 귀무 가설은 기각되며 결론적으로 평균 월평균 수익률은 다음과 같다. 실제로 180 달러 이상이므로 투자자는이 계획에 대한 투자를 고려할 수 있습니다. 방법 2 - 표준화 된 시험 통계의 사용

:

또한 표준화 된 값 z를 사용할 수있다.

Test Statistic, Z = (표본 평균 - 모집단 평균) / (표준 편차 / sqrt (표본 수))

그러면 거부 영역은 Z = (190-180) / 5 % 유의 수준에서의 우리의 거부 영역은 Z> Z이다 .0.599는 1.Z = 2.309가 더 크기 때문에 P 값 계산 :

P (표본 평균> 190, 평균 = 180)를 식별하는 것을 목표로한다.

다음의 표 (Z & gt; & gt; & gt; p 값 계산을 추론하는 것은 평균 월 수익이 180보다 높다는 확증이 있다는 결론을 내린다.추론

추론

1 % 미만

대체 가설을 뒷받침하는 증거

1 % -5 %

입증 증거

대립 가설을 뒷받침하는 강력한 증거

> 대체 가설을 뒷받침하는 약한 증거

10 %보다 큰

증거 없음

  • 대안 가설을 뒷받침하는 증거
  • 예 2 : 새로운 주식 중개인 (XYZ) 주장 그의 중개 수수료가 현재 주식 브로커 (ABC)보다 낮다. 독립적 인 리서치 회사에서 입수 할 수있는 데이터에 따르면 모든 ABC 브로커 고객의 평균 및 표준 편차는 각각 $ 18 및 $ 6입니다. ABC 고객 100 명을 대상으로 브로커 수수료를 계산합니다. 표본의 평균이 18 달러라면. 75와 std-dev가 동일하면 ($ 6), ABC와 XYZ 중개인 간의 평균 중개 법안의 차이에 대해 어떤 추측이 가능합니까? 대안 가설 : 평균 18 (이것은 우리가 증명하기를 원하는 것이다) 거부 영역 : 1 개의 가설 영역 : 0 = Z <= -z 2이다. Z & gt; = Z & gt; Z = (표본 평균 - 평균) / (표준 편차 / sqrt (표본 수)) 999 = (18 % 유의 수준, 이 계산 된 Z 값은 999 내지 Z9999로 정의되는 2 개의 한계 사이에 속한다 .5-999 / -1 / (6 / (sqrt (100)) = 이것은 기존 브로커와 신규 브로커의 환율 사이에 차이가 있다는 것을 추론 할 증거가 충분하지 않다고 결론 내린다 .999) p-value = P (Z1.25) 999 = 2 * 0.1056 = 0.2112 = 21.12 % 이는 0.05 또는 5 %보다 크며, 동일한 결론을 유도한다 .999
  • 가상 시험 방법에 대한 비판 점 :

-

가정에 기반한 통계 방법

- 알파 및 베타 오류에 대해 상세히 설명 된 오류

- 해석 p 값의 값이 모호 해지고 혼란스러운 결과를 낳을 수 있습니다. 결론 가설 테스트를 통해 수학적 모델을 통해 주장이나 아이디어의 유효성을 검증 할 수 있습니다. 특정 신뢰 수준. 그러나 대다수의 통계 도구 및 모델과 마찬가지로 몇 가지 제한 사항이 있습니다. 재정적 결정을 내릴 때이 모델을 사용하는 것은 중요성을 고려하여 모든 종속성을 염두에 두어야합니다. Bayesian Inference와 같은 다른 방법도 비슷한 분석을 위해 탐구 할 가치가 있습니다.