설명

정규분포 (십월 2024)

정규분포 (십월 2024)
설명
Anonim

정규 분포 공식은 평균 및 표준 편차의 두 가지 간단한 매개 변수를 기반으로합니다. 주어진 데이터 세트의 특성. 평균은 전체 데이터 세트의 "중앙"또는 평균 값을 나타내지 만 표준 편차는 평균값 주변의 데이터 포인트의 "확산"또는 변동을 나타냅니다.

데이터 세트 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10}

다음 두 데이터 세트를 고려하십시오. - 데이터 세트 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

데이터 세트 1의 경우 평균 = 10이고 표준 편차 (stddev) = 0

데이터 세트 2의 경우 mean = 10이고 표준 편차 (stddev) = 2. 83

DataSet1에 대해 다음 값을 플롯합니다.

DataSet2의 경우와 유사하게

위의 두 그래프에서 빨간색 가로선은 각 데이터 세트의 평균 또는 평균값을 나타냅니다 (두 경우 모두 10). 두 번째 그래프의 분홍색 화살표는 평균값에서 데이터 값의 분산 또는 변동을 나타냅니다. DataSet2의 경우 표준 편차 값 2.83로 표시됩니다. DataSet1에는 모든 값이 동일하므로 (각각 10 개) 변형이 없으므로 stddev 값은 0이므로 분홍색 화살표가 적용되지 않습니다.

stddev 값은 데이터 분석에 매우 유용한 몇 가지 중요하고 유용한 특성을 가지고 있습니다. 정규 분포의 경우 데이터 값은 평균의 양쪽에 대칭으로 분포됩니다. 정상적으로 분산 된 데이터 세트의 경우, 가로축에 stddev가있는 그래프를 그리고, 세로축의 데이터 값 중, 다음 그래프가 얻어진다.

정규 분포의 특성

정규 곡선은 평균에 대해 대칭입니다.

평균은 가운데에 있으며 면적을 두 부분으로 나눕니다. 곡선 아래의 전체 면적은 mean = 0 및 stdev = 1 인 경우 1과 같습니다.

분포는 그 평균과 표준 편차에 의해 완전하게 기술된다.

  1. 위의 그래프에서 알 수 있듯이, stddev는 다음을 나타낸다 :
  2. 68. 데이터 값의 3 %는 평균 (-1 내지 + 1) 999 95의 표준 편차
  3. 이내이다. 데이터 값의 4 % 999는 평균 (-2 to +2) 999 99의 2 표준 편차
  4. 이내이다. 데이터 값의 7 %는 평균의 표준 편차 (999)

내에있다. (3 내지 +3) 종 모양 곡선 아래의 면적은 측정 될 때 주어진 주어진 확률을 나타낸다 범위 :

  • X보다 작음 : - e. 지. 데이터 값의 확률은 X-999보다 큰 70999 미만이다. 지. 데이터 값의 확률은 X9999와 X999999999 사이의 9599보다 크다. 지. 데이터 값의 확률은 65 ~ 85입니다. 여기서 X는 관심있는 값입니다 (아래 예 참조). 영역을 플로팅하고 계산하는 것이 항상 편리하지는 않습니다. 다른 데이터 세트는 평균값과 표준값이 다릅니다.쉬운 계산과 실제 문제에 적용 할 수있는 균일 한 표준 방법을 용이하게하기 위해 Z- 값으로의 표준 변환이 도입되어 정규 분포표
  • 의 일부를 구성합니다. Z = (X - 평균) / stddev, 여기서 X는 확률 변수입니다. 기본적으로이 변환은 평균값과 표준 편차를 각각 0과 1로 표준화하도록 강제합니다 (표준 분배 테이블 의 표준 정의 된 세트를 사용하여 쉽게 계산할 수 있음) . 확률 값이 포함 된 표준 z 값 테이블의 스냅 샷은 다음과 같습니다.
  • z 0. 00 999. 01 999. 02 99. 03. 049. 05 999. 06 0 990. 00000 0. 00399 0. 0. 01197

0. 01595

  • 0. 01994
  • 0. 1 999. 0398 0. 04380 999. 04776 999. 05172 999. 05567
  • 0. 05966 0. 2 990. 0793 0. 08317 999. 08706 999. 09095 0. 09483 999. 09871

0. 3

0. 11791 999. 12172 999. 12552 999. 12930 999. 13307 999. 13683 999 … 999. 4 990. 15542 0. 15910 999. 16276 999. 16640 999. 17003 999. 17364

0. 599. 19146

0. 19497 999. 19847

0. 20194 999. 20540 999. 20884

0. 699. 22575 999. 22907 999. 23237 999. 23565 999. 23891. 24215

0. 799. 25804

0. 26115. 26424 999. 26730 999. 27035

0. 27337

0의 Z 값과 관련된 확률을 구하기 위해 239865 , 먼저 소수점 둘째 자리까지 반올림합니다 (즉, 0.22). 그런 다음 열의 첫 번째 2 자리 (0.2)와 열의 최하위 자리 (나머지 0.4)를 확인하십시오. 그러면 값은 09483이됩니다.

-> -

확률 값 (음수 값 포함)에 대한 소수점 이하 5 자까지의 전체 정규 분포표가 여기에 있습니다.

실제 사례를 살펴 보겠습니다. 큰 그룹의 개인의 신장은 정상적인 분포 패턴을 따른다. 우리는 높이가 기록되고 평균 및 표준 편차가 각각 66 및 6 인치로 계산되는 100 명의 개인 집합이 있다고 가정합니다.

->

Z-value 테이블을 사용하여 쉽게 대답 할 수있는 몇 가지 샘플 질문이 있습니다.

그룹에 속한 사람이 70 인치 이하인 확률은 얼마입니까?

질문은

P (X <= 70)의

누적 값을 찾는 것입니다. 이자형. 100의 전체 데이터 세트에서 0과 70 사이의 값이 몇 개인가.

먼저 70의 X 값을 해당 Z 값으로 변환합시다. 66667 = 0.67 (소수점 이하 2 자리로 반올림)

Z (X- 평균) / stddev = (70-66) / 6 = 4/6 = δ = 24857 (위의 z- 표로부터)

i. 이자형. 그룹에 속한 개인이 70 인치보다 작거나 같을 확률은 24.85 %입니다.

하지만 잠깐 만요 - 위는 불완전합니다.기억하십시오, 우리는 70까지 모든 가능한 높이의 확률을 찾고 있습니다. i. 이자형. 0에서 70까지. 위는 단지 평균에서 원하는 값까지의 부분을 제공합니다 (즉, 66에서 70까지). 나머지 절반 (0에서 66까지)을 포함시켜 정답을 찾아야합니다. 0에서 66까지는 절반 부분 (즉, 중간에서 중간까지 평균)을 나타 내기 때문에 그 확률은 단순히 0입니다. 5.

그러므로 70 인치 이하의 올바른 확률은 0입니다. 24857 + 0.5 = 0. 74857 = 999. 857 %

그래픽으로 (면적을 계산하여) 솔루션을 나타내는 두 개의 합계 영역입니다.

사람이 75 인치 이상인 확률은 얼마입니까? i. 이자형. 보완 적

누적 적

P (X> = 75)를 찾아라. Z = (X- 평균) / stddev = (75-66) / 6 = 9/6 = 1.P (Z> = 1.5) = 1- P (Z <= 1). 5 인치) = 1 - (0.5 + 43319) = 0. 06681 = 6.681 %

사람이 52 인치와 67 인치 사이에있을 확률은 얼마인가?

P를 찾으십시오 (52 <= x <= 67). P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2.33 <= z <= 0. P (Z = -0.233) = (0.5 + 0. 56749) - (.40905) =

정상 유통 테이블

(및 z 값)은 주식 및 지수에 대한 주식 시장의 예상 가격 변동에 대한 확률 계산에 일반적으로 사용됩니다. 이 지수는 상승 추세 또는 하락 추세,지지 또는 저항 수준 및 평균 및 표준 편차의 정규 분포 개념을 기반으로하는 기타 기술 지표를 식별하여 범위 기반 거래에 사용됩니다.