타이거 알지브라 계산기
정규 분포와 표준 정규 분포
정규 분포
정규 분포(또는 가우시안, 가우스, 라플라스-가우스 분포 또는 종 모양 곡선)는 누적 확률을 임의의 변수 와 관련시키는 확률 분포입니다. 정규 분포의 중심은 항상 평균에 위치해 있으며, 이를 기준으로 완전히 대칭입니다.

표기법
통계학자들은 일반적으로 대문자로 무작위 변수를 표시하고, 소문자로 그 값들을 표시합니다. 예를 들어:
다른 예제들
: 가 보다 큰 확률은 무엇인가요?
: 가 보다 작은 확률은 무엇인가요?
: 가 와 사이일 확률은 무엇인가요?
: 가 보다 크고 보다 작을 확률은 무엇인가요?
정규 분포의 파라미터
평균과 표준 편차는 정규 분포의 두 가지 주요 파라미터입니다. 이들은 분포의 모양과 확률을 모두 결정합니다.
평균
또는
평균은 분포의 중심과 최고점의 위치인데, 이는 평균에 변화가 발생하면 분포 곡선이 x축을 따라 왼쪽 또는 오른쪽으로 이동한다는 것을 의미합니다. 대부분의 데이터 포인트(값들)는 평균 주변에 위치합니다.
표준 편차
또는
표준 편차는 데이터 포인트가 분포의 평균에서 얼마나 멀리 떨어져 있는지를 측정합니다. 이는 정규 분포의 너비를 결정합니다. 표준 편차가 크면 곡선이 짧고 넓어지며, 표준 편차가 작으면 곡선이 높고 좁아집니다.
정규 분포의 성질
표준 정규 분포
표준 정규 분포는 평균이 0이고 표준 편차가 1인 정규 분포의 특수한 경우입니다. 이 분포를 Z-분포라고도 합니다.

표기법
표준 점수
표준 정규 분포에서의 특정 값은 표준 점수 또는 z-점수라고 불립니다. 이 점수는 특별한 관측치가 평균에서 위나 아래로 얼마나 기준 편차가 있는지를 나타냅니다.
예를 들어, 표준 점수가 라면, 이는 관측치가 평균보다 개의 표준 편차가 크다는 것을 나타냅니다. 부정적인 표준 점수는 평균보다 작은 값을 나타냅니다. 평균은 z-점수가 입니다.
99.9% 이상의 모든 경우는 평균에서 +/- 3.9 표준 편차 내에 있습니다. 그래서 z-점수가 보다 크거나 보다 작은 어떤 데이터의 확률을 0%로 간주합니다. 다시 말해, 와 사이의 간격을 표준 정규 분포의 100%로 간주합니다.
표준 정규 분포의 곡선 아래 영역 찾기
정규 분포는 확률 분포이므로, 확률 분포 그래프의 두 점 사이에 걸쳐 있는 곡선의 영역은 값이 그 구간에 들어갈 확률을 나타냅니다.
곡선 아래의 면적은 과 동일하며, 이는 분포의 100%입니다. =100%.
z-점수를 얻으면 표준 정규 분포 테이블을 살펴보아 그 아래의 영역을 찾을 수 있습니다. 이를 z-점수 테이블이라고도 합니다. (표에 대한 링크는 곧 제공됩니다)
z-점수 테이블은 z-점수 값까지의 영역을 보여주므로, 더 큰 z-점수를 가진 데이터의 확률을 찾고자 할 때, 표의 수를 에서 빼야 합니다. 이는 다음과 같은 규칙으로 보여줄 수 있습니다:
표에서 완벽한 z-점수를 찾지 못하면 가장 가까운 것을 선택합니다. 원하는 z-점수에서 가장 가까운 두 z-점수의 거리가 같으면 그 평균을 계산합니다.
다른 예제들
- z-점수가 보다 큰 데이터의 확률은 얼마인가요?
- z-점수가 보다 작은 데이터의 확률은 얼마인가요?
- z-점수가 와 사이인 데이터의 확률은 얼마인가요?
- z-점수가 보다 크고 보다 작은 데이터의 확률은 얼마인가요?
표준화
z-점수 계산
표준 점수는 특정 관측치가 전체 정규 분포에 대해 어디에 위치하는지 이해하는 데 좋은 방법입니다. 또한, 서로 다른 평균과 표준 편차를 가진 정규 분포에서 얻어진 데이터를 표준화하여 같은 척도에 놓을 수 있습니다. 데이터를 표준화하면 표준 정규 분포 내에 그들을 놓을 수 있습니다.
이런 식으로, 표준화는 각 관측치가 자신의 분포 내에서 어디에 놓이는지에 따라 다른 종류의 관측치를 비교하는 데 도움을 줍니다.
관찰치의 표준 점수를 계산하기 위해서는 원래 측정값을 가져다가 평균을 뺀 다음 표준 편차로 나눕니다. 수학적으로, 그 과정의 공식은 다음과 같습니다:
는 관심 사항의 측정치의 원 값을 나타냅니다. 이는 표준화할 값으로서, 때때로 데이터 포인트라고도 불립니다.
(뮤)와 (시그마)는 관측치가 추출된 모집단의 파라미터를 나타냅니다.
더 많은 관련 용어
왜도
왜도는 데이터 집합의 정규 분포, 또는 종 모양 곡선에서 이격하거나 왜곡하는 대칭을 참조합니다. 만약 곡선이 왼쪽 또는 오른쪽으로 이동되면, 이는 왜곡되었다고 말합니다. 왜도는 정규 분포에서 어떠한 분포의 이격을 정량적으로 표현할 수 있습니다. 왜도는 한쪽 대 또 다른 꼬리에서 극단적인 값들을 구별합니다. 정규 분포는 왜도가 0입니다.
첨도
첨도는 양쪽 꼬리에서의 극단적인 값들을 측정합니다. 첨도가 큰 분포는 꼬리 데이터가 정규 분포의 꼬리를 초과합니다. 낮은 첨도의 분포는 일반적으로 정규분포의 꼬리보다 극단적이지 않은 꼬리 데이터를 보입니다. 첨도는 분포의 꼬리에 대한 가중치를 분포의 중심에 대하여 측정합니다. 대략적인 정규 데이터가 히스토그램을 통해 그리면 종 모양의 최고점을 보이고, 대부분의 데이터가 평균의 세 개 표준 편차(더하고 뺀 것) 내에 있다. 그러나, 높은 첨도가 있을 때, 꼬리는 정규 분포의 종 모양의 꼬리보다 더 멀리 뻗어 있습니다.
정규 분포(또는 가우시안, 가우스, 라플라스-가우스 분포 또는 종 모양 곡선)는 누적 확률을 임의의 변수 와 관련시키는 확률 분포입니다. 정규 분포의 중심은 항상 평균에 위치해 있으며, 이를 기준으로 완전히 대칭입니다.

표기법
통계학자들은 일반적으로 대문자로 무작위 변수를 표시하고, 소문자로 그 값들을 표시합니다. 예를 들어:
- 는 임의의 변수 의 값입니다.
- 는 의 확률을 나타냅니다.
- 는 임의의 변수 가 특정 값 와 동일한 확률을 나타냅니다. 예를 들면, 은 임의의 변수 가 과 같을 확률을 나타냅니다.
다른 예제들
: 가 보다 큰 확률은 무엇인가요?
: 가 보다 작은 확률은 무엇인가요?
: 가 와 사이일 확률은 무엇인가요?
: 가 보다 크고 보다 작을 확률은 무엇인가요?
정규 분포의 파라미터
평균과 표준 편차는 정규 분포의 두 가지 주요 파라미터입니다. 이들은 분포의 모양과 확률을 모두 결정합니다.
평균
또는
평균은 분포의 중심과 최고점의 위치인데, 이는 평균에 변화가 발생하면 분포 곡선이 x축을 따라 왼쪽 또는 오른쪽으로 이동한다는 것을 의미합니다. 대부분의 데이터 포인트(값들)는 평균 주변에 위치합니다.
표준 편차
또는
표준 편차는 데이터 포인트가 분포의 평균에서 얼마나 멀리 떨어져 있는지를 측정합니다. 이는 정규 분포의 너비를 결정합니다. 표준 편차가 크면 곡선이 짧고 넓어지며, 표준 편차가 작으면 곡선이 높고 좁아집니다.
정규 분포의 성질
- 대칭성이 있습니다
정규 분포는 완벽한 대칭성을 띠며, 즉 분포 곡선을 평균을 따라 중간에서 접으면 두 개의 동일한 반절이 생깁니다. 이 대칭 형태는 관측치의 절반이 곡선의 각 측면에 놓임으로써 생깁니다. - 평균, 중간값, 최빈값이 모두 같습니다
정규 분포는 대칭이므로, 그 중심은 모든 데이터 포인트의 평균을 나타냅니다. 이 의미는 중간값(값이 최소부터 최대까지 정렬되는 경우 중간에 위치한 값)도 분포 중심에 위치하며 평균과 동일하다는 것입니다. 또한, 의미는 분포 곡선의 최고점 역시 그래프의 중심에 위치해 있으며, 분포의 패턴에 따라 최빈값(가장 일반적으로 발생하는 값) 역시 분포의 중심에 위치한다는 것입니다. 이들은 평균이 거의 제일 자주 발생하므로, 평균은 분포의 중심입니다. 중점 또한 이 세 가지 측정치가 놓인 위치입니다. 측정치는 대부분 완벽한(정규) 분포에서 같습니다. - 실험치 규칙
이를 68-95-99.7 규칙이라고도 합니다. 실험치 규칙은 종형 곡선의 평균으로부터 표준 편차의 특정 수의 데이터 범위 내에서 데이터의 비율을 설명합니다.
정규 분포 데이터에서 평균과 표준 편차의 특정 수 사이에 위치하는 곡선 아래의 거리는 일정한 비율을 유지합니다. 실험치 규칙은 평균에서 특정 거리의 값이 어떤 비율을 차지하는지 결정할 수 있게 해줍니다.
모든 경우의 68.25%가 평균에서 +/- 한 개의 표준 편차 내에 속합니다.
모든 경우의 95%가 평균에서 +/- 두 개의 표준 편차 내에 속합니다.
모든 경우의 99.7%가 평균에서 +/- 세 개의 표준 편차 내에 속합니다.
표준 정규 분포
표준 정규 분포는 평균이 0이고 표준 편차가 1인 정규 분포의 특수한 경우입니다. 이 분포를 Z-분포라고도 합니다.

표기법
- 는 "z-점수" (표준 점수) - z 점수는 값이 평균에서 몇 개의 표준 편차나 떨어져 있는지를 나타냅니다.
- (뮤)는 평균을 나타냅니다.
- (시그마)는 표준 편차를 나타냅니다.
표준 점수
표준 정규 분포에서의 특정 값은 표준 점수 또는 z-점수라고 불립니다. 이 점수는 특별한 관측치가 평균에서 위나 아래로 얼마나 기준 편차가 있는지를 나타냅니다.
예를 들어, 표준 점수가 라면, 이는 관측치가 평균보다 개의 표준 편차가 크다는 것을 나타냅니다. 부정적인 표준 점수는 평균보다 작은 값을 나타냅니다. 평균은 z-점수가 입니다.
99.9% 이상의 모든 경우는 평균에서 +/- 3.9 표준 편차 내에 있습니다. 그래서 z-점수가 보다 크거나 보다 작은 어떤 데이터의 확률을 0%로 간주합니다. 다시 말해, 와 사이의 간격을 표준 정규 분포의 100%로 간주합니다.
표준 정규 분포의 곡선 아래 영역 찾기
정규 분포는 확률 분포이므로, 확률 분포 그래프의 두 점 사이에 걸쳐 있는 곡선의 영역은 값이 그 구간에 들어갈 확률을 나타냅니다.
곡선 아래의 면적은 과 동일하며, 이는 분포의 100%입니다. =100%.
z-점수를 얻으면 표준 정규 분포 테이블을 살펴보아 그 아래의 영역을 찾을 수 있습니다. 이를 z-점수 테이블이라고도 합니다. (표에 대한 링크는 곧 제공됩니다)
z-점수 테이블은 z-점수 값까지의 영역을 보여주므로, 더 큰 z-점수를 가진 데이터의 확률을 찾고자 할 때, 표의 수를 에서 빼야 합니다. 이는 다음과 같은 규칙으로 보여줄 수 있습니다:
표에서 완벽한 z-점수를 찾지 못하면 가장 가까운 것을 선택합니다. 원하는 z-점수에서 가장 가까운 두 z-점수의 거리가 같으면 그 평균을 계산합니다.
다른 예제들
- z-점수가 보다 큰 데이터의 확률은 얼마인가요?
- z-점수가 보다 작은 데이터의 확률은 얼마인가요?
- z-점수가 와 사이인 데이터의 확률은 얼마인가요?
- z-점수가 보다 크고 보다 작은 데이터의 확률은 얼마인가요?
표준화
z-점수 계산
표준 점수는 특정 관측치가 전체 정규 분포에 대해 어디에 위치하는지 이해하는 데 좋은 방법입니다. 또한, 서로 다른 평균과 표준 편차를 가진 정규 분포에서 얻어진 데이터를 표준화하여 같은 척도에 놓을 수 있습니다. 데이터를 표준화하면 표준 정규 분포 내에 그들을 놓을 수 있습니다.
이런 식으로, 표준화는 각 관측치가 자신의 분포 내에서 어디에 놓이는지에 따라 다른 종류의 관측치를 비교하는 데 도움을 줍니다.
관찰치의 표준 점수를 계산하기 위해서는 원래 측정값을 가져다가 평균을 뺀 다음 표준 편차로 나눕니다. 수학적으로, 그 과정의 공식은 다음과 같습니다:
는 관심 사항의 측정치의 원 값을 나타냅니다. 이는 표준화할 값으로서, 때때로 데이터 포인트라고도 불립니다.
(뮤)와 (시그마)는 관측치가 추출된 모집단의 파라미터를 나타냅니다.
더 많은 관련 용어
왜도
왜도는 데이터 집합의 정규 분포, 또는 종 모양 곡선에서 이격하거나 왜곡하는 대칭을 참조합니다. 만약 곡선이 왼쪽 또는 오른쪽으로 이동되면, 이는 왜곡되었다고 말합니다. 왜도는 정규 분포에서 어떠한 분포의 이격을 정량적으로 표현할 수 있습니다. 왜도는 한쪽 대 또 다른 꼬리에서 극단적인 값들을 구별합니다. 정규 분포는 왜도가 0입니다.
첨도
첨도는 양쪽 꼬리에서의 극단적인 값들을 측정합니다. 첨도가 큰 분포는 꼬리 데이터가 정규 분포의 꼬리를 초과합니다. 낮은 첨도의 분포는 일반적으로 정규분포의 꼬리보다 극단적이지 않은 꼬리 데이터를 보입니다. 첨도는 분포의 꼬리에 대한 가중치를 분포의 중심에 대하여 측정합니다. 대략적인 정규 데이터가 히스토그램을 통해 그리면 종 모양의 최고점을 보이고, 대부분의 데이터가 평균의 세 개 표준 편차(더하고 뺀 것) 내에 있다. 그러나, 높은 첨도가 있을 때, 꼬리는 정규 분포의 종 모양의 꼬리보다 더 멀리 뻗어 있습니다.