方程式を入力してください
カメラ入力が識別されません!

タイガー代数計算器

通常の分布と標準正規分布

正規分布
正規分布(またはガウス分布、ガウス、ラプラス-ガウス分布、ベル曲線とも呼ばれます)は、確率分布で、累積確率とランダム変数 X の関係を示します。正規分布の中心は常に平均値に位置し、その分布は完全に対称です。

Normal_Distributions_Graph

表記法
統計家は通常、大文字を使ってランダム変数を表し、小文字を使ってその値を表します。例えば:

  • xはランダム変数Xの値です。
  • xP(X)の確率を表します。
  • P(X=x)はランダム変数 X が特定の値 x に等しい確率を表します。例えば、 P(X=1) はランダム変数 X1 に等しい確率を指します。

他の例
P(30<X): X30より大きい確率は何ですか。
P(X<80): X80より小さい確率は何ですか。
P(30<X<80): X3080の間である確率は何ですか。
P(30>X>80): X80より大きくかつ30より小さい確率は何ですか。

正規分布のパラメータ
平均と標準偏差は正規分布の主要な2つのパラメータです。これらが分布の形状と確率を決定します。

平均
μまたはx̅
平均は分布の中心およびピークの位置で、平均値を変更すると分布曲線がx軸に沿って左右に移動します。ほとんどのデータ点(値)は平均の周りに位置します。

標準偏差
σまたはs
標準偏差は、データ点が分布の平均値からどれだけ離れているかを測定します。それは正規分布の幅を決定します。大きな標準偏差は短く広い曲線を、小さな標準偏差は高く狭い曲線を生成します。

正規分布の性質

  1. それは対称です
    正規分布は完全に対称で、分布曲線は平均値に沿って真ん中で折りたたむことができ、それによって2つの同一の半分を生み出します。この対称形状は、観察値の半分が曲線の各側に落ちる結果です。
  2. 平均、中央値、最頻値はすべて等しい
    正規分布が対称であるため、その中心はすべてのデータ点の平均、つまり平均値を表します。これは、その中央値(値が最小から最大まで順に並べられた集合の中央の値)も分布の中心に位置し、平均と同じであることを意味します。ピーク、つまり正規分布曲線の最も高い点も、グラフの中心に位置しているため、分布の最頻値、つまり最も一般的に発生する値、そしてしたがってグラフ上の最高点も分布の中心に位置しています。これらのデータは本来の正規分布を表現しています。値が発生するデータ点(値)。平均は最も頻繁に発生する点であるため、分布の中心である。中点もこれらの三つの尺度が落ちる点でもあります。この尺度は通常、完全な(正規の)分布では等しいです。母集団の半分は平均以下で、残りの半分は平均以上です。
  3. 経験則
    68-95-99.7 の規則とも呼ばれます。経験則は、平均値からの標準偏差の特定の数値内にあるデータのパーセンテージを説明します。

    正常に分布したデータでは、平均値と特定の標準偏差の数値の間にある曲線下の距離に一定の比率が存在します。経験則は、平均からの特定の距離内に落ちる値の比率を決定することを可能にします。

    全てのケースの68.25%が平均から±一つの標準偏差の範囲内にあります。
    全てのケースの95%が平均から±二つの標準偏差の範囲内にあります。
    全てのケースの99.7%が平均から±三つの標準偏差の範囲内にあります。

    The_Empirical_Rule_Graph

標準正規分布

標準正規分布は正規分布の特殊なケースで、平均値がゼロで標準偏差が一つです。この分布は、Z分布とも呼ばれます。

Standard_Normal_Distribution_Graph

表記法
  • zは"zスコア"(標準スコア)- zスコアは値が平均からどれだけ標準偏差であるかを示します。
  • μ(ミュー)は平均値です。
  • σ(シグマ)は標準偏差です。

標準スコア

標準正規分布上の値は標準スコアまたはzスコアと呼ばれ、特定の観測値が平均値から上下に何個の標準偏差であるかを示します。
例えば、標準スコアが1.5である場合、その観測値は平均値から1.5の標準偏差上にあることを示します。負の標準スコアは、平均値以下の値を示します。平均値はzスコア0をもっています。
全ての事例の99.9%以上が平均値から±3.9の標準偏差内に落ちる。したがって、我々は、zスコアが3.9より大きい、または3.9より小さい任意のデータの確率を0%と見なす。言い換えれば、我々は、3.93.9の間のインターバルを標準正規分布の100%と見なす。

標準正規分布の曲線下面積を求める

正規分布は確率分布です。確率分布の任意の2つの点の間に当てはまる曲線下の面積の比率は、値がその区間に含まれる確率を示しています。
曲線下の面積は1であり、これは分布の100%に相当します。1=100%。
zスコアを得たとき、標準正規分布表を見て、それまでの面積を見つけることができます。これは、zスコア表とも呼ばれます。(表へのリンクは今後提供されます)
テーブルに表示されている数値を1から引くことで、大きなzスコアを持つデータの確率を見つける必要があります。
P(z>a)=1P(z<a)
テーブルに完全なzスコアが見つからない場合、最も近いものを選びます。もし、2つの最も近いzスコアが私たちが求めるzスコアから等距離にある場合、それらの平均を計算します。

他の例
P(0.15<z) - zスコアが0.15より大きいデータの確率は何ですか。
P(z<2.92) - zスコアが2.92より小さいデータの確率は何ですか。
P(0.15<z<2.92) - zスコアが0.152.92の間にあるデータの確率は何ですか。
P(0.15>z>2.92) - zスコアが2.92より大きく、かつ0.15より小さいデータの確率は何ですか。

標準化

zスコアの計算
標準スコアは、特定の観測値が全体の正規分布に対してどこに位置するかを理解するための優れた方法です。それらはまた、異なる平均値と標準偏差を持つ正規分布から描かれた観測値を取り、それを標準的な尺度に置くことを可能にします。データを標準化した後、それらを標準正規分布内に置くことができます。
このように、標準化は、それぞれの観測値が自分の分布内でどこに位置するかに基づいて、異なるタイプの観測値を比較することを可能にします。
観測値の標準スコアを計算するためには、生の測定値を取り、平均を引き、標準偏差で割ります。数学的には、そのプロセスは次の式になります:
z=(x-μ)/σ
xは興味のある測定値の生の値を代表します。これは標準化するべき値 - データ点とも呼ばれます。
μ(ミュー)とσ(シグマ)は、観測値が抽出された集団のパラメータを代表します。

他の関連用語

歪度
歪度は、データの集まりにおける正規分布またはベル曲線からのディストーションまたは非対称性を参照します。曲線が左または右に偏ると、それは歪度があると言われます。歪度は、与えられた分布が正規分布からどれだけ異なるかを表す量として定量化できます。歪度は、一方の尾と他方の尾の極端な値を区別します。正規分布はゼロの歪度を持っています。

尖度
尖度は、どちらの尾にもある極端な値を測定します。大きな尖度を持つ分布は、正規分布の尾を超える尾のデータを示します。低い尖度を持つ分布は、正規分布の尾よりも一般的に尾のデータが少ないことを示します。尖度は、分布の中心に対する分布の尾の結合重量の測定です。ヒストグラムによってグラフ化された正常なデータのセットでは、ベルピークとほとんどのデータが平均から3つの標準偏差(プラスまたはマイナス)の範囲内にあります。しかし、高い尖度が存在すると、尾は正規のベル曲線分布の3つの標準偏差よりもさらに広がります。