输入一个方程或问题
无法识别摄像头输入!

老虎代数计算器

正态和标准正态分布

正态分布
正态分布(也被称为高斯、高斯或拉普拉斯-高斯分布,或者钟形曲线)是一种概率分布,它将累积概率与随机变量 X 关联起来。正态分布的中心始终位于均值,分布在该点是完全对称的。

Normal_Distributions_Graph

符号
统计学家通常使用大写字母来表示随机变量,小写字母来表示它们的值。例如:

  • x 是随机变量 X 的值。
  • x 表示 P(X) 的概率。
  • P(X=x) 表示随机变量 X 等于特定值 x 的概率。例如,P(X=1) 是指随机变量 X 等于 1 的概率。

其他示例
P(30<X)X 大于 30 的概率是多少?
P(X<80)X 小于 80 的概率是多少?
P(30<X<80)X 位于 3080 之间的概率是多少?
P(30>X>80)X 大于 80 且小于 30 的概率是多少?

正态分布的参数
均值和标准偏差是正态分布的两个主要参数。它们决定了分布的形状和概率。

平均数
μx̅
平均数是分布中心和峰值的位置,这意味着任何对平均数的更改都将使分布曲线左移或右移。大多数数据点(值)都位于平均值附近。

标准差
σs
标准差测量数据点离分布的平均值有多远。它决定正态分布的宽度。标准差更大会导致短宽曲线,标准差更小会导致高窄曲线。

正态分布的性质

  1. 它是对称的
    正态分布完全对称,也就是说,你可以在中间,即均值处,折叠分布曲线,得到两个完全相同的部分。这种对称形状是因为一半的观察值出现在曲线的每一侧。
  2. 平均值、中位数和众数相等
    由于正态分布是对称的,其中心代表所有数据点的平均值或均值。这意味着,它的中位数(当一个集合的值按从最小到最大的顺序排列时位于中间的值)也位于分布中心,且与均值相同。正态分布曲线的顶部,也就是最高点,恰好位于图形的中心,这意味着分布的众数——其最常出现的值,也就是图上最高点,也位于分布中心。正态分布的这些数据表示出现的数据点(值)。均值是分布的中心,因为均值是最频繁出现的点。这三个测量值通常位于中间点。在一个完全的(正态)分布中,这些测量值通常相等。分布的一半人口小于平均值,另一半大于平均值。
  3. 经验法则
    也被称为68-95-99.7规则。经验法则描述了在均值和某个特定数目的标准偏差之间的曲线下的数据的百分比。

    在正常分布的数据中,有一定比例的距离位于曲线下,这些距离位于均值和某一特定数目的标准偏差之间。经验法则让你可以确定某些距离从均值开始的值的比例。

    68.25%的所有案例落在均值的正负一个标准偏差之内。
    95%的所有案例落在均值的正负两个标准偏差之内。
    99.7%的所有案例落在均值的正负三个标准偏差之内。

    The_Empirical_Rule_Graph

标准正态分布

标准正态分布是正态分布的一种特殊情况,其中均值为零,标准偏差为一。此分布也被称为 Z-分布

Standard_Normal_Distribution_Graph

符号
  • z 是"z-分数"(标准分数) - z 分数是一个值距离平均数有多少个标准偏差。
  • μ(mu)是平均值。
  • σ(sigma")是标准偏差。

标准分数

在标准正态分布上的一个值被称为标准分数或 z 分数。它表示一个特定的观察值超过或低于平均值多少个标准偏差。
例如,标准分数为 1.5 表示观察值超过平均值 1.5 个标准偏差。负的标准分数表示一个值低于平均数。平均数的 z 分数为 0
超过 99.9% 的所有案例落在均值的正负 3.9 个标准偏差之内。所以,我们把任何数据的 z 分数大于 3.9 或小于 3.9 的概率视为 0%。换句话说,我们把从 3.93.9 的区间视为标准正态分布的 100%。

找出标准正态分布曲线下的面积

正态分布是一种概率分布。与任何概率分布一样,落在概率分布图上两个点之间的曲线下的区域的比例,可以表示一个值落在那个区间的概率。
曲线下的面积为 1,它是分布的 100%。 1=100%。
当你得到一个 z 分数,你可以通过查看标准正态分布表找到以分数为代表的区域。也被称为 z 分数表。(表信息即将公布)
由于 z 分数表显示的是到 z 分数值的面积,所以当你想要找出大于 z 分数的数据的概率时,你需要从表中的数值中减去 1。这可以显示为一个规则:
P(z>a)=1P(z<a)
当我们在表中找不到完全的 z 分数时,我们选择最接近的一个。如果最近的两个 z 分数距离我们想要的 z 分数的距离相同,我们就计算它们的平均数。

其他例子
P(0.15<z) - 数据的 z 分数大于 0.15 的概率是多少?
P(z<2.92) - 数据的 z 分数小于 2.92 的概率是多少?
P(0.15<z<2.92) - 数据的 z 分数在 0.152.92 之间的概率是多少?
P(0.15>z>2.92) - 数据的 z 分数大于 2.92 和小于 0.15 的概率是多少?

标准化

计算 z 分数
标准分数是理解特定观察值位于整个正态分布位置的好方法。它们还允许你将从不同均值和标准偏差的正态分布群体中抽取的观察值放置在一个标准的尺度上。在标准化你的数据后,你可以将它们放在标准正态分布内。
这样,标准化就允许你通过基于每个观察值位于自己的分布内的位置来比较不同类型的观察值。
要计算观察值的标准分数,取原始测量值,减去均值,然后除以标准偏差。在数学上,这个过程的公式如下:
z=(x-μ)/σ
x 代表你感兴趣的测量值的原始值。也就是需要标准化的值 - 有时被称为数据点。
μ(Mu)和 σ(sigma)代表了观察值所取的人口的参数。

更多相关术语

偏度
偏度是指一种扭曲或不对称,它偏离了数据集中的对称钟形曲线,或正态分布。如果曲线向左或向右移动,就认为它是偏的。偏度可以被量化为表示给定分布与正态分布差距的表示。偏度区别了一个尾巴和另一个尾巴的极端值。正态分布偏度为零。

峰度
峰度测量尾部的极端值。具有大峰度的分布显示尾部数据超过正态分布的尾部。峰度低的分布表明,尾部数据通常小于正态分布的尾部。峰度是分布的尾部相对于分布中心的组合权重的度量。当一组近似正态的数据通过直方图画出时,它显示一种钟形的峰和大多数数据在平均数的三个标准偏差范围内(正负)。然而,当高峰度存在时,尾部在正常钟形曲线的三个标准差之外延伸。