Digita un'equazione o un problema
L'input della fotocamera non viene riconosciuto!

Calcolatrice Tiger Algebra

Нормальное и стандартное нормальное распределения

Distribución normal
Una distribución normal (también conocida como distribución gaussiana, de Gauss o de Laplace-Gauss, o la curva de campana) es una distribución de probabilidad que relaciona una probabilidad acumulada con una variable aleatoria X. El centro de una distribución normal siempre se encuentra en la media, a través de la cual la distribución es completamente simétrica.

distribuciones_normales_grafico

Notaciones
Los estadísticos suelen utilizar letras mayúsculas para representar variables aleatorias y letras minúsculas para representar sus valores. Por ejemplo:

  • x es el valor de la variable aleatoria X.
  • x representa la probabilidad de P(X).
  • P(X=x) representa la probabilidad de que la variable aleatoria X sea igual a un valor particular x. Por ejemplo, P(X=1) se refiere a la probabilidad de que la variable aleatoria X sea igual a 1.

Otros ejemplos
P(30<X): ¿Cuál es la probabilidad de que X sea mayor que 30?
P(X<80): ¿Cuál es la probabilidad de que X sea menor que 80?
P(30<X<80): ¿Cuál es la probabilidad de que X esté entre 30 y 80?
P(30>X>80): ¿Cuál es la probabilidad de que X sea mayor que 80 y menor que 30?

Parámetros de la distribución normal
La media y la desviación estándar son los dos principales parámetros de a distribución normal. Determinan tanto la forma de la distribución como las probabilidades.

Media
μ o x̅
La media es la ubicación del centro y el pico de una distribución, lo que significa que cualquier cambio en la media mueve la curva de distribución hacia la izquierda o la derecha a lo largo del eje x. La mayoría de los puntos de datos (valores) se encuentran alrededor de la media.

Desviación estándar
σ o s
La desviación estándar mide cuán lejos están los puntos de datos de la media de una distribución. Determina la amplitud de una distribución normal. Una desviación estándar mayor resulta en curvas más cortas y anchas, y las desviaciones estándar más pequeñas resultan en curvas más altas y estrechas.

Propiedades de la distribución normal

  1. Es simétrica
    La distribución normal es perfectamente simétrica, lo que significa que la curva de distribución puede ser doblada en el medio, a lo largo de la media, para producir dos mitades idénticas. Esta forma simétrica es el resultado de que la mitad de las observaciones caigan a cada lado de la curva.
  2. La media, la mediana y la moda son todas iguales
    Debido a que la distribución normal es simétrica, su centro representa el promedio, o media, de todos los puntos de datos. Esto significa que su mediana (el valor en el medio de un conjunto cuando sus valores se ordenan de menor a mayor) también se sitúa en el centro de la distribución y es igual a la media. El pico, el punto más alto de la curva de distribución normal, también sucede que está ubicado en el centro del gráfico, lo que significa que la moda de la distribución, su valor más común y, por lo tanto, el punto más alto en el gráfico, también está ubicado en el centro de la distribución. Estos datos de la distribución normal representan los puntos de datos (valores) que ocurren. La media es el centro de la distribución porque la media es el punto que ocurre con más frecuencia. El punto medio es también el punto en el que caen estas tres medidas. Las medidas suelen ser iguales en una distribución perfectamente (normal). La mitad de la población es menor que la media, y la mitad es mayor que la media.
  3. La regla empírica
    También llamada la regla 68-95-99.7. La regla empírica describe el porcentaje de los datos que caen dentro de números específicos de desviaciones estándar de la media para curvas en forma de campana.

    En los datos distribuidos normalmente, hay una proporción constante de distancia que se encuentra bajo la curva entre la media y un número específico de desviaciones estándar de la media. La Regla Empírica te permite determinar la proporción de valores que caen dentro de ciertas distancias de la media.

    El 68.25% de todos los casos caen dentro de +/- una desviación estándar de la media.
    El 95% de todos los casos caen dentro de +/- dos desviaciones estándar de la media.
    El 99.7% de todos los casos caen dentro de +/- tres desviaciones estándar de la media.

    grafico_de_la_regla_empirica

Distribución normal estándar

La distribución normal estándar es un caso especial de la distribución normal donde la media es cero y la desviación estándar es uno. Esta distribución también se llama la distribución Z.

grafico_de_distribucion_normal_estandar

Notaciones
  • z es el "z-score" (puntuación estándar) - el z score es cuántas desviaciones estándar está un valor alejado de la media.
  • μ (mu) es la media.
  • σ (sigma) es la desviación estándar.

Puntuaciones estándar

Un valor en la distribución normal estándar se llama puntuación estándar o z-score. Representa el número de desviaciones estándar por encima o por debajo de la media en el que cae una observación específica.
Por ejemplo, una puntuación estándar de 1.5 indica que la observación está 1.5 desviaciones estándar por encima de la media. Una puntuación estándar negativa representa un valor por debajo de la media. La media tiene un z-score de 0.
Más del 99.9% de todos los casos caen dentro de +/- 3.9 desviaciones estándar de la media. Por lo tanto, consideramos la probabilidad de cualquier dato con un z-score mayor que 3.9 o menor que 3.9 como del 0%. En otras palabras, consideramos el intervalo entre 3.9 y 3.9 como el 100% de la distribución normal estándar.

Encontrar áreas bajo la curva de una distribución normal estándar

La distribución normal es una distribución de probabilidad. Como con cualquier distribución de probabilidad, la proporción del área que cae bajo la curva entre dos puntos en un gráfico de distribución de probabilidad indica la probabilidad de que un valor caiga dentro de ese intervalo.
El área bajo la curva es igual a 1, y es el 100% de la distribución. 1=100%.
Cuando obtienes un z-score, puedes encontrar el área hasta él mirando una tabla de distribución normal estándar. También conocida como la tabla de z-scores. (próximamente enlace a la tabla)
Debido a que la tabla de z-scores muestra el área hasta el valor del z-score, cuando quieres encontrar la probabilidad de datos con z-scores más grandes, necesitas restar el número de la tabla de 1. Esto se puede mostrar como una regla:
P(z>a)=1P(z<a)
Cuando no encontramos el z-score perfecto en la tabla, elegimos el más cercano. Si los 2 z-scores más cercanos están a la misma distancia de nuestro z-score deseado, calculamos su media.

Otros ejemplos
P(0.15<z) - ¿Cuál es la probabilidad de datos con un z-score que es mayor que 0.15?
P(z<2.92) - ¿Cuál es la probabilidad de datos con un z-score que es menor que 2.92?
P(0.15<z<2.92) - ¿Cuál es la probabilidad de datos con un z-score que está entre 0.15 y 2.92?
P(0.15>z>2.92) - ¿Cuál es la probabilidad de datos con un z-score que es mayor que 2.92 y menor que 0.15?

Estandarización

Calculando los z-scores
Las puntuaciones estándar son una excelente forma de entender donde cae una observación específica en relación con la distribución normal en su conjunto. También te permiten tomar observaciones extraídas de poblaciones con distribución normal con diferentes medias y desviaciones estándar y colocarlas en una escala estándar. Después de estandarizar tus datos, puedes colocarlos dentro de la distribución normal estándar.
De esta manera, la estandarización te permite comparar diferentes tipos de observaciones en función de donde cae cada observación dentro de su propia distribución.
Para calcular la puntuación estándar para una observación, toma la medición bruta, resta la media y divide por la desviación estándar. Matemáticamente, la fórmula para ese proceso es la siguiente:
z=(x-μ)/σ
x representa el valor bruto de la medición de interés. Es el valor a ser estandarizado, a veces llamado punto de datos.
μ (Mu) y σ (sigma) representan los parámetros para la población de la que se extrajo la observación.

Más términos relacionados

Asimetría
La asimetría se refiere a una distorsión o asimetría que se desvía de la curva de campana simétrica, o distribución normal, en un conjunto de datos. Si la curva se desplaza a la izquierda o a la derecha, se dice que está sesgada. La asimetría puede ser cuantificada como una representación de la medida en que una determinada distribución varía de una distribución normal. La asimetría diferencia los valores extremos en una cola frente a la otra. Una distribución normal tiene una asimetría de cero.

Curtosis
La curtosis mide los valores extremos en cualquiera de las colas. Las distribuciones con alta curtosis presentan datos de cola que exceden las colas de la distribución normal. Las distribuciones con baja curtosis muestran datos de cola que son generalmente menos extremos que las colas de la distribución normal. La curtosis es una medida del peso combinado de las colas de una distribución en relación con el centro de dicha distribución. Cuando un conjunto de datos aproximadamente normal se grafica mediante un histograma, muestra un pico en forma de campana y la mayoría de los datos dentro de tres desviaciones estándar (más o menos) de la media. Sin embargo, cuando está presente una alta curtosis, las colas se extienden más allá de las tres desviaciones estándar de la distribución normal en forma de campana.