Bir denklem veya problem girin
Kamera girişi tanınmadı!

Tiger Algebra Hesap Makinesi

Normal ve standart normal dağılımlar

Normal dağılım
Normal dağılım (Gaussian, Gauss, Laplace-Gauss dağılımı veya çan eğrisi olarak da bilinir), rastgele bir değişken olan X ile kümülatif olasılığın ilişkisini belirler. Normal bir dağılımın merkezi her zaman ortalama noktasında bulunur ve dağılım bu noktadan tamamen simetrik şekilde yayılır.

Normal_Distributions_Graph

Notasyonlar
İstatistisyenler genellikle rastgele değişkenleri temsil etmek için büyük harf, ve bu değişkenlerin değerlerini temsil etmek için ise küçük harfleri kullanır. Örneğin:

  • x, rastgele değişken X'in değeridir.
  • x the P(X)ın olasılığını temsil eder.
  • P(X=x) rastgele X değişkeninin belirli bir x değerine eşit olma olasılığını temsil eder. Örneğin, P(X=1), rastgele X değişkeninin 1 değerine eşit olma olasılığına karşılık gelir.

Diğer örnekler
P(30<X): X'in 30'dan daha büyük olma olasılığı nedir?
P(X<80): X'in 80'den daha küçük olma olasılığı nedir?
P(30<X<80): X'in 30 ve 80 arasında olma olasılığı nedir?
P(30>X>80): X'in 80'den daha büyük ve 30'dan daha küçük olma olasılığı nedir?

Normal dağılımın parametreleri
Ortalama ve standart sapma, normal dağılımın iki ana parametresidir. Bu parametreler hem dağılımın şeklini hem de olasılıkları belirler.

Çok
μ or x̅
Ortalama, bir dağılımın merkez ve zirve lokasyonunu belirtir. Dolayısıyla ortalamanın değiştirilmesi dağılım eğrisinin x ekseni üzerinde sola veya sağa kaymasına sebep olur. Veri noktalarının (değerlerin) çoğu ortalama etrafında bulunur.

Standart Sapma
σ or s
Standart sapma, veri noktalarının bir dağılımın ortalamasına ne kadar uzakta olduğunu ölçer. Normal bir dağılımın genişliğini belirler. Büyük bir standart sapma daha kısa, daha geniş eğriler ve daha küçük standart sapma ise daha yüksek, daha dar eğriler sonucunu verir.

Normal dağılımın özellikleri

  1. Simetrikdir
    The normal dağılım mükemmel bir şekilde simetriktir, yani dağılım eğrisi orta noktadan, yani ortalamanın olduğu noktadan, ikiye katlanabilir ve iki aynı parça elde edilebilir. Bu simetrik şekil, gözlemlerin yarısının her bir eğri yarısına düşmesi sonucudur.
  2. Ortalama, medyan ve mod hepsi eşittir
    Normal dağılım simetrik olduğu için, merkezi tüm veri noktalarının ortalamasını temsil eder. Bu demek oluyor ki medyanı (değerler küçükten büyüğe sıralandığında ortada kalan değer) da dağılımın merkezinde yer alır ve ortalama ile aynıdır. Zirve noktası, normal dağılım eğrisinin en yüksek noktası, aynı zamanda grafik merkezinde yer alır. Bu da demektir ki dağılımın modu, yani en sık görülen değer ve dolayısıyla grafik üzerindeki en yüksek nokta, dağılım merkezinde bulunur. Bu normal dağılım verileri, veri noktalarını (değerleri) temsil eder. Ortalama, en sık görülen nokta olduğu için dağılımın merkezidir. Ayrıca, bu üç ölçümün düştüğü bir orta nokta da vardır. Mükemmel bir dağılımda (normal) bu ölçümler genellikle eşittir. Nüfusun yarısı ortalamanın altında, yarısı da üzerindedir.
  3. Empirik kural
    68-95-99.7 kuralı olarak da bilinir. Empirik kural, çan şeklindeki eğriler için ortalamanın belirli sayıda standart sapma uzağındaki verilerin yüzdesini tanımlar.

    Normal dağıtılmış verilerde, ortalamadan belirli sayıda standart sapma uzağına düşen mesafenin altındaki alan sabit bir oranı temsil eder. Empirik Kural, ortalamanın belirli mesafeleri içindeki değerlerin oranını belirlemenizi sağlar.

    Tüm durumların %68.25'i ortalamanın +/- bir standart sapma uzağına düşer.
    Tüm durumların %95'i ortalamanın +/- two standart sapma uzağına düşer.
    Tüm durumların %99.7'i ortalamanın +/- three standart sapma uzağına düşer.

    The_Empirical_Rule_Graph

Standart normal dağılım

Standart normal dağılım, ortalamanın sıfır ve standart sapmanın bir olduğu normal dağılımın özel bir durumudur. Bu dağılıma Z-dağılımıda denir.

Standard_Normal_Distribution_Graph

Notasyonlar
  • z, "z-puanı" (standart puanı) - z puanı bir değerin ortalamadan kaç standart sapma uzağında olduğunu belirtir.
  • μ (mu), ortalamadır.
  • σ (sigma) standart sapmadır.

Standart puanlar

Standart normal dağılımdaki bir değer standart puan veya z-puan olarak adlandırılır. Bu puan, belirli bir gözlemin ortalamanın üzerinde veya altında kaç standart sapma düştüğünü belirtir.
Örneğin, standart puanı 1.5 olan bir gözlem, bu gözlemin ortalamanın 1.5 standart sapma üzerinde olduğunu belirtir. Negatif bir standart puan, ortalamanın altındaki bir değeri temsil eder. Ortalamanın z-puanı 0'dır.
Tüm durumların %99,9'dan fazlası ortalamanın +/- 3,9 standart sapma uzağına düşer. Dolayısıyla, z-puanı 3.9'dan daha büyük ya da 3.9'dan daha küçük olan herhangi bir veri olasılığını %0 olarak kabul ederiz. Başka bir deyişle, 3.9 ve 3.9 arasındaki aralığı standart normal dağılımın %100'ü olarak kabul ederiz.

Standart normal dağılımın eğrisi altındaki alanları bulmak

Normal dağılım bir olasılık dağılımıdır. Herhangi bir olasılık dağılımında olduğu gibi, bir olasılık dağılımı grafiğindeki iki nokta arasında kalan ve eğri altına düşen alanın oranı, bir değerin bu aralığa düşme olasılığını belirtir.
Eğri altına düşen alan 1'e eşittir ve bu dağılımın %100'ünü temsil eder. 1=%100.
Bir z-puanı aldığınızda, bir standart normal dağılım tablosuna bakarak bu puanın altına düşen alanı bulabilirsiniz. Bu tablo aynı zamanda z-puanları tablosu olarak da bilinir. (tabloya bağlantı yakında eklenecektir)
Z-puanları tablosu z-puan değerine kadar olan alanı gösterir, dolayısıyla daha büyük z-puanlara sahip verinin olasılığını bulmak istediğinizde, tablodaki sayıyı 1'den çıkartmanız gerekir. Bu durum aşağıdaki kural ile ifade edilebilir:
P(z>a)=1P(z<a)
Tabloda aradığımız mükemmel z-puanı bulamadığımızda, en yakın olanını seçeriz. Eğer en yakın olan 2 z-puan bizim istediğimiz z-puan ile aynı mesafedeyse, onların ortalamasını hesaplarız.

Diğer örnekler
P(0.15<z) - Z-puanı 0.15'den daha büyük olan bir verinin olasılığı nedir?
P(z<2.92) - Z-puanı 2.92'den daha küçük olan bir verinin olasılığı nedir?
P(0.15<z<2.92) - Z-puanı 0.15 ile 2.92 arasında olan bir verinin olasılığı nedir?
P(0.15>z>2.92) - Z-puanı 2.92'den daha büyük ve 0.15'den daha küçük olan bir verinin olasılığı nedir?

Standartlaştırma

Z-puanı Hesaplama
Standart puanlar, belirli bir gözlemin tüm normal dağılıma göre nerede düştüğünü anlamanın mükemmel bir yoludur. Ayrıca, farklı ortalamalara ve standart sapmalara sahip normal dağıtılmış popülasyonlardan çekilen gözlemleri alıp standart bir ölçekte koymanıza olanak sağlar. Verilerinizi standardize ettikten sonra, bunları standart normal dağılım içine koyabilirsiniz.
Bu şekilde, standartlaştırma, her gözlemin kendi dağılımı içinde nerede düştüğüne dayanarak farklı türdeki gözlemleri karşılaştırmanıza olanak sağlar.
Bir gözlem için standart puanı hesaplamak için, ham ölçümü alın, ortalamayı çıkarın ve standart sapmayla bölün. Matematiksel olarak, bu sürecin formülü şu şekildedir:
z=(x-μ)/σ
x, ilgi çeken ölçümün ham değeridir. Standardize edilecek değerdir - bazen veri noktası olarak adlandırılır.
μ (Mu) ve σ (sigma), gözlemin çekildiği nüfusun parametrelerini temsil eder.

Daha fazla ilgili terimler

Çarpıklık
Çarpıklık, bir veri setindeki simetrik çan eğrisi veya normal dağılımdan sapmayı temsil eden bir bozulma veya asimetridir. Eğer eğri sola veya sağa kaydırılmışsa, çarpık olduğu söylenir. Çarpıklık, bir dağılımın normal dağılımdan ne ölçüde farklı olduğunu gösteren bir gösterge olarak ölçülebilir. Çarpıklık, bir kuyruğa kıyasla diğerindeki aşırı değerlerin farklılaşmasını ifade eder. Normal bir dağılımın çarpıklığı sıfırdır.

Kurtosis
Kurtosis, iki uçta bulunan aşırı değerleri ölçer. Büyük kurtosisli dağılımlar, normal dağılımın uçlarından aşırı değerleri gösterir. Küçük kurtosisli dağılımlar, genellikle normal dağılımın uçlarından daha az aşırı uç değerleri sergiler. Kurtosis, bir dağılımın merkezine kıyasla bir dağılımın kuyruklarındaki ağırlıkların birleşik ölçüsüdür. Normaldağılımı andıran bir veri seti, bir histogramda grafiği çizildiğinde bu ortalama üzerine ve değişken değerlerinin (artı eksi) üç standart sapmalı içerisinde en çok alanı kaplar. Ancak yüksek kurtosisli verilerde, uçlar normal çan eğrisi dağılımının üç standart sapma dalgalanmasından daha fazla uzanır.