Nhập một phương trình hay bài toán
Camera không nhận ra dữ liệu đầu vào!

Máy tính giải toán Tiger Algebra

Phân phối chuẩn và phân phối chuẩn hóa

Phân phối chuẩn
Phân phối chuẩn (còn được gọi là phân phối Gaussian, Gauss, hoặc Laplace–Gauss, hay đồ thị hình chuông) là phân phối xác suất liên quan đến xác suất tích lũy với một biến ngẫu nhiên X. Trung tâm của phân phối chuẩn luôn nằm ở giá trị trung bình, qua đó phân phối hoàn toàn đối xứng.

Normal_Distributions_Graph

Ký hiệu
Các nhà thống kê thường sử dụng chữ hoa để đại diện cho các biến ngẫu nhiên và chữ thường để đại diện cho các giá trị của chúng. Chẳng hạn:

  • x là giá trị của biến ngẫu nhiên X.
  • x đại diện cho xác suất của P(X).
  • P(X=x) đại diện cho xác suất mà biến ngẫu nhiên X bằng một giá trị cụ thể x. Chẳng hạn, P(X=1) đề cập đến xác suất mà biến ngẫu nhiên X bằng 1.

Một số ví dụ khác
P(30<X): Xác suất mà X lớn hơn 30 là bao nhiêu?
P(X<80): Xác suất mà X nhỏ hơn 80 là bao nhiêu?
P(30<X<80): Xác suất mà X ở giữa 3080 là bao nhiêu?
P(30>X>80): Xác suất mà X lớn hơn 80 và nhỏ hơn 30 là bao nhiêu?

Các tham số của phân phối chuẩn
Giá trị trung bình và độ lệch chuẩn là hai tham số chính của phân phối chuẩn. Chúng xác định cả hình dạng và xác suất của phân phối.

Giá trị trung bình
μ hoặc x̅
Giá trị trung bình là vị trí trung tâm và đỉnh của phân phối, có nghĩa là bất kỳ thay đổi nào đối với giá trị trung bình sẽ di chuyển đường cong phân phối sang trái hoặc phải theo trục x. Hầu hết các điểm dữ liệu (giá trị) đều nằm xung quanh giá trị trung bình.

Độ lệch chuẩn
σ hoặc s
Độ lệch chuẩn đo lường khoảng cách giữa các điểm dữ liệu và giá trị trung bình của phân phối. Nó xác định độ rộng của phân phối chuẩn. Một độ lệch chuẩn lớn hơn sẽ tạo ra của sắc cao hơn, rộng hơn và độ lệch chuẩn nhỏ hơn sẽ tạo ra đường cong cao hơn, hẹp hơn.

Các đặc điểm của phân phối chuẩn

  1. Nó là đối xứng
    Phân phối chuẩn hoàn toàn đối xứng, có nghĩa là đường cong phân phối có thể được gập lại từ trung tâm, dọc theo giá trị trung bình, để tạo ra hai nửa giống hệt nhau. Hình dạng đối xứng này là kết quả của việc một nửa số quan sát rơi vào mỗi phía của đường cong.
  2. Giá trị trung bình, trung vị, và mode đều bằng nhau
    Do phân phối chuẩn là đối xứng, trung tâm của nó đại diện cho trung bình, hoặc giá trị trung bình, của tất cả các điểm dữ liệu. Điều này có nghĩa là trung vị của nó (giá trị ở giữa của một tập hợp khi các giá trị của nó được sắp xếp từ thấp đến cao) cũng nằm ở trung tâm phân phối và giống với giá trị trung bình. Đỉnh, điểm cao nhất của đường cong phân phối chuẩn, cũng vô tình nằm ở trung tâm đồ thị, có nghĩa là mode của phân phối, giá trị xuất hiện thường xuyên nhất và do đó là điểm cao nhất trên đồ thị, cũng nằm ở trung tâm phân phối. Những dữ liệu này của phân phối chuẩn đại diện cho các điểm dữ liệu (giá trị) diễn ra. Giá trị trung bình là trung tâm của phân phối vì giá trị trung bình là điểm xuất hiện nhiều nhất. Điểm giữa cũng là nơi mà ba phép đo này rơi vào. Các phép đo thường bằng nhau trong một phân phối hoàn hảo (bình thường). Một nửa dân số nhỏ hơn giá trị trung bình, và nửa còn lại lớn hơn giá trị trung bình.
  3. Quy tắc trực quan
    Còn được gọi là quy tắc 68-95-99.7. Quy tắc trực quan mô tả tỷ lệ phần trăm các dữ liệu rơi vào trong một số lượng độ lệch chuẩn cố định từ giá trị trung bình cho các đường cong hình chuông.

    Trong dữ liệu được phân phối chuẩn, có một tỷ lệ cố định của khoảng cách nằm dưới đường cong giữa giá trị trung bình và một số lượng độ lệch chuẩn cố định từ giá trị trung bình. Quy tắc Trực quan cho phép bạn xác định tỷ lệ các giá trị rơi vào trong các khoảng cách nhất định từ giá trị trung bình.

    68,25% tất cả các trường hợp rơi vào trong +/- một độ lệch chuẩn từ giá trị trung bình.
    95% tất cả các trường hợp rơi vào trong +/- hai độ lệch chuẩn từ giá trị trung bình.
    99,7% tất cả các trường hợp rơi vào trong +/- ba độ lệch chuẩn từ giá trị trung bình.

    The_Empirical_Rule_Graph

Phân phối chuẩn chuẩn

Phân phối chuẩn chuẩn là một trường hợp đặc biệt của phân phối chuẩn nơi mà giá trị trung bình bằng không và độ lệch chuẩn bằng một. Phân phối này cũng được gọi là Z-phân phối.

Standard_Normal_Distribution_Graph

Ký hiệu
  • z là "z-score" (điểm chuẩn) - z-score là số độ lệch chuẩn mà một giá trị lệch khỏi giá trị trung bình.
  • μ (mu) là giá trị trung bình.
  • σ (sigma") là độ lệch chuẩn.

Điểm chuẩn

Một giá trị trên phân phối chuẩn chuẩn được gọi là điểm chuẩn hoặc z-score. Nó đại diện cho số độ lệch chuẩn trên hoặc dưới giá trị trung bình mà một quan sát cụ thể rơi vào.
Chẳng hạn, điểm chuẩn 1.5 cho biết quan sát đó ở 1.5 độ lệch chuẩn trên giá trị trung bình. Điểm chuẩn âm đại diện cho một giá trị dưới giá trị trung bình. Giá trị trung bình có z-score bằng 0.
Hơn 99.9% tất cả các trường hợp rơi vào trong +/- 3.9 độ lệch chuẩn từ giá trị trung bình. Vì vậy, chúng ta xem xét xác suất của bất kỳ dữ liệu nào với điểm z lớn hơn 3.9 hoặc nhỏ hơn 3.9 là 0%. Nói cách khác, chúng tôi xem xét khoảng giữa 3.93.9 là 100% của phân phối chuẩn chuẩn.

Tìm khu vực dưới đường cong của một phân phối chuẩn chuẩn

Phân phối chuẩn là một phân phối xác suất. Như với bất kỳ phân phối xác suất nào, tỷ lệ khu vực rơi dưới đường cong giữa hai điểm trên một đồ thị phân phối xác suất chỉ ra xác suất mà một giá trị sẽ rơi vào khoảng đó.
Khu vực dưới đường cong bằng 1, và nó là 100% của phân phối. 1=100%.
Khi bạn có một z-score, bạn có thể tìm khu vực đến nó bằng cách xem bảng phân phối chuẩn chuẩn. Còn được gọi là bảng z-scores. (liên kết đến bảng sẽ sớm được cung cấp)
Bởi vì bảng z-scores cho thấy khu vực đến giá trị z-score, khi bạn muốn tìm xác suất của dữ liệu với điểm z lớn hơn, bạn cần phải trừ số từ bảng từ 1. Điều này có thể được hiển thị như một quy tắc:
P(z>a)=1P(z<a)
Khi chúng tôi không tìm được điểm z hoàn hảo trong bảng, chúng tôi chọn điểm gần nhất. Nếu 2 điểm z gần nhất cách biệt như nhau từ điểm z chúng tôi muốn, chúng tôi tính trung bình của chúng.

Một số ví dụ khác
P(0.15<z) - Xác suất của dữ liệu với điểm z lớn hơn 0.15 là bao nhiêu?
P(z<2.92) - Xác suất của dữ liệu với điểm z nhỏ hơn 2.92 là bao nhiêu?
P(0.15<z<2.92) - Xác suất của dữ liệu với điểm z nằm giữa 0.152.92 là bao nhiêu?
P(0.15>z>2.92) - Xác suất của dữ liệu với điểm z lớn hơn 2.92 và nhỏ hơn 0.15 là bao nhiêu?

Chuẩn hóa

Tính toán điểm z
Điểm chuẩn là một cách tuyệt vời để hiểu tốt một quan sát cụ thể rơi vào đâu so với toàn bộ phân phối chuẩn. Chúng cũng cho phép bạn lấy các quan sát được rút ra từ các dân số có phân phối chuẩn với giá trị trung bình và độ lệch chuẩn khác nhau và đặt chúng trên một tỷ lệ chuẩn. Sau khi chuẩn hóa dữ liệu của bạn, bạn có thể đặt chúng trong phân phối chuẩn chuẩn.
Theo cách này, chuẩn hóa cho phép bạn so sánh các loại quan sát khác nhau dựa trên nơi mỗi quan sát rơi vào trong phân phối của nó.
Để tính điểm chuẩn cho một quan sát, lấy đo lường thô, trừ đi giá trị trung bình, và chia cho độ lệch chuẩn. Theo toán học, công thức cho quá trình đó là:
z=(x-μ)/σ
x đại diện cho giá trị thô của phép đo quan tâm. Nó là giá trị cần được chuẩn hóa - đôi khi được gọi là điểm dữ liệu.
μ (Mu) và σ (sigma) đại diện cho các tham số cho dân số mà quan sát được rút ra.

Thêm một số thuật ngữ liên quan

Độ nghiêng
Độ nghiêng (Skewness) đề cập đến một sự biến dạng hoặc không đối xứng phá vỡ sự đối xứng của đồ thị hình chuông, hoặc phân phối chuẩn, trong một tập dữ liệu. Nếu đường cong bị dịch chuyển sang trái hoặc sang phải, người ta nói rằng nó bị "nghiêng". Độ nghiêng có thể được định lượng để đại diện cho mức độ mà một phân phối cụ thể khác đi từ phân phối chuẩn. Độ nghiêng phân biệt các giá trị cực đoan trong một so với đuôi khác. Một phân phối chuẩn có độ nghiêng là không.

Kurtosis
Kurtosis đo lường các giá trị cực đoan trong cả hai đuôi. Các phân phối có kurtosis lớn thể hiện dữ liệu đuôi vượt quá đuôi của phân phối chuẩn. Phân phối với kurtosis thấp hiển thị dữ liệu đuôi thấp hơn đuôi của phân phối chuẩn. Kurtosis là một biện pháp cho khối lượng kết hợp của đuôi của phân phối so với trung tâm của phân phối. Khi một tập dữ liệu gần như bình thường được đồ thị qua một biểu đồ cột, nó cho thấy một đỉnh chuông và hầu hết dữ liệu trong ba độ lệch chuẩn (cộng trừ) từ giá trị trung bình. Tuy nhiên, khi có kurtosis cao, các đuôi mở rộng xa hơn so với ba độ lệch chuẩn của sự phân phối dạng chuông chuẩn.