Phân phối chuẩn trong thống kê - Định nghĩa, Ví dụ, Diễn giải

Phân phối Chuẩn trong Thống kê là gì?

Phân phối chuẩn là một đường cong phân bố tần số hình chuông giúp mô tả tất cả các giá trị có thể có mà một biến ngẫu nhiên có thể nhận trong một phạm vi nhất định với phần lớn vùng phân bố nằm ở giữa và một số ở phần đuôi, ở cực trị. Phân phối này có hai tham số chính: giá trị trung bình (µ) và độ lệch chuẩn (σ), đóng vai trò quan trọng trong việc tính toán lợi tức tài sản và trong chiến lược quản lý rủi ro.

Cách diễn giải phân phối bình thường

Hình trên cho thấy phân phối chuẩn thống kê là một đường cong hình chuông. Phạm vi kết quả có thể có của phân phối này là toàn bộ số thực nằm trong khoảng từ -∞ đến + ∞. Phần đuôi của đường cong hình chuông mở rộng ở cả hai phía của biểu đồ (+/-) mà không có giới hạn.

  • Khoảng 68% tổng số quan sát nằm trong +/- một độ lệch chuẩn (σ)
  • Khoảng 95% tất cả các quan sát nằm trong khoảng +/- hai độ lệch chuẩn (σ)
  • Khoảng 99% tất cả các quan sát nằm trong +/- ba độ lệch chuẩn (σ)

Nó có độ lệch bằng 0 (đối xứng của một phân phối). Nếu phân phối dữ liệu không đối xứng, thì phân phối không đồng đều nếu tập dữ liệu có độ lệch lớn hơn 0 hoặc độ lệch dương. Khi đó, đuôi bên phải của phân phối kéo dài hơn bên trái và đối với độ lệch âm (nhỏ hơn 0) thì đuôi bên trái sẽ dài hơn đuôi bên phải.

Nó có kurtosis là 3 (đo độ cao nhất của một phân phối), cho biết sự phân bố không quá đỉnh hoặc đuôi quá mỏng. Nếu kurtosis nhiều hơn ba so với phân phối là đỉnh nhiều hơn với đuôi béo hơn và nếu kurtosis nhỏ hơn ba, thì nó có đuôi mỏng và điểm đỉnh thấp hơn phân phối chuẩn.

Nét đặc trưng

  • Chúng đại diện cho một nhóm phân phối trong đó trung bình & độ lệch xác định hình dạng của phân phối.
  • Giá trị trung bình, trung vị và chế độ của phân phối này đều bằng nhau.
  • Một nửa giá trị nằm ở bên trái của tâm và nửa còn lại ở bên phải.
  • Tổng giá trị dưới đường cong chuẩn sẽ luôn là một.
  • Nhiều khả năng, phân phối nằm ở trung tâm và ít giá trị hơn nằm ở cuối đuôi.

Chuyển đổi (Z)

Hàm mật độ xác suất (PDF) của phân phối biến ngẫu nhiên (X) sau đây được cho bởi:

trong đó -∞ <x <∞; -∞ <µ 0

Ở đâu,

  • F (x) = Hàm xác suất thông thường
  • x = Biến ngẫu nhiên
  • µ = Trung bình của phân phối
  • σ = Độ lệch chuẩn của phân phối
  • π = 3,14159
  • e = 2,71828

Công thức chuyển đổi

Ở đâu,

  • X = Biến ngẫu nhiên

Ví dụ về phân phối chuẩn trong thống kê

Hãy thảo luận các ví dụ sau.

Ví dụ 1

Giả sử một công ty có 10000 nhân viên và nhiều cơ cấu tiền lương theo vai trò công việc mà nhân viên đó làm việc. Tiền lương thường được phân phối với trung bình dân số là µ = 60.000 đô la và độ lệch chuẩn dân số σ = 15000 đô la. Xác suất để nhân viên được chọn ngẫu nhiên có mức lương hàng năm thấp hơn $ 45000.

Giải pháp

Như trong hình trên, để trả lời câu hỏi này, chúng ta cần tìm diện tích dưới đường cong bình thường từ 45 đến đuôi bên trái. Ngoài ra, chúng ta cần sử dụng giá trị bảng Z để có câu trả lời đúng.

Đầu tiên, chúng ta cần chuyển giá trị trung bình và độ lệch chuẩn đã cho thành phân phối chuẩn chuẩn với giá trị trung bình (µ) = 0 và độ lệch chuẩn (σ) = 1 bằng cách sử dụng công thức biến đổi.

Sau khi chuyển đổi, chúng ta cần tra bảng Z- để tìm ra giá trị tương ứng, từ đó sẽ cho ta câu trả lời chính xác.

Được,

  • Trung bình (µ) = $ 60.000
  • Độ lệch chuẩn (σ) = $ 15000
  • Biến ngẫu nhiên (x) = $ 45000

Chuyển đổi (z) = (45000 - 60000/15000)

Chuyển đổi (z) = -1

Bây giờ giá trị tương đương với -1 trong bảng Z là 0,1587, đại diện cho khu vực dưới đường cong từ 45 về phía bên trái. Nó chỉ ra rằng khi chúng tôi chọn ngẫu nhiên một nhân viên, xác suất kiếm được ít hơn $ 45000 một năm là 15,87%.

Ví dụ số 2

Bây giờ giữ kịch bản tương tự như trên, hãy tìm xác suất để nhân viên được chọn ngẫu nhiên kiếm được hơn 80.000 đô la một năm bằng cách sử dụng phân phối chuẩn.

Giải pháp

Vì vậy, trong câu hỏi này, chúng ta cần tìm ra vùng bóng mờ từ 80 đến đuôi bên phải bằng cách sử dụng cùng một công thức.

Được,

  • Trung bình (µ) = $ 60.000
  • Độ lệch chuẩn (σ) = $ 15000
  • Biến ngẫu nhiên (X) = 80.000 đô la

Chuyển đổi (z) = (80000 - 60000/15000)

Chuyển đổi (z) = 1,33

Theo bảng Z, giá trị tương đương của 1,33 là 0,9082 hay 90,82%, cho thấy xác suất chọn ngẫu nhiên những nhân viên có thu nhập dưới 80.000 đô la hàng năm là 90,82%.

Nhưng theo câu hỏi, chúng ta cần xác định xác suất để các nhân viên ngẫu nhiên kiếm được hơn 80.000 đô la một năm, vì vậy chúng ta cần lấy giá trị trừ đi 100.

  • Biến ngẫu nhiên (X) = 100% - 90,82%
  • Biến ngẫu nhiên (X) = 9.18%

Vậy xác suất nhân viên kiếm được hơn 80.000 USD mỗi năm là 9,18%.

Sử dụng

  • Biểu đồ kỹ thuật thị trường chứng khoán thường là một đường cong hình chuông, cho phép các nhà phân tích và nhà đầu tư đưa ra các suy luận thống kê về lợi nhuận kỳ vọng và rủi ro của cổ phiếu.
  • Nó được sử dụng trong thế giới thực, như để xác định thời gian tốt nhất có thể xảy ra nhất mà các công ty bánh pizza thực hiện để giao bánh pizza và nhiều ứng dụng thực tế khác.
  • Được sử dụng để so sánh chiều cao của một tập hợp dân số nhất định, trong đó hầu hết mọi người sẽ có kích thước trung bình với rất ít người có chiều cao trên trung bình hoặc dưới trung bình.
  • Chúng được sử dụng để xác định kết quả học tập trung bình của học sinh, giúp so sánh thứ hạng của học sinh.

Phần kết luận

Phân phối bình thường tìm thấy các ứng dụng trong khoa học dữ liệu và phân tích dữ liệu. Các công nghệ tiên tiến như Trí tuệ nhân tạo và học máy được sử dụng cùng với phân phối này có thể mang lại chất lượng dữ liệu tốt hơn, giúp các cá nhân và công ty ra quyết định hiệu quả.

thú vị bài viết...