Hypergeometric Distribution (Định nghĩa, Công thức) - Làm thế nào để tính toán?

Định nghĩa phân phối siêu đo

Trong thống kê và lý thuyết xác suất, phân phối siêu đại về cơ bản là một phân phối xác suất riêng biệt xác định xác suất của k thành công (nghĩa là một số lần rút ngẫu nhiên cho đối tượng được vẽ có một số đặc điểm cụ thể) trong n lần rút thăm, không có bất kỳ sự thay thế nào từ quy mô dân số N bao gồm chính xác K đối tượng có đặc điểm đó, nơi rút thăm có thể thành công hoặc có thể thất bại.

Công thức tính xác suất của một phân phối siêu bội được suy ra bằng cách sử dụng một số mục trong tổng thể, số mục trong mẫu, số lần thành công trong tổng thể, số lần thành công trong mẫu và một số kết hợp. Về mặt toán học, xác suất được biểu thị là,

P = K C k * (N - K) C (n - k) / N C n

Ở đâu,

  • N = Số mục trong tổng thể
  • n = Số mục trong mẫu
  • K = Số lần thành công trong quần thể
  • k = Số lần thành công trong mẫu

Giá trị trung bình và độ lệch chuẩn của phân bố siêu đại được biểu thị bằng,

Trung bình = n * K / N Độ lệch chuẩn = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Giải trình

Bước 1: Đầu tiên, xác định tổng số vật phẩm trong quần thể, được ký hiệu là N. Ví dụ, số thẻ chơi trong một bộ bài là 52.

Bước 2: Tiếp theo, xác định số lượng vật phẩm trong mẫu, ký hiệu là n-ví dụ như số lượng thẻ rút ra từ bộ bài.

Bước 3: Tiếp theo, xác định các trường hợp sẽ được coi là thành công trong tổng thể, và nó được ký hiệu là K. Ví dụ, số trái tim trong bộ bài tổng thể, là 13.

Bước 4: Tiếp theo, xác định các trường hợp sẽ được coi là thành công trong mẫu đã vẽ, và nó được ký hiệu là k. Ví dụ: số lượng trái tim trong các lá bài được rút ra từ bộ bài.

Bước 5: Cuối cùng, công thức tính xác suất của phân phối siêu bội được suy ra bằng cách sử dụng một số mục trong tổng thể (bước 1), số mục trong mẫu (bước 2), số lần thành công trong tổng thể (bước 3) và số lần thành công trong mẫu (bước 4) như hình dưới đây.

P = K C k * (N - K) C (n - k) / N C n

Ví dụ về phân phối siêu đại (với Mẫu Excel)

Ví dụ 1

Chúng ta hãy lấy ví dụ về một dạng bộ bài bình thường trong đó 6 lá bài được rút ra ngẫu nhiên mà không cần thay thế. Xác định xác suất để rút được đúng 4 quân bài màu đỏ, tức là kim cương hoặc trái tim.

  • Cho trước, N = 52 (vì có 52 lá trong một bộ bài bình thường)
  • n = 6 (Số quân bài được rút ngẫu nhiên từ bộ bài)
  • K = 26 (vì có 13 thẻ đỏ mỗi thẻ trong bộ kim cương và trái tim)
  • k = 4 (Số thẻ đỏ được coi là thành công trong mẫu được rút ra)

Giải pháp:

Do đó, xác suất rút ra chính xác 4 quân bài màu đỏ trong 6 quân bài được rút ra có thể được tính bằng công thức trên là,

Xác suất = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

Xác suất sẽ là -

Xác suất = 0,2387 ~ 23,87%

Do đó, có 23,87% xác suất rút ra chính xác 4 thẻ đỏ trong khi rút 6 thẻ ngẫu nhiên từ một bộ bài thông thường.

Ví dụ số 2

Chúng ta hãy lấy một ví dụ khác về một chiếc ví chứa 5 tờ 100 đô la và 7 tờ 1 đô la. Nếu chọn ngẫu nhiên 4 tờ tiền thì xác định xác suất chọn đúng 3 tờ 100 đô la.

  • Cho trước, N = 12 (Số tờ 100 đô la + Số tờ 1 đô la)
  • n = 4 (Số lượng hóa đơn được chọn ngẫu nhiên)
  • K = 5 (vì có 5 tờ 100 đô la)
  • k = 3 (Số tờ 100 đô la được coi là thành công trong mẫu đã chọn)

Giải pháp:

Do đó, xác suất chọn chính xác 3 tờ 100 đô la trong 4 tờ tiền được chọn ngẫu nhiên có thể được tính theo công thức trên là,

Xác suất = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

Xác suất sẽ là -

Xác suất = 0,1414 ~ 14,14%

Do đó, có 14,14% xác suất chọn đúng 3 tờ 100 đô la trong khi rút ra 4 tờ tiền ngẫu nhiên.

Mức độ liên quan và sử dụng

Khái niệm phân phối siêu đại rất quan trọng vì nó cung cấp một cách chính xác để xác định xác suất khi số lần thử nghiệm không phải là một số quá lớn và mẫu được lấy từ một tập hợp hữu hạn mà không cần thay thế. Trên thực tế, phân phối hypergeometric tương tự như phân phối nhị thức, được sử dụng khi số lượng thử nghiệm về cơ bản là lớn. Tuy nhiên, phân bố hypergeometric chủ yếu được sử dụng để lấy mẫu mà không cần thay thế.

thú vị bài viết...