T-Test (Định nghĩa, Các loại) - Ví dụ về tính toán từng bước

Mục lục

T-Test là gì?

T-Test là một phương pháp được sử dụng để đưa ra suy luận trong thống kê, nhằm mục đích tìm hiểu xem có bất kỳ sự khác biệt chính nào giữa hai phương tiện trong đó hai nhóm được xem xét có thể liên quan với nhau hay không.

Giải trình

  • Nó nhằm mục đích kiểm tra giả thuyết, về cơ bản được sử dụng để kiểm tra một giả thuyết liên quan đến một dân số nhất định. Phép thử T xem xét thống kê T, giá trị phân phối T và bậc tự do, được sử dụng để xác định xác suất chênh lệch giữa hai tập dữ liệu.
  • Hoạt động cơ bản đằng sau T-Test là nó xem xét một mẫu từ mỗi bộ trong số hai bộ và xây dựng một tuyên bố vấn đề bằng cách xem xét một giả thuyết rỗng trong đó cả hai phương tiện được nêu là bằng nhau.
  • Trên cơ sở các công thức tương đương, các giá trị được rút ra và so sánh với các giá trị tiêu chuẩn, điều này càng dẫn đến việc chấp nhận hoặc bác bỏ giả thuyết rỗng. Việc bác bỏ giả thuyết vô hiệu chỉ ra rằng tập dữ liệu khá chính xác và không phải ngẫu nhiên.

Các loại kiểm tra T

Chủ yếu có bốn loại kiểm tra t, như sau:

# 1 - Bài kiểm tra T mẫu 1

Nó nhằm mục đích kiểm tra xem giá trị trung bình mà người ta đã nhắm mục tiêu có bằng giá trị trung bình của một quần thể đơn lẻ, ví dụ: Kiểm tra xem trọng lượng trung bình của học sinh Lớp 5 có lớn hơn 45kg không

# 2 - Bài kiểm tra T-2 mẫu

Nó nhằm mục đích kiểm tra xem giá trị trung bình mà người ta đã nhắm mục tiêu bằng giá trị trung bình của hai quần thể độc lập, ví dụ: Kiểm tra xem trọng lượng trung bình của học sinh nam Lớp 5 có khác với học sinh nữ Lớp 5 hay không.

# 3 - Kiểm tra T ghép đôi

Nó nhằm mục đích kiểm tra nếu trung bình của giá trị mà người ta đã nhắm mục tiêu bằng giá trị trung bình của sự khác biệt giữa các quan sát phụ thuộc. Ví dụ, so sánh điểm của học sinh trước và sau khi thi học phần cho mỗi môn học giúp chúng tôi xác định xem việc thi học phần có đủ quan trọng để cải thiện điểm số của học sinh hay không.

# 4 - Kiểm tra T trong đầu ra hồi quy

Cần xem xét hệ số trong phương trình hồi quy và kiểm tra xem nó khác giá trị 0 ở mức độ nào. Ví dụ: Nếu điểm thi đầu vào là một yếu tố quan trọng để xác định liệu học sinh có đạt điểm tổng kết tốt hay không.

Các giả định của T-Test

  • Giả thiết đầu tiên cho phép thử t liên quan đến thang đo. Điều này liên quan đến việc thang đo theo thang đo liên tục hay thứ tự
  • Giả thiết thứ hai có thể liên quan đến tính chất ngẫu nhiên của mẫu. Điều này có nghĩa là dữ liệu được thu thập phải hoàn toàn ngẫu nhiên về bản chất.
  • Giả thiết thứ ba có thể là khi chúng ta vẽ biểu đồ dữ liệu liên quan đến phân phối kiểm định t, nó phải tuân theo phân phối chuẩn và đưa về một đồ thị cong hình chuông.
  • Giả thiết thứ tư có thể là đối với phân phối t và cụ thể là để có được hình dạng của đường cong hình chuông, chúng ta cần có cỡ mẫu lớn hơn.
  • Giả thiết cuối cùng có thể là cho phép thử t. Phương sai phải đồng nhất về bản chất. e. độ lệch chuẩn gần như bằng nhau.

Làm thế nào để tính toán?

Nó hoạt động trong hai trường hợp khác nhau, tức là, một cho mẫu độc lập và một cho mẫu phụ thuộc.

# 1 - Kịch bản mẫu độc lập

  • Chúng ta cần tính toán tổng, cỡ mẫu, được xác định bằng “N” và giá trị điểm trung bình cho mỗi mẫu độc lập. Sau đó, mức độ tự do cần được tính toán cho mọi mẫu độc lập.
  • Điều này được biểu thị bằng cách lấy mẫu trừ đi một, chúng tôi ký hiệu là “n-1”. Sau đó, phương sai và độ lệch chuẩn cần được tính toán.
  • Bậc tự do của các mẫu được thêm vào, và điều này được gọi là “df-tổng”. Tiếp theo, chúng ta cần nhân bậc tự do của mỗi mẫu với phương sai của mỗi mẫu. Chúng ta cần thêm các kết quả và sau đó chia tổng cho "df-total." Kết quả thu được được gọi là phương sai tổng hợp.
  • Sau đó, phương sai tổng hợp được chia cho n mẫu. Kết quả thu được cho tất cả các mẫu sau đó được thêm vào. Căn bậc hai của điều này được lấy, và đây được gọi là sai số chuẩn của sự khác biệt.
  • Cuối cùng, chúng ta cần lấy giá trị trung bình lớn hơn trừ đi giá trị trung bình của mẫu. Sự khác biệt thu được sau đó được chia cho sai số chuẩn của sự khác biệt và kết quả thu được được gọi là giá trị T.

# 2 - Kịch bản mẫu phụ thuộc

  • Điểm số thu được từ mỗi cặp tập dữ liệu được ghi nhận và chúng ta cần phải trừ đi. Sự khác biệt thu được được thêm vào và được gọi là "D." Sự khác biệt của mỗi mẫu được bình phương và thêm vào để thu được kết quả được gọi là “D-Squared”. Sau đó, chúng ta cần nhân “N” hoặc số điểm được ghép với “D bình phương”.
  • Kết quả thu được được trừ đi bình phương của tổng “D.” Kết quả này được chia nhỏ hơn nữa với “N-1”. Căn bậc hai của kết quả thu được và được gọi là một ước số. Cuối cùng, chúng ta cần chia tổng “D” cho số chia, cho chúng ta giá trị t cuối cùng.

Ví dụ về T-Test

Chúng ta hãy xem xét chúng ta có điểm cho mỗi môn học trong kỳ kiểm tra được tổ chức trong hai kỳ.

Bước 1: Trừ Giai đoạn 1 khỏi Giai đoạn 2

Bước 2: Cộng tất cả sự khác biệt tức là -55

Bước 3: Bình phương sự khác biệt

Bước 4: Cộng tất cả các bình phương chênh lệch, tức là 983

Bước 5: Sử dụng công thức để tính giá trị T

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2/6 )) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • Giá trị T = -2,29

Giá trị T thu được sau đó được so sánh với giá trị T thu được từ bảng sử dụng giá trị p và bậc tự do. Nếu giá trị t được tính toán lớn hơn giá trị bảng ở một mức alpha xác định trước cụ thể, chúng ta có thể bác bỏ giả thuyết rỗng nói rằng có sự khác biệt giữa các giá trị trung bình.

Khi nào nó được sử dụng?

Điều này được sử dụng để so sánh hai phương tiện hoặc tỷ lệ. Ngoài ra, chúng tôi sử dụng kiểm tra t khi người dùng không biết các tham số tổng thể. Có ba trường hợp sử dụng kịch bản t-test như sau:

  • Kiểm định t mẫu độc lập được sử dụng khi chúng ta muốn so sánh giá trị trung bình của hai nhóm.
  • Phép thử t mẫu ghép đôi được sử dụng khi chúng ta muốn so sánh giá trị trung bình của cùng một nhóm nhưng tại các thời điểm khác nhau.
  • Một phép thử t mẫu được sử dụng khi chúng ta cần kiểm tra giá trị trung bình của một nhóm cá nhân so với giá trị trung bình chưa biết.

Sử dụng T-Test trong Excel

  • Trong excel, điều đầu tiên và quan trọng nhất chúng ta cần là cài đặt một add-in có tên là Data Analysis. Sau đó, chúng ta cần đi đến "Dữ liệu" trên tab trình đơn và nhấp vào nó. Tùy chọn "Phân tích dữ liệu" sẽ hiển thị ở đó.
  • Để tiến hành T-Test, chúng tôi cần có dữ liệu của mình ở định dạng cột. Khi nhấp vào “Phân tích dữ liệu”, chúng tôi sẽ nhận được một số kiểm tra thống kê mà chúng tôi có thể thực hiện và từ danh sách, chúng tôi cần chọn kiểm tra t và nhấp vào “Ok”.
  • Một hộp thoại xuất hiện nơi chúng ta cần nhập dữ liệu cho đường dẫn 1 trong hộp phạm vi biến 1 và dữ liệu thử nghiệm 2 trong hộp phạm vi biến 2. Theo mặc định, giá trị của alpha vẫn ở mức 0,05, nhưng điều này có thể được thay đổi dựa trên tùy chọn của chúng tôi. Khi tất cả đều ổn, hãy nhấp vào “OK”.
  • Bây giờ chúng ta có thể xem kết quả của T-Test trên bảng excel. Giá trị quan trọng nhất ở đây cần lưu ý là P-value. Trên những gì chúng tôi đã chọn giá trị alpha của mình, nếu giá trị P của chúng tôi trong excel nhỏ hơn giá trị alpha, chúng tôi có thể kết luận rằng có sự khác biệt quan trọng về mặt thống kê giữa giá trị trung bình của hai bộ giá trị của chúng tôi.

Phần kết luận

Kiểm tra T nhằm mục đích kiểm tra giả thuyết, về cơ bản được sử dụng để kiểm tra một giả thuyết liên quan đến một dân số nhất định. Nó cho chúng ta biết mức độ ý nghĩa của sự khác biệt giữa các nhóm, thường được đo lường trên cơ sở giá trị trung bình. Ở đây, về cơ bản chúng ta tìm ra sự khác biệt giữa trung bình dân số và giá trị giả định.

thú vị bài viết...