Lý thuyết đằng sau giá trị p và giả thuyết null ban đầu có vẻ phức tạp, nhưng hiểu các khái niệm sẽ giúp bạn điều hướng thế giới thống kê. Thật không may, những thuật ngữ này thường bị sử dụng sai trong khoa học phổ biến, vì vậy nó sẽ hữu ích cho mọi người để hiểu những điều cơ bản.
Cũng xem bài viết của chúng tôi Cách xóa mọi hàng khác trong Excel
Tính toán giá trị p của một mô hình và chứng minh / bác bỏ giả thuyết khống là đơn giản đáng ngạc nhiên với MS Excel. Có hai cách để làm điều đó và chúng tôi sẽ đề cập đến cả hai. Nào cùng đào vào bên trong.
Giả thuyết Null và p -Value
Giả thuyết null là một tuyên bố, cũng được gọi là một vị trí mặc định, tuyên bố rằng mối quan hệ giữa các hiện tượng quan sát là không tồn tại. Nó cũng có thể được áp dụng cho các hiệp hội giữa hai nhóm quan sát. Trong quá trình nghiên cứu, bạn kiểm tra giả thuyết này và cố gắng bác bỏ nó.
Ví dụ, giả sử bạn muốn quan sát xem một chế độ ăn mốt cụ thể có kết quả đáng kể hay không. Giả thuyết khống, trong trường hợp này, là không có sự khác biệt đáng kể về cân nặng của đối tượng thử nghiệm trước và sau khi ăn kiêng. Giả thuyết thay thế là chế độ ăn uống đã tạo ra sự khác biệt. Đây là những gì các nhà nghiên cứu sẽ cố gắng chứng minh.
Giá trị p biểu thị cơ hội rằng tóm tắt thống kê sẽ bằng hoặc lớn hơn giá trị quan sát được khi giả thuyết null là đúng đối với một mô hình thống kê nhất định. Mặc dù nó thường được biểu thị dưới dạng số thập phân, nhưng nói chung tốt hơn là biểu thị dưới dạng phần trăm. Ví dụ: giá trị p của 0, 1 phải được biểu thị là 10%.
Giá trị p thấp có nghĩa là bằng chứng chống lại giả thuyết null là mạnh mẽ. Điều này hơn nữa có nghĩa là dữ liệu của bạn là đáng kể. Mặt khác, giá trị p cao có nghĩa là không có bằng chứng mạnh mẽ chống lại giả thuyết. Để chứng minh rằng chế độ ăn mốt hoạt động, các nhà nghiên cứu sẽ cần tìm giá trị p thấp.
Một kết quả có ý nghĩa thống kê là kết quả rất khó xảy ra nếu giả thuyết null là đúng. Mức ý nghĩa được biểu thị bằng chữ cái Hy Lạp alpha và nó phải lớn hơn giá trị p để kết quả có ý nghĩa thống kê.
Nhiều nhà nghiên cứu trong nhiều lĩnh vực sử dụng giá trị p để hiểu rõ hơn và sâu sắc hơn về dữ liệu họ đang làm việc. Một số lĩnh vực nổi bật bao gồm xã hội học, tư pháp hình sự, tâm lý học, tài chính và kinh tế.
Tìm giá trị p trong Excel
Bạn có thể tìm giá trị p của một tập dữ liệu trong MS Excel thông qua chức năng T-Test hoặc sử dụng công cụ Phân tích dữ liệu. Đầu tiên, chúng ta sẽ xem xét chức năng T-Test. Chúng tôi sẽ kiểm tra năm sinh viên đại học đã ăn kiêng 30 ngày. Chúng tôi sẽ so sánh cân nặng của họ trước và sau khi ăn kiêng.
LƯU Ý: Đối với mục đích của bài viết này, chúng tôi sẽ sử dụng MS Excel 2010. Mặc dù đây không phải là phiên bản mới nhất, nhưng các bước thường cũng nên áp dụng cho các phiên bản mới hơn.
Chức năng kiểm tra T
Thực hiện theo các bước sau để tính giá trị p với hàm T-Test.
- Tạo và điền vào bảng. Bảng của chúng tôi trông như thế này:

- Nhấp vào bất kỳ ô bên ngoài bảng của bạn.
- Nhập vào: = T.Test (.
- Sau dấu ngoặc mở, nhập đối số đầu tiên. Trong ví dụ này, đó là cột Before Diet. Phạm vi nên là B2: B6. Cho đến nay, hàm trông như thế này: T.Test (B2: B6.
- Tiếp theo, chúng ta sẽ nhập đối số thứ hai. Cột After Diet và kết quả của nó là đối số thứ hai của chúng tôi và phạm vi chúng tôi cần là C2: C6. Hãy thêm nó vào công thức: T.Test (B2: B6, C2: C6.
- Nhập dấu phẩy sau đối số thứ hai và phân phối một đuôi và tùy chọn phân phối hai đuôi sẽ tự động xuất hiện trong menu thả xuống. Hãy chọn phân phối đầu tiên - một đuôi. Nhấp đúp chuột vào nó.
- Nhập vào dấu phẩy khác.
- Nhấp đúp vào tùy chọn Ghép đôi trong menu thả xuống tiếp theo.
- Bây giờ bạn có tất cả các yếu tố bạn cần, đóng khung. Công thức cho ví dụ này trông như thế này: = T.Test (B2: B6, C2: C6, 1, 1)

- Nhấn Enter. Các tế bào sẽ hiển thị giá trị p ngay lập tức. Trong trường hợp của chúng tôi, giá trị là 0, 133906 hoặc 13.3906%.
Cao hơn 5%, giá trị p này không cung cấp bằng chứng mạnh mẽ chống lại giả thuyết khống. Trong ví dụ của chúng tôi, nghiên cứu đã không chứng minh rằng chế độ ăn kiêng đã giúp các đối tượng thử nghiệm giảm được một lượng cân nặng đáng kể. Điều này không nhất thiết có nghĩa là giả thuyết khống là đúng, chỉ có điều nó chưa được chứng minh.
Lộ trình phân tích dữ liệu
Công cụ phân tích dữ liệu cho phép bạn thực hiện nhiều điều thú vị, bao gồm cả tính toán giá trị p . Để làm cho mọi thứ đơn giản hơn, chúng tôi sẽ sử dụng cùng một bảng như trong phương pháp trước.
Đây là cách nó được thực hiện.
- Vì chúng tôi đã có sự khác biệt về trọng số trong cột D, chúng tôi sẽ bỏ qua cách tính chênh lệch. Đối với các bảng trong tương lai, hãy sử dụng công thức này: = Di động 1 1 - Di động 2 2.
- Tiếp theo, nhấp vào tab Dữ liệu trong menu Chính.
- Chọn công cụ Phân tích dữ liệu.
- Cuộn xuống danh sách và nhấp vào tùy chọn t-Test: Ghép nối hai mẫu cho phương tiện.
- Nhấn OK.
- Một cửa sổ bật lên sẽ xuất hiện. Nó trông như thế này:

- Nhập phạm vi / đối số đầu tiên. Trong ví dụ của chúng tôi, nó là B2: B6.
- Nhập phạm vi / đối số thứ hai. Trong trường hợp này, nó là C2: C6.
- Để lại giá trị mặc định trong hộp văn bản Alpha (0, 05).
- Nhấp vào nút radio Phạm vi đầu ra và chọn nơi bạn muốn kết quả. Nếu đó là ô A8, hãy nhập: $ A $ 8.
- Nhấn OK.
- Excel sẽ tính giá trị p và một số tham số khác. Bảng cuối cùng có thể trông như thế này:

Như bạn có thể thấy, giá trị p một đuôi giống như trong trường hợp đầu tiên - 0.133905569. Vì nó trên 0, 05, giả thuyết null áp dụng cho bảng này và bằng chứng chống lại nó là yếu.
Những điều cần biết về p -Value
Dưới đây là một số mẹo hữu ích liên quan đến tính toán giá trị p trong Excel.
- Nếu giá trị p bằng 0, 05 (5%), dữ liệu trong bảng của bạn là đáng kể. Nếu nó nhỏ hơn 0, 05 (5%), dữ liệu bạn có rất có ý nghĩa.
- Trong trường hợp giá trị p lớn hơn 0, 1 (10%), dữ liệu trong bảng của bạn không đáng kể. Nếu nó nằm trong phạm vi 0, 05-0, 10, bạn có dữ liệu rất đáng kể.
- Bạn có thể thay đổi giá trị alpha, mặc dù các tùy chọn phổ biến nhất là 0, 05 (5%) và 0, 10 (10%).
- Chọn thử nghiệm hai đuôi có thể là lựa chọn tốt hơn, tùy thuộc vào giả thuyết của bạn. Trong ví dụ trên, thử nghiệm một đầu có nghĩa là chúng tôi khám phá xem các đối tượng thử nghiệm có giảm cân sau khi ăn kiêng hay không, và đó chính xác là những gì chúng tôi cần tìm hiểu. Nhưng một thử nghiệm hai đuôi cũng sẽ kiểm tra xem họ có tăng cân đáng kể về mặt thống kê hay không.
- Giá trị p không thể xác định các biến. Nói cách khác, nếu nó xác định mối tương quan, nó không thể xác định nguyên nhân đằng sau nó.
Giá trị p -Value
Mỗi nhà thống kê có giá trị muối của anh ấy hoặc cô ấy phải biết các thử nghiệm giả thuyết null và giá trị p có nghĩa là gì. Kiến thức này cũng sẽ có ích cho các nhà nghiên cứu trong nhiều lĩnh vực khác.
Bạn đã bao giờ sử dụng Excel để tính giá trị p của mô hình thống kê chưa? Bạn đã sử dụng phương pháp nào? Bạn có thích một cách khác để tính toán nó? Cho chúng tôi biết trong phần ý kiến.






