Các giá trị ước lượng có ý nghĩa thống kê không

Mục đích của suy luận thống kê và việc sử dụng các bài thống kê kiểm tra là để rút ra kết luận từ dữ liệu mẫu. Suy luận thống kê được sử dụng trong kiểm tra giả thuyết dựa trên lý thuyết xác suất. Kiểm tra ý nghĩa thống kê là kiểm tra của một giả thuyết vô hiệu, sức mạnh của các bằng chứng chống lại giả thuyết vô hiệu được đánh giá bằng cách sử dụng ý tưởng xác suất [cơ hội trong quá trình ra quyết định của chúng ta]. Nói một cách đơn giản, kiểm tra ý nghĩa là phương pháp đánh giá sức mạnh chống lại giả thuyết vô hiệu và sức mạnh của bằng chứng này bởi những giá trị p thu được cho các bài thống kê kiểm tra.

Bất kỳ thống kê tham số cụ thể nào sẽ có một phân phối mẫu đã biết [chẳng như t-test, F-test và χ2] liên quan đến giả thuyết vô hiệu [H0], nó thường được lập thành bảng phân phối mẫu trong các sách thống kê. Khi một dữ liệu được phân tích và các kết quả đưa đến một giá trị thống kê kiểm tra cụ thể, và một xác suất quan sát liên quan, p. Xác suất quan sát này được so sánh với mức xác suất alpha được chọn trước, thường được gọi là mức ý nghĩa của một bài kiểm tra [thường là 5%, p≤0.05 hoặc 1%, p≤0.01].

Thông thường, nếu xác suất quan sát, p, là ≤ mức xác suất alpha đã chọn [xác suất mắc lỗi Loại I] thì giả thuyết vô hiệu bị bác bỏ và đạt được ý nghĩa thống kê. Sẽ tốt hơn nữa nếu các giá trị ước lượng và khoảng tin cậy của các tham số được báo cáo cùng giá trị p để tăng cường sức mạnh của các bằng chứng chống lại H0.

Vì quá trình suy luận chính thức là dựa trên sự phân phối mẫu của một thống kê đã chọn, nên cần có một mô hình thống kê hoặc xác suất cơ bản cho các bài kiểm tra thống kê. Ví dụ, phân phối xác suất chuẩn là một mô hình thống kê phổ biến mô tả phân phối xác suất của các biến và là mô hình xác suất cơ bản làm cơ sở cho một số thử nghiệm thống kê. Các phép thử thống kê có các suy luận dựa trên phân phối chuẩn được gọi là các thủ tục thống kê tham số [parametric statistical procedures].

Các suy luận sử dụng thủ tục thống kê tham số chỉ có thể hợp lệ khi đáp ứng bốn điều kiện:

  • các quan sát là độc lập;
  • chúng được lấy ngẫu nhiên từ một dân số;
  • chúng có các mức đo lường liên tục [ít nhất là trên lý thuyết];
  • và các sai số ngẫu nhiên liên quan đến các quan sát có một phân phối đã biết [thường là chuẩn].

Một số bài kiểm tra thống kê đòi hỏi đáp ứng các giả định bổ sung; những giả định này khác nhau về số lượng và mức độ. Ví dụ, trong số các thử nghiệm thống kê mạnh mẽ nhất là t-testF-test. Kiểm tra t-test [để kiểm tra giả thuyết về sự khác biệt giữa hai trung bình mẫu], ngoài các giả định chung, còn giả định thêm điều kiện rằng dân số mà từ đó hai mẫu được rút ra phải có phương sai tương tự [phương sai đồng nhất].

2. Xử lý các vi phạm giả định thống kê

Chúng ta phải làm gì nếu các giả định chung của mô hình tham số và/hoặc các điều kiện cụ thể của các bài thử nghiệm thống kê cụ thể không được đáp ứng?

Trong trường hợp đầu tiên, chúng ta phải nhận biết khi nào các giả định kiểm tra bị vi phạm và nhận thức được mức độ nghiêm trọng của hậu quả của việc vi phạm các giả định cụ thể. Giả sử, nếu các giả định về phân phối cho một kiểm tra tham số không được đáp ứng thì chúng ta có thể sử dụng các bài kiểm tra phi tham số [Non-parametric]. Những thử nghiệm này đôi khi được gọi là thử nghiệm phân phối tự do [distribution-free] vì chúng không đưa ra các giả định về phân phối xác suất của các sai số. Ví dụ, khi phân phối dân số cơ bản của một biến quan trọng được cho là không chuẩn hoặc khi các giả định đo lường không được đáp ứng, thì kiểm tra phi tham số nên được xem xét.

Các bài kiểm tra phi tham số thường kém về sức mạnh hơn so với các bài kiểm tra tham số tương đương [trung bình kém hơn về sức mạnh khoảng 10–20%]. Một chiến lược thay thế để sử dụng các bài kiểm tra phi tham số là biến đổi dữ liệu để làm cho nó phân phối chuẩn hơn. Các thủ tục để kiểm tra tính chuẩn của phân phối dữ liệu và các biến chuyển đổi sẽ được thảo luận trong bài phân phối chuẩn.

Tài liệu tham khảo

  1. Coolican, H. [2018]. Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. [2012]. Basic statistics for social research [Vol. 38]. John Wiley & Sons.
  3. Jackson, S. L. [2015]. Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. [2006]. Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. [2006]. Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. [2019]. Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

Cùng viết bởi Nhân viên của wikiHow

Tham khảo

X

Bài viết này có đồng tác giả là đội ngũ biên tập viên và các nhà nghiên cứu đã qua đào tạo, những người xác nhận tính chính xác và toàn diện của bài viết.

Nhóm Quản lý Nội dung của wikiHow luôn cẩn trọng giám sát công việc của các biên tập viên để đảm bảo rằng mọi bài viết đều đạt tiêu chuẩn chất lượng cao.

Có 10 thông tin tham khảo được trích dẫn trong bài viết này mà bạn có thể xem tại cuối trang.

Bài viết này đã được xem 63.628 lần.

Kiểm định giả thuyết thống kê được dẫn lối bởi phân tích thống kê. Độ tin cậy mang ý nghĩa thống kê được tính toán bằng cách sử dụng giá trị p - cho biết khả năng của kết quả quan sát khi một mệnh đề nhất định [giả thuyết không] là đúng.[1] Nếu giá trị p nhỏ hơn mức ý nghĩa [thường là 0,05], thực nghiệm viên có thể kết luận rằng đủ chứng cứ để bác bỏ giả thuyết không và thừa nhận giả thuyết nghịch. Sử dụng kiểm định t đơn giản, bạn có thể tính giá trị p và xác định ý nghĩa giữa hai nhóm dữ liệu khác nhau.

Các bước

Phần 1

Phần 1 của 3:

Thiết lập thực nghiệm của bạn

  1. 1

    Xác định giả thuyết của bạn. Bước đầu tiên trong đánh giá ý nghĩa thống kê là xác định câu hỏi cần trả lời và tuyên bố giả thuyết. Giả thuyết là một tuyên bố về số liệu thực nghiệm và sự khác biệt có thể xuất hiện trong tổng thể. Mọi thực nghiệm đều có một giả thuyết không và một giả thuyết nghịch.[2] Nói một cách tổng quát, bạn sẽ so sánh hai nhóm để thấy được liệu chúng giống hay khác nhau.

    • Nhìn chung, giả thuyết không [H0] khẳng định rằng không có sự khác biệt giữa hai nhóm số liệu. Ví dụ: Sinh viên đọc tài liệu trước khi đến lớp không đạt điểm cuối khóa tốt hơn.
    • Giả thuyết nghịch [Ha] trái ngược với giả thuyết không và là tuyên bố mà bạn đang cố hậu thuẫn bằng số liệu thực nghiệm. Ví dụ: Sinh viên đọc tài liệu trước khi đến lớp thực sự đạt điểm cuối khóa tốt hơn.

  2. 2

    Chọn mức ý nghĩa nhằm xác định độ khác biệt để có thể được xem là có ý nghĩa của dữ liệu. Mức ý nghĩa [còn được gọi là alpha] là ngưỡng mà bạn chọn để quyết định ý nghĩa. Nếu giá trị p nhỏ hơn hay bằng mức ý nghĩa cho trước, số liệu được coi là có ý nghĩa thống kê.[3]

    • Theo quy tắc chung, mức ý nghĩa [hay alpha] thường được chọn ở mức 0,05 - nghĩa là khả năng kết quả quan sát sự khác biệt được nhìn thấy trên số liệu là ngẫu nhiên chỉ là 5%.
    • Mức tin cậy càng cao [và do đó, giá trị p càng thấp], kết quả càng có ý nghĩa.
    • Nếu đòi hỏi số liệu một độ tin cậy cao hơn, hãy hạ giá trị p xuống 0,01. Giá trị p thấp thường được dùng trong sản xuất để phát hiện lỗi của sản phẩm. Độ tin cậy cao là rất quan trọng để có thể chấp nhận rằng mọi phần sẽ hoạt động đúng như chức năng thiết kế của chúng.
    • Với hầu hết thực nghiệm dựa trên giả thuyết, mức ý nghĩa 0,05 là chấp nhận được.

  3. 3

    Quyết định dùng kiểm định một đầu hay kiểm định hai đầu. Một trong những giả định của kiểm định t là dữ liệu của bạn đang có phân phối chuẩn. Phân phối chuẩn sẽ hình thành đường cong hình chuông với đa số quan sát nằm ở giữa.[4] Kiểm định t là một kiểm định toán học được tiến hành để kiểm tra liệu số liệu của bạn có nằm ở phần ngoài của phân phối chuẩn, trên hoặc dưới, trong phần “đầu” của đường cong.

    • Nếu không chắc liệu số liệu có nằm trên hay dưới nhóm kiểm soát, hãy dùng kiểm định hai đầu. Nó cho phép bạn kiểm tra mức ý nghĩa ở cả hai hướng.
    • Nếu biết đâu là hướng kỳ vọng của số liệu, hãy dùng kiểm định một đầu. Trong ví dụ kể trên, bạn kỳ vọng rằng điểm của sinh viên sẽ được cải thiện. Do đó, bạn dùng kiểm định một đầu.

  4. 4

    Quyết định kích thước mẫu với phân tích lực lượng. Lực lượng của một phép kiểm định là khả năng quan sát kết quả được kỳ vọng với một kích thước mẫu cho trước.[5] Ngưỡng phổ biến cho lực lượng [hay β] là 80%. Phân tích lực lượng có thể tương đối phức tạp nếu không có một vài dữ liệu sơ bộ bởi bạn cần một số thông tin về giá trị trung bình kỳ vọng giữa các nhóm và độ lệch chuẩn của chúng. Hãy sử dụng công cụ phân tích lực lượng trực tuyến để xác định kích cỡ mẫu tối ưu dành cho số liệu của bạn.[6]

    • Các nhà nghiên cứu thường thực hiện một nghiên cứu tiền đề nhỏ để có thông tin cho phân tích lực lượng và quyết định kích cỡ mẫu cần thiết cho nghiên cứu lớn và toàn diện.
    • Nếu không có phương tiện để thực hiện nghiên cứu tiền đề phức tạp, hãy ước tính giá trị trung bình khả thi dựa trên việc đọc các bài viết và nghiên cứu mà các cá nhân khác có thể đã thực hiện. Nó có thể cho bạn một khởi đầu tốt để xác định kích thước mẫu.

Phần 2

Phần 2 của 3:

Tính độ lệch chuẩn

  1. 1

    Xác định công thức độ lệch chuẩn. Độ lệch chuẩn đo lường mức phân tán của dữ liệu. Nó cho bạn thông tin về tính đồng nhất của mỗi điểm dữ liệu trong mẫu. Khi mới làm quen, phương trình có thể trông khá phức tạp. Thế nhưng, những bước dưới đây sẽ giúp bạn dễ dàng nắm rõ quy trình tính toán. Công thức là s = √∑[[xi – µ]2/[N – 1]].

    • s là độ lệch chuẩn.
    • ∑ biểu thị bạn sẽ phải cộng tất cả các quan sát được thu thập.
    • xi đại diện mỗi giá trị dữ liệu của bạn.
    • µ là giá trị trung bình của dữ liệu từng nhóm.
    • N là tổng số quan sát.

  2. 2

    Tính trung bình số liệu quan sát ở mỗi nhóm. Để tính độ lệch chuẩn, trước hết bạn cần tính giá trị trung bình các quan sát ở từng nhóm đơn lẻ. Giá trị này được ký hiệu bằng chữ cái Hy Lạp mu hay µ. Để làm điều đó, bạn chỉ việc đơn giản cộng các quan sát với nhau và chia cho tổng số quan sát.[7]

    • Ví dụ, để tìm điểm trung bình của nhóm đọc tài liệu trước khi đến lớp, chúng ta hãy cùng xem xét một vài dữ liệu. Để đơn giản hóa, chúng ta sẽ dùng bộ dữ liệu gồm 5 điểm: 90, 91, 85, 83 và 94 [trên thang điểm 100].
    • Cộng tất cả các quan sát: 90 + 91 + 85 + 83 + 94 = 443.
    • Chia tổng trên cho số quan sát N [N= 5]: 443/5 = 88,6.
    • Điểm trung bình cho nhóm này là 88,6.

  3. 3

    Lấy từng giá trị quan sát trừ đi trung bình. Bước tiếp theo liên quan đến phần [xi – µ] của phương trình. Bạn sẽ lấy từng giá trị quan sát trừ đi giá trị trung bình vừa tính được. Với ví dụ trên, chúng ta có năm phép trừ.

    • [90 – 88,6], [91- 88,6], [85 – 88,6], [83 – 88,6] và [94 – 88,6].
    • Giá trị tính được là 1,4; 2,4; -3,6; -5,6 và 5,4.

  4. 4

    Bình phương những hiệu trên và cộng lại. Mỗi giá trị mới vừa được tính giờ đây sẽ được lấy bình phương. Ở đây, dấu âm cũng sẽ được loại bỏ. Nếu xuất hiện dấu âm sau bước này hoặc khi kết thúc tính toán, có lẽ bạn đã quên thực hiện bước trên.

    • Trong ví dụ đang xét, giờ đây, chúng ta sẽ làm việc với 1,96; 5,76; 12,96; 31,36 và 29,16.
    • Cộng những kết quả bình phương này với nhau: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.

  5. 5

    Chia cho tổng số quan sát đã trừ đi 1. Chia cho N – 1 giúp bù trừ việc tính toán không thực hiện trên toàn bộ tổng thể mà chỉ ước tính dựa trên một mẫu trong tổng thể mọi sinh viên.[8]

    • Trừ: N – 1 = 5 – 1 = 4
    • Chia: 81,2/4 = 20,3

  6. 6

    Lấy căn bậc hai. Một khi đã chia cho số quan sát trừ 1, lấy căn bậc hai giá trị thu được. Đây là bước cuối cùng trong tính độ lệch chuẩn. Một số chương trình thống kê sẽ giúp bạn thực hiện tính toán này sau khi được nhập dữ liệu gốc.

    • Với ví dụ trên, độ lệch chuẩn của điểm cuối kỳ của sinh viên đọc tài liệu trước khi đến lớp là: s =√20,3 = 4,51.

Phần 3

Phần 3 của 3:

Xác định ý nghĩa thống kê

  1. 1

    Tính phương sai giữa hai nhóm quan sát của bạn. Đến thời điểm này, ví dụ chỉ mới xử lý một nhóm quan sát. Để so sánh hai nhóm, rõ ràng bạn cần dữ liệu từ cả hai. Tính độ lệch chuẩn của nhóm quan sát thứ hai và dùng nó để tính phương sai giữa hai nhóm thực nghiệm. Công thức tính phương sai là: sd = √[[s1/N1] + [s2/N2]].[9]

    • sd là phương sai giữa các nhóm.
    • s1 là độ lệch chuẩn của nhóm 1 và N1 là kích cỡ nhóm 1.
    • s2 là độ lệch chuẩn của nhóm 2 và N2 là kích cỡ nhóm 2.
    • Trong ví dụ của chúng ta, giả sử dữ liệu từ nhóm 2 [sinh viên không đọc bài trước khi đến lớp] có kích cỡ là 5 và độ lệch chuẩn là 5,81. Phương sai là:
      • sd = √[[s1]2/N1] + [[s2]2/N2]]
      • sd = √[[[4.51]2/5] + [[5.81]2/5]] = √[[20.34/5] + [33.76/5]] = √[4.07 + 6.75] = √10.82 = 3.29.

  2. 2

    Tính giá trị thống kê t của dữ liệu. Giá trị thống kê t cho phép bạn chuyển dữ liệu thành một dạng có thể so sánh với dữ liệu khác. Giá trị t cũng cho phép bạn thực hiện kiểm định t, kiểm định cho phép bạn tính khả năng hai nhóm khác nhau một cách có ý nghĩa thống kê. Công thức tính giá trị thống kê t là: t = [µ1 – µ2]/sd.[10]

    • µ1 là trung bình của nhóm thứ nhất.
    • µ2 là trung bình của nhóm thứ hai.
    • sd là phương sai giữa các quan sát.
    • Dùng giá trị trung bình lớn hơn làm µ1 để không nhận được giá trị thống kê t âm.
    • Với ví dụ của chúng ta, giả sử trung bình quan sát của nhóm 2 [những người không đọc bài trước] là 80. Giá trị thống kê t là: t = [µ1 – µ2]/sd = [88,6 – 80]/3,29 = 2,61.

  3. 3

    Xác định bậc tự do của mẫu. Khi dùng giá trị thống kê t, bậc tự do được xác định dựa trên kích cỡ mẫu. Cộng số quan sát của mỗi nhóm và sau đó trừ đi hai. Với ví dụ trên, bậc tự do [d.f.] là 8 bởi có 5 quan sát ở nhóm thứ nhất và 5 quan sát ở nhóm thứ hai [[5 + 5] – 2 = 8].[11]

  4. 4

    Dùng bảng t để đánh giá mức ý nghĩa. Bảng giá trị thống kê t[12] và bậc tự do có thể được tìm thấy ở sách thống kê chuẩn hoặc qua mạng. Tìm dòng chứa bậc tự do của dữ liệu và giá trị p tương ứng với giá trị thống kê t mà bạn có.

    • Với bậc tự do 8 và t = 2,61, giá trị p cho kiểm định một đầu nằm giữa 0,01 và 0,025. Bởi mức ý nghĩa được chọn nhỏ hơn hoặc bằng 0,05, dữ liệu của chúng ta có ý nghĩa thống kê. Với dữ liệu này, chúng ta bác bỏ giả thuyết không và chấp nhận giả thuyết nghịch:[13] sinh viên đọc tài liệu trước khi đến lớp có điểm cuối kỳ cao hơn.

  5. 5

    Cân nhắc tiến hành nghiên cứu tiếp theo. Nhiều nhà nghiên cứu thực hiện nghiên cứu tiền đề với một vài giá trị đo lường để hiểu cách thiết kế một nghiên cứu lớn hơn. Thực hiện nghiên cứu khác với nhiều giá trị đo lường hơn sẽ nâng cao độ tự tin với kết luận của bạn.

Lời khuyên

  • Thống kê là một lĩnh vực lớn và phức tạp. Hãy tham gia một khóa kiểm định giả thuyết thống kê tương đương trình độ cấp ba hay đại học [hoặc cao hơn] để hiểu về ý nghĩa thống kê.

Cảnh báo

  • Phân tích này tập trung vào kiểm định t để kiểm tra sự khác biệt giữa hai tổng thể phân phối chuẩn. Tùy vào độ phức tạp của dữ liệu, có thể bạn sẽ cần một kiểm định thống kê khác.

Hiển thị thêm

Video liên quan

Chủ Đề