Ý nghĩa của phân tích tương quan trong spss

Phân tích tương quan Pearson r [cung cấp một hệ số tương quan Pearson, được ký hiệu là r] là thước đo độ mạnh của mối liên kết tuyến tính giữa hai biến. Về cơ bản, sự tương quan Pearson cố gắng vẽ một đường phù hợp nhất thông qua dữ liệu của hai biến và hệ số tương quan Pearson, r, cho biết khoảng cách tất cả các điểm dữ liệu này đến đường phù hợp nhất này [tức là các điểm dữ liệu này tốt như thế nào với mô hình / đường mới phù hợp nhất].

1. Khi nào sử dụng?

Phân tích tương quan Pearson, r, có thể được sử dụng làm ước lượng mẫu cho tương quan dân số, ρ [rho]. Nó là một chỉ số không có thứ nguyên về mối quan hệ tuyến tính giữa hai biến ngẫu nhiên, giá trị bằng 0 có nghĩa là không có mối quan hệ tuyến tính giữa các biến và giá trị bằng 1 cho thấy mối quan hệ tuyến tính hoàn hảo. Nếu mối tương quan là âm, có nghĩa là giá trị tăng trên một biến được kết hợp với giá trị giảng trên biến kia. Giá trị của r có thể thay đổi giữa −1 và +1 bất kể kích thước đo lường của hai biến.

Tương quan Pearson, r, nên được coi là một thống kê mô tả [descriptive statistic] khi một nhà nghiên cứu muốn định lượng mức độ của mối quan hệ tuyến tính giữa các biến. Một tương quan tham số sẽ thích hợp bất cứ khi nào các phép đo định lượng được thực hiện đồng thời trên hai hoặc nhiều biến, mối quan hệ giữa hai biến là tuyến tính và cả hai biến đều được phân phối chuẩn. Các mối tương quan phải luôn được kiểm tra trước khi thực hiện các phân tích đa biến phức tạp hơn, chẳng hạn như phân tích nhân tố [factor analysis] hoặc phân tích thành phần chính [principal component analysis]. Mức độ của mối quan hệ tuyến tính giữa hai biến số có thể khó đánh giá từ biểu đồ phân tán và hệ số tương quan cung cấp một bản tóm tắt ngắn gọn hơn. Tuy nhiên, sẽ không khôn ngoan nếu cố gắng tính toán mối tương quan khi biểu đồ phân tán mô tả một mối quan hệ phi tuyến tính rõ ràng. Khi một nhà nghiên cứu quan tâm đến cả mức khoảng rộng và ý nghĩa của một mối tương quan thì r được sử dụng theo cách suy diễn như một ước lượng của mối tương quan dân số, ρ [rho].

Công thức tính hệ số tương quan Pearson trong hai biến x và y từ n mẫu như sau:

2. Giả thuyết vô hiệu và suy luận thống kê

Khi ước lượng kích thước của mối tương quan dân số, chúng ta có thể muốn kiểm tra xem nó có ý nghĩa thống kê hay không. Giả thuyết vô hiệu là H0: ρ = 0, nghĩa là, biến X không liên quan tuyến tính với biến Y. Giả thuyết thay thế là H1: ρ ≠ 0. Giả thuyết vô hiệu là một phép kiểm tra xem có bất kỳ mối quan hệ rõ ràng nào giữa các biến X và Y có thể phát sinh một cách tình cờ hay không. Phân phối mẫu của r là không chuẩn khi tương quan dân số lệch khỏi 0 và khi cỡ mẫu nhỏ [n 30].

  • Không nên sử dụng tương quan r khi các giá trị trên một trong các biến đã được cố định trước.
  • 4. Phân tích tương quan Pearson r trong SPSS

    Ví dụ, một nhà nghiên cứu muốn biết liệu kết quả kỳ thi viết cuối kì môn Toán giải thích có tương quan với thời gian ôn tập cuối kì của các sinh viên hay không. Có 20 sinh viên được mời tham gia một cuộc thử nghiệm, kể từ khi bài học của môn Toán giải tích kết kết đến ngày thi cuối kì, họ được đề nghị ghi lại tổng số giờ ôn bài [cộng dồn của mỗi ngày] dành cho môn Toán. Kết thúc kì thi, nhà nghiên cứu thu thập điểm số của 20 sinh viên này theo thang điểm 100, và tổng hợp theo bảng dưới đây.

    Hai câu hỏi nghiên cứu được xem xét: i] Điểm thi viết cuối kì môn Toán giải thích có liên quan tuyến tính với số giờ ôn tập của các sinh viên hay không? và ii] Số giờ ôn tập của các sinh viên có liên quan tuyến tính với điểm thi viết cuối kì môn Toán giải thích hay không?

    Các bước dưới đây hướng dẫn chúng ta cách phân tích Tương quan Pearson r trong Thống kê SPSS.

    – Bước 1: Kiểm tra biểu đồ phân tán mô tả mối quan hệ giữa hai biến. Xin vui lòng đọc bài cách vẽ biểu đồ phân tán. Kết quả vẽ biểu đồ phân tán được trình bày trong hình dưới đây.

    Nhận xét: Biểu đồ scatter giữa Điểm thi và Ôn tập gợi ý xu hướng gần đúng tuyến tính, nhưng cỡ mẫu là nhỏ để quan sát rõ ràng một đường tuyến tính. Trong thực tế, chúng ta cần một cỡ mẫu lớn hơn, ít nhất n > 30. Biểu đồ này cũng cho thấy một quan sát ngoại lệ rất rõ ràng [điểm gần giá trị 4 ở trục hoành].

    – Bước 2: Khi biểu đồ phân tán dự đoán mối quan hệ tuyến tính, chúng ta tiến hành phân tích tương quan Pearson r. Click Analyze-> Correlate -> Bivariate…

    – Bước 3: Trong hộp thoại Bivariate Correlations, chúng ta chuyển các biến cần kiểm tra tương quan với nhau vào hộp Variables. Chú ý check vào hộp Pearson trong vùng Correlation Coefficients. Sau đó nhấp OK để chạy kết quả.

    Phân tích kết quả:

    Bảng Correlations trình bày hệ số tương quan Pearson r, giá trị ý nghĩa p của nó và kích thước mẫu được tính toán. Trong ví dụ này, chúng ta có thể thấy rằng hệ số tương quan Pearson, r, là 0.78 và nó có ý nghĩa thống kê [p = 0.000].

    Chúng ta có thể viết báo cáo rằng, một tương quan Pearson đã được chạy để xác định mối quan hệ tuyến tính giữa Điểm thi viết cuối kì môn Toán giải thích và số giờ ôn tập của các sinh viên. Kết quả cho thấy có mối tương quan thuận giữa Điểm thi viết cuối kì môn Toán giải thích và số giờ ôn tập của các sinh viên [r = 0.780, n = 20, p = 0.000].

    – Bước 4: Kiểm tra ý nghĩa của hệ số tương quan r

    Một khi mối tương quan đã được tính toán, nhà nghiên cứu có thể muốn biết khả năng xảy ra mối tương quan thu được này như thế nào, nghĩa là, đây có phải là sự xuất hiện tình cờ hay nó đại diện cho mối tương quan dân số đáng kể?

    Để thực hiện việc này, r được chuyển đổi, và xác suất của công cụ ước lượng này dựa trên phân phối mẫu của thống kê t [t-statistic]. Do đó, ý nghĩa của một hệ số tương quan Pearson thu được được đánh giá bằng cách sử dụng phân phối t [t-distribution] với n − 2 bậc tự do [df] và được cho bởi phương trình sau:

    Giả thuyết vô hiệu được kiểm định là hai biến độc lập, tức là không có mối quan hệ tuyến tính giữa chúng, H0: ρ = 0. Giả thuyết thay thế là, H1: ρ ≠ 0.

    Để trả lời câu hỏi, Có mối tương quan đáng kể nào, ở mức 5%, giữa điểm Điểm thi viết cuối kì môn Toán giải thích và số giờ ôn tập của các sinh viên không? t sẽ được tính như sau:

    Tra bảng tới hạn của giá trị t [critical t-value] thu được giá trị là 2.101. Thống kê kiểm tra t là vượt quá giá trị tới hạn này, [5.433 > 2.101], và do đó giả thuyết vô hiệu bị bác bỏ. Chúng ta kết luận rằng mối tương quan có ý nghĩa ở mức 5%.

    – Bước 5: Kiểm tra khoảng tin cậy của hệ số tương quan r

    Khoảng tin cậy là dựa vào một sự chuyển đổi thống kê r thành thống kê Fisher’s z. Điều này không giống như độ lệch Z [Z-deviate] so với phân phối chuẩn [đôi khi được gọi là điểm Z]. Để diễn giải khoảng tin cậy, điểm số Fisher’s z phải được chuyển đổi trở lại số liệu tương quan. Fisher’s z được đánh giá là:

    Khoảng tin cậy [95%] cho mối tương quan lưỡng biến giữa Điểm thi viết cuối kì môn Toán giải thích và số giờ ôn tập của các sinh viên được tính bằng công thức:

    Công thức chuyển đổi Fisher’s Z được định nghĩa là:

    Áp dụng các công thức trong ví dụ [với r = 0.78], ta có:

    Khoảng tin cậy [95%]:

    = 0.57 đến 1.52

    Các giá trị này bây giờ phải được chuyển đổi trở lại số liệu ban đầu.

    Nhận xét: Chúng ta có thể kết luận rằng chúng ta chắc chắn 95% rằng mối tương quan dân số là dương và nằm trong khoảng 0.515 đến 0.909. Khoảng tin cậy này không bao gồm giá trị 0, điều này cho thấy mối tương quan có ý nghĩa thống kê ở mức 5%.

    Tài liệu tham khảo

    1. Coolican, H. [2018]. Research methods and statistics in psychology. Routledge.
    2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. [2012]. Basic statistics for social research [Vol. 38]. John Wiley & Sons.
    3. Jackson, S. L. [2015]. Research methods and statistics: A critical thinking approach. Cengage Learning.
    4. McQueen, R. A., & Knussen, C. [2006]. Introduction to research methods and statistics in psychology. Pearson education.
    5. Peers, I. [2006]. Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
    6. Wagner III, W. E. [2019]. Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

    Video liên quan

    Chủ Đề