Kiểm Định Chi Bình Phương: Giải Thích Chi Tiết và Ứng Dụng Thực Tế trong SPSS

Bài viết này cung cấp một hướng dẫn chi tiết về kiểm định Chi Bình Phương (Chi-Square), một công cụ thống kê mạnh mẽ để xác định mối liên hệ giữa các biến định tính. Chúng ta sẽ khám phá cách thực hiện kiểm định này bằng cả phương pháp thủ công và phần mềm SPSS, giúp bạn hiểu rõ bản chất và ứng dụng của nó trong phân tích dữ liệu.

Giả sử chúng ta có dữ liệu về 100 người với trình độ học vấn khác nhau. Câu hỏi đặt ra là: liệu có mối liên hệ nào giữa giới tính và trình độ học vấn hay không? Kiểm định Chi Bình Phương sẽ giúp chúng ta trả lời câu hỏi này.

Kiểm Định Chi Bình Phương là gì?

Kiểm định Chi Bình Phương (ký hiệu χ²) là một kiểm định giả thuyết thống kê được sử dụng để xác định xem có mối quan hệ đáng kể nào giữa hai biến phân loại (định tính) hay không. Nói cách khác, nó kiểm tra xem liệu sự phân phối quan sát được của một biến có khác biệt đáng kể so với sự phân phối kỳ vọng hay không.

Các Bước Thực Hiện Kiểm Định Chi Bình Phương bằng SPSS

Để thực hiện kiểm định Chi Bình Phương bằng SPSS, bạn có thể làm theo các bước sau:

  1. Mở dữ liệu: Mở file dữ liệu của bạn trong SPSS.

  2. Chọn Crosstabs: Vào menu Analyze > Descriptive Statistics > Crosstabs.

    2 crosstab menu2 crosstab menu

  3. Chọn biến: Đưa hai biến bạn muốn kiểm tra (ví dụ: giới tính và trình độ học vấn) vào ô Row(s)Column(s).

  4. Chọn Chi-square: Nhấn vào nút Statistics và chọn Chi-square.

    3 crosstab3 crosstab

  5. Chọn Cells: Chọn ô Cells và tích vào Observed, ExpectedTotal. Observed là giá trị quan sát thực tế, Expected là giá trị kỳ vọng, và Total là tổng phần trăm theo dòng và cột.

    4 cell crosstab4 cell crosstab

  6. Xem kết quả: Nhấn OK để chạy kiểm định và xem kết quả.

Giải Thích Kết Quả Kiểm Định Chi Bình Phương trong SPSS

Kết quả kiểm định Chi Bình Phương trong SPSS sẽ cung cấp cho bạn các thông tin sau:

  • Giá trị Observed: Số lượng quan sát thực tế trong mỗi ô của bảng chéo. Ví dụ, số người nam có trình độ cao đẳng.

  • Giá trị Expected: Số lượng kỳ vọng trong mỗi ô, giả sử không có mối liên hệ giữa hai biến. Ví dụ, số người nam dự kiến có trình độ cao đẳng nếu giới tính và trình độ học vấn độc lập. Giá trị này được tính bằng công thức P(Giới tính & Trình độ) = P(Giới tính) * P(Trình độ).

  • Giá trị Chi-square: Thể hiện mức độ khác biệt giữa giá trị quan sát và giá trị kỳ vọng. Giá trị Chi-square càng lớn, sự khác biệt càng lớn.

  • Bậc tự do (df): Được tính bằng công thức (số hàng – 1) * (số cột – 1).

  • Giá trị p (Asymptotic Significance): Xác suất để thu được kết quả kiểm định (hoặc kết quả khắc nghiệt hơn) nếu không có mối liên hệ giữa hai biến.

    5 ket qua chi square5 ket qua chi square

Quy tắc quyết định:

  • Nếu giá trị p < α (thường là 0.05), ta bác bỏ giả thuyết H0 (giả thuyết cho rằng không có mối liên hệ giữa hai biến) và kết luận rằng có mối liên hệ đáng kể giữa hai biến.
  • Nếu giá trị p ≥ α, ta không bác bỏ giả thuyết H0 và kết luận rằng không có đủ bằng chứng để chứng minh có mối liên hệ giữa hai biến.

Lưu ý quan trọng: Kiểm định Chi Bình Phương chỉ có ý nghĩa khi số lượng quan sát đủ lớn. Nếu có hơn 20% số ô trong bảng chéo có giá trị kỳ vọng nhỏ hơn 5, kết quả kiểm định có thể không đáng tin cậy. Trong trường hợp này, bạn có thể sử dụng kiểm định Fisher’s exact test (đối với bảng 2×2).

Ví dụ cụ thể

Giả sử, sau khi thực hiện kiểm định Chi Bình Phương, ta có các giá trị sau:

  • Giá trị Chi-square = 2.873
  • Bậc tự do (df) = 2
  • Giá trị p (Sig.) = 0.238

Vì giá trị p (0.238) > 0.05, ta không bác bỏ giả thuyết H0 và kết luận rằng không có đủ bằng chứng để chứng minh có mối liên hệ giữa học vấn và giới tính trong tập dữ liệu này.

Tính Toán Chi Bình Phương Thủ Công

Để hiểu rõ hơn về bản chất của kiểm định Chi Bình Phương, chúng ta có thể tính toán các giá trị Chi-square, bậc tự do và giá trị p một cách thủ công.

  1. Lập bảng tần số quan sát: Tạo một bảng thể hiện số lượng quan sát thực tế cho mỗi tổ hợp của hai biến.

    6 data goc6 data goc

  2. Tính tổng hàng và tổng cột: Tính tổng số quan sát cho mỗi hàng và mỗi cột trong bảng.

  3. Tính tỷ lệ phần trăm theo dòng và cột: Tính tỷ lệ phần trăm của mỗi ô so với tổng số quan sát.

    7 excel7 excel

    Ví dụ: 10% số người có trình độ cao đẳng.

  4. Tính giá trị kỳ vọng: Tính giá trị kỳ vọng cho mỗi ô bằng cách nhân tổng của hàng với tổng của cột, sau đó chia cho tổng số quan sát. Giá trị kỳ vọng thể hiện số lượng quan sát dự kiến nếu hai biến độc lập với nhau. Công thức: E = (Tổng hàng * Tổng cột) / Tổng số quan sát.

    8 kivong8 kivong

    Ví dụ: Số kỳ vọng người nam có trình độ cao đẳng = 10% x 56% x 100 = 5.6.

  5. Tính giá trị Chi-square: Sử dụng công thức sau để tính giá trị Chi-square cho mỗi ô: χ² = (O – E)² / E, trong đó O là giá trị quan sát và E là giá trị kỳ vọng. Sau đó, cộng tất cả các giá trị Chi-square của mỗi ô lại để được giá trị Chi-square tổng thể.

    9 chi square9 chi square

    Ví dụ: χ² = (6-5.6)²/5.6 + (35-38.64)²/38.64 + (15-11.76)²/11.76 + (4-4.4)²/4.4 + (34-30.36)²/30.36 + (6-9.24)²/9.24 = 2.873

  6. Tính bậc tự do (df): df = (số hàng – 1) (số cột – 1). Ví dụ, nếu có 3 trình độ học vấn và 2 giới tính, thì df = (3-1) (2-1) = 2.

  7. Tính giá trị p: Sử dụng hàm CHIDIST trong Excel để tính giá trị p. CHIDIST(chi-square, df). Ví dụ: CHIDIST(2.873, 2) = 0.238.

Kết Luận

Kiểm định Chi Bình Phương là một công cụ hữu ích để xác định mối liên hệ giữa các biến định tính. Bằng cách hiểu rõ cách thực hiện kiểm định này bằng cả phương pháp thủ công và SPSS, bạn có thể áp dụng nó một cách hiệu quả trong phân tích dữ liệu và đưa ra những kết luận chính xác. Nếu giá trị p lớn hơn mức ý nghĩa (thường là 0.05), chúng ta kết luận rằng không có đủ bằng chứng để bác bỏ giả thuyết rằng hai biến là độc lập. Trong ví dụ trên, học vấn và giới tính không có mối liên hệ với nhau.