Bài viết này là phần đầu tiên trong chuỗi hai bài về phân tích nhân tố, tập trung vào các khái niệm cốt lõi trong phân tích nhân tố khám phá (EFA). Phần một này sẽ đi sâu vào EFA, sử dụng phần mềm SPSS để minh họa, nhưng các nguyên tắc được trình bày có thể áp dụng cho bất kỳ phần mềm thống kê nào. Phần hai sẽ giới thiệu về phân tích nhân tố khẳng định (CFA).
I. Phân Tích Nhân Tố Khám Phá (EFA)
- Giới thiệu
- Ví dụ thực tế: SAQ (SPSS Anxiety Questionnaire)
- Công thức tương quan Pearson
- Phân chia phương sai trong phân tích nhân tố
- Trích xuất nhân tố
- Phân tích thành phần chính (PCA)
- Phân tích nhân tố chung (Common Factor Analysis)
- Phương pháp trục chính (Principal Axis Factoring)
- Phương pháp khả năng tối đa (Maximum Likelihood)
- Phương pháp xoay nhân tố
- Cấu trúc đơn giản (Simple Structure)
- Xoay trực giao (Orthogonal Rotation – Varimax)
- Xoay xiên (Oblique Rotation – Direct Oblimin)
- Tạo điểm nhân tố
Giới Thiệu
Khi thực hiện một khảo sát, bạn muốn biết liệu các mục trong khảo sát có các mô hình phản hồi tương tự hay không, liệu chúng có “kết nối” với nhau để tạo thành một cấu trúc không? Giả định cơ bản của phân tích nhân tố là đối với một tập hợp các biến quan sát được, có một tập hợp các biến tiềm ẩn gọi là nhân tố (ít hơn các biến quan sát được), có thể giải thích các mối quan hệ giữa các biến này. Ví dụ, bạn thực hiện một khảo sát và thu thập phản hồi về sự lo lắng của mọi người khi sử dụng SPSS. Liệu tất cả các mục này có thực sự đo lường những gì chúng ta gọi là “Nỗi lo SPSS” không?
Biểu đồ minh họa sự liên hệ giữa các biến quan sát và nhân tố tiềm ẩn trong phân tích nhân tố.
Ví dụ thực tế: SAQ (SPSS Anxiety Questionnaire)
Hãy tiếp tục với ví dụ khảo sát về Bảng câu hỏi về Nỗi lo SPSS (SPSS Anxiety Questionnaire) của Andy Field. Để đơn giản, chúng ta sẽ sử dụng “SAQ-8”, bao gồm tám mục đầu tiên trong SAQ. SAQ-8 bao gồm các câu hỏi sau:
- Thống kê làm tôi phát khóc
- Bạn bè sẽ nghĩ tôi ngu ngốc nếu không thể đối phó với SPSS
- Độ lệch chuẩn làm tôi phấn khích
- Tôi mơ thấy Pearson tấn công tôi bằng các hệ số tương quan
- Tôi không hiểu thống kê
- Tôi có ít kinh nghiệm về máy tính
- Tất cả máy tính đều ghét tôi
- Tôi chưa bao giờ giỏi toán
Tương quan Pearson của SAQ-8
Hãy xem bảng tương quan trong SPSS (Analyze – Correlate – Bivariate):
Correlations
1 2 3 4 5 6 7 8
1 1
2 -.099** 1
3 -.337** .318** 1
4 .436** -.112** -.380** 1
5 .402** -.119** -.310** .401** 1
6 .217** -.074** -.227** .278** .257** 1
7 .305** -.159** -.382** .409** .339** .514** 1
8 .331** -.050* -.259** .349** .269** .223** .297** 1
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Từ bảng này, chúng ta thấy rằng hầu hết các mục có một số tương quan với nhau, từ (r = -0.382) cho Mục 3 và 7 đến (r = 0.514) cho Mục 6 và 7. Do tương quan tương đối cao giữa các mục, đây sẽ là một ứng cử viên tốt cho phân tích nhân tố. Mục tiêu của phân tích nhân tố là mô hình hóa các mối quan hệ giữa các mục với ít biến (tiềm ẩn) hơn. Các mối quan hệ này có thể được chia thành nhiều thành phần.
Phân Chia Phương Sai Trong Phân Tích Nhân Tố
Vì mục tiêu của phân tích nhân tố là mô hình hóa các mối quan hệ giữa các mục, chúng ta tập trung chủ yếu vào phương sai và hiệp phương sai hơn là giá trị trung bình. Phân tích nhân tố giả định rằng phương sai có thể được chia thành hai loại: phương sai chung và phương sai duy nhất.
- Phương sai chung là lượng phương sai được chia sẻ giữa một tập hợp các mục. Các mục có tương quan cao sẽ chia sẻ nhiều phương sai.
- Độ tương đồng (Communality – h²) là một định nghĩa về phương sai chung, nằm trong khoảng từ 0 đến 1. Các giá trị gần 1 cho thấy rằng các nhân tố được trích xuất giải thích nhiều hơn phương sai của một mục riêng lẻ.
- Phương sai duy nhất là bất kỳ phần nào của phương sai không phải là phương sai chung. Có hai loại:
- Phương sai cụ thể là phương sai dành riêng cho một mục cụ thể (ví dụ: Mục 4 “Tất cả máy tính đều ghét tôi” có thể có phương sai là do lo lắng về máy tính ngoài lo lắng về SPSS).
- Phương sai sai số đến từ các sai số đo lường và về cơ bản là bất kỳ điều gì không được giải thích bởi phương sai chung hoặc phương sai cụ thể (ví dụ: người đó nhận được cuộc gọi từ người giữ trẻ nói rằng cậu con trai hai tuổi của cô đã ăn thỏi son yêu thích của cô).
Hình dưới đây cho thấy các khái niệm này liên quan đến nhau như thế nào:
Sơ đồ phân chia phương sai trong phân tích nhân tố.
Tổng phương sai được tạo thành từ phương sai chung và phương sai duy nhất, và phương sai duy nhất bao gồm phương sai cụ thể và phương sai sai số. Nếu tổng phương sai là 1, thì độ tương đồng là h² và phương sai duy nhất là (1 – h²). Hãy xem cách phân chia phương sai áp dụng cho mô hình nhân tố SAQ-8.
Mô hình nhân tố SAQ-8 với phương sai chung, phương sai cụ thể và phương sai sai số.
Ở đây, bạn thấy rằng Nỗi lo SPSS tạo nên phương sai chung cho cả tám mục, nhưng trong mỗi mục có phương sai cụ thể và phương sai sai số. Lấy ví dụ về Mục 7 “Máy tính chỉ hữu ích để chơi trò chơi”. Mặc dù Nỗi lo SPSS giải thích một số phương sai này, nhưng có thể có các yếu tố hệ thống như chứng sợ công nghệ và các yếu tố phi hệ thống không thể được giải thích bởi Nỗi lo SPSS hoặc chứng sợ công nghệ, chẳng hạn như bị phạt vì chạy quá tốc độ ngay trước khi đến trung tâm khảo sát (sai số đo lường). Bây giờ chúng ta đã hiểu việc phân chia phương sai, chúng ta có thể chuyển sang thực hiện phân tích nhân tố đầu tiên của mình. Trên thực tế, các giả định chúng ta đưa ra về việc phân chia phương sai ảnh hưởng đến phân tích chúng ta chạy.
Thực Hiện Phân Tích Nhân Tố
Là một nhà phân tích dữ liệu, mục tiêu của phân tích nhân tố là giảm số lượng biến để giải thích và diễn giải kết quả. Điều này có thể được thực hiện trong hai bước:
- Trích xuất nhân tố
- Xoay nhân tố
Trích xuất nhân tố liên quan đến việc lựa chọn loại mô hình cũng như số lượng nhân tố cần trích xuất. Xoay nhân tố diễn ra sau khi các nhân tố được trích xuất, với mục tiêu đạt được cấu trúc đơn giản để cải thiện khả năng diễn giải.
Trích Xuất Nhân Tố
Có hai cách tiếp cận để trích xuất nhân tố, bắt nguồn từ các cách tiếp cận khác nhau để phân chia phương sai: a) phân tích thành phần chính và b) phân tích nhân tố chung.
Phân Tích Thành Phần Chính (PCA)
Không giống như phân tích nhân tố, phân tích thành phần chính hoặc PCA giả định rằng không có phương sai duy nhất, tổng phương sai bằng phương sai chung. Phương sai có thể được chia thành phương sai chung và phương sai duy nhất. Nếu không có phương sai duy nhất, thì phương sai chung chiếm tổng phương sai (xem hình bên dưới). Ngoài ra, nếu tổng phương sai là 1, thì phương sai chung bằng độ tương đồng.
Sơ đồ minh họa sự khác biệt giữa phân tích thành phần chính và phân tích nhân tố chung về phân chia phương sai.
Chạy PCA Với 8 Thành Phần Trong SPSS
Mục tiêu của PCA là sao chép ma trận tương quan bằng một tập hợp các thành phần có số lượng ít hơn và các tổ hợp tuyến tính của tập hợp các mục ban đầu. Mặc dù phân tích sau đây đánh bại mục đích của việc thực hiện PCA, nhưng chúng ta sẽ bắt đầu bằng cách trích xuất càng nhiều thành phần càng tốt như một bài tập giảng dạy và để chúng ta có thể quyết định số lượng thành phần tối ưu để trích xuất sau này.
Đầu tiên, hãy vào Analyze – Dimension Reduction – Factor. Di chuyển tất cả các biến quan sát vào hộp Variables: để phân tích.
Trong Extraction – Method, hãy chọn Principal components và đảm bảo phân tích ma trận Correlation. Chúng ta cũng yêu cầu giải pháp nhân tố Unrotated và biểu đồ Scree. Trong Extract, chọn Fixed number of factors và trong Factor to extract, hãy nhập 8. Chúng ta cũng tăng số lượng Iterations hội tụ tối đa lên 100.
Cú pháp SPSS tương đương được hiển thị bên dưới:
FACTOR
/VARIABLES q01 q02 q03 q04 q05 q06 q07 q08
/MISSING LISTWISE
/ANALYSIS q01 q02 q03 q04 q05 q06 q07 q08
/PRINT INITIAL EXTRACTION
/PLOT EIGEN
/CRITERIA FACTORS(8) ITERATE(100)
/EXTRACTION PC
/ROTATION NOROTATE
/METHOD=CORRELATION.
Giá Trị Riêng (Eigenvalues) và Vectơ Riêng (Eigenvectors)
Trước khi đi vào đầu ra của SPSS, hãy hiểu một vài điều về giá trị riêng và vectơ riêng.
Giá trị riêng đại diện cho tổng lượng phương sai có thể được giải thích bởi một thành phần chính nhất định. Về lý thuyết, chúng có thể dương hoặc âm, nhưng trong thực tế, chúng giải thích phương sai luôn dương.
- Nếu giá trị riêng lớn hơn 0, thì đó là một dấu hiệu tốt.
- Vì phương sai không thể âm, nên giá trị riêng âm ngụ ý rằng mô hình không ổn định.
- Giá trị riêng gần bằng 0 ngụ ý rằng có hiện tượng đa cộng tuyến mục, vì tất cả phương sai có thể được lấy bởi thành phần đầu tiên.
Giá trị riêng cũng là tổng của các tải thành phần bình phương trên tất cả các mục cho mỗi thành phần, đại diện cho lượng phương sai trong mỗi mục có thể được giải thích bởi thành phần chính.
Vectơ riêng đại diện cho một trọng số cho mỗi giá trị riêng. Vectơ riêng nhân với căn bậc hai của giá trị riêng cho tải thành phần, có thể được hiểu là tương quan của mỗi mục với thành phần chính. Đối với PCA cụ thể này của SAQ-8, vectơ riêng liên quan đến Mục 1 trên thành phần đầu tiên là (0.377), và giá trị riêng của Mục 1 là (3.057). Chúng ta có thể tính thành phần đầu tiên là
$$(0.377)sqrt{3.057}= 0.659.$$
Trong trường hợp này, chúng ta có thể nói rằng tương quan của mục đầu tiên với thành phần đầu tiên là (0.659). Hãy chuyển sang ma trận thành phần.
Ma Trận Thành Phần (Component Matrix)
Các thành phần có thể được hiểu là tương quan của mỗi mục với thành phần. Mỗi mục có một tải tương ứng với mỗi trong số 8 thành phần. Ví dụ: Mục 1 có tương quan (0.659) với thành phần đầu tiên, (0.136) với thành phần thứ hai và (-0.398) với thành phần thứ ba, v.v.
Bình phương mỗi tải đại diện cho tỷ lệ phương sai (hãy nghĩ về nó như một thống kê R²) được giải thích bởi một thành phần cụ thể. Đối với Mục 1, ((0.659)² = 0.434) hoặc (43.4%) phương sai của nó được giải thích bởi thành phần đầu tiên. Sau đó, ((0.136)² = 0.018) hoặc (1.8%) phương sai trong Mục 1 được giải thích bởi thành phần thứ hai. Tổng phương sai được giải thích bởi cả hai thành phần do đó là (43.4% + 1.8% = 45.2%). Nếu bạn tiếp tục cộng các tải bình phương một cách tích lũy xuống các thành phần, bạn sẽ thấy rằng nó cộng lại thành 1 hoặc 100%. Điều này cũng được gọi là độ tương đồng, và trong PCA, độ tương đồng cho mỗi mục bằng tổng phương sai.
Component Matrixa
Item Component
1 2 3 4 5 6 7 8
1 0.659 0.136 -0.398 0.160 -0.064 0.568 -0.177 0.068
2 -0.300 0.866 -0.025 0.092 -0.290 -0.170 -0.193 -0.001
3 -0.653 0.409 0.081 0.064 0.410 0.254 0.378 0.142
4 0.720 0.119 -0.192 0.064 -0.288 -0.089 0.563 -0.137
5 0.650 0.096 -0.215 0.460 0.443 -0.326 -0.092 -0.010
6 0.572 0.185 0.675 0.031 0.107 0.176 -0.058 -0.369
7 0.718 0.044 0.453 -0.006 -0.090 -0.051 0.025 0.516
8 0.568 0.267 -0.221 -0.694 0.258 -0.084 -0.043 -0.012
Extraction Method: Principal Component Analysis.
a. 8 components extracted.
Tổng các tải thành phần bình phương trên các thành phần (cột) cho bạn các ước tính độ tương đồng cho mỗi mục và tổng mỗi tải bình phương xuống các mục (hàng) cho bạn giá trị riêng cho mỗi thành phần. Ví dụ: để có được giá trị riêng đầu tiên, chúng ta tính:
$$(0.659)^2 + (-.300)^2 – (-0.653)^2 + (0.720)^2 + (0.650)^2 + (0.572)^2 + (0.718)^2 + (0.568)^2 = 3.057$$
Bạn sẽ nhận được tám giá trị riêng cho tám thành phần, dẫn chúng ta đến bảng tiếp theo.
Tổng Phương Sai Được Giải Thích Trong PCA 8 Thành Phần
Giá trị riêng đại diện cho tổng lượng phương sai có thể được giải thích bởi một thành phần chính nhất định. Bắt đầu từ thành phần đầu tiên, mỗi thành phần tiếp theo được lấy từ việc phân chia thành phần trước đó. Do đó, thành phần đầu tiên giải thích nhiều phương sai nhất và thành phần cuối cùng giải thích ít nhất. Nhìn vào bảng Tổng Phương Sai Được Giải Thích, bạn sẽ nhận được tổng phương sai được giải thích bởi mỗi thành phần. Ví dụ: Thành phần 1 là (3.057) hoặc ((3.057/8)% = 38.21%) tổng phương sai. Vì chúng ta đã trích xuất cùng số lượng thành phần như số lượng mục, nên cột Giá Trị Riêng Ban Đầu giống như cột Tổng Tích Lũy của Tải Bình Phương.
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 3.057 38.206 38.206 3.057 38.206 38.206
2 1.067 13.336 51.543 1.067 13.336 51.543
3 0.958 11.980 63.523 0.958 11.980 63.523
4 0.736 9.205 72.728 0.736 9.205 72.728
5 0.622 7.770 80.498 0.622 7.770 80.498
6 0.571 7.135 87.632 0.571 7.135 87.632
7 0.543 6.788 94.420 0.543 6.788 94.420
8 0.446 5.580 100.000 0.446 5.580 100.000
Extraction Method: Principal Component Analysis.
Chọn Số Lượng Thành Phần Để Trích Xuất
Vì mục tiêu của việc chạy PCA là giảm tập hợp các biến của chúng ta xuống, sẽ hữu ích khi có một tiêu chí để chọn số lượng thành phần tối ưu, tất nhiên là nhỏ hơn tổng số mục. Một tiêu chí là chọn các thành phần có giá trị riêng lớn hơn 1. Trong bảng Tổng Phương Sai Được Giải Thích, chúng ta thấy hai thành phần đầu tiên có giá trị riêng lớn hơn 1. Điều này có thể được xác nhận bởi Biểu Đồ Scree, biểu đồ giá trị riêng (tổng phương sai được giải thích) theo số thành phần. Chúng ta đã kiểm tra tùy chọn Biểu Đồ Scree trong Extraction – Display, vì vậy biểu đồ Scree sẽ được tạo tự động.
Biểu đồ Scree minh họa sự thay đổi của giá trị riêng theo số lượng thành phần.
Thành phần đầu tiên sẽ luôn có tổng phương sai cao nhất và thành phần cuối cùng sẽ luôn có ít nhất, nhưng chúng ta thấy sự giảm lớn nhất ở đâu? Nếu bạn nhìn vào Thành phần 2, bạn sẽ thấy một khớp “khuỷu tay”. Đây là điểm đánh dấu nơi có lẽ không quá có lợi để tiếp tục trích xuất thành phần nữa. Có một số định nghĩa mâu thuẫn về cách diễn giải biểu đồ scree, nhưng một số người nói rằng hãy lấy số lượng thành phần ở bên trái “khuỷu tay”. Theo tiêu chí này, chúng ta sẽ chỉ chọn một thành phần. Một cách diễn giải chủ quan hơn về các biểu đồ scree cho thấy rằng bất kỳ số lượng thành phần nào từ 1 đến 4 đều có thể xảy ra và bằng chứng củng cố thêm sẽ rất hữu ích.
Một số tiêu chí nói rằng tổng phương sai được giải thích bởi tất cả các thành phần phải nằm trong khoảng từ 70% đến 80% phương sai, trong trường hợp này có nghĩa là khoảng bốn đến năm thành phần. Các tác giả của cuốn sách nói rằng điều này có thể không thể duy trì được đối với nghiên cứu khoa học xã hội, nơi các nhân tố được trích xuất thường chỉ giải thích 50% đến 60%. Chọn số lượng thành phần là một chút nghệ thuật và đòi hỏi sự đóng góp từ toàn bộ nhóm nghiên cứu. Giả sử chúng ta đã nói chuyện với điều tra viên chính và cô ấy tin rằng giải pháp hai thành phần có ý nghĩa đối với nghiên cứu, vì vậy chúng ta sẽ tiến hành phân tích.
Chạy PCA Với 2 Thành Phần Trong SPSS
Chạy PCA hai thành phần cũng dễ dàng như chạy giải pháp 8 thành phần. Sự khác biệt duy nhất là trong Fixed number of factors – Factors to extract, bạn nhập 2.
Chúng ta sẽ tập trung vào sự khác biệt trong đầu ra giữa giải pháp tám và hai thành phần. Trong Total Variance Explained, chúng ta thấy rằng Giá Trị Riêng Ban Đầu không còn bằng Tổng Tích Lũy của Tải Bình Phương. Sự khác biệt chính là chỉ có hai hàng giá trị riêng và phần trăm phương sai tích lũy lên đến (51.54%).
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 3.057 38.206 38.206 3.057 38.206 38.206
2 1.067 13.336 51.543 1.067 13.336 51.543
3 0.958 11.980 63.523
4 0.736 9.205 72.728
5 0.622 7.770 80.498
6 0.571 7.135 87.632
7 0.543 6.788 94.420
8 0.446 5.580 100.000
Extraction Method: Principal Component Analysis.
Tương tự, bạn sẽ thấy rằng Ma Trận Thành Phần có cùng tải như giải pháp tám thành phần, nhưng thay vì tám cột, bây giờ nó có hai cột.
Component Matrixa
Item Component
1 2
1 0.659 0.136
2 -0.300 0.866
3 -0.653 0.409
4 0.720 0.119
5 0.650 0.096
6 0.572 0.185
7 0.718 0.044
8 0.568 0.267
Extraction Method: Principal Component Analysis.
a. 2 components extracted.
Một lần nữa, chúng ta hiểu rằng Mục 1 có tương quan 0.659 với Thành phần 1. Từ cái nhìn thoáng qua về giải pháp, chúng ta thấy rằng Mục 4 có tương quan cao nhất với Thành phần 1 và Mục 2 thấp nhất. Tương tự, chúng ta thấy rằng Mục 2 có tương quan cao nhất với Thành phần 2 và Mục 7 thấp nhất.
Kiểm tra nhanh:
Đúng hay Sai
- Các phần tử của Ma Trận Thành Phần là tương quan của mục với mỗi thành phần.
- Tổng các giá trị riêng bình phương là tỷ lệ phương sai trong Tổng Phương Sai Được Giải Thích.
- Ma Trận Thành Phần có thể được coi là tương quan và bảng Tổng Phương Sai Được Giải Thích có thể được coi là R².
1.Đ, 2.S (tổng các tải bình phương), 3. Đ
Độ Tương Đồng (Communality) Của PCA 2 Thành Phần
Độ tương đồng là tổng của các tải thành phần bình phương lên đến số lượng thành phần bạn trích xuất. Trong đầu ra của SPSS, bạn sẽ thấy một bảng độ tương đồng.
Communalities
Item Initial Extraction
1 1.000 0.453
2 1.000 0.840
3 1.000 0.594
4 1.000 0.532
5 1.000 0.431
6 1.000 0.361
7 1.000 0.517
8 1.000 0.394
Extraction Method: Principal Component Analysis.
Vì PCA là một quá trình ước tính lặp đi lặp lại, nên nó bắt đầu với 1 làm ước tính ban đầu của độ tương đồng (vì đây là tổng phương sai trên tất cả 8 thành phần), và sau đó tiến hành phân tích cho đến khi một độ tương đồng cuối cùng được trích xuất. Lưu ý rằng cột Extraction nhỏ hơn cột Initial vì chúng ta chỉ trích xuất hai thành phần. Như một bài tập, hãy tính thủ công độ tương đồng đầu tiên từ Ma Trận Thành Phần. Cặp được sắp xếp đầu tiên là ((0.659, 0.136)) đại diện cho tương quan của mục đầu tiên với Thành phần 1 và Thành phần 2. Tổng bình phương các tải và tổng các thành phần (cột) cho chúng ta độ tương đồng:
$$h^2_1 = (0.659)^2 + (0.136)^2 = 0.453$$
Quay lại bảng Độ Tương Đồng, nếu bạn tổng tất cả 8 mục (hàng) của cột Extraction, bạn sẽ nhận được (4.123). Nếu bạn quay lại bảng Tổng Phương Sai Được Giải Thích và tổng hai giá trị riêng đầu tiên, bạn cũng sẽ nhận được (3.057 + 1.067 = 4.124). Điều đó có đáng ngạc nhiên không? Về cơ bản, nó nói rằng tổng các độ tương đồng trên tất cả các mục giống như tổng các giá trị riêng trên tất cả các thành phần.
Câu đố
- Trong PCA, khi nào độ tương đồng cho cột Initial bằng cột Extraction?
Trả lời: Khi bạn chạy PCA 8 thành phần.
Đúng hay Sai
- Giá trị riêng đại diện cho độ tương đồng cho mỗi mục.
- Đối với một thành phần duy nhất, tổng các tải thành phần bình phương trên tất cả các mục đại diện cho giá trị riêng cho thành phần đó.
- Tổng các giá trị riêng cho tất cả các thành phần là tổng phương sai.
- Tổng các độ tương đồng xuống các thành phần bằng tổng các giá trị riêng xuống các mục.
Câu trả lời:
- S, giá trị riêng là tổng độ tương đồng trên tất cả các mục cho một thành phần duy nhất, 2. Đ, 3. Đ, 4. S (bạn chỉ có thể tổng các độ tương đồng trên các mục và tổng các giá trị riêng trên các thành phần, nhưng nếu bạn làm điều đó thì chúng bằng nhau).
Phân Tích Nhân Tố Chung (Common Factor Analysis)
Việc phân chia phương sai phân biệt phân tích thành phần chính với những gì chúng ta gọi là phân tích nhân tố chung. Cả hai phương pháp đều cố gắng giảm chiều của tập dữ liệu xuống ít biến không quan sát được hơn, nhưng trong khi PCA giả định rằng các phương sai chung chiếm tất cả tổng phương sai, thì phân tích nhân tố chung giả định rằng tổng phương sai có thể được chia thành phương sai chung và phương sai duy nhất. Thường hợp lý hơn khi cho rằng bạn đã không đo lường tập hợp các mục của mình một cách hoàn hảo. Biến không quan sát được hoặc tiềm ẩn tạo nên phương sai chung được gọi là nhân tố, do đó có tên là phân tích nhân tố. Sự khác biệt chính khác giữa PCA và phân tích nhân tố nằm ở mục tiêu phân tích của bạn. Nếu mục tiêu của bạn chỉ đơn giản là giảm danh sách biến của bạn xuống thành một tổ hợp tuyến tính của các thành phần nhỏ hơn thì PCA là cách để thực hiện. Tuy nhiên, nếu bạn tin rằng có một cấu trúc tiềm ẩn nào đó xác định mối quan hệ giữa các mục, thì phân tích nhân tố có thể phù hợp hơn. Trong trường hợp này, chúng ta giả định rằng có một cấu trúc gọi là Nỗi lo SPSS giải thích lý do tại sao bạn thấy mối tương quan giữa tất cả các mục trên SAQ-8, tuy nhiên chúng ta thừa nhận rằng Nỗi lo SPSS không thể giải thích tất cả phương sai được chia sẻ giữa các mục trong SAQ, vì vậy chúng ta mô hình hóa phương sai duy nhất. Dựa trên kết quả của PCA, chúng ta sẽ bắt đầu với việc trích xuất hai nhân tố.
Chạy Phân Tích Nhân Tố Chung Với 2 Nhân Tố Trong SPSS
Để chạy phân tích nhân tố, hãy sử dụng các bước tương tự như chạy PCA (Analyze – Dimension Reduction – Factor), ngoại trừ trong Method, hãy chọn Principal axis factoring. Lưu ý rằng chúng ta tiếp tục đặt Số Lần Lặp Lại Tối Đa Để Hội Tụ ở 100 và chúng ta sẽ thấy lý do sau.
Dán cú pháp vào Trình Chỉnh Sửa Cú Pháp SPSS, chúng ta nhận được:
FACTOR
/VARIABLES q01 q02 q03 q04 q05 q06 q07 q08
/MISSING LISTWISE
/ANALYSIS q01 q02 q03 q04 q05 q06 q07 q08
/PRINT INITIAL EXTRACTION
/PLOT EIGEN
/CRITERIA FACTORS(2) ITERATE(100)
/EXTRACTION PAF
/ROTATION NOROTATE
/METHOD=CORRELATION.
Lưu ý sự khác biệt chính là trong /EXTRACTION, chúng ta liệt kê PAF cho Principal Axis Factoring thay vì PC cho Principal Components. Chúng ta sẽ nhận được ba bảng đầu ra, Độ Tương Đồng, Tổng Phương Sai Được Giải Thích và Ma Trận Nhân Tố. Hãy xem xét từng bảng này và so sánh chúng với đầu ra của PCA.
Độ Tương Đồng (Communality) Của PAF 2 Nhân Tố
Communalities
Item Initial Extraction
1 0.293 0.437
2 0.106 0.052
3 0.298 0.319
4 0.344 0.460
5 0.263 0.344
6 0.277 0.309
7 0.393 0.851
8 0.192 0.236
Extraction Method: Principal Axis Factoring.
Sự khác biệt nổi bật nhất giữa bảng độ tương đồng này và bảng từ PCA là việc trích xuất ban đầu không còn là một. Recall rằng đối với PCA, chúng ta giả định tổng phương sai hoàn toàn được chiếm bởi phương sai chung hoặc độ tương đồng, và do đó chúng ta chọn 1 làm ước tính ban đầu tốt nhất của chúng ta. Những gì Principal axis factoring làm là thay vì đoán 1 làm độ tương đồng ban đầu, nó chọn hệ số tương quan bội bình phương (R²). Để xem điều này trong hành động cho Mục 1, hãy chạy một hồi quy tuyến tính trong đó Mục 1 là biến phụ thuộc và Mục 2 -8 là biến độc lập. Đi tới Analyze – Regression – Linear và nhập q01 trong Dependent và q02 đến q08 trong Independent(s).
Dán cú pháp vào Trình Chỉnh Sửa Cú Pháp cho chúng ta:
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT q01
/METHOD=ENTER q02 q03 q04 q05 q06 q07 q08.
Đầu ra chúng ta thu được từ phân tích này là
Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .541a 0.293 0.291 0.697
Lưu ý rằng 0.293 (được đánh dấu màu đỏ) khớp với ước tính độ tương đồng ban đầu cho Mục 1. Chúng ta có thể thực hiện thêm tám hồi quy tuyến tính để có được tất cả tám ước tính độ tương đồng, nhưng SPSS đã thực hiện điều đó cho chúng ta. Giống như PCA, phân tích nhân tố cũng sử dụng một quá trình ước tính lặp đi lặp lại để có được các ước tính cuối cùng trong cột Extraction. Cuối cùng, tổng tất cả các hàng của cột trích xuất, và chúng ta nhận được 3.00. Điều này đại diện cho tổng phương sai chung được chia sẻ giữa tất cả các mục cho một giải pháp hai nhân tố.
Tổng Phương Sai Được Giải Thích (PAF 2 Nhân Tố)
Bảng tiếp theo chúng ta sẽ xem xét là Tổng Phương Sai Được Giải Thích. So sánh bảng này với bảng từ PCA, chúng ta nhận thấy rằng Giá Trị Riêng Ban Đầu hoàn toàn giống nhau và bao gồm 8 hàng cho mỗi “nhân tố”. Trên thực tế, SPSS chỉ đơn giản là mượn thông tin từ phân tích PCA để sử dụng trong phân tích nhân tố và các nhân tố thực sự là các thành phần trong cột Giá Trị Riêng Ban Đầu. Sự