Luận Văn A-Z xin dịch một số từ tiếng anh thông dụng khi sử dụng phần mềm SPSS cho các anh chị đang chuẩn bị làm luận văn thạc sĩ, luận án tiếng sĩ tham khảo
Tên tiếng Anh | Dịch qua tiếng Việt |
---|---|
Frequencies | Tần số |
Statistics | Thống kê |
Valid | Hợp lệ |
Missing | Thiếu |
Frequency Table | Bảng tần số |
Frequency | Tần số |
PercentValid Percent | Tỷ lệ phần trăm hợp lệ |
Cumulative Percent | Phần trăm tích lũy |
Descriptive Statistics | Thống kê mô tả |
Minimum | Nhỏ nhất |
Maximum | Lớn nhất |
Mean | Trung Bình |
Std. Deviation | Độ lệch chuẩn |
Corrected Item-Total Correlation | Tương quan biến tổng |
Cronbach’s Alpha if Item Deleted | Alpha Cronbach nếu xóa biến này |
KMO and Bartlett’s Test | Kiểm định KMO và Bartlett |
Total Variance Explained | Tổng phương sai trích |
Initial Eigenvalues | Eigenvalues khởi tạo |
Component Matrix | Ma trận các thành phần |
Rotated Component Matrix | Ma trận xoay các thành phần |
R | Hệ số R |
R Square | Hệ số R bình phương |
Adjusted R Square | Hệ số R bình phương hiệu chỉnh |
Std. Error of the Estimate | Sai số chuẩn của ước lượng |
Coefficients | Hệ số |
Model | Mô hình |
Unstandardized Coefficients | Hệ số chưa chuẩn hóa |
Standardized Coefficients | Hệ số đã chuẩn hóa |
t | t |
Sig. | Sig. |
Collinearity Statistics | Đa cộng Tuyến |
B | B |
Std. Error | Sai số chuẩn |
Beta | Beta |
Tolerance | Hệ số Tolerance |
VIF | Hệ số phóng đại phương sai VIF |
Constant | Hằng số |
Test of Homogeneity of Variances | Kiểm định tính đồng nhất của phương sai |
Levene Statistic | Kiểm định Levene |
Độ tin cậy là mức độ mà thang đo được xem xét là nhất quán và ổn định (Parasuraman, 1991). Hay nói cách khác, độ tin cậy của một phép đo là mức độ mà phép đo tránh được sai số ngẫu nhiên. Trong nghiên cứu này, để đánh giá độ tin cậy (reliability) của từng thang đo, đánh giá độ phù hợp của từng mục hỏi (items) hệ số tương quan alpha của Cronbach (Cronbach’s Coefficient Alpha) được sử dụng.
Đo lường độ tin cậy bằng hệ số Cronbach’s alpha là một phép kiểm định thống kê về mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005), hệ số này đánh giá độ tin cậy của phép đo dựa trên sự tính toán phương sai của từng item và tính tương quan điểm của từng item với điểm của tổng các items còn lại của phép đo.
Nhiều nhà nghiên cứu đồng ý rằng hệ số alpha của từng thang đo từ 0.8 trở lên đến gần 1 thì thang đo lường là tốt, từ 0.7 đến gần 0.8 là sử dụng được. Cũng có nhà nghiên cứu đề nghị rằng hệ số alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang nghiên cứu là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu (Nunnally, 1978; Peterson, 1994; Slater, 1995 dẫn theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).Vì vậy, đối với nghiên cứu này thì hệ số alpha từ 0.6 trở lên là chấp nhận được.
Khi đánh giá độ phù hợp của từng item, những item nào có hệ số tương quan biến tổng (item-total correlation) lớn hơn hoặc bằng 0.3 được coi là những item có độ tin cậy bảo đảm (Nguyễn Công Khanh, 2005), các item có hệ số tương quan biến tổng nhỏ hơn 0.3 sẽ bị loại bỏ ra khỏi thang đo.
Dear all, dạo này Luận Văn A-Z thấy nhiều bạn đặt câu hỏi về EFA. Nên mình viết bài này hy vọng sẽ giúp mọi người có cái nhìn tổng quát và rõ hơn trong phân tích EFA.
Phân tích EFA có 4 bước cơ bản:
KMO là một chỉ tiêu để xem xét sự phù hợp cho việc ptich EFA. ( 0.5< KMO <1 là tốt).
Kiểm định Bartlett xem xét giạ thuyết Ho: Độ tương quan giữa các biến số quan sát bằng 0. Nếu kiểm định này có ý nghĩa thống kê ( sig <0.05) thì các biến có tương quan với nhau trong tổng thể.
Eigen values > 1
The Scree Plot
Dựa vào bảng trên, và xu hướng diễn đạt của từng thang đo các bạn có thể đặt tên phù hợp cho từng nhân tố rồi.
Chúc mọi người thành công nhé !!!
Nội dung của phần này nhằm kiểm định sự khác biệt giữa các biến định tính với biến định lượng, ví dụ có sự khác biệt về sự hài lòng dịch vụ ngân hàng A với các đối tượng khách hàng (như giới tính, độ tuổi, mức thu nhập…) hay không. Để thực hiện được điều này chúng ta tiến hành phân tích phương sai ANOVA và Indepent-sample T – test. Sự khác biệt có ý nghĩa thống kê với độ tin cậy 95% (hay mức ý nghĩa Sig.< 0.05).
Có hai thủ tục phân tích phương sai: ANOVA một yếu tố và ANOVA nhiều yếu tố. Tuỳ nghiên cứu mà thực hiện phân tích phương sai một yếu tố hay hai yếu tố, riêng đối với các luận văn bậc Đại học hoặc Cao học thuần về hướng nghiên cứu ứng dụng khảo sát mẫu không quá phức tạp thì những nghiên cứu dạng này dùng kiểm định phương sai một yếu tố sẽ được thực hiện vì chúng ta chỉ kiểm định biến định tính để phân loại các quan sát thành các nhóm khác nhau. Kiểm định ANOVA gồm kiểm định độ đồng nhất giữa phương sai của các nhóm nhân tố có mức ý nghĩa sig. > 0.05.
Các biến có hai lựa chọn (ví dụ như giới tính chỉ có hai thái thể hiện là Nam và Nữ) chính vì thế chúng ta sẽ sử dụng phép kiểm định Independent-sample T – test (kiểm định giả thuyết trung bình của hai tổng thể) để tìm sự khác biệt với biến định lượng.
Cách thực hiện kiểm định này trong SPSS: Analysist/Compare Mean/Independent Samples T-Test/
Cho biến định lượng vào Test varible
Biến định tính vào Grouping Varible
Sau đó chọn Define Groups; lần lượt chọn giá trị đã gán cho 2 lựa chọn của biến định tính vào
okie xong phần T-Test
Đọc kết quả phân tích T-Test
Kiểm tra kiểm định Levene’s ở bảng Independent Samples Test
Nếu sig. của kiểm định này < 0.05 thì phương sai giữa 2 lựa chọn của biến định tính ở trên khác nhau, ta sẽ sử dụng kết quả kiểm định T ở phần Equal variances not assumed. Nếu giá trị sig của kiểm định t ở phần Equal variances not assumed sig. > 0.05 thì kết luận kiểm định T không có sự khác biệt, còn Sig <= 0.05 thì kết luận có sự khác biệt giữa các nhóm của biến định tính
Nếu sig. của kiểm định này >=0.05 thì phương sai giữa 2 lựa chọn của biến định tính ở trên không khác nhau, ta sẽ sử dụng kết quả kiểm định T ở phần Equal variances assumed. Nếu giá trị sig của kiểm định t ở phần Equal variances not assumed sig. > 0.05 thì kết luận kiểm định T không có sự khác biệt, còn Sig <= 0.05 thì kết luận có sự khác biệt giữa các nhóm của biến định tính
Cách thực hiện kiểm định này trong SPSS: Analysist/Compare Mean/One way ANOVA
Cho biến định lượng vào ô Dependent list
Cho biến định tính vào ô Factors
Chọn Opiton chọn Descriptive và Homogeneity of variance test
Okie xong các bước thực hiện ANOVA
Đọc kết quả phân tích ANOVA
Thực hiện kiểm tra kiểm định Levene ở bảng Test of Homogeneity of variances, nếu sig ở kiểm định này < = 0.05 thì kết luận phương sai giữa các lựa chọn của biến định tính ở trên khác nhau.
Nếu sig ở kiểm định này >0.05 thì phương sai giữa các lựa chọn của biến định tính ở trên không khác nhau, xem tiếp kết quả ở bảng ANOVA. Nếu sig ở bảng này > 0.05 kết luận không có sự khác biệt giữa các nhóm biến định tính, còn nếu sig ở bảng này < = 0.05 thì kết luận có sự khác biệt giữa các nhóm biến định tính
Khi có sự khác biệt giữa các nhóm của biến định tính với định lượng trong phần T – Test hoặc ANOVA ta tiếp tục theo dõi giá trị Mean ở bảng Descriptives và kết luận
Nếu nhóm nào có giá trị Mean cao hơn thì kết luận nhóm đó tác động nhiều hơn với biến định lượng.
Khi chạy EFA, một số bạn phản ánh với Luận Văn A-Z rằng mình bị mắc lỗi này “Rotation failed to converge in 25 iterations…”
Lỗi này thường là do dữ liệu của bạn chưa thể hội tụ được sau 25 bước lặp. Cách xử lý là khi chạy EFA, bạn vào nút “Extraction” và chỉnh “Maximum iteration for convergence” từ 25 lên 40, 50… rồi chạy lại EFA là ok nhé!
Điều kiện để phân tích nhân tố khám phá là phải thỏa mãn các yêu cầu:
Hệ số tải nhân tố (Factor loading ) > 0.5
0.5 ≤ KMO ≤ 1: Hệ số KMO (Kaiser-Meyer-Olkin) là chỉ số được dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO lớn có ý nghĩa phân tích nhân tố là thích hợp.
Lỗi khi chạy EFA không hiện bảng KMO mặc dù có chọn: “This matrix is not positive definite” (như hình mô tả).
Lỗi này thường là do trong dữ liệu của các bạn có những biến (items) tương quan rất mạnh với nhau, có thể biến này là tổ hợp của các biến khác chẳng hạn. Và câu báo lỗi đưa ra của SPSS “This matrix is not positive definite” cũng chẳng ăn nhập gì với ND lỗi nên thường làm các bạn bối rối, khó hiểu Cách khắc phục là bạn tìm loại bớt các biến có tương quan mạnh với nhau như thế, vì đây gần như là có sự trùng lắp dữ liệu. Nếu bạn qua được bước này thì về sau bạn cũng sẽ đối mặt với vấn đề đa cộng tuyến khi chạy hồi quy áh. Bạn có thể chạy tương quan cho các biến này để tìm ra các biến có tương quan mạnh với nhau nhé
Một tranh cãi gần đây ở khoa mình (qua môn SPSS và môn Nghiên cứu marketing) rằng sẽ nên đánh giá độ tin cậy (bằng Cronbach alpha) trước hay phân tích nhân tố khám phá (EFA) trước.
Ở đây mình không khẳng định rằng quan điểm của thầy Q hay cô C là ai đúng hơn ai. Mình chỉ nêu ra những luận điểm của riêng mình, dẫn chứng qua những thứ mình đọc được. Tất cả bài viết nà ad xin trình bày quan điểm cá nhân và chỉ mang tính chất xây dựng thôi nhé!
– Về Cronbach alpha:
Là việc bạn đánh giá độ tin cậy của thang đo (cách tính cronbach alpha các bạn xem thêm sách của thầy Hoàng Trọng & Chu Nguyễn Mộng Ngọc), ở đây mình không đề cập sâu vấn đề công thức nhé. Ý nghĩa của việc đánh giá Cronbach alpha là xem xét xem thang đo đó có ĐO CÙNG MỘT KHÁI NIỆM hay không. Nói cách khác, trong một thang đo có chỉ số Cronbach alpha cao chứng tỏ những đáp viên được hỏi sẽ hiểu CÙNG MỘT KHÁI NIỆM. Và có câu trả lời đồng nhất – tương đương nhau – qua mỗi biến quan sát của thang đo.
– Về phân tích nhân tố khám phá (Exploit Factor Analysis – EFA):
Là việc bạn đánh giá giá trị hội tụ và giá trị phân biệt của thang đo (theo Nguyễn Đình Thọ – Phương pháp nghiên cứu trong kinh doanh – tr.364). Nói đơn giản, EFA giúp bạn sắp xếp lại thang đo thành nhiều tập (các biến thuộc cùng 1 tập là giá trị hội tụ, việc chia các tập khác nhau là giá trị phân biệt), hiểu nôm na thì các biến thuộc cùng một tập sẽ đo lường CÙNG MỘT KHÁI NIỆM. Nó dựa trên cơ sở sự tương quan giữa các biến với nhau.
Trong một thang đo các bạn đưa ra chắc chắn sẽ có sai số đo lường (do bảng câu hỏi, do phỏng vấn kém, do đáp viên, do ngoại cảnh,…). Và nếu có sai số do bảng câu hỏi thì thang đo có thể tạo thành các biến giả – biến giả ở đây là các biến đo lường cùng-một-khái-niệm nhưng khái niệm này không liên quan gì đến vấn đề đang nghiên cứu (không có trong mô hình).
Vậy thì trường hợp các bạn chạy phân tích nhân tố (EFA) trước, giả sử trong thang đo có 3-5 biến giả và được SPSS vô tình nhóm cùng một nhóm. Và lúc đó bạn sẽ phải đặt tên cho nhóm biến đó trong khi nó hoàn toàn không có giá trị cho bài nghiên cứu.
Sau đó bạn lại tiếp tục đánh giá Cronbach alpha cho những “nhân tố” đã được EFA sắp xếp lại. Vậy thì sau khi đã EFA, các nhân tố đo lường cùng một khái niệm đã được sắp xếp chung, các bạn đánh giá Cronbach alpha thì HIỂN NHIÊN nó sẽ ĐO LƯỜNG CÙNG KHÁI NIỆM và cho kết-quả-tốt thôi. Các bạn có thể kiểm chứng bằng cách cho chạy thử Cronbach alpha cho những “nhân tố” đã được EFA sắp xếp. Thì Cronbach alpha luôn cao, và sẽ KHÔNG có một biến nào mà khi delete có thể làm tăng Cronbach alpha được (có thể chênh lệch 1 chút nhưng sẽ không đáng để bạn loại biến đó ra).
Trong trường hợp kiểm định Cronbach alpha trước, vậy khi này thì Cronbach alpha có “ý nghĩa” gì? Mình xin trích lại nguyên văn 1 câu trong sách của thầy Thọ, mình khỏi phải giải thích cho cho mắc công, hehe: “Cronbach alpha phải được thực hiện trước để loại các biến rác (garbage items) trước khi thực hiện phân tích EFA. Quá trình này có thể giúp chúng ta tránh được các biến rác vì các biến rác này có thể tạo nên các nhân tố giả (artifical factors) khi phân tích EFA (Churchill 1979)” (Nguyễn Đình Thọ, Phương pháp nghiên cứu trong kinh doanh, tr.304).
Đây là toàn bộ lí do phải phân tích Cronbach alpha trước, khỏi giải thích thêm nhé!
Cronbach alpha bằng 5.8 < 6.0 hay 6.5 > 6.0 không quan trọng bằng việc nhân tố này có Ý NGHĨA quan trọng thế nào trong bài nghiên cứu. Vì khi thực hiện một bài nghiên cứu, chúng ta thường dựa trên các mô hình có sẵn (và đã được kiểm định rất nhiều bằng các chuyên gia). Nên chúng ta không thể chỉ căn cứ vào các con số đơn thuần từ bảng kết quả của SPSS để kết luận bỏ hay thêm một biến, 1 nhân tố. Dĩ nhiên điều này cũng phụ thuộc rất nhiều vào kinh nghiệm của nhà nghiên cứu.
Cuối bài viết, ad Luận Văn A-Z xin nhắc nhở 1 vấn đề nhỏ. Các công cụ như Cronbach alpha, EFA, CFA hay hồi quy, cuối cùng thì nó vẫn là một CÔNG CỤ. Mà công cụ là thứ vô tri, chúng ta tập trung quá nhiều vào các con số dẫn đến quên mất một thứ quan trọng, đó là Ý NGHĨA BÀI NGHIÊN CỨU. Vậy đó.
Trước khi kiểm định lý thuyết khoa học thì cần phải đánh giá độ tin cậy và giá trị của thang đo. Phương pháp Cronbach Alpha dùng để đánh giá độ tin cậy của thang đo. Còn phương pháp phân tích nhân tố khám phá EFA (Exploratory Factor Analysis, gọi tắt là phương pháp EFA) giúp chúng ta đánh giá hai loại giá trị quan trọng của thang đo là giá trị hội tụ và giá trị phân biệt.
Như các bạn đã biết khi phân tích nhân tố khám phá EFA (Exploratory Factor Analysis) thì ngoài việc phải đảm bảo “Giá trị hội tụ” (các items hội tụ về cùng 1 nhân tố) thì còn phải đảm bảo “Giá trị phân biệt” (thuộc về nhân tố này và phải phân biệt với nhân tố khác).
Như trong hình minh họa, khi 1 items load đồng thời cùng lúc lên 2 or nhiều nhân tố, để đảm bảo “giá trị phân biệt” thì các hệ số tải của cùng 1 items đó khi load lên các nhân tố phải chênh nhau 0.3 thì lúc đó bạn mới giữ lại item này và nó sẽ thuộc về nhân tố mà nó tải lên cao nhất (đương nhiên là phải thỏa điều kiện hệ số tải >0.5).
Trường hợp ngược lại thì bạn cân nhắc loại item này vì nó không thỏa việc đảm bảo “giá trị phân biệt”.
Lưu ý: khi có nhiều items vi phạm các điều kiện khi chạy phân tích EFA thì nguyên tắc là bạn sẽ loại từng item một, item nào xấu nhất sẽ bị loại trước.
Các bạn có thể tham khảo nguồn như sau nhé: “Tại mỗi Item, chênh lệch |Factor Loading| lớn nhất và |Factor Loading| bất kỳ phải >=0.3 (Jabnoun & Al-Tamimi, 2003)”
Trước khi kiểm định lý thuyết khoa học thì cần phải đánh giá độ tin cậy và giá trị của thang đo. Phương pháp Cronbach Alpha dùng để đánh giá độ tin cậy của thang đo. Còn phương pháp phân tích nhân tố khám phá EFA (Exploratory Factor Analysis, gọi tắt là phương pháp EFA) giúp chúng ta đánh giá hai loại giá trị quan trọng của thang đo là giá trị hội tụ và giá trị phân biệt.
Phương pháp phân tích nhân tố EFA thuộc nhóm phân tích đa biến phụ thuộc lẫn nhau (interdependence techniques), nghĩa là không có biến phụ thuộc và biến độc lập mà nó dựa vào mối tương quan giữa các biến với nhau (interrelationships). EFA dùng để rút gọn một tập k biến quan sát thành một tập F (F<k) các nhân tố có ý nghĩa hơn.
Cơ sở của việc rút gọn này dựa vào mối quan hệ tuyến tính của các nhân tố với các biến nguyên thủy (biến quan sát). Các tác giả Mayers, L.S., Gamst, G., Guarino A.J. (2000) đề cập rằng: Trong phân tích nhân tố, phương pháp trích Pricipal Components Analysis đi cùng với phép xoay Varimax là cách thức được sử dụng phổ biến nhất.
Theo Hair & ctg (1998, 111), Factor loading (hệ số tải nhân tố hay trọng số nhân tố) là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA:
• Factor loading > 0.3 được xem là đạt mức tối thiểu
• Factor loading > 0.4 được xem là quan trọng
• Factor loading > 0.5 được xem là có ý nghĩa thực tiễn
Điều kiện để phân tích nhân tố khám phá là phải thỏa mãn các yêu cầu:
Hệ số tải nhân tố (Factor loading ) > 0.5 0.5 ≤ KMO ≤ 1:
Hệ số KMO (Kaiser-Meyer-Olkin) là chỉ số được dùng để xem xét sự thích hợp của phân tích nhân tố.
Trị số KMO lớn có ý nghĩa phân tích nhân tố là thích hợp.
Kiểm định Bartlett có ý nghĩa thống kê (Sig. < 0.05): Đây là một đại lượng thống kê dùng để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig. < 0.05) thì các biến quan sát có mối tương quan với nhau trong tổng thể.
Phần trăm phương sai toàn bộ (Percentage of variance) > 50%: Thể hiện phần trăm biến thiên của các biến quan sát. Nghĩa là xem biến thiên là 100% thì giá trị này cho biết phân tích nhân tố giải thích được bao nhiêu %.