- Mở một tập tin dữ liệu đã được lưu bằng định dạng SPSS
- Nhập số liệu bằng tay vào trình soạn thảo dữ liệu của SPSS
- Đọc tập tin dữ liệu vào SPSS từ nguồn khác như database, text data file, Excel, SAS hoặc STATA
Mở một tâp tin được lưu bằng định dạng SPSS là đơn giản, giả sử chúng ta cần thống kê độ tuổi của người trả lời trong một nghiên cứu. Dữ liệu này được lưu dưới dạng SPSS với tên data_tonghop, chúng ta mở tập tin này bằng SPSS như sau: Mở chương trình SPSS vào FILE/OPEN/DATA tại “Files of Type” chọn “SPSS (*.sav)” và đi đến nơi lưu file data_tonghop và click open.
Nhập số liệu trực tiếp trên SPSS
Ví dụ 1: Chúng ta có số liệu về độ tuổi và trình độ học vấn của 10 người tham gia khảo sát như Bảng 1, và muốn nhập vào SPSS Bảng 1: Số liệu Ví dụ 1STT | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Độ tuổi | 26 | 43 | 35 | 42 | 30 | 25 | 35 | 44 | 36 | 32 |
Trình độ học vấn | Cao đẳng | Tiến sĩ | Thạc sĩ | Thạc sĩ | Đại học | Cao đẳng | Đại học | Tiến sĩ | Đại học | Thạc sĩ |
Tên biến | Độ tuổi | Trình độ học vấn | Cao đẳng | Đại học | Thạc sĩ | Tiến sĩ |
Mã | TUOI | HOCVAN | 1 | 2 | 3 | 4 |
Mỗi cột trong cửa sổ Variable View có một mặc định thông dụng, nếu chúng ta không định nghĩa lại tương ứng với biến thì SPSS sẽ sử dụng lựa chọn mặc định. Tuy nhiên khi nhập liệu và phân tích chúng ta sẽ không thực hiện được những gì mình muốn, vì vậy hãy xem qua tất cả các cột trong cửa sổ Variable View này, các cột được giới thiệu chi tiết bên dưới. 1. Name Cột đầu tiên của Sheet Variable View là Name ở cột này chúng ta đặt mã cho tên biến chỉ cần click vào ô và đặt tên, ở ví dụ này chúng ta có 2 biến độ tuổi và trình độ học vấn, theo bảng mã ở Bảng 2 trên trong SPSS chúng ta có 2 biến TUOI và HOCVAN. Một mô tả dài hơn của biến được thực hiện ở cột Label, chúng ta sẽ bàn ở bên dưới cột này. Ở cột Name chúng ta có thể gõ tên mã dài hơn để dễ hình dung nhất về biến, nhưng không quá dài cố gắng trong khoản 8 ký tự bởi vì tên này sẽ được sử dụng trong các phân tích cũng như biểu đồ. Tên quá dài thì đầu ra phân tích sẽ bị cắt ngắn. Nếu chúng ta đặt tên biến quá dài hoặc sai chính tả, chúng ta có thể mở cửa sổ Variable View để chỉnh sửa lại. Một trong những tiện ích của SPSS là chúng ta chỉnh sửa lại những sai lầm một cách nhanh chóng. Dưới đây là một số gợi ý hữu ích khi chúng ta đặt tên biến:
- Trong SPSS chúng ta có thể sử dụng các ký tự đặt biệt để đặt tên như @, #, $, gạch chân (_) và chữ số.
- Tên nên bắt đầu bằng một ký tự, hoa hoặc thường.
- Không thể có khoản trắng trong một tên
Chúng ta có thể chọn các kiểu cho biến khi mã trong SPSS như sau:
- Numeric: Kiểu số. Các giá trị được nhập vào và hiển thị ở dạng chữ số, có hoặc không có dẫu ngăn cách hàng thập phân. Giá trị được định dạng theo tiêu chuẩn khoa học, với E được gắn vào để đại diện cho số mũ. Giá trị ở ô Width là tổng số của tất cả các ký tự trong một số, bao gồm tất cả ký tự ngăn cách hàng thập phân cũng như chỉ số mũ. Số lượng chữ số hàng thập phân được xác định ở ô Decimal Places, không bao gồm số mũ.
- Comma: Kiểu này chỉ rõ những giá trị số với những dấu phẩy (,) được chèn vào giữa những nhóm ba chữ số để thuận tiện phân biệt chữ số hàng chục, trăm, nghìn…Chúng ta có thể nhập dữ liệu mà không cần chèn dấu phẩy nhưng SPSS sẽ chèn vào khi hiển thị giá trị. Ở hàng thập phân, cho dù có hơn ba chữ số nhưng vẫn không có dấu phẩy ngăn cách. Ví dụ 1000000,555555 = 1,000,000.555555
- Dot: Giống như kiểu Comma, nhưng ở đâu dấu ngăn cách giữa những nhóm ba chữ số là dấu chấm (.) và dấu phẩy được dùng cho chữ số hàng thập phân. Ví dụ 1000000,555555 = 1.000.000,555555
- Scientific Notation: Biến số mà dùng ký tự E để hiển thị chữ số mũ. Cơ số được viết biên trái chữ E, có hoặc không có hàng thập phân. Số mũ được viết bên phải chữ E, có hoặc không có hàng thập phân, cho biết mười mũ bao nhiêu sau đó nhân với cơ số. Bạn có thể nhập D hoặc E để đánh dấu số mũ nhưng SPSS luôn luôn sử dụng E. Ví dụ số 2,014 được viết như 2.014E3, chẳng hạn số 0.0005 được việt như 5E-4
- Date: Một biến có thể bao gồm năm, tháng, ngày, giờ, phút, giây. Khi chúng ta chọn Date các định dạng có sẵn xuất hiện bên trái hộp thoại như Hình 3. Chọn định dạng phù hợp nhất với kiểu dữ liệu nhập vào. Lựa chọn của chúng ta sẽ quyết định cách hiển thị dữ liệu trong SPSS. Định dạng này cũng xác định phạm vi và hình thức để chúng ta nhập liệu vào. Chúng ta có thể nhập liệu sử dụng dấu gạch ngang (-) dấu gạch chéo (/) dấu chấm (.) dấu cách hoặc ký tự khác để phân biệt ngày tháng năm, giờ phút giây. Ví dụ, nếu chọn định dạng mà năm chỉ có 2 chữ số, khi nhập vào SPSS sẽ chấp nhận hiển thị năm theo cách đó, tuy nhiên nó sẽ sử dụng bốn chữ số để tính toán. Hai chữ số đầu tiên của năm nó sẽ lấy theo cấu hình mà chúng ta phải thiết lập bằng cách vào Edit ➪Options sau đó vào thẻ Data để thực hiện
- Dollar: Khi chọn Dollar các lựa chọn định dạng có sẵn xuất hiện trong danh sách bên phải của hộp thoại. Giá trị của số liệu luôn được hiển thị với một dấu dollar ($) đằng trước, dấu chấm ngăn cách hàng thập phân và dấu phẩy cho các giá trị lớn ngăn cách nhóm ba chữ số với nhau. Chọn định dạng, độ rộng và số chữ số hàng thập phân như Hình 4. Các lựa chọn định dạng là tương tự nhau, quan trọng là chúng ta chọn một trong các định dạng đó tương thích với định nghĩa biến của mình để thuận tiện trong việc in ấn cũng như hiển thị giá trị tiền tiện trong các bảng đầu ra của phần mềm SPSS. Như vậy khi nhập số liệu chúng ta không cần phải nhập ký tự dollar ($) và dấu chấm, phẩy, SPSS sẽ tự động chèn các ký tự này vào dữ liệu
- Custom Currency: Năm định dạng tùy chỉnh cho tiền tệ được đặt tên CCA, CCB, CCC, CCD, và CCE, như thể hiện trong Hình 5. Chúng ta có thể xem và tuỳ chỉnh định dạng này bằng cách vào Edit➪Options sau đó chọn thẻ Currency. Chúng ta có thể sửa định dạng tuỳ chỉnh bất kỳ khi nào mà không sợ làm thay đổi số liệu khi nhập vào SPSS. Cũng như định dạng Dollar thiết lập width và Decimal Places để thuận tiện việc in ấn cũng như xuất kết quả SPSS
- String: Định dạng kiểu ký tự không phải số. Bởi vì định dạng này là chuỗi ký tự nên nó không dùng để tính toán. Kiểu định dạng này không giới hạn số ký tự nhập vào, chúng ta sử dụng định dạng kiểu này cho biến mô tả hoặc định danh của một trường hợp cụ thể.
- Restricted Numeric (integer with leading zeros): Giống định dạng kiểu Numeric tuy nhiên số chữ số được hiển thị trên SPSS là bằng nhau, số chữ số hiển thị được khai báo ở ô width. Những số liệu nhập vào mà ít hơn số ký tự được hiển thị nhập vào thì SPSS mặc định thêm vào chữ số 0 đằng trước đến khi đủ số ký tự như khai báo.
- Bỏ qua lựa chọn này và chấp nhận mặc định sẵn có của SPSS (hoặc số mà chúng ta đã khai trước đó trong mục Type)
- Nhập một giá trị nào đó cho độ rộng của biến
- Sử dụng dấu mũi tên hướng lên hoặc xuống để lựa chọn một giá trị cho độ rộng của biến
- Bỏ qua lựa chọn này và chấp nhận mặc định sẵn có của SPSS (hoặc số mà chúng ta đã khai trước đó trong mục Type)
- Nhập một giá trị nào đó cho độ rộng của biến
- Sử dụng dấu mũi tên hướng lên hoặc xuống để lựa chọn một giá trị cho độ rộng của biến
Thông thường, bạn sẽ gán mã cho các lựa chọn của biến, ví dụ với biến giới tính thì giá trị 1 gán nhãn Nam, giá trị 2 gán nhãn Nữ hoặc với biến sở thích giá trị 1 gán nhãn không thích, giá trị 2 gán nhãn bình thường và giá trị 3 gán nhãn thích. Nếu chúng ta đã xác định nhãn ở đây thì khi SPSS xuất kết quả phân tích, nó sẽ hiển thị các nhãn thay vì giá trị Để định nghĩa một nhãn cho một giá trị ta làm như sau:
- Trong hộp Value, ta nhập giá trị
- Trong hộp Label, ta nhập vào nhãn
- Click nút Add
- Chọn định nghĩa cần thay đổi hoặc loại bỏ
- Click nút Remove để loại bỏ định nghĩa
- Trường hợp thay đổi định nghĩa thì sau bước 4, chúng ta thay đổi giá trị hoặc nhãn mới sau đó click nút Change để thay đổi định nghĩa
Ở Ví dụ 1 chúng ta có biến hỏi về trình độ học vấn có những người được điều tra vì lý do tế nhị nào đó đã từ chối trả lời biến hỏi này, biến này sẽ không có giá trị. Tuy nhiên, chúng ta có thể chỉ định một giá trị để thay thế khoảng trống này, có lẽ 0 là một lựa chọn phù hợp, giá trị thay thế sẽ không mang ý nghĩa để tính toán. Chúng ta cần khai báo Missing để mỗi khi cần tính toán cho biến, ví dụ như tính tần số chẳng hạn thì SPSS sẽ loại giá trị khuyết này ra khi tính phần trăm hợp lệ. Cách gán giá trị cho các Missing value là tuỳ tình hình và sự lụa chọn của người xử lý. Ví dụ nếu đặt Missing value cho biến độ tuổi mà ta chọn số 99 sẽ gây nhầm lẫn nếu cuộc điều tra có thể có những người đạt 99 tuổi hoặc hơn nữa, với tình huống này ta nên đặt là 999 hay 888. Trong SPSS chúng ta có thể chỉ định tối đa ba giá trị cụ thể (hay gọi là giá trị rời rạc) để đại diện cho dữ liệu bị mất, hoặc cũng có thể chỉ rõ phạm vi của giá trị nằm trong khoản nào của dãy số cộng với một giá trị riêng biệt tất cả khoản giá trị và một giá trị riêng biệt này sẽ được gán là Missing. Ngoài ra có một loại giá trị khuyết nữa là System Missing, đó là giá trị khuyết của hệ thống, nó được chương trình tự động đặt dấu chấm (.) ở những vị trí không được nhập giá trị. Giá trị System Missing này “vô hình” đối với các lệnh xử lý thống kê của phần mềm SPSS
8. Columns Columns là nơi khai báo độ rộng của cột biến khi ta nhập liệu. Để xác định độ rộng của cột ta chọn vào ô và nhập số, thông thường chọn là 8
9. Align Xác định vị trí của dữ liệu được nhập trong cột, dữ liệu được canh trái, canh phải hoặc canh giữa của cột. Khi chúng ta bấm chọn vào ô Align, một danh sách xuất hiện và chúng ta chọn một trong ba khả năng hiển thị. Canh trái (Left) nghĩa là số liệu nằm phía bên trái của cột, canh phải (Right) nghĩa là số liệu nằm phía bên phải của cột, canh giữa (Center) nghĩa là giữ liệu nằm chính giữa của cột.
10. Measure Giá trị chúng ta chọn ở đây khai báo thang đo đo thể hiện dữ liệu với ba loại chính là Scale (gồm cả Interval và Ratio tức thang đo khoảng cách và tỉ lệ), Ordinary (thang đo thứ bậc), Norminal (thang đo danh nghĩa). Khi bấm chọn ô Measure chúng ta chọn một trong các lựa chọn như Hình 9
Scale: thang đo định lượng nó có thể là khoản cách, trọng lượng, tuổi tác, mức độ hài lòng… Trong SPSS thang đo Scale này bao gồm thang đo khoảng – Interval và thang đo tỉ lệ – Ratio. Ordinal: thang đo thứ bậc những con số trong thang đo này xác định vị trí (thứ tự) của cái gì đó trong một danh sách chọn lựa. Ví dụ đầu tiên, thứ hai, thứ ba Nominal: Thang đo danh nghĩa (còn gọi là thang đo định danh hoặc thang đo phân loại) trong thang đo này các con số dùng để phân loại các đối tượng, chúng không mang ý nghĩa nào khác. Ví dụ các phân loại giới tính, quốc tịch, dân tộc…
Bước 2: Nhập số liệu Sau khi thực hiện xong bước 1 – khai báo tất cả các biến vào SPSS ở sheet Variable View, chúng ta chuyển qua làm việc ở sheet Data View để tiến hành nhập liệu. Thực hiện việc chuyển đổi sheet làm việc này bằng cách click chuột vào thẻ Data View ở dưới cùng bên trái của màn hình SPSS. Khi đó màn hình Data View xuất hiện. Màn hình Data View sau khi khai báo biến cho Ví dụ 1 như Hình 11, hàng ở trên cùng là những tên biến đã mã hoá, chúng ta click vào các ô này để chuyển sang Variable View để xem định dạng cũng như kiểu mã khi nhập liệu cho từng biến. Cuối cùng chúng ta tiến hành nhập số liệu vào SPSS cho từng biến
Sau khi chúng ta nhập được vài số liệu, phải lưu dữ liệu chúng ta vào một tập tin thực hiện bằng cách chọn File ➪Save As chọn nơi lưu dữ liệu và bấn save. Trong suốt quá trình nhập liệu chúng ta chỉ cần chọn File ➪Save để lưu những thao tác trước đó tránh trường hợp máy bị treo hoặc cúp điện đột ngột.
Nguồn bài viết của Thầy Ngô Thông https://ngothong.wordpress.com/2015/10/10/bai-1-khai-bao-va-nhap-lieu-tren-spss/
Trung tâm Hỗ trợ nghiên cứu
Xin vui lòng chú ý một số điều sau
- Các bạn có thể bình luận với tài khoản Google, tài khoản tùy chọn (tên, địa chỉ) hoặc ẩn danh
- Nếu thực sự quan tâm một chủ đề nào đó, khi bình luận xong hãy nhân vào nút "Thông báo cho tôi" ở góc dưới. Khi đó nếu có các bình luận và thảo luận mới về chủ đề này sẽ có thông báo gửi đến email của bạn
- Nếu cần hỗ trợ, hãy để lại số điện thoại. Nên chủ động gửi tài lệu về Hỗ Trợ Nghiên Cứu
- Các bình luận spam, có lời lẽ không phù hợp sẽ bị chặn
0 nhận xét:
Đăng nhận xét