Các loại dữ liệu trong thống kê - Các loại dữ liệu danh nghĩa, thứ tự, khoảng thời gian và tỷ lệ được giải thích với các ví dụ

Nếu bạn đang ôn thi cho kỳ thi thống kê và cần xem lại các loại dữ liệu của mình, bài viết này sẽ cung cấp cho bạn một cái nhìn tổng quan ngắn gọn với một số ví dụ đơn giản.

Bởi vì hãy đối mặt với nó: không có nhiều người nghiên cứu các loại dữ liệu để giải trí hoặc trong cuộc sống thực hàng ngày của họ.

Vì vậy, chúng ta hãy đi sâu vào.

Dữ liệu định lượng và định tính - sự khác biệt là gì?

Tóm lại: định lượng có nghĩa là bạn có thể đếm nó và nó là số (nghĩ là số lượng - thứ bạn có thể đếm được). Định tính có nghĩa là bạn không thể, và nó không phải là số (hãy nghĩ về chất lượng - thay vào đó là dữ liệu phân loại).

Bùm! Đơn giản, phải không?

Có một điểm phân biệt nữa mà chúng ta nên hiểu ngay trước khi chuyển sang các kiểu dữ liệu thực tế và nó liên quan đến dữ liệu định lượng (số): dữ liệu rời rạc và liên tục.

Dữ liệu rời rạc liên quan đến các số nguyên (số nguyên - như 1, 356 hoặc 9) không thể phân chia dựa trên bản chất của chúng.

Giống như số người trong một lớp học, số ngón tay trên bàn tay của bạn hoặc số trẻ em mà một người nào đó có. Bạn không thể có 1,9 con trong một gia đình (mặc dù điều tra dân số có thể nói gì).

Mặt khác, dữ liệu liên tục thì ngược lại. Nó có thể được chia nhiều như bạn muốn và đo đến nhiều chữ số thập phân.

Như trọng lượng của một chiếc ô tô (có thể được tính đến nhiều chữ số thập phân), nhiệt độ (32,543 độ, v.v.) hoặc tốc độ của máy bay.

Bây giờ cho các công cụ thú vị.

Các kiểu dữ liệu định tính

Dữ liệu ẩn danh

Dữ liệu danh nghĩa được sử dụng để gắn nhãn các biến mà không có bất kỳ giá trị định lượng nào. Các ví dụ phổ biến bao gồm nam / nữ (mặc dù hơi lỗi thời), màu tóc, quốc tịch, tên người, v.v.

Trong tiếng Anh đơn giản: về cơ bản, chúng là nhãn (và danh nghĩa xuất phát từ "tên" để giúp bạn ghi nhớ). Bạn có mái tóc nâu (hoặc mắt nâu) . Bạn là người Mỹ . Tên bạn là Jane .

Ví dụ:

Bạn có mái tóc màu gì?

  • nâu
  • Vàng
  • Đen
  • Cầu vồng kỳ lân

Quốc tịch của bạn là gì?

  • Người Mỹ
  • tiếng Đức
  • Người Kenya
  • tiếng Nhật

Lưu ý rằng các biến này không trùng lặp. Vì mục đích thống kê, bạn không thể có cả mái tóc màu nâu và màu cầu vồng. Và chúng chỉ thực sự liên quan theo danh mục chính mà chúng là một bộ phận.

Dữ liệu thông thường

Chìa khóa với dữ liệu thứ tự là nhớ rằng thứ tự nghe giống như thứ tự - và thứ tự của các biến mới là điều quan trọng. Không có quá nhiều sự khác biệt giữa các giá trị đó.

Thang đo thứ tự thường được sử dụng để đo mức độ hài lòng, hạnh phúc, v.v. Bạn đã bao giờ thực hiện một trong những cuộc khảo sát như thế này chưa?

"Bạn có thể giới thiệu dịch vụ của chúng tôi cho bạn bè của mình như thế nào?"

  • Rất có khả năng
  • Có khả năng
  • Trung tính
  • Không có khả năng
  • Rất khó

Hãy xem, chúng tôi thực sự không biết sự khác biệt giữa rất khó xảy ra và không chắc - hoặc nếu nó có cùng mức độ khả năng xảy ra (hoặc không có khả năng xảy ra) như giữa khả năng và rất có thể. Nhưng không sao. Chúng ta chỉ biết rằng khả năng xảy ra nhiều hơn trung lập và khó xảy ra hơn là rất khó xảy ra. Tất cả đều theo thứ tự.

Các kiểu dữ liệu định lượng

Dữ liệu khoảng thời gian

Dữ liệu khoảng thời gian rất thú vị (và hữu ích) vì nó liên quan đến cả thứ tự sự khác biệt giữa các biến của bạn. Điều này cho phép bạn đo lường độ lệch chuẩn và xu hướng trung tâm.

Ví dụ yêu thích của mọi người về dữ liệu khoảng thời gian là nhiệt độ tính bằng độ C. 20 độ C ấm hơn 10 độ, và chênh lệch giữa 20 độ và 10 độ là 10 độ. Sự khác biệt giữa 10 và 0 cũng là 10 độ.

Nếu bạn cần trợ giúp để nhớ thang đo khoảng là gì, chỉ cần nghĩ về ý nghĩa của khoảng: khoảng cách giữa . Vì vậy, bạn không chỉ quan tâm đến thứ tự của các biến mà còn quan tâm đến các giá trị ở giữa chúng.

Tuy nhiên, có một vấn đề nhỏ với khoảng thời gian: không có "số 0 đúng". Một số 0 thực sự không có giá trị - không có điều đó - nhưng 0 độ C chắc chắn có một giá trị: nó khá lạnh. Bạn cũng có thể có số âm.

Nếu bạn không có số 0 thực sự, bạn không thể tính toán các tỷ lệ. Điều này có nghĩa là phép cộng và phép trừ hoạt động, nhưng phép chia và phép nhân thì không.

Dữ liệu tỷ lệ

Ơn trời có dữ liệu tỷ lệ. Nó giải quyết tất cả các vấn đề của chúng tôi.

Dữ liệu tỷ lệ cho chúng ta biết về thứ tự của các biến, sự khác biệt giữa chúng và chúng có độ không tuyệt đối. Điều này cho phép thực hiện và rút ra tất cả các loại phép tính và suy luận.

Dữ liệu tỷ lệ là dữ liệu khoảng thời gian rất giống nhau, ngoại trừ số 0 có nghĩa là không có. Đối với dữ liệu tỷ lệ, không thể có giá trị âm.

Ví dụ, chiều cao là dữ liệu tỷ lệ. Không thể có chiều cao âm. Nếu chiều cao của một đối tượng bằng 0, thì không có đối tượng nào. Điều này khác với một cái gì đó như nhiệt độ. Cả 0 độ và -5 độ đều là nhiệt độ hoàn toàn hợp lệ và có ý nghĩa.

Bây giờ bạn đã có cách xử lý cơ bản về các loại dữ liệu này, bạn nên sẵn sàng hơn một chút để giải quyết bài kiểm tra thống kê đó.