Dữ liệu từ đề cập đến thông tin được thu thập và ghi lại. Nó có thể ở dạng số, từ, số đo và nhiều hơn nữa.
Có hai loại dữ liệu và đây là dữ liệu định tính và dữ liệu định lượng. Sự khác biệt giữa hai loại dữ liệu là dữ liệu định lượng được sử dụng để mô tả thông tin bằng số. Ví dụ, phép đo nhiệt độ sẽ thuộc loại dữ liệu này.
Mặt khác, dữ liệu định tính được sử dụng để mô tả thông tin bằng từ ngữ. Sau khi thu thập dữ liệu, nó cần phải được tổ chức do đó cần tách dữ liệu được nhóm khỏi dữ liệu chưa được nhóm. Cả hai đều là dạng dữ liệu hữu ích nhưng sự khác biệt giữa chúng là dữ liệu chưa được nhóm là dữ liệu thô. Điều này có nghĩa là nó vừa được thu thập nhưng không được sắp xếp vào bất kỳ nhóm hoặc lớp nào. Mặt khác, dữ liệu được nhóm là dữ liệu được tổ chức thành các nhóm từ dữ liệu thô.
Như đã đề cập ở trên, dữ liệu được nhóm là loại dữ liệu được phân loại thành các nhóm sau khi thu thập. Dữ liệu thô được phân loại thành các nhóm khác nhau và một bảng được tạo. Mục đích chính của bảng là hiển thị các điểm dữ liệu xảy ra trong mỗi nhóm. Chẳng hạn, khi kiểm tra xong, kết quả là dữ liệu trong kịch bản này và có nhiều cách để nhóm dữ liệu này. Ví dụ, số lượng học sinh đạt điểm trên mỗi 20 điểm có thể được ghi lại.
Ngoài ra, các lớp có thể được sử dụng. Ví dụ: 90-100 cho đến F 0-59 với mỗi danh mục cho biết có bao nhiêu học sinh trong mỗi thể loại. Biểu đồ và bảng tần số được sử dụng tốt nhất để hiển thị và giải thích dữ liệu được nhóm. Đây là một ví dụ
Nhóm dữ liệu có các ưu điểm sau:
Dữ liệu được nhóm lại, còn được gọi là dữ liệu thô là dữ liệu chưa được đặt trong bất kỳ nhóm hoặc danh mục nào sau khi thu thập. Dữ liệu được phân loại theo số lượng hoặc đặc điểm, do đó, dữ liệu chưa được đặt trong bất kỳ danh mục nào sẽ không được nhóm lại. Ví dụ: khi tiến hành điều tra dân số và bạn muốn phân tích có bao nhiêu phụ nữ trên 45 tuổi ở một khu vực cụ thể, trước tiên bạn cần biết có bao nhiêu người cư trú trong khu vực đó.
Số lượng cá nhân cư trú trong khu vực đó là dữ liệu chưa được nhóm hoặc thông tin thô vì không có gì được phân loại. Do đó, chúng tôi có thể kết luận rằng dữ liệu chưa được nhóm là dữ liệu được sử dụng để hiển thị thông tin về một thành viên riêng lẻ của một mẫu hoặc dân số.
Một số ưu điểm của dữ liệu chưa được nhóm như sau;
Dữ liệu được nhóm là dữ liệu đã được tổ chức trong các lớp sau khi phân tích. Các ví dụ bao gồm có bao nhiêu bao ngô thu được trong mùa mưa là xấu. Mặt khác, dữ liệu chưa được nhóm là dữ liệu không thuộc bất kỳ nhóm nào. Nó vẫn là dữ liệu thô.
Khi thu thập dữ liệu, dữ liệu chưa được nhóm được ưu tiên vì thông tin vẫn ở dạng ban đầu. Nó đã không bị giả mạo bằng cách phân loại hoặc phân chia. Tuy nhiên, khi phân tích nó và vẽ biểu đồ, dữ liệu được nhóm được ưu tiên vì nó đơn giản để giải thích.
Khi tính toán phương tiện của dữ liệu được nhóm và chưa được nhóm, sẽ có một biến thể. Giá trị trung bình của dữ liệu được nhóm được ưa thích vì nó chính xác hơn so với giá trị trung bình của dữ liệu chưa được nhóm. Giá trị trung bình của dữ liệu chưa được nhóm có thể dẫn đến thao tác sai trung vị do đó nó được coi là không hiệu quả trong hầu hết các trường hợp.
Các bảng tần suất được sử dụng để hiển thị thông tin của dữ liệu được nhóm trong khi đó trong trường hợp dữ liệu chưa được nhóm, thông tin sẽ xuất hiện như một danh sách lớn các số. Điều này là do thực tế là thông tin vẫn còn nguyên.
Dữ liệu được nhóm là dữ liệu được tổ chức thành phân phối tần số trong khi dữ liệu chưa được nhóm chưa được tóm tắt theo bất kỳ cách nào.