Sự khác biệt giữa phân loại và hồi quy

Các sự khác biệt chính giữa phân loại và cây hồi quy là trong phân loại các biến phụ thuộc là phân loại và không có thứ tự trong khi hồi quy các biến phụ thuộc là liên tục hoặc được sắp xếp toàn bộ giá trị.

Phân loại và hồi quy là các kỹ thuật học tập để tạo ra các mô hình dự đoán từ dữ liệu được thu thập. Cả hai kỹ thuật được trình bày bằng đồ họa dưới dạng cây phân loại và hồi quy, hay đúng hơn là sơ đồ khối với sự phân chia dữ liệu sau mỗi bước, hay nói đúng hơn là nhánh nhánh Hồi trong cây. Quá trình này được gọi là phân vùng đệ quy. Các lĩnh vực như Khai thác sử dụng các kỹ thuật học phân loại và hồi quy. Bài viết này tập trung vào cây Phân loại và cây hồi quy.

NỘI DUNG

1. Tổng quan và sự khác biệt chính
2. Phân loại là gì
3. Hồi quy là gì
4. So sánh cạnh nhau - Phân loại so với hồi quy ở dạng bảng
5. Tóm tắt

Phân loại là gì?

Phân loại là một kỹ thuật được sử dụng để đi đến một sơ đồ cho thấy việc tổ chức dữ liệu bắt đầu bằng một biến tiền thân. Các biến phụ thuộc là những gì phân loại dữ liệu.

Hình 01: Khai thác dữ liệu

Cây phân loại bắt đầu với biến độc lập, phân nhánh thành hai nhóm được xác định bởi các biến phụ thuộc hiện có. Nó có nghĩa là làm sáng tỏ các câu trả lời dưới dạng phân loại do các biến phụ thuộc mang lại.

Hồi quy là gì

Hồi quy là một phương pháp dự đoán dựa trên giá trị đầu ra số giả định hoặc đã biết. Giá trị đầu ra này là kết quả của một loạt phân vùng đệ quy, với mỗi bước có một giá trị số và một nhóm biến phụ thuộc khác phân nhánh sang một cặp khác như thế này.

Cây hồi quy bắt đầu bằng một hoặc nhiều biến tiền thân và kết thúc bằng một biến đầu ra cuối cùng. Các biến phụ thuộc là biến số liên tục hoặc rời rạc.

Sự khác biệt giữa phân loại và hồi quy là gì?

 Phân loại so với hồi quy

Một mô hình cây trong đó biến mục tiêu có thể lấy một tập các giá trị rời rạc. Một mô hình cây trong đó biến mục tiêu có thể lấy các giá trị liên tục thường là số thực.
Biến phụ thuộc
Đối với cây phân loại, các biến phụ thuộc là phân loại. Đối với cây hồi quy, các biến phụ thuộc là số.
Giá trị
Có một lượng giá trị không được sắp xếp. Có các giá trị rời rạc chưa được đặt hàng hoặc các giá trị rời rạc.
Mục đích xây dựng
Mục đích của việc xây dựng cây hồi quy là để phù hợp với hệ thống hồi quy cho từng nhánh xác định theo cách mà giá trị đầu ra dự kiến ​​xuất hiện. Một cây phân loại được xác định bởi một biến phụ thuộc xuất phát từ nút trước đó.

Tóm tắt - Phân loại so với hồi quy

Cây hồi quy và phân loại là các kỹ thuật hữu ích để vạch ra quá trình chỉ ra một kết quả được nghiên cứu, cho dù trong phân loại hoặc một giá trị số duy nhất. Sự khác biệt giữa cây phân loại và cây hồi quy là biến phụ thuộc của chúng. Cây phân loại có các biến phụ thuộc là phân loại và không có thứ tự. Cây hồi quy có các biến phụ thuộc là các giá trị liên tục hoặc được sắp xếp toàn bộ giá trị.

Tài liệu tham khảo:

1. Học quyết định học cây. Wikipedia, Wikimedia Foundation, ngày 13 tháng 5 năm 2018. Có sẵn tại đây 

Hình ảnh lịch sự:

1.'Data Mining'By Arbeck - Công việc riêng, (CC BY 3.0) qua Commons Wikimedia