Hồi quy tuyến tính và logistic
Trong phân tích thống kê, điều quan trọng là xác định mối quan hệ giữa các biến liên quan đến nghiên cứu. Đôi khi nó có thể là mục đích duy nhất của chính phân tích. Một công cụ mạnh được sử dụng để thiết lập sự tồn tại của mối quan hệ và xác định mối quan hệ là phân tích hồi quy.
Hình thức phân tích hồi quy đơn giản nhất là hồi quy tuyến tính, trong đó mối quan hệ giữa các biến là mối quan hệ tuyến tính. Theo thuật ngữ thống kê, nó đưa ra mối quan hệ giữa biến giải thích và biến trả lời. Ví dụ: sử dụng hồi quy, chúng ta có thể thiết lập mối quan hệ giữa giá hàng hóa và mức tiêu thụ dựa trên dữ liệu được thu thập từ một mẫu ngẫu nhiên. Phân tích hồi quy sẽ tạo ra hàm hồi quy của tập dữ liệu, đây là mô hình toán học phù hợp nhất với dữ liệu có sẵn. Điều này có thể dễ dàng được đại diện bởi một âm mưu phân tán. Hồi quy đồ họa tương đương với việc tìm đường cong phù hợp nhất cho tập dữ liệu đã cho. Hàm của đường cong là hàm hồi quy. Sử dụng mô hình toán học, việc sử dụng hàng hóa có thể được dự đoán với một mức giá nhất định.
Do đó, phân tích hồi quy được sử dụng rộng rãi trong dự đoán và dự báo. Nó cũng được sử dụng để thiết lập các mối quan hệ trong dữ liệu thực nghiệm, trong các lĩnh vực vật lý, hóa học và trong nhiều ngành khoa học tự nhiên và kỹ thuật. Nếu mối quan hệ hoặc hàm hồi quy là một hàm tuyến tính, thì quá trình này được gọi là hồi quy tuyến tính. Trong biểu đồ phân tán, nó có thể được biểu diễn dưới dạng một đường thẳng. Nếu hàm không phải là tổ hợp tuyến tính của các tham số, thì hồi quy là phi tuyến tính.
Hồi quy logistic có thể so sánh với hồi quy đa biến và nó tạo ra một mô hình để giải thích tác động của nhiều yếu tố dự đoán đến một biến phản ứng. Tuy nhiên, trong hồi quy logistic, biến kết quả cuối cùng phải được phân loại (thường được chia; nghĩa là, một cặp kết quả có thể đạt được, như cái chết hoặc sự sống sót, mặc dù các kỹ thuật đặc biệt cho phép mô hình hóa nhiều thông tin hơn). Một biến kết quả liên tục có thể được chuyển thành biến phân loại, được sử dụng cho hồi quy hậu cần; tuy nhiên, thu gọn các biến liên tục theo cách này chủ yếu không được khuyến khích vì nó làm giảm độ chính xác.
Không giống như trong hồi quy tuyến tính, đối với giá trị trung bình, các biến dự đoán trong hồi quy hậu cần không bị buộc phải được kết nối tuyến tính, phân phối chung hoặc có phương sai bằng nhau trong mỗi cụm. Kết quả là, mối quan hệ giữa các yếu tố dự đoán và biến kết quả có thể không phải là một hàm tuyến tính.
Sự khác biệt giữa hồi quy logistic và tuyến tính?
• Trong hồi quy tuyến tính, một mối quan hệ tuyến tính giữa biến giải thích và biến trả lời được giả sử và các tham số thỏa mãn mô hình được tìm thấy bằng phân tích, để đưa ra mối quan hệ chính xác.
• Hồi quy tuyến tính được thực hiện cho các biến định lượng và hàm kết quả là định lượng.
• Trong hồi quy logistic, dữ liệu được sử dụng có thể là phân loại hoặc định lượng, nhưng kết quả luôn luôn là phân loại.