Cả Tương quan và Hồi quy là các công cụ thống kê xử lý hai hoặc nhiều biến. Mặc dù cả hai đều liên quan đến cùng một vấn đề, có sự khác biệt giữa hai vấn đề. Sự khác biệt, giữa hai được giải thích dưới đây.
Thuật ngữ tương quan với tham chiếu đến hai hoặc nhiều biến có nghĩa là các biến có liên quan theo một cách nào đó. Phân tích tương quan xác định xem có tồn tại mối quan hệ giữa hai biến hay không và độ mạnh của mối quan hệ. Nếu hai biến x (độc lập) và y (phụ thuộc) có liên quan đến mức có sự thay đổi về độ lớn của biến độc lập, bởi sự thay đổi về độ lớn của biến phụ thuộc thì hai biến được cho là tương quan.
Tương quan có thể là tuyến tính hoặc phi tuyến tính. Một mối tương quan tuyến tính là một trong đó các biến có liên quan đến mức thay đổi giá trị của một biến sẽ gây ra thay đổi giá trị của biến khác một cách nhất quán. Trong một mối tương quan tuyến tính, các điểm phân tán liên quan đến các giá trị tương ứng của các biến phụ thuộc và biến độc lập sẽ tập trung xung quanh một đường thẳng không nằm ngang, mặc dù một đường thẳng ngang cũng sẽ chỉ ra mối quan hệ tuyến tính giữa các biến nếu một đường thẳng có thể kết nối các điểm đại diện các biến.
Mặt khác, phân tích hồi quy sử dụng dữ liệu hiện có để xác định mối quan hệ toán học giữa các biến có thể được sử dụng để xác định giá trị của biến phụ thuộc đối với bất kỳ giá trị nào của biến độc lập.
Tương quan liên quan đến việc đo lường sức mạnh của mối liên hệ hoặc cường độ của mối quan hệ, trong đó khi hồi quy liên quan đến dự đoán giá trị của biến phụ thuộc liên quan đến giá trị đã biết của biến độc lập. Điều này có thể được giải thích với các công thức sau đây.
Hệ số tương quan hoặc tương quan hệ số (r) giữa x & y được tìm ra với công thức sau;
r = hiệp phương sai (x, y) /σx.σy, cov (x, y) = Σxy / n - (x / n) (y / n), σx & y lần lượt là độ lệch chuẩn của x và y, và - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Hệ số tương quan r là một số thuần túy và không phụ thuộc vào đơn vị đo lường. Do đó, nếu x là chiều cao (inch) và y là trọng lượng (lbs.) Của những người thuộc một khu vực nhất định, thì r không tính bằng inch cũng không tính bằng lbs., Mà chỉ đơn giản là một con số.
Phương trình hồi quy được tìm ra với công thức sau;
Phương trình hồi quy của y trên x (để tìm ra ước tính của y) là y - y '= byx (x-x‾), byx được gọi là hệ số hồi quy của y trên x. Phương trình hồi quy của x trên y (để tìm ra ước tính của x) là x - x '= bxy (y - y‾), bxy được gọi là hệ số hồi quy của x trên y.
Phân tích tương quan không giả định sự phụ thuộc của bất kỳ biến nào vào biến khác, nó cũng không cố gắng tìm ra mối quan hệ giữa hai biến. Nó chỉ đơn giản là ước tính mức độ liên kết giữa các biến. Nói cách khác, phân tích tương quan kiểm tra sự phụ thuộc lẫn nhau của các biến. Mặt khác, phân tích hồi quy mô tả sự phụ thuộc của biến phụ thuộc hoặc biến phản ứng vào biến độc lập hoặc biến giải thích / s. Phân tích hồi quy giả định rằng tồn tại mối quan hệ nhân quả một chiều giữa các biến giải thích và phản ứng, và không tính đến việc mối quan hệ nhân quả đó là tích cực hay tiêu cực. Đối với tương quan cả hai giá trị của biến phụ thuộc và biến độc lập là ngẫu nhiên, nhưng đối với giá trị hồi quy của biến độc lập không cần phải ngẫu nhiên.
1. Phân tích tương quan là một thử nghiệm về sự phụ thuộc lẫn nhau giữa hai biến. Phân tích hồi quy đưa ra một công thức toán học để xác định giá trị của biến phụ thuộc đối với giá trị của biến độc lập / s.
2. Hệ số tương quan không phụ thuộc vào lựa chọn nguồn gốc và tỷ lệ, nhưng hệ số hồi quy không như vậy.
Để tương quan, các giá trị của cả hai biến phải là ngẫu nhiên, nhưng điều này không đúng với hệ số hồi quy.
1. Das, N. G., (1998), Phương pháp thống kê, Calcutta
2. Tương quan & hồi quy, có sẵn tại www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Hồi quy & Tương quan, có sẵn tại www.abyss.uoregon.edu