Hồi quy đa nhân tố tiếng anh là gì năm 2024

Tương quan và Hồi quy là 2 phân tích khác biệt nhau. Tương quan là phép phân tích cho phép chúng ta biết mối quan hệ giữa 2 biến không có sự phân biệt độc lập và phụ thuộc. Trong khi đó, phân tích Hồi quy dự đoán giá trị của biến phụ thuộc Y dựa trên giá trị đã biết của 1 hay nhiều biến độc lập.

Hồi quy đa nhân tố tiếng anh là gì năm 2024

1. Tương quan

- Mục đích của tương quan là tìm ra một con số biểu thị mối quan hệ giữa 2 biến A và B với nhau.

- Tương quan phản ánh mức độ liên kết hay độ mạnh trong sự liên kết giữa biến A với biến B. Nếu sự thay đổi của biến A sẽ kéo theo sự thay đổi của biến B và ngược lại. Tương quan là mối quan hệ 2 chiều, A với B cũng như B với A, hệ số tương quan của A đối với B bằng với hệ số tương quan của B đối với A.

- Trong tương quan, khi 2 biến A và B di chuyển cùng hướng, tức A tăng sẽ làm B tăng và ngược lại B tăng làm A tăng, 2 biến này sẽ được coi là có tương quan dương. Nếu 2 biến di chuyển theo 2 hướng khác nhau, A tăng làm B giảm, hoặc B tăng làm A giảm, 2 biến sẽ có tương quan nghịch. Lượng thay đổi của X bằng lượng thay đổi của Y.

- Không có sự phân biệt biến độc lập và biến phụ thuộc, vai trò của A và B là như nhau.

- Tương quan là sự xem xét mối quan hệ giữa từng cặp biến với nhau.

2. Hồi quy

- Mục đích của hồi quy là đi tìm một phương trình mà khi biểu diễn nó trên đồ thị, chúng ta có một đường thẳng phù hợp nhất và ước tính được biến phụ thuộc Y dựa vào những thay đổi của biến độc lập X.

- Hồi quy phản ánh sự ảnh hưởng của việc thay đổi giá trị của biến độc lập X lên biến phụ thuộc Y. Chúng ta sẽ đi ước tính Y dựa vào những giá trị của X. Hồi quy là mối quan hệ 1 chiều từ X lên Y. Hệ số hồi quy sẽ khác nhau nếu đổi X thành biến phụ thuộc, đổi Y thành biến độc lập.

- Trong hồi quy, việc tăng X làm Y tăng nghĩa là biến X có sự tác động thuận chiều lên Y. Nếu X tăng làm Y giảm nghĩa là biến X có sự tác động nghịch chiều lên Y. Lượng thay đổi của X không bằng lượng thay đổi của Y.

- Có sự phân biệt biến độc lập X và biến phụ thuộc Y, hồi quy chỉ xem xét sự tác động của biến độc lập lên biến phụ thuộc.

Trong toán học, phương trình cho ta mối quan hệ giữa hai biến: x và y. Bạn có thể sử dụng các phương trình hoặc hàm này để vẽ đồ thị theo trục x và trục y bằng cách nhập các giá trị khác nhau của x và y. Ví dụ: nếu bạn vẽ đồ thị cho hàm y = 2*x, bạn sẽ có một đường thẳng như hình dưới đây. Do đó hàm này còn được gọi là hàm tuyến tính.

Hồi quy đa nhân tố tiếng anh là gì năm 2024

Biến

Trong thống kê, biến là các yếu tố dữ liệu hoặc thuộc tính có giá trị khác nhau. Bất kỳ phân tích nào cũng có một số biến nhất định là biến độc lập hoặc biến giải thích. Những thuộc tính này là nguyên nhân của một kết quả. Các biến khác là biến phụ thuộc hoặc biến đáp ứng; giá trị của chúng phụ thuộc vào các biến độc lập. Nhìn chung, hồi quy logistic khám phá cách các biến độc lập ảnh hưởng đến một biến phụ thuộc bằng cách xem xét các giá trị dữ liệu lịch sử của cả hai biến.

Trong ví dụ ở trên của chúng tôi, x được gọi là biến độc lập, biến dự đoán hoặc biến giải thích vì nó có một giá trị đã xác định. Y được gọi là biến phụ thuộc, biến kết quả hoặc biến đáp ứng vì giá trị của nó không xác định.

Hàm hồi quy logistic

Hồi quy logistic là một mô hình thống kê sử dụng hàm logistic, hay hàm logit trong toán học làm phương trình giữa x và y. Hàm logit ánh xạ y làm hàm sigmoid của x.

Hồi quy đa nhân tố tiếng anh là gì năm 2024

Nếu vẽ phương trình hồi quy logistic này, bạn sẽ có một đường cong hình chữ S như hình dưới đây.

Hồi quy đa nhân tố tiếng anh là gì năm 2024

Như bạn có thể thấy, hàm logit chỉ trả về các giá trị giữa 0 và 1 cho biến phụ thuộc, dù giá trị của biến độc lập là gì. Đây là cách hồi quy logistic ước tính giá trị của biến phụ thuộc. Phương pháp hồi quy logistic cũng lập mô hình phương trình giữa nhiều biến độc lập và một biến phụ thuộc.

Phân tích hồi quy logistic với nhiều biến độc lập

Trong nhiều trường hợp, nhiều biến giải thích ảnh hưởng đến giá trị của biến phụ thuộc. Để lập mô hình các tập dữ liệu đầu vào như vậy, công thức hồi quy logistic phải giả định mối quan hệ tuyến tính giữa các biến độc lập khác nhau. Bạn có thể sửa đổi hàm sigmoid và tính toán biến đầu ra cuối cùng như sau

y = f(β0 + β1x1 + β2x2+… βnxn)

Ký hiệu β đại diện cho hệ số hồi quy. Mô hình logit có thể đảo ngược tính toán các giá trị hệ số này khi bạn cho nó một tập dữ liệu thực nghiệm đủ lớn có các giá trị đã xác định của cả hai biến phụ thuộc và biến độc lập.

Log của tỷ số odds

Mô hình logit cũng có thể xác định tỷ số thành công trên thất bại hay log của tỷ số odds. Ví dụ: nếu bạn đang chơi poker với bạn bè và thắng bốn ván trên mười ván, tỷ số chiến thắng của bạn là bốn phần sáu, hoặc 4/6, và đó là tỷ số thành công trên thất bại của bạn. Mặt khác, xác suất thắng là 4/10.

Về mặt toán học, tỷ số odds về mặt xác suất của bạn là p/(1 - p) và log của tỷ số odds là log (p/(1 - p)). Bạn có thể biểu diễn hàm logistic bằng log của tỷ số odds như hình dưới đây:

Hồi quy đa nhân tố tiếng anh là gì năm 2024

Phân tích hồi quy logistic có những loại nào?

Có ba cách tiếp cận phân tích hồi quy logistic dựa trên kết quả của biến phụ thuộc.

Hồi quy logistic nhị phân

Hồi quy logistic nhị phân phù hợp với các vấn đề phân lớp nhị phân chỉ có hai kết quả có thể xảy ra. Biến phụ thuộc chỉ có thể có hai giá trị, chẳng hạn như có và không hoặc 0 và 1.

Dù hàm logistic tính toán một phạm vi giá trị giữa 0 và 1, mô hình hồi quy nhị phân vẫn sẽ làm tròn kết quả đến các giá trị gần nhất. Nói chung, kết quả dưới 0,5 sẽ được làm tròn thành 0 và kết quả trên 0,5 sẽ được làm tròn thành 1, do đó hàm logistic trả về một kết quả nhị phân.

Hồi quy logistic đa thức

Hồi quy đa thức có thể phân tích các vấn đề có một số kết quả có thể xảy ra, miễn là số kết quả hữu hạn. Ví dụ: kỹ thuật này có thể dự đoán xem giá nhà sẽ tăng 25%, 50%, 75% hay 100% dựa trên dữ liệu dân số, nhưng sẽ không thể dự đoán được giá trị chính xác của một ngôi nhà.

Hồi quy logistic đa thức hoạt động bằng cách ánh xạ các giá trị kết quả cho các giá trị khác nhau giữa 0 và 1. Hàm logistic có thể trả về một khoảng dữ liệu liên tục như 0,1, 0,11, 0,12, v.v., do đó hồi quy đa thức cũng nhóm đầu ra đến các giá trị gần nhất có thể có.

Hồi quy logistic thứ tự

Hồi quy logistic thứ tự, hay mô hình logit có thứ tự, là một loại hồi quy đa thức đặc biệt cho các vấn đề trong đó các số đại diện cho các bậc chứ không phải là giá trị thực tế. Ví dụ: bạn sẽ sử dụng hồi quy thứ tự để dự đoán đáp án cho câu hỏi khảo sát yêu cầu khách hàng đánh giá dịch vụ của bạn ở mức kém, ổn, tốt hoặc xuất sắc dựa trên một giá trị số, chẳng hạn như số lượng mặt hàng họ mua từ bạn trong năm.