Thư viện python nào được sử dụng cho hồi quy tuyến tính?

Điều kiện tiên quyết. Hồi quy tuyến tính Hồi quy tuyến tính là một thuật toán học máy dựa trên học có giám sát. Nó thực hiện một nhiệm vụ hồi quy. Mô hình hồi quy một giá trị dự đoán mục tiêu dựa trên các biến độc lập. Nó chủ yếu được sử dụng để tìm ra mối quan hệ giữa các biến và dự báo. Các mô hình hồi quy khác nhau khác nhau dựa trên – loại mối quan hệ giữa các biến phụ thuộc và biến độc lập, chúng đang xem xét và số lượng biến độc lập đang được sử dụng. Bài viết này sẽ trình bày cách sử dụng các thư viện Python khác nhau để triển khai hồi quy tuyến tính trên một tập dữ liệu nhất định. Chúng tôi sẽ chứng minh một mô hình tuyến tính nhị phân vì điều này sẽ dễ hình dung hơn. Trong phần trình diễn này, mô hình sẽ sử dụng Gradient Descent để tìm hiểu. Bạn có thể tìm hiểu về nó ở đây.  

Bước 1. Nhập tất cả các thư viện cần thiết

Python3




import numpy as np

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

from import0import import2

from import4import import6

from import8import numpy as np0

Bước 2. Đọc bộ dữ liệu Bạn có thể tải xuống bộ dữ liệu

Python3




numpy as np1numpy as np2 numpy as np3____14numpy as np5

numpy as np6numpy as np2 numpy as np8numpy as np9import0import1import2

import3

import4

import5numpy as np2 import7import8import0pandas as pd0pandas as pd1

pandas as pd2

pandas as pd3

đầu ra

  

Bước 3. Khám phá phân tán dữ liệu

Python3




pandas as pd4

pandas as pd5numpy as np2_______37pandas as pd8numpy as np2import0import1numpy as np2 import3numpy as np2 import5import6numpy as np2 import8numpy as np5

đầu ra.   

Bước 4. Làm sạch dữ liệu

Python3




seaborn as sns0

seaborn as sns1numpy as np2____53____54numpy as np2 seaborn as sns6numpy as np5

Bước 5. Đào tạo mô hình của chúng tôi

Python3




seaborn as sns8numpy as np2 import0_______08import2import3import4import0import4numpy as np5

import8numpy as np2 import0pandas as pd0import2import3import4import0import4numpy as np5

import3

matplotlib.pyplot as plt9

from0

from1

from2numpy as np2 seaborn as sns6____15

import3

from7

from8numpy as np2 import00numpy as np2 import02numpy as np5

import3

import05

import06numpy as np2 import08

import3

import10

import11import12

đầu ra

 

Bước 6. Khám phá kết quả của chúng tôi

Python3




import13numpy as np2 import15

import16numpy as np2import18numpy as np5

import20numpy as np2____022numpy as np5

import3

import25

import26

đầu ra

 

Điểm chính xác thấp của mô hình của chúng tôi cho thấy rằng mô hình hồi quy của chúng tôi không phù hợp lắm với dữ liệu hiện có. Điều này cho thấy dữ liệu của chúng tôi không phù hợp cho hồi quy tuyến tính. Nhưng đôi khi, một tập dữ liệu có thể chấp nhận một biến hồi quy tuyến tính nếu chúng ta chỉ xem xét một phần của nó. Hãy để chúng tôi kiểm tra khả năng đó.   

Bước 7. Làm việc với một tập dữ liệu nhỏ hơn

Python3




import27numpy as np2 import29____030pandas as pd1

import32

import33

pandas as pd5numpy as np2____37pandas as pd8numpy as np2import0import1numpy as np2 import42

import43import44numpy as np2 import5import6numpy as np2 import8numpy as np5

đầu ra

 

Chúng ta đã có thể thấy rằng 500 hàng đầu tiên tuân theo mô hình tuyến tính. Tiếp tục với các bước tương tự như trước.  

Python3




import51numpy as np2____53____54numpy as np2 seaborn as sns6numpy as np5

import3

seaborn as sns8numpy as np2 import61import8import2import3import4import0import4numpy as np5

import8numpy as np2 import61pandas as pd0import2import3import4import0import4numpy as np5

import3

import80numpy as np2 seaborn as sns6____15

from8numpy as np2 import00numpy as np2 import02numpy as np5

import3

import06numpy as np2 import08

import10

import11import12

đầu ra

 

Python3




import13numpy as np2 import15

import16numpy as np2import18numpy as np5

import20numpy as np2____022numpy as np5

import3

import25

đầu ra

Bước 8. Số liệu đánh giá hồi quy

Cuối cùng, chúng tôi kiểm tra hiệu suất của mô hình Hồi quy tuyến tính với sự trợ giúp của các số liệu đánh giá. Đối với các thuật toán Hồi quy, chúng tôi sử dụng rộng rãi các chỉ số mean_absolute_error và mean_squared_error để kiểm tra hiệu suất của mô hình.  

Python3




from numpy as np11import numpy as np13

import3

numpy as np15numpy as np2 numpy as np17numpy as np2numpy as np19numpy as np2numpy as np21

numpy as np22

numpy as np23numpy as np2 numpy as np25numpy as np2numpy as np19numpy as np2numpy as np21numpy as np30

numpy as np31numpy as np2 numpy as np25numpy as np2numpy as np19numpy as np2numpy as np37numpy as np2numpy as np39numpy as np5

Tôi nên nhập gói Python nào cho hồi quy tuyến tính đa biến?

Bắt đầu bằng cách nhập mô-đun Pandas . Tìm hiểu về mô-đun Pandas trong Hướng dẫn về Pandas của chúng tôi. Mô-đun Pandas cho phép chúng tôi đọc các tệp csv và trả về một đối tượng DataFrame. Sau đó lập danh sách các giá trị độc lập và gọi biến này là X.

Python có tốt cho hồi quy tuyến tính không?

Hiểu cách triển khai mô hình hồi quy tuyến tính có thể khám phá các câu chuyện trong dữ liệu để giải quyết các vấn đề quan trọng. Chúng ta sẽ sử dụng Python vì nó là một công cụ mạnh mẽ để xử lý, xử lý và mô hình hóa dữ liệu . Nó có một loạt các gói cho mô hình hồi quy tuyến tính.

LinearRegression trong Sklearn là gì?

Regression tuyến tính phù hợp với mô hình tuyến tính có hệ số w = [w1, …, wp] để giảm thiểu tổng bình phương còn lại giữa các mục tiêu được quan sát trong tập dữ liệu và các mục tiêu được dự đoán bởi . Thông số. fit_interceptbool, mặc định=True. Có tính toán hệ số chặn cho mô hình này hay không. . Parameters: fit_interceptbool, default=True. Whether to calculate the intercept for this model.

Chủ Đề