Tính năng quy mô
Khi dữ liệu của bạn có các giá trị khác nhau và thậm chí các đơn vị đo khác nhau, có thể khó so sánh chúng. Kilogram là gì so với mét? Hoặc độ cao so với thời gian?
Câu trả lời cho vấn đề này là mở rộng quy mô. Chúng ta có thể mở rộng dữ liệu thành các giá trị mới dễ so sánh hơn.
Hãy xem bảng bên dưới, đó là cùng một tập dữ liệu mà chúng ta đã sử dụng trong chương hồi quy bội, nhưng lần này cột âm lượng chứa các giá trị trong lít thay vì CM3 [1.0 thay vì 1000].volume column contains values in liters instead of cm3 [1.0 instead of 1000].
Xe hơi | Người mẫu | Âm lượng | Trọng lượng | CO2 |
Toyota | Aygo | 1.0 | 790 | 99 |
Mitsubishi | Ngôi sao không gian | 1.2 | 1160 | 95 |
Skoda | Citigo | 1.0 | 929 | 95 |
Fiat | 500 | 0.9 | 865 | 90 |
MINI | Cooper | 1.5 | 1140 | 105 |
Vw | Lên! | 1.0 | 929 | 105 |
Skoda | Citigo | 1.4 | 1109 | 90 |
Fiat | MINI | 1.5 | 1365 | 92 |
Cooper | Vw | 1.5 | 1112 | 98 |
Lên! | Fabia | 1.6 | 1150 | 99 |
Mercedes | Một lớp học | 1.1 | 980 | 99 |
Ford | Fiesta | 1.3 | 990 | 101 |
Cooper | Vw | 1.0 | 1112 | 99 |
Lên! | Fabia | 1.6 | 1252 | 94 |
Mercedes | Một lớp học | 1.6 | 1326 | 97 |
Ford | Fiesta | 1.6 | 1330 | 97 |
Audi | 1 | 1.6 | 1365 | 99 |
A1 | 3 | 2.2 | 1280 | 104 |
Skoda | Citigo | 1.6 | 1119 | 104 |
Cooper | Vw | 2.0 | 1328 | 105 |
Cooper | Vw | 1.6 | 1584 | 94 |
Ford | Fiesta | 2.0 | 1428 | 99 |
Fiat | MINI | 2.1 | 1365 | 99 |
Skoda | Citigo | 1.6 | 1415 | 99 |
Fiat | MINI | 2.0 | 1415 | 99 |
Fiat | MINI | 1.5 | 1465 | 102 |
Lên! | Fabia | 2.0 | 1490 | 104 |
Lên! | Fabia | 2.0 | 1725 | 114 |
Fiat | MINI | 1.6 | 1523 | 109 |
Audi | 5 | 2.0 | 1705 | 114 |
Fiat | MINI | 2.1 | 1605 | 115 |
Fiat | MINI | 2.0 | 1746 | 117 |
Cooper | Vw | 1.6 | 1235 | 104 |
Audi | 2 | 1.6 | 1390 | 108 |
Ford | Fiesta | 1.6 | 1405 | 109 |
Fiat | MINI | 2.5 | 1395 | 120 |
Cooper
Vw
Lên!
z = [x - u] / s
Fabia
Mercedesweight column from the data set above, the first value is 790, and the scaled value will be:
[790 - 1292.23] / 238.74 = -2.1
Một lớp họcvolume column from the data set above, the first value is 1.0, and the scaled value will be:
[1.0 - 1.61] / 0.38 = -1.59
Ford
Fiesta
Audi
A1
Hyundai
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
scale = StandardScaler[]
I20
Suzuki
Nhanh
Honda
Result:
Công dân
[[-2.10389253 -1.59336644] [-0.55407235 -1.07190106] [-1.52166278 -1.59336644] [-1.78973979 -1.85409913] [-0.63784641 -0.28970299] [-1.52166278 -1.59336644] [-0.76769621 -0.55043568] [ 0.3046118 -0.28970299] [-0.7551301 -0.28970299] [-0.59595938 -0.0289703 ] [-1.30803892 -1.33263375] [-1.26615189 -0.81116837] [-0.7551301 -1.59336644] [-0.16871166 -0.0289703 ] [ 0.14125238 -0.0289703 ] [ 0.15800719 -0.0289703 ] [ 0.3046118 -0.0289703 ] [-0.05142797 1.53542584] [-0.72580918 -0.0289703 ] [ 0.14962979 1.01396046] [ 1.2219378 -0.0289703 ] [ 0.5685001 1.01396046] [ 0.3046118 1.27469315] [ 0.51404696 -0.0289703 ] [ 0.51404696 1.01396046] [ 0.72348212 -0.28970299] [ 0.8281997 1.01396046] [ 1.81254495 1.01396046] [ 0.96642691 -0.0289703 ] [ 1.72877089 1.01396046] [ 1.30990057 1.27469315] [ 1.90050772 1.01396046] [-0.23991961 -0.0289703 ] [ 0.40932938 -0.0289703 ] [ 0.47215993 -0.0289703 ] [ 0.4302729 2.31762392]]
Hundai
I30
Opel
Astra
Audi
A1
Hyundai
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
scale = StandardScaler[]
I20
Suzuki
y = df['CO2']
Nhanh
Honda
regr.fit[scaledX, y]
Công dân
Hundai
print[predictedCO2]
Result:
Hundai