Thuộc tính dữ liệu trong lớp Python

Nếu bạn đã cố gắng hiểu các thuộc tính dữ liệu trong khi học lập trình hoặc khám phá một công cụ dữ liệu lớn, rất có thể bạn sẽ gặp phải rất nhiều câu hỏi. Thuộc tính dữ liệu rất đơn giản, nhưng ý nghĩa của chúng có thể bị lẫn lộn

Mục đích của bài viết này là xác định rõ ràng các thuộc tính dữ liệu, giải thích các loại khác nhau và hiển thị các ví dụ trong cơ sở dữ liệu đơn giản, cũng như giải thích vai trò của chúng trong HTML, Python, jQuery, GIS và Six Sigma

nội dung

Định nghĩa và mô tả thuộc tính dữ liệu

Tóm lại, một thuộc tính dữ liệu là một bộ mô tả một giá trị cho một điểm dữ liệu hoặc đối tượng dữ liệu. Nó tồn tại thường xuyên nhất dưới dạng một cột trong bảng dữ liệu, nhưng cũng có thể đề cập đến định dạng hoặc chức năng đặc biệt cho các đối tượng trong các ngôn ngữ lập trình như Python

Điều quan trọng là phải nhận ra rằng một thuộc tính chỉ đơn giản là dữ liệu mô tả dữ liệu khác — bạn không nên tưởng tượng nó nằm ngoài tập dữ liệu. Theo nghĩa này, thuộc tính là cách chúng ta sử dụng một phần dữ liệu để mô tả các phần khác

Ví dụ: hãy tưởng tượng bạn đang xem lượng mưa ở 2 quốc gia và 10 thành phố của họ. Nếu bạn quyết định muốn tập trung vào lượng mưa theo từng thành phố, thì các quốc gia là thuộc tính của các thành phố đó. Các thành phố và quốc gia đều là dữ liệu, nhưng dữ liệu này mô tả dữ liệu kia

Đừng quên, bạn có thể nhận danh sách kiểm tra 67 khái niệm và kỹ năng dữ liệu miễn phí để bao gồm tất cả các yếu tố cần thiết (bao gồm cả thuộc tính dữ liệu)

Các loại thuộc tính dữ liệu

Thuộc tính dữ liệu tồn tại dưới dạng 3 loại khác nhau. (Hãy nhớ rằng, các giá trị số được coi là thước đo vì chúng có thể được thao tác số học lên và xuống các hàng. Chúng không phải là thuộc tính tổng hợp. )

  • Ngày – ngày của một năm và tháng nhất định
  • Văn bản – thường được gọi là "chuỗi", có nghĩa đơn giản là bất kỳ sự kết hợp nào của các chữ cái hoặc ký hiệu khác thay vì số
  • Boolean – Dữ liệu TRUE hoặc FALSE, thường được di chuyển sang văn bản CÓ hoặc KHÔNG hoặc số 1 và 0. Nói một cách đơn giản, đó là dữ liệu nhị phân

Ví dụ về thuộc tính dữ liệu trong cơ sở dữ liệu

Sử dụng ví dụ về lượng mưa của chúng tôi, hãy xem cơ sở dữ liệu mẫu và xác định các thuộc tính

ThángNgàyQuốc giaThành phốLượng mưa (cm)Jan24USAHouston13Feb24USANew York City12Mar14USAOrlando15Apr14USABoston12May4USAPhoenix10Jun24PhápToulon14Jul24PhápMarseille19Aug14PhápParis10Sep14PhápBordeaux24Tháng 104PhápDijon2

Cơ sở dữ liệu hiển thị lượng mưa cho 10 thành phố ở hai quốc gia trong hơn 10 tháng. Nhưng lưu ý. chúng ta không biết rằng những tháng này đều trong cùng một năm. Hơn nữa, mặc dù mỗi quốc gia có các mục ngày giống nhau, nhưng những ngày đó không nằm trong cùng một tháng ở mỗi quốc gia. Điều này đặt ra câu hỏi. những gì chúng ta đang mô tả trong tập dữ liệu này?

Để tìm hiểu, chúng ta cần xem dữ liệu nào phân biệt từng hàng — điều gì làm cho mỗi dòng trở nên độc đáo. Khi chúng ta biết điều gì không bao giờ lặp lại, thì chúng ta biết thông tin được ghi lại như thế nào. Một cách dễ dàng để hình dung điều này là theo thời gian;

Trong bộ này, mỗi tháng và thành phố chỉ xuất hiện một lần. Do đó, chúng ta có thể nói rằng chúng là các mã định danh duy nhất của mỗi hàng. Các cột khác (quốc gia, ngày, lượng mưa) mô tả tháng và thành phố

Vì các trường khác, chẳng hạn như “quốc gia” và “ngày” có các mục nhập trùng lặp hoặc đóng vai trò là một giá trị, chẳng hạn như “lượng mưa”, nên chúng sẽ không giúp chúng tôi xác định được hàng. Có thể nói rằng tập dữ liệu của chúng tôi được chuẩn hóa theo tháng và thành phố

Đây là một cách tốt hơn để xem dữ liệu với điều này trong tâm trí. Nó sẽ giúp chúng ta hiểu các thuộc tính

ThángThành phốNgàyQuốc giaLượng mưa (cm)JanHouston24USA13FebNew York City24USA12MarOrlando14USA15AprBoston14USA12MayPhoenix4USA10JunToulon24Pháp14JulMarseille24Pháp19Tháng8Paris14Pháp10Tháng9Bordeaux14Pháp24Tháng 10Dijon4Pháp2

Vì vậy, các thuộc tính ở đâu? . một thuộc tính dữ liệu là một bộ mô tả một giá trị cho một điểm dữ liệu hoặc đối tượng dữ liệu. Cho rằng các điểm dữ liệu của chúng tôi dựa trên tháng và thành phố, các trường khác chứa mô tả một giá trị và do đó là các thuộc tính

Mỗi mục nhập riêng lẻ theo ngày và quốc gia là một thuộc tính. Lượng mưa, tuy nhiên, không phải là một thuộc tính. Để hiểu tại sao, chúng ta cần hiểu các thuộc tính và thước đo tổng hợp

Thuộc tính tổng hợp vs Thuộc tính đơn

Một điểm khác biệt quan trọng là thuật ngữ “thuộc tính” được sử dụng một cách lỏng lẻo trong ngữ cảnh này có nghĩa là cả từng ô riêng lẻ VÀ toàn bộ cột. Ví dụ: bạn có thể nói rằng France là thuộc tính của tháng 10 ở Dijon hoặc bạn có thể nói country là thuộc tính của tháng và thành phố. Cái trước là trường hợp của các thuộc tính đơn lẻ, trong khi cái sau là trường hợp của các thuộc tính tổng hợp

Thuộc tính vs Đo lường

Quay trở lại ví dụ về lượng mưa, chúng ta không thể coi lượng mưa là một thuộc tính. Điều này là do không có bộ mô tả cố định của các ID duy nhất — nó không phân loại. Thay vào đó, nó cung cấp một giá trị số có thể được thao tác số học với các hàng khác. Thay vì "thuộc tính", chúng tôi đề cập đến các cột cung cấp dữ liệu số dưới dạng thước đo

Điều này thoạt nghe có vẻ phản trực giác. Nếu số cung cấp thông tin về ID duy nhất giống như cách một từ cung cấp, thì cả hai đều mô tả, phải không? . Việc chúng ta có thể nhân, chia, cộng và trừ các số lên và xuống theo hàng là rất quan trọng. Các con số không mô tả từng ID duy nhất theo một số cách cố định, nhưng các thuộc tính thì có.

Tuy nhiên, nếu cột chỉ chứa các số 1 và 0, thì đó sẽ là thứ nguyên phân loại — một thuộc tính — bởi vì bạn không thể thao tác các số theo phương pháp số học

Hàng dưới dạng thuộc tính

Cho đến giờ, chúng ta đã thảo luận về các cột dưới dạng thuộc tính và thước đo, nhưng còn hàng thì sao?

Để hiểu điều này, chúng ta cần quay lại tiền đề cơ bản về các thuộc tính. chúng không gì khác hơn là một phần dữ liệu mô tả một phần khác

Ví dụ: hãy tưởng tượng chúng ta muốn biết lượng mưa 13 cm đổ xuống ở thành phố nào ở Hoa Kỳ vào ngày 24 của tháng. Trong trường hợp này, thuộc tính là giá trị hàng, Houston, trong khi "ID duy nhất" là 13 cm, Hoa Kỳ, ngày thứ 24. Điều quan trọng là tiêu chí tìm kiếm của chúng tôi — tùy thuộc vào cách bạn lọc dữ liệu, một hàng có thể trở thành một thuộc tính và một cột là ID duy nhất

Như đã nói, chỉ có một thành phố có liên quan đến 13 cm ở Hoa Kỳ vào ngày thứ 24. Trong một cơ sở dữ liệu lớn hơn, có thể có nhiều thành phố liên quan. Đây là một lý do khác tại sao chúng ta có thể coi các thuộc tính là đơn lẻ hoặc tổng hợp

Khi chúng tôi thực hiện phân tích dữ liệu, mục tiêu là thu thập thông tin chi tiết từ tập dữ liệu bằng cách hợp nhất và so sánh các hàng và cột của nó. Nếu một thuộc tính chỉ áp dụng cho một ID duy nhất, nó sẽ không hữu ích cho việc phân tích. Do đó, các thuộc tính tổng hợp là cần thiết trong phân tích

Tiêu chí của thuộc tính dữ liệu có thể sử dụng trong Analytics

Để một thuộc tính dữ liệu có giá trị đối với phân tích dữ liệu lớn, thuộc tính đó phải đáp ứng các tiêu chí sau

  1. Thuộc tính phải xuất hiện trong nhiều hàng hoặc cột (tổng hợp), trừ khi thuộc tính chỉ xuất hiện một lần trong trường của nó. Ví dụ: nếu một trong các thành phố của chúng tôi ở Đức, thì đây vẫn sẽ là thuộc tính "quốc gia"
  2. Giá trị thuộc tính phải rõ ràng hoặc có mô tả
  3. Thuộc tính không được chuẩn hóa thành một ID duy nhất nếu nó được sử dụng làm bộ mô tả cho một ID duy nhất khác. Nếu không, phân tích có thể tạo ra các liên kết sai

Điểm thứ ba này rất khó khái niệm hóa. Để hiểu, hãy tưởng tượng cơ sở dữ liệu sau

ID1# hiện tạiID1ID2# hiện tạiID2ID11ID26ID22ID35ID33ID44ID44ID53ID55ID62ID66ID71

Cấu trúc này xảy ra khi chúng tôi muốn hợp nhất hai ID duy nhất trong một bảng để so sánh chúng. Nhưng nó đưa ra một vấn đề. vì #presentID2 không phải là giá trị chính xác cho ID1 nên chúng tôi không thể coi đó là một thuộc tính cho ID1

Để # presentID2 trở thành thuộc tính hữu ích cho ID1, chúng tôi cần ánh xạ lại các giá trị đó để đảm bảo chúng chính xác trong ID1. Đây là lý do tại sao chúng tôi chuẩn hóa cơ sở dữ liệu ngay từ đầu

Thuộc tính dữ liệu trong mô hình dữ liệu

Trong ngữ cảnh của mô hình dữ liệu, thuộc tính dữ liệu đại diện cho các cột của bảng dữ liệu. Ví dụ: mô hình dữ liệu logic hiển thị khóa chính (còn gọi là ID duy nhất), cũng như tên cột thuộc tính. Vì nó không liệt kê tất cả các tùy chọn thuộc tính nên đây là ví dụ về thuộc tính dữ liệu tổng hợp

Dưới đây là một ví dụ về mô hình dữ liệu kinh doanh đơn giản

Thuộc tính dữ liệu trong lớp Python
Thuộc tính dữ liệu trong lớp Python

Vì các hộp này đại diện cho các bảng dữ liệu nên bạn có thể hình dung cách chúng được cấu trúc dựa trên khóa chính (ID duy nhất) và tiêu đề thuộc tính (các cột khác)

Thuộc tính dữ liệu trong HTML và jQuery

Trong HTML và jQuery, thuộc tính là bất kỳ định dạng hoặc chức năng đặc biệt nào bạn thêm vào một đối tượng. Một trong những cái cần thiết nhất là thuộc tính data-ID

Thuộc tính data-ID là gì?

Nói tóm lại, khi bạn tạo một biến hoặc thành phần dữ liệu khác trong mã của mình, bạn có thể chỉ định ID dạng số hoặc văn bản để nhập biến đó làm đối tượng dữ liệu bằng cách sử dụng id=”name”. Trong ngữ cảnh này, ID dữ liệu là một thuộc tính của phần tử và nó xác định ID duy nhất cho phần tử để sử dụng tiếp

For example, imagine any random element. We can add a data-ID attribute in the first brackets with the following notation: .

Thuộc tính dữ liệu trong Python

Trong python, mọi đối tượng bạn tạo đều có thể nhận các thuộc tính như tên, tuổi, chiều cao và các bộ mô tả khác. Ví dụ, khi định nghĩa một lớp, lập trình viên có thể đặt tên cho nó theo cú pháp sau. bản thân. tên = tên

Thuộc tính dữ liệu trong GIS

Các đối tượng dữ liệu trong GIS có thể nhận các thuộc tính dữ liệu mô tả vị trí, cái gì và tại sao của đối tượng dữ liệu, giống như cơ sở dữ liệu truyền thống. Tuy nhiên, bản thân GIS là một khung chứ không phải ngôn ngữ lập trình. Do đó, các thuộc tính của GIS là đầu ra của Python, HTML và các tập lệnh khác

Thuộc tính dữ liệu trong Six Sigma

Trong các phương pháp Six Sigma, các thuộc tính dữ liệu được xác định giống như trong cơ sở dữ liệu truyền thống. Chúng thường là tên cột, nhưng cũng có thể là giá trị hàng tùy thuộc vào cách tiếp cận câu hỏi của nhà phân tích

Thuộc tính dữ liệu trong một lớp là gì?

Tóm lại, thuộc tính dữ liệu là bộ mô tả một giá trị cho một điểm dữ liệu hoặc đối tượng dữ liệu . Nó tồn tại thường xuyên nhất dưới dạng một cột trong bảng dữ liệu, nhưng cũng có thể đề cập đến định dạng hoặc chức năng đặc biệt cho các đối tượng trong các ngôn ngữ lập trình như Python.

Các thuộc tính được thêm vào một lớp trong Python như thế nào?

Việc thêm các thuộc tính vào một lớp Python rất đơn giản, bạn chỉ cần sử dụng '. ' sau một thể hiện của lớp với bất kỳ tên tùy ý nào mà bạn muốn thuộc tính được gọi, theo sau là giá trị của nó .

Lớp có thuộc tính hoặc dữ liệu không?

Thuộc tính của lớp là thuộc tính do chính lớp đó sở hữu . Chúng sẽ được chia sẻ bởi tất cả các thể hiện của lớp. Do đó, chúng có cùng giá trị cho mọi trường hợp. Chúng tôi định nghĩa các thuộc tính lớp bên ngoài tất cả các phương thức, thường chúng được đặt ở trên cùng, ngay bên dưới tiêu đề lớp.

Các loại thuộc tính khác nhau trong Python là gì?

Có hai loại tên thuộc tính hợp lệ. các thuộc tính và phương thức dữ liệu . Một loại tham chiếu thuộc tính thể hiện khác là một phương thức. Một phương thức là một hàm “thuộc về” một đối tượng. (Trong Python, thuật ngữ phương thức không phải là duy nhất đối với các thể hiện của lớp. các loại đối tượng khác cũng có thể có các phương thức.