XY Scatter là gì?

Scatter chart luôn luôn có hai trục giá trị để hiển thị: một bộ dữ liệu số dọc theo trục ngang và một bộ giá trị số khác dọc theo trục dọc. Biểu đồ hiển thị các điểm tại giao điểm của giá trị số x và y, kết hợp các giá trị này thành các điểm dữ liệu liệu duy nhất. Power BI có thể phân phối các điểm dữ liệu này đồng đều hoặc không đồng đều trên trục hoành. Điều đó sẽ phụ thuộc vào dữ liệu mà biểu đồ đại diện. Bạn có thể đặt tối đa 10,000 điểm dữ liệu.

1.1. Scatter chart và bubble chart

Kích thước bong bóng sẽ đại diện cho kích thước dữ liệu

Scatter chart biểu thị mối quan hệ giữa 2 giá trị số. Bubble chart thay thế các điểm dữ liệu bằng các bong bóng, với kích thước bong bóng đại diện cho kích thước dữ liệu. Scatter chart thường được dùng trong các trường hợp:

  • Biểu diễn mối quan hệ giữa 2 giá trị số.
  • Vẽ hai nhóm số dưới dạng một chuỗi tọa độ x và y.
  • Sử dụng thay biểu đồ đường khi bạn muốn thay đổi tỷ lệ của trục ngang.
  • Cần chuyển trục ngang thành thang đo logarit.
  • Hiển thị dữ liệu bảng tính bao gồm các cặp hoặc nhóm giá trị được nhóm.

Lưu ý: Trong Scatter chart, bạn có thể điều chỉnh tỷ lệ độc lập của các trục để tiết lộ thêm thông tin về các giá trị được nhóm.

  • Hiển thị các mẫu trong các bộ dữ liệu lớn, ví dụ hiển thị các xu hướng tuyến tính hoặc phi tuyến tính, cụm và ngoại lệ.
  • So sánh số lượng lớn các điểm dữ liệu mà không cần quan tâm đến thời gian. Càng nhiều dữ liệu mà bạn đưa vào Scatter chart, thì sự so sánh mà bạn có thể thực hiện càng tốt.

Ngoài những gì mà Scatter chart có thể làm, bubble chart còn mang đến một số ứng dụng khác:

  • Khi dữ liệu của bạn có ba chuỗi dữ liệu, mỗi chuỗi chứa một tập hợp các giá trị.
  • Trình bày dữ liệu thuộc lĩnh vực tài chính. Kích thước bong bóng khác nhau rất hữu ích để nhấn mạnh trực quan các giá trị cụ thể.
  • Sử dụng với góc phần tư.
1.2. Dot plot charts

Dot plot chart thì tương tự như bubble chart và scatter chart nhưng thay vào đó được dùng để vẽ phân loại dữ liệu dọc theo trục X.

Các loại biểu đồ trên là lựa chọn tuyệt vời nếu bạn muốn bao gồm dữ liệu phân loại dọc theo trục X.

1.3. Các bước chuẩn bị:

Hướng dẫn dưới đây sử dụng tệp Retail Analysis sample PBIX. Bạn có thể tải tệp về máy tính tại đây.

  • Bước 1: Từ góc trên bên trái chọn menu File > Open.
  • Bước 2: Tìm đến tệp mà bạn đã tải về ở trên.
  • Bước 3: Mở tệp lên và chọn chế độ xem báo cáo.
  • Bước 4: Nhấp vào dấu cộng bên dưới để tạo một trang mới.
2. Cách tạo một Scatter chart
  • Bước 1: Bắt đầu từ một trang báo cáo trống, từ thanh Fields chọn các fields sau:
    • Sales > Sales Per Sq Ft
    • Sales > Total Sales Variance %
    • District > District

  • Bước 2: Trong thanh Visualization, chọn biểu tượng của Scatter chart đã được đánh dấu trong hình minh họa dưới đây.

  • Bước 3: Kéo District từ Details vào dòng Legend.

Power BI hiển thị một scatter chart mà giá trị Total Sales Variance % dọc theo trục Y và Sales Per Square Feet dọc theo trục X. Màu sắc điểm dữ liệu sẽ đại diện cho các quận.

Bây giờ, chúng ta sẽ thêm vào một dimension thứ ba.

3. Cách tạo một bubble chart
  • Bước 1: Từ thanh Fields, kéo Sales > This Year Sales > Value vào ô Size. Các điểm dữ liệu sẽ mở rộng để tương ứng với giá trị sales. Xem ảnh minh họa bên dưới để biết thứ tự các bước thực hiện.

  • Bước 2: Rê chuột của bạn qua một bong bóng bất kì. Kích thước của bong bóng sẽ phản chiếu giá trị của This Year Sales.

 

  • Bước 3: Để đặt số lượng của điểm dữ liệu hiển thị trong bubble chart, trong phần Format của khung Visualization, mở rộng phần General và điều chỉnh giá trị Data Volume, xem ảnh minh họa.

Bạn có thể đặt khối lượng dữ liệu tối đa là 10,000, khi bạn đặt giá trị cao hơn, hãy thử nghiệm trước để đảm bảo hiệu suất.

Lưu ý: Càng nhiều điểm dữ liệu càng mất nhiều thời gian tải. Nếu bạn chọn publish các reports với giới hạn cao hơn, hãy chắc chắn kiểm tra các reports của bạn trên web và mobile.

  • Bước 4: Tiếp tục định dạng màu sắc của trực quan, nhãn (labels), tiêu đề (titles), background (nền)…. Để cải thiện khả năng tiếp cận của biểu đồ, Power BI còn cung cấp tính năng thêm các hình dạng đánh dấu vào mỗi dòng. Để chọn hình, bạn mở rộng dòng Shape, chọn Marker shape và chọn một hình bất kì.

Thay đổi hình dạng đánh dấu thành một hình kim cương (diamond), tam giác (triangle) hoặc hình vuông (square). Việc sử dụng các hình dạng đánh dấu khác nhau cho mỗi dòng giúp báo cáo rõ ràng hơn cho người xem.

  • Bước 5: Chọn tab Analytic biểu tượng kính lúp trong khung Visualization và thêm thông tin bổ sung vào trực quan của bạn.

Thêm một đường trung bình bằng cách chọn Median line > Add. Mặc định, Power BI sẽ thêm một đường trung bình cho Sales per sq ft. Điều này không thực sự hữu ích khi chúng ta có thể thấy rằng có đến 10 điểm dữ liệu và biết đường trung bình sẽ được tạo với 5 điểm ở mỗi bên. Thay vào đó, chuyển Measure thành Total sales variance % và kết quả thu được như ảnh.

Tiếp theo, chúng ta sẽ thêm biểu tượng đối xứng để chỉ ra điểm nào có giá trị cao hơn của measure trục x so với measure trục y và ngược lại. Khi bạn thay đổi biểu tượng đối xứng trên tab Analytic, Power BI hiển thị cho bạn nền của scatter chart dựa trên các ranh giới trên và dưới của trục hiện tại của bạn. Đây là một cách rất nhanh để xác định measure trục nào ưu tiên điểm dữ liệu, đặc biệt là khi bạn có phạm vi trục khác nhau cho hai trục x và y.

  1. Thay đổi trường Total sales variance % thành Gross margin last year %

  1. Từ tab Analytic, thêm Symmetry shading, chúng ta có thể thấy từ biểu đồ rằng Hosiery (bong bóng màu xanh lá cây trên nền hồng) là danh mục duy nhất ưu tiên gross margin thay vì doanh thu trên mỗi ô của cửa hàng.

Tiếp tục khám phá tab Analytic để tìm ra những điểm thú vị bên trong dữ liệu của bạn.

4. Cách tạo một dot plot chart

Bây giờ, để tạo một dot plot chart, bạn cần thay thế trường trục X bằng số bằng một trường phân loại. Từ khung X-Axis, bạn xóa Sales per sq ft và  thay thế nó với District > District Manager, xem ảnh minh họa.

5. Xem xét và xử lý sự cố

Chỉ xuất hiện một điểm dữ liệu bên trong scatter chart

Trường hợp bạn tạo một Scatter chart và chỉ xuất hiện một điểm duy nhất trên biểu đồ, có thể đó là giá trị tổng hợp của tất cả giá trị trên trục X và Y. Một trường hợp khác đó là tổng của tất cả giá trị trên một đường hoặc trục.

Thêm một trường vào ô Details để báo với Power BI cách nhóm các giá trị. Trường phải là duy nhất cho mỗi điểm mà bạn muốn vẽ. Đó có thể là một số hàng hoặc ID của trường.

Nếu không có trường như trên trong dữ liệu của bạn, hãy tạo ra một trường nối các giá trị trên trục X và Y lại với nhau thành một điểm duy nhất cho mỗi điểm.

Để tạo một trường mới trong Power BI, bạn có thể sử dụng Power BI Desktop Query Editor để thêm một Index Column và dataset của bạn. Sau đó, bạn chỉ cần thêm cột này vào ô Detail trong trực quan của mình.

Tham khảo: Thêm một cột tùy chỉnh trong Power BI Desktop

Bài viết hướng dẫn chứa nhiều bước mà bạn đọc cần thực hiện đúng theo thứ tự. Hy vọng rằng những thông tin được BAC tổng hợp trên đây sẽ hữu ích với bạn đọc quan tâm lĩnh vực phân tích dữ liệu. Đừng quên đón đọc các bài viết mới nhất của BAC tại website bacs.vn.

Nguồn tham khảo: docs.microsoft.com

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 

  • Phân tích và trực quan hóa dữ liệu với Tableau
  • Phân tích và trực quan hóa dữ liệu với Power BI

Các bài viết liên quan Power BI: 

  • Power BI cơ bản cho người mới bắt đầu
  • Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
  • Kết hợp dữ liệu trong Power BI Desktop
  • Hướng dẫn kết nối dữ liệu trong Power BI Desktop
  • Hướng dẫn tải & cài đặt Power BI trên máy tính
  • Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
  • Power BI là gì?

Các bài viết liên quan: 

  • TABLEAU - Giải pháp BUSINESS INTELLIGENCE (BI) - click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU - click vào đây
  • Tính năng mới trên tableau - verion 2019.1 - click vào đây

BAC - Biên soạn và tổng hợp nội dung

Click để đọc tiếp

  • XY Scatter là gì?

    6 ví dụ thực tế về Business Intelligence Dashboard

    Business Intelligence Dashboard mang đến khả năng làm chủ dữ liệu cho cả những người không chuyên. Đã có rất nhiều lĩnh vực, hoạt động nhận được lợi ích từ việc sử dụng các BI Dashboard này, đây là 6 ví dụ thực tế để bạn tham khảo.

  • XY Scatter là gì?

    9 Phần mềm khảo sát tốt nhất dành cho doanh nghiệp nhỏ

    Phần mềm khảo sát giúp bạn thu thập dữ liệu từ các nhóm mục tiêu. Qua đó, bạn sẽ có được những dữ liệu phân tích chính xác để nghiên cứu thị trường, khảo sát mức độ hài lòng của khách hàng và nhiều ứng dụng thực tế khác.

  • XY Scatter là gì?

    8 công cụ trực quan dữ liệu lớn hàng đầu hiện nay

    Dữ liệu lớn có thể xem là một khó khăn với các công cụ xử lý. Tuy nhiên, trong thời đại hiện nay dữ liệu lớn đã không còn xa lạ với các doanh nghiệp. Đây là danh sách 8 công cụ trực quan dữ liệu lớn tốt nhất mà bạn nên cân nhắc sử dụng.

  • XY Scatter là gì?

    Sự khác nhau giữa MSBI và Power BI

    Power BI và MSBI là những công cụ Business Intelligence được xếp hàng đầu về chất lượng hiện nay. Chúng giúp các doanh nghiệp đưa ra những quyết định chính xác trong thời gian ngắn thông qua việc phân tích. Nếu bạn còn đang phân vân giữa hai công cụ này thì đây là bài viết dành cho bạn.