Hướng dẫn probit plot python - con trăn âm mưu probit
7 phút đọc Show Các sơ đồ probit là một công cụ trực quan hóa dữ liệu thường được sử dụng trong ngành dầu khí để phân tích phân phối xác suất. Chúng rất hữu ích để đánh giá sự không chắc chắn và rủi ro trong quá trình khám phá chơi, đánh giá diện tích, lập kế hoạch phát triển và ước tính dự trữ. Trong bài đăng này, tôi sẽ bao gồm một biểu đồ probit là gì và làm thế nào để tạo một bản bằng cách sử dụng dữ liệu và python của riêng bạn. Chúng tôi sẽ sử dụng Thư viện Python Cốt truyện Probit là gì?Một biểu đồ probit là một biểu đồ tần số tích lũy trong đó trục y hoặc trục tần số tích lũy, được chuyển đổi bởi phân phối bình thường (còn gọi là hàm probit của Hồi giáo). Khái niệm này tương tự như thang đo logarit quen thuộc hơn. Giống như khi vẽ dữ liệu trên thang đo logarit trong đó khoảng cách giữa các trục trục được xác định bởi hàm Các sơ đồ xác suất tích lũy giúp dễ dàng xác định xác suất dữ liệu được rút ra từ phân phối trực quan sẽ giảm trên hoặc dưới một giá trị nhất định hoặc nằm trong một phạm vi nhất định. Trực quan hóa dữ liệu tần số tích lũy trên thang đo Probit có tất cả các lợi ích của việc sử dụng các ô tần số tích lũy trên thang đo tuyến tính nhưng với một vài tính năng bổ sung. Khi dữ liệu được rút ra từ một phân phối bình thường tiêu chuẩn được vẽ trên trục probit so với trục tuyến tính, nó sẽ vẽ dọc theo một đường thẳng. Khi dữ liệu được rút ra từ phân phối lognatur được vẽ trên trục probit so với trục logarit, nó cũng sẽ rơi dọc theo một đường thẳng. Bởi vì các bản phân phối bình thường và logn thường được tìm thấy trong tự nhiên và là các phân phối tương đối đơn giản để mô hình, điều này tạo ra các sơ đồ probit các công cụ hữu ích để trực quan hóa dữ liệu. Trong hình dưới đây, bạn có thể thấy sự khác biệt về hình dạng của cùng một dữ liệu, được rút ra từ một phân phối bình thường tiêu chuẩn, được vẽ trên thang xác suất tích lũy tuyến tính so với thang đo xác suất tích lũy. Như đã được chứng minh trong hình, trực quan hóa dữ liệu trên biểu đồ probit cho phép bạn nhanh chóng đánh giá các xác suất vượt quá hoặc không quá mức và để đánh giá mức độ dữ liệu của bạn phù hợp với phân phối bình thường hoặc lognatural. Ngoài ra, vì các giá trị dữ liệu được kéo dài ở đuôi, các sơ đồ probit giúp dễ dàng hiểu được hành vi của phân phối ở các giá trị thấp và cao của xác suất vượt quá. Cách tạo cốt truyện Probit bằng cách sử dụng PythonĐể thực hiện âm mưu probit với Python, chúng tôi sẽ sử dụng các gói Python Chúng tôi sẽ bắt đầu bằng cách nhập các gói mà chúng tôi cần và sử dụng
Tạo ra một biểu đồ probit cơ bản dễ dàng như truyền dữ liệu cho hàm 0 và cho nó biết trục nào mà thang đo probit sẽ tiếp tục. Chức năng Seaborn 1 làm sạch cốt truyện và làm cho nó trông đẹp hơn.
Một cốt truyện hoàn chỉnh hơnBây giờ chúng tôi có một biểu đồ probit cơ bản, hãy để tải một số dữ liệu mẫu và thêm một số tính năng vào cốt truyện để làm cho nó hoàn thiện hơn. Chúng tôi sẽ sử dụng chức năng 2 để tải một số dữ liệu tổng hợp từ các tệp văn bản. Vì lợi ích của ví dụ này, dữ liệu thể hiện các giá trị phục hồi cuối cùng (EUR) ước tính trong hàng ngàn thùng dầu (MBO) cho 40 giếng từ hai lần chơi. Hai mươi là từ Play A, và hai mươi là từ Play B. Chúng tôi sẽ vẽ cả hai mẫu trên cùng một biểu đồ probit để so sánh các bản phân phối của chúng.Mã để thực hiện cốt truyện được bao gồm dưới đây. Chúng tôi sẽ cần nhập 3 để cho phép chúng tôi truy cập kiểu dữ liệu mảng và đọc dữ liệu từ các tệp. Chúng tôi cũng sẽ cần nhập 4 để cho chúng tôi kiểm soát nhiều hơn các chi tiết của cốt truyện. Hàm probscale.probplot giống như trước đây, nhưng với một vài đối số nữa. Để xem một lời giải thích về các đối số, bạn có thể chuyển đến hàm 6, hãy kiểm tra tài liệu.Tùy thuộc vào quy ước nào bạn chọn, bạn có thể muốn lật nhãn trên tick trục y. Điều này sẽ phụ thuộc vào cách bạn nghĩ về xác suất P10 và P90. Theo mặc định, 0 coi P10 để biểu thị giá trị dữ liệu mà bạn có 10 % cơ hội không vượt quá và P90 là giá trị dữ liệu mà bạn có 90 % cơ hội không vượt quá. Nói cách khác, 10 phần trăm dữ liệu của bạn nhỏ hơn hoặc bằng P10 và 90 phần trăm dữ liệu của bạn nhỏ hơn hoặc bằng P90. Nhiều người (và các công ty) thực hiện Công ước ngược lại: P10 nên đại diện cho giá trị mà bạn có 10 % cơ hội gặp gỡ hoặc vượt quá. Với quan điểm này, 10 phần trăm dữ liệu của bạn lớn hơn hoặc bằng P10. Nếu bạn tuân theo quy ước thứ hai, bạn sẽ cần đảo ngược các ve với dòng: 8Nếu bạn tuân theo quy ước đầu tiên, hãy để dòng này ra khỏi mã của bạn. Phần còn lại của mã liên quan đến tính thẩm mỹ của cốt truyện: thêm các dòng tham chiếu và nhãn cho P10, P50 và P90, ghi nhãn các trục, tạo tiêu đề cốt truyện và thiết lập huyền thoại.
Hình trên là biểu đồ probit với hai mẫu. Quan sát đầu tiên chúng ta có thể thực hiện vì cả hai đều tuyến tính và trục X nằm trên thang đo logarit là phân phối lognatural sẽ phù hợp để mô hình hóa cả hai bộ dữ liệu. Như đã đề cập ở trên, đó là một trong những lợi ích chính của việc trực quan hóa dữ liệu trên một biểu đồ probit. Chúng tôi cũng có thể thực hiện một vài quan sát về các độ dốc và vị trí tương đối của mỗi bộ dữ liệu. Dòng phân phối của Play B được thay đổi sang bên phải chơi A (nhìn ở giữa, khoảng P60-P50 để kiểm tra điều này). Điều này có nghĩa là giá trị dự kiến của EURS trong Play B cao hơn chơi A. Tuy nhiên, vì độ dốc của chơi B nông hơn nhiều so với độ dốc của Play A, có nhiều sự lây lan trong dữ liệu và sự không chắc chắn hơn trong EUR của một cuộc thi tốt trong chơi B. Tùy thuộc vào kích thước tổng thể của mỗi lần chơi, khả năng chịu rủi ro của bạn và khả năng tài trợ cho một vài giếng P90 hoạt động thấp từ Play B, bạn có thể chọn giá trị dự kiến thấp hơn và rủi ro thấp hơn và chọn Phát triển chơi A. Các sơ đồ probit là một công cụ hữu ích để trực quan hóa dữ liệu có thể được mô hình hóa với các phân phối lognatural hoặc bình thường. Chúng giúp dễ dàng khẳng định xác suất dữ liệu được rút ra từ các phân phối sẽ đáp ứng hoặc vượt quá một giá trị nhất định hoặc nằm trong một phạm vi nhất định và chúng là một sự cải thiện so với các đường cong xác suất tích lũy đơn giản đặc biệt là ở các phần phân phối. Hy vọng rằng bài đăng này là hữu ích trong việc chứng minh cách tạo chúng bằng cách sử dụng Python và gói |