Hướng dẫn how do you create a confidence interval in python? - làm cách nào để bạn tạo khoảng tin cậy trong python?

& nbsp; Trong bài viết này, chúng tôi sẽ xem xét các cách khác nhau để tính toán khoảng tin cậy bằng cách sử dụng các phân phối khác nhau trong ngôn ngữ lập trình Python. Khoảng tin cậy cho một giá trị trung bình là một loạt các giá trị có khả năng chứa một dân số có nghĩa là với một mức độ tin cậy nhất định.

Formula:

Confidence Interval = x(+/-)t*(s/√n)
  • X: Mẫu trung bìnhsample mean
  • T: Giá trị T tương ứng với mức độ tin cậy t-value that corresponds to the confidence level
  • S: Độ lệch chuẩn mẫusample standard deviation
  • N: cỡ mẫu sample size

Phương pháp 1: Tính khoảng tin cậy bằng cách sử dụng phân phối T

Cách tiếp cận này được sử dụng để tính toán khoảng tin cậy cho bộ dữ liệu nhỏ trong đó n trong đó n trong đó

Cú pháp: St.T.Interval (alpha, chiều dài, loc, tỷ lệ)) & nbsp;st.t.interval(alpha, length, loc, scale)) 

Parameters:

  • Alpha: Xác suất RV sẽ được rút ra từ phạm vi trả về. Probability that an RV will be drawn from the returned range.
  • Chiều dài: Chiều dài của tập dữ liệuLength of the data set
  • LỘC: tham số vị trílocation parameter
  • Tỷ lệ: tham số tỷ lệ scale parameter

Ví dụ 1:

Trong ví dụ này, chúng tôi sẽ sử dụng tập dữ liệu có kích thước (n = 20) và sẽ tính toán khoảng tin cậy 90% bằng cách sử dụng hàm T. Python.

Python

import numpy as np

import scipy.stats as st

Các

(6.920661262464349, 7.3593387375356505)
2
(2.3481954013214263, 5.4518045986785735)
4
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
5
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
5
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3
(6.689075889330163, 7.450924110669837)
5
(2.962098014195961, 4.837901985804038)
3
(6.689075889330163, 7.450924110669837)
7
(2.962098014195961, 4.837901985804038)
3
(6.689075889330163, 7.450924110669837)
9
(2.962098014195961, 4.837901985804038)
3import1import2

Các

numpy as np3numpy as np4

(2.962098014195961, 4.837901985804038)
0numpy as np6

numpy as np3numpy as np8

(2.962098014195961, 4.837901985804038)
0import0

Output:

(2.962098014195961, 4.837901985804038)

Ví dụ 2:

Trong ví dụ này, chúng tôi sẽ sử dụng tập dữ liệu có kích thước (n = 20) và sẽ tính toán khoảng tin cậy 90% bằng cách sử dụng chức năng & nbsp; t.interval () và chuyển tham số alpha sang 0,99 trong Python.

Python

import numpy as np

import scipy.stats as st

Các

(6.920661262464349, 7.3593387375356505)
2
(2.3481954013214263, 5.4518045986785735)
4
(2.962098014195961, 4.837901985804038)
3
(2.3481954013214263, 5.4518045986785735)
4
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
5
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
5
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3
(6.689075889330163, 7.450924110669837)
5numpy as np2

(6.920661262464349, 7.3593387375356505)
2
(6.689075889330163, 7.450924110669837)
7
(2.962098014195961, 4.837901985804038)
3
(6.689075889330163, 7.450924110669837)
9
(2.962098014195961, 4.837901985804038)
3import1import2

import3

(2.962098014195961, 4.837901985804038)
0
(2.962098014195961, 4.837901985804038)
22numpy as np2

numpy as np3

(2.962098014195961, 4.837901985804038)
25
(2.962098014195961, 4.837901985804038)
0import8import9numpy as np0
(2.962098014195961, 4.837901985804038)
2numpy as np2

Các

numpy as np3numpy as np8

(2.962098014195961, 4.837901985804038)
0import0

Output:

(2.3481954013214263, 5.4518045986785735)

Ví dụ 2:

Trong ví dụ này, chúng tôi sẽ sử dụng tập dữ liệu có kích thước (n = 20) và sẽ tính toán khoảng tin cậy 90% bằng cách sử dụng chức năng & nbsp; t.interval () và chuyển tham số alpha sang 0,99 trong Python.

gfg_data (2.962098014195961, 4.837901985804038)0 (2.962098014195961, 4.837901985804038)1(2.962098014195961, 4.837901985804038)2(2.962098014195961, 4.837901985804038)3__12

numpy as np3numpy as np4

(2.962098014195961, 4.837901985804038)
0
(2.962098014195961, 4.837901985804038)
35

Giải thích từ Ví dụ 1 và Ví dụ 2:st.norm.interval(alpha, loc, scale)) 

Parameters:

  • Alpha: Xác suất RV sẽ được rút ra từ phạm vi trả về.
  • LỘC: tham số vị trí
  • Tỷ lệ: tham số tỷ lệ

Ví dụ 1:

Trong ví dụ này, chúng tôi sẽ sử dụng tập dữ liệu có kích thước (n = 20) và sẽ tính toán khoảng tin cậy 90% bằng cách sử dụng hàm T. Python.

Python

import numpy as np

import scipy.stats as st

Các

(2.962098014195961, 4.837901985804038)
53
(2.962098014195961, 4.837901985804038)
0import5numpy as np2

(2.962098014195961, 4.837901985804038)
57numpy as np4
(2.962098014195961, 4.837901985804038)
0numpy as np6

(2.962098014195961, 4.837901985804038)
57numpy as np8
(2.962098014195961, 4.837901985804038)
0import0

Output:

(6.920661262464349, 7.3593387375356505)

Các

Ví dụ 2:

Python

import numpy as np

import scipy.stats as st

gfg_data

(2.962098014195961, 4.837901985804038)
0
(2.962098014195961, 4.837901985804038)
46
(6.920661262464349, 7.3593387375356505)
9
(2.962098014195961, 4.837901985804038)
3import1
(2.962098014195961, 4.837901985804038)
3
(2.962098014195961, 4.837901985804038)
51
(2.962098014195961, 4.837901985804038)
52

(2.962098014195961, 4.837901985804038)
53
(2.962098014195961, 4.837901985804038)
0
(2.962098014195961, 4.837901985804038)
22
(6.920661262464349, 7.3593387375356505)
1

(2.962098014195961, 4.837901985804038)
57numpy as np4
(2.962098014195961, 4.837901985804038)
0numpy as np6

(2.962098014195961, 4.837901985804038)
57numpy as np8______10

Output:

(6.689075889330163, 7.450924110669837)

Giải thích từ Ví dụ 3 và Ví dụ 4:

Trong trường hợp của ví dụ 3, khoảng thời gian trung bình tự tin được tính toán của dân số với 90% là (6,92-7,35) và trong ví dụ 4 khi tính toán khoảng trung bình tự tin của dân số với 99% là (6,68-7,45), nó có thể được giải thích rằng khoảng thời gian tự tin ví dụ 4 rộng hơn khoảng thời gian tự tin ví dụ 3 với 95% dân số, điều đó có nghĩa là có 99% cơ hội khoảng tin cậy của [6,68, 7,45] chứa phương tiện dân số thực sự.


Làm thế nào để Python tính toán khoảng tin cậy?

Tạo một mẫu mới dựa trên bộ dữ liệu của chúng tôi, với sự thay thế và với cùng một số điểm.Tính giá trị trung bình và lưu trữ nó trong một mảng hoặc danh sách.Lặp lại quá trình nhiều lần (ví dụ: 1000) trong danh sách các giá trị trung bình, tính toán phần trăm 2,5 và 97,5 phần trăm (nếu bạn muốn khoảng tin cậy 95%)

Chức năng Python nào sẽ cung cấp khoảng tin cậy 95%?

Hàm ppf.Các lập luận cho t.ppf () là q = tỷ lệ phần trăm, df = mức độ tự do, tỷ lệ = std dev, loc = mean.Vì phân phối T là đối xứng cho khoảng tin cậy 95% Q sẽ là 0,975.. The arguments for t. ppf() are q = percentage, df = degree of freedom, scale = std dev, loc = mean. As t-distribution is symmetric for a 95% confidence interval q will be 0.975.

Mô -đun Python nào được sử dụng để tạo khoảng tin cậy Chọn một?

hàm khoảng () từ thư viện scipy.stats để có được khoảng tin cậy cho một phương tiện dân số của bộ dữ liệu đã cho trong Python.scipy. stats library to get the confidence interval for a population means of the given dataset in python.