Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Lấy mẫu từ dân số

Trong một thí nghiệm khoa học điển hình, chúng tôi quan tâm đến hai quần thể (kiểm soát và kiểm tra) và liệu có sự khác biệt giữa các phương tiện của chúng không (MuffTest - MuffControl).

Show

Chúng tôi đi về điều này bằng cách thu thập các quan sát từ dân số kiểm soát và từ dân số thử nghiệm.

Chúng tôi có thể dễ dàng tính toán sự khác biệt trung bình trong các mẫu quan sát của chúng tôi. Đây là ước tính của chúng tôi về quy mô hiệu ứng dân số mà chúng tôi quan tâm.

Nhưng làm thế nào để chúng ta có được một thước đo độ chính xác và niềm tin về ước tính của chúng ta? Chúng ta có thể hiểu được cách nó liên quan đến sự khác biệt có nghĩa là dân số?

Giới thiệu khoảng tin cậy bootstrap

Chúng tôi muốn có được khoảng tin cậy 95% (95% CI) xung quanh ước tính của chúng tôi về sự khác biệt trung bình. 95% chỉ ra rằng bất kỳ khoảng tin cậy nào như vậy sẽ nắm bắt được sự khác biệt trung bình dân số 95% của thời gian11 nói cách khác, nếu chúng ta lặp lại thí nghiệm của mình 100 lần, thu thập 100 bộ quan sát độc lập và tính toán CI 95% cho sự khác biệt trung bình mỗi Thời gian, 95 trong số các khoảng tin cậy này sẽ thu được sự khác biệt trung bình dân số .. nghĩa là, chúng ta có thể tự tin 95% khoảng thời gian chứa trung bình thực sự của dân số.95% confidence interval (95% CI) around the our estimate of the mean difference. The 95% indicates that any such confidence interval will capture the population mean difference 95% of the time11 In other words, if we repeated our experiment 100 times, gathering 100 independent sets of observations, and computing a 95% CI for the mean difference each time, 95 of these confidence intervals would capture the population mean difference.. That is to say, we can be 95% confident the interval contains the true mean of the population.

Chúng ta có thể tính toán CI 95% của chênh lệch trung bình bằng cách thực hiện lấy mẫu Bootstrap.

Bootstrap trong hành động

Bootstrap22 Tên có nguồn gốc từ câu nói của mình bởi một người bootstraps, thường được sử dụng như một sự hô hào để đạt được thành công mà không cần sự giúp đỡ bên ngoài. là một kỹ thuật đơn giản nhưng mạnh mẽ. Nó được mô tả đầu tiên bởi Bradley Efron.2 The name is derived from the saying “pull oneself by one’s bootstraps”, often used as an exhortation to achieve success without external help. is a simple but powerful technique. It was first described by Bradley Efron.

Nó tạo ra nhiều mẫu người (với sự thay thế) từ một bộ quan sát duy nhất và tính toán kích thước hiệu ứng của lợi ích trên mỗi mẫu này. Các mô hình lại bootstrap của kích thước hiệu ứng sau đó có thể được sử dụng để xác định 95% CI.

Với máy tính, chúng tôi có thể thực hiện 5000 resples rất dễ dàng.

Sự phân phối lại của sự khác biệt trong phương tiện tiếp cận phân phối bình thường. Điều này là do định lý giới hạn trung tâm: Một số lượng lớn các mẫu ngẫu nhiên độc lập sẽ tiếp cận phân phối bình thường ngay cả khi dân số cơ bản không được phân phối bình thường.

Bootstrap Resampling mang lại cho chúng ta hai lợi ích quan trọng:

  1. Phân tích thống kê phi tham số. Không cần phải cho rằng các quan sát của chúng tôi, hoặc các quần thể cơ bản, thường được phân phối. Nhờ định lý giới hạn trung tâm, việc phân phối lại kích thước hiệu ứng sẽ tiếp cận tính quy tắc.
  2. Dễ dàng xây dựng CI 95% từ phân phối lại. Đối với 1000 mô hình phân biệt bootstrap của chênh lệch trung bình, người ta có thể sử dụng giá trị thứ 25 và giá trị thứ 975 của sự khác biệt được xếp hạng là ranh giới của khoảng tin cậy 95%. (Điều này nắm bắt được 95% trung tâm của phân phối.) Việc xây dựng khoảng thời gian như vậy được gọi là khoảng phần trăm.

Điều chỉnh các phân phối tái tạo không đối xứng

Mặc dù việc lấy mẫu lại phân phối của sự khác biệt về phương tiện thường có phân phối bình thường, nhưng không có gì lạ khi gặp phân phối sai lệch. Do đó, Efron đã phát triển Bootstrap được điều chỉnh và tăng tốc độ lệch (BCA Bootstrap) để giải thích cho độ lệch và vẫn có được 95% trung tâm của phân phối. Dabest áp dụng hiệu chỉnh BCA cho các phân phối bootstrap lấy mẫu lại của kích thước hiệu ứng.

Các lô ước tính kết hợp lấy lại Bootstrap

Biểu đồ ước tính được tạo ra bởi

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
08 trình bày RawData và khoảng tin cậy bootstrap của kích thước hiệu ứng (sự khác biệt về phương tiện) cạnh nhau như một biểu đồ tích hợp duy nhất. Do đó, nó kết hợp chặt chẽ sự trình bày trực quan của dữ liệu thô với một dấu hiệu của sự khác biệt trung bình dân số và khoảng tin cậy của nó.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Trong Chương 7, chúng tôi đã nghiên cứu lấy mẫu. Chúng tôi bắt đầu với một bài tập xúc giác của người Viking, nơi chúng tôi muốn biết tỷ lệ bóng trong bát lấy mẫu trong Hình 7.1 có màu đỏ. Mặc dù chúng tôi có thể đã thực hiện một số lượng toàn diện, đây sẽ là một quá trình tẻ nhạt. Vì vậy, thay vào đó, chúng tôi đã sử dụng một cái xẻng để trích xuất một mẫu gồm 50 quả bóng và sử dụng tỷ lệ kết quả có màu đỏ làm ước tính. Hơn nữa, chúng tôi đảm bảo trộn các nội dung bát trước khi sử dụng xẻng. Do tính ngẫu nhiên được tạo ra bởi sự pha trộn, các cách sử dụng khác nhau của xẻng mang lại các tỷ lệ khác nhau màu đỏ và do đó các ước tính khác nhau về tỷ lệ của các quả bóng bát có màu đỏ.

Sau đó, chúng tôi đã bắt chước bài tập lấy mẫu xúc giác của người Viking này với một bài tập lấy mẫu ảo ảo tương đương được thực hiện trên máy tính. Sử dụng trình tạo số ngẫu nhiên máy tính của chúng tôi, chúng tôi đã nhanh chóng bắt chước quy trình lấy mẫu ở trên một số lượng lớn. Trong Tiểu mục 7.2, chúng tôi đã nhanh chóng lặp lại quy trình lấy mẫu này 1000 lần, sử dụng ba khe cắm ảo khác nhau với các khe 25, 50 và 100. Chúng tôi đã hình dung ba bộ 1000 ước tính trong Hình 7.15 và thấy rằng kích thước mẫu tăng lên, sự thay đổi trong ước tính giảm.

Khi làm như vậy, những gì chúng tôi đã làm là xây dựng các phân phối lấy mẫu. Động lực để lấy 1000 mẫu lặp đi lặp lại và hình dung các ước tính kết quả là nghiên cứu cách các ước tính này thay đổi từ mẫu này sang mẫu khác; Nói cách khác, chúng tôi muốn nghiên cứu ảnh hưởng của biến thể lấy mẫu. Chúng tôi đã định lượng biến thể của các ước tính này bằng cách sử dụng độ lệch chuẩn của chúng, có tên đặc biệt: lỗi tiêu chuẩn. Cụ thể, chúng tôi đã thấy rằng kích thước mẫu tăng từ 25 đến 50, lỗi tiêu chuẩn giảm và do đó, các phân phối lấy mẫu bị thu hẹp. Kích thước mẫu lớn hơn dẫn đến các ước tính chính xác hơn khác nhau ít hơn xung quanh trung tâm.

Sau đó, chúng tôi buộc các bài tập lấy mẫu này vào thuật ngữ và ký hiệu toán học liên quan đến lấy mẫu trong tiểu mục 7.3.1. Dân số nghiên cứu của chúng tôi là bát lớn với \ (n \) = 2400 quả bóng, trong khi tham số dân số, số lượng quan tâm không xác định, là tỷ lệ dân số \ (p \) của các quả bóng bát có màu đỏ. Vì việc thực hiện điều tra dân số sẽ tốn kém về thời gian và năng lượng, chúng tôi thay vào đó đã trích xuất một mẫu kích thước \ (n \) = 50. Ước tính điểm, còn được gọi là thống kê mẫu, được sử dụng để ước tính \ (p \) là Tỷ lệ mẫu \ (\ Widhat {p} \) của 50 quả bóng được lấy mẫu này có màu đỏ. Hơn nữa, vì mẫu được lấy ngẫu nhiên, nó có thể được coi là không thiên vị và đại diện cho dân số. Do đó, bất kỳ kết quả nào dựa trên mẫu có thể được khái quát cho dân số. Do đó, tỷ lệ của những quả bóng xẻng có màu đỏ là một dự đoán tốt của người Hồi giáo về tỷ lệ của những quả bóng bát có màu đỏ. Nói cách khác, chúng tôi đã sử dụng mẫu để suy ra về dân số.\(N\) = 2400 balls, while the population parameter, the unknown quantity of interest, was the population proportion \(p\) of the bowl’s balls that were red. Since performing a census would be expensive in terms of time and energy, we instead extracted a sample of size \(n\) = 50. The point estimate, also known as a sample statistic, used to estimate \(p\) was the sample proportion \(\widehat{p}\) of these 50 sampled balls that were red. Furthermore, since the sample was obtained at random, it can be considered as unbiased and representative of the population. Thus any results based on the sample could be generalized to the population. Therefore, the proportion of the shovel’s balls that were red was a “good guess” of the proportion of the bowl’s balls that are red. In other words, we used the sample to infer about the population.

Tuy nhiên, như được mô tả trong Phần 7.2, cả các bài tập lấy mẫu ảo và ảo không phải là những gì người ta sẽ làm trong cuộc sống thực; Đây chỉ là một hoạt động được sử dụng để nghiên cứu ảnh hưởng của biến thể lấy mẫu. Trong một tình huống thực tế, chúng tôi sẽ không lấy 1000 mẫu có kích thước \ (n \), mà là lấy một mẫu đại diện duy nhất mà LỚN càng lớn càng tốt. Ngoài ra, chúng tôi biết rằng tỷ lệ thực sự của những quả bóng bát có màu đỏ là 37,5%. Trong một tình huống thực tế, chúng ta sẽ không biết giá trị này là gì. Bởi vì nếu chúng tôi đã làm, thì tại sao chúng tôi lại lấy một mẫu để ước tính nó?\(n\), but rather take a single representative sample that’s as large as possible. Additionally, we knew that the true proportion of the bowl’s balls that were red was 37.5%. In a real-life situation, we will not know what this value is. Because if we did, then why would we take a sample to estimate it?

Một ví dụ về một tình huống lấy mẫu thực tế sẽ là một cuộc thăm dò, như cuộc thăm dò của Obama mà bạn đã thấy trong Phần 7.4. Những người gây ô nhiễm không biết tỷ lệ thực sự của tất cả những người Mỹ trẻ tuổi ủng hộ Tổng thống Obama vào năm 2013, và do đó họ đã lấy một mẫu có kích thước \ (n \) = 2089 thanh niên Mỹ ước tính giá trị này.\(n\) = 2089 young Americans to estimate this value.

Vậy làm thế nào để một người định lượng các tác động của biến thể lấy mẫu khi bạn chỉ có một mẫu để làm việc? Bạn không thể nghiên cứu trực tiếp các tác động của biến thể lấy mẫu khi bạn chỉ có một mẫu. Một phương pháp phổ biến để nghiên cứu điều này là lấy mẫu bootstrapping, đó sẽ là trọng tâm của các phần trước của chương này.

Hơn nữa, điều gì sẽ xảy ra nếu chúng ta muốn không chỉ một ước tính duy nhất về tham số dân số chưa biết, mà còn là một loạt các giá trị rất hợp lý? Quay trở lại bài báo của Obama Poll, nó tuyên bố rằng những người thăm dò ý kiến ​​ước tính tỷ lệ của tất cả những người Mỹ trẻ ủng hộ Tổng thống Obama là 41%. Nhưng ngoài ra, nó đã tuyên bố rằng tỷ lệ lỗi của cuộc thăm dò là cộng hoặc trừ 2,1 điểm phần trăm. Phạm vi hợp lý của người Viking này là [41% - 2,1%, 41% + 2,1%] = [38,9%, 43,1%]. Phạm vi của các giá trị hợp lý này là những gì được gọi là khoảng tin cậy, đó sẽ là trọng tâm của các phần sau của chương này.

Các gói cần thiết

Hãy để tải tất cả các gói cần thiết cho chương này (điều này giả sử bạn đã cài đặt chúng). Nhớ lại từ cuộc thảo luận của chúng tôi trong Phần 4.4 tải gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
09 bằng cách chạy
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
10 tải các gói khoa học dữ liệu thường được sử dụng sau đây cùng một lúc:

  • # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    11 để trực quan hóa dữ liệu
  • # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    12 cho dữ liệu Wrangling
  • # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    13 để chuyển đổi dữ liệu thành định dạng gọn gàng
  • # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    14 để nhập dữ liệu bảng tính vào r
  • Cũng như
    # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    15,
    # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    16,
    # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    17 và
    # A tibble: 50 × 2
          ID  year
        
     1     1  2002
     2     2  1986
     3     3  2017
     4     4  1988
     5     5  2008
     6     6  1983
     7     7  2008
     8     8  1996
     9     9  2004
    10    10  2000
    # … with 40 more rows
    18 nâng cao

Nếu cần, hãy đọc Phần 1.3 để biết thông tin về cách cài đặt và tải các gói R.

library(tidyverse)
library(moderndive)
library(infer)

Hoạt động đồng xu

Như chúng tôi đã làm trong Chương 7, chúng tôi sẽ bắt đầu với một hoạt động xúc giác thực hành.

Năm trung bình của chúng tôi là đồng xu năm 2019 là gì?

Hãy cố gắng tưởng tượng tất cả các đồng xu đang được sử dụng ở Hoa Kỳ vào năm 2019. Đó là rất nhiều đồng xu! Bây giờ nói rằng chúng tôi quan tâm đến năm trung bình của tất cả các đồng xu này. Một cách để tính toán giá trị này là thu thập tất cả các đồng xu đang được sử dụng ở Mỹ, ghi lại năm và tính toán trung bình. Tuy nhiên, điều này sẽ gần như không thể! Vì vậy, thay vào đó, hãy để Lôi thu thập một mẫu gồm 50 đồng xu từ một ngân hàng địa phương ở trung tâm thành phố Northampton, Massachusetts, Hoa Kỳ như trong Hình 8.1.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?
Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.1: Thu thập một mẫu 50 đồng xu của Hoa Kỳ từ một ngân hàng địa phương.

Một hình ảnh của 50 đồng xu này có thể được nhìn thấy trong Hình 8.2. Đối với mỗi trong số 50 đồng xu bắt đầu ở phía trên bên trái, chuyển đổi từng hàng và kết thúc ở phía dưới bên phải, chúng tôi đã chỉ định một biến nhận dạng ID ID và được đánh dấu năm của việc khai thác.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.2: 50 đồng xu Hoa Kỳ được dán nhãn.

Gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19 chứa dữ liệu này trên 50 đồng xu được lấy mẫu của chúng tôi trong khung dữ liệu
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows

Khung dữ liệu

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 có 50 hàng tương ứng với mỗi xu với hai biến. Biến đầu tiên
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
22 tương ứng với các nhãn ID trong Hình 8.2, trong khi biến thứ hai
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 tương ứng với năm khai thác được lưu dưới dạng biến số, còn được gọi là Double (
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
24).

Dựa trên 50 đồng xu được lấy mẫu này, chúng ta có thể nói gì về tất cả các đồng xu của Hoa Kỳ trong năm 2019? Hãy cùng nghiên cứu một số thuộc tính của mẫu của chúng tôi bằng cách thực hiện phân tích dữ liệu khám phá. Trước tiên, hãy trực quan hóa việc phân phối năm của 50 đồng xu này bằng cách sử dụng các công cụ trực quan hóa dữ liệu của chúng tôi từ Chương 2. Vì

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 là một biến số, chúng tôi sử dụng biểu đồ trong Hình 8.3 để trực quan hóa phân phối của nó.

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.3: Phân phối năm trên 50 đồng xu của Hoa Kỳ.

Quan sát một phân phối sai lệch hơi trái, vì hầu hết các đồng xu giảm từ năm 1980 đến 2010 chỉ với một vài đồng xu lớn hơn 1970. Năm trung bình của 50 đồng xu được lấy mẫu là bao nhiêu? Nhờ biểu đồ biểu đồ mà nó dường như là vào khoảng năm 1990. Bây giờ, hãy tính toán chính xác giá trị này bằng cách sử dụng các công cụ Wrangling dữ liệu của chúng tôi từ Chương 3.

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar

# A tibble: 1 × 1
  mean_year
      
1   1995.44

Do đó, nếu chúng tôi sẵn sàng cho rằng

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 là một mẫu đại diện từ tất cả các đồng xu của Hoa Kỳ, thì một dự đoán tốt của người Hồi giáo về việc khai thác trung bình của tất cả các đồng xu của Hoa Kỳ sẽ là năm 1995,44. Nói cách khác, khoảng năm 1995. Tất cả điều này sẽ bắt đầu nghe tương tự như những gì chúng ta đã làm trước đây trong Chương 7!

Trong Chương 7, dân số nghiên cứu của chúng tôi là bát \ (n \) = 2400 quả bóng. Thông số dân số của chúng tôi là tỷ lệ dân số của những quả bóng có màu đỏ, được ký hiệu là \ (p \). Để ước tính \ (p \), chúng tôi đã trích xuất một mẫu 50 quả bóng bằng xẻng. Sau đó, chúng tôi đã tính toán ước tính điểm có liên quan: Tỷ lệ mẫu của 50 quả bóng màu đỏ, được biểu thị về mặt toán học bằng \ (\ Widhat {p} \).\(N\) = 2400 balls. Our population parameter was the population proportion of these balls that were red, denoted by \(p\). In order to estimate \(p\), we extracted a sample of 50 balls using the shovel. We then computed the relevant point estimate: the sample proportion of these 50 balls that were red, denoted mathematically by \(\widehat{p}\).

Ở đây, dân số của chúng tôi là \ (n \) = bất kể số đồng xu đang được sử dụng ở Mỹ, một giá trị mà chúng tôi không biết và có lẽ sẽ không bao giờ. Tham số dân số quan tâm hiện là năm trung bình dân số của tất cả các đồng xu này, một giá trị được biểu thị bằng toán học bằng chữ Hy Lạp \ (\ mu \) (phát âm là Mu Mu Mu). Để ước tính \ (\ mu \), chúng tôi đã đến ngân hàng và lấy một mẫu gồm 50 đồng xu và tính toán ước tính điểm liên quan: Năm trung bình của 50 đồng xu này, được biểu thị bằng toán học bằng \ (\ Overline {x} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ ) (phát âm là X X-Bar). Một ký hiệu thay thế và trực quan hơn cho giá trị trung bình của mẫu là \ (\ widhat {\ mu} \). Tuy nhiên, điều này không may là không được sử dụng phổ biến, vì vậy trong cuốn sách này, chúng tôi sẽ gắn bó với quy ước và luôn biểu thị giá trị trung bình của mẫu là \ (\ Overline {x} \).\(N\) = whatever the number of pennies are being used in the US, a value which we don’t know and probably never will. The population parameter of interest is now the population mean year of all these pennies, a value denoted mathematically by the Greek letter \(\mu\) (pronounced “mu”). In order to estimate \(\mu\), we went to the bank and obtained a sample of 50 pennies and computed the relevant point estimate: the sample mean year of these 50 pennies, denoted mathematically by \(\overline{x}\) (pronounced “x-bar”). An alternative and more intuitive notation for the sample mean is \(\widehat{\mu}\). However, this is unfortunately not as commonly used, so in this book we’ll stick with convention and always denote the sample mean as \(\overline{x}\).

Chúng tôi tóm tắt sự tương ứng giữa bài tập lấy mẫu trong Chương 7 và bài tập đồng xu của chúng tôi trong Bảng 8.1, là hai hàng đầu tiên của Bảng 7.5 đã thấy trước đó.

Bảng 8.1: Các kịch bản lấy mẫu cho suy luậnScenarios of sampling for inference
Kịch bản Số liệu dân sốKý hiệu Ước tính điểm (Các) biểu tượng
1 Tỷ lệ dân số \(P\) Tỷ lệ mẫu \ (\ widhat {p} \)
2 Dân số có nghĩa là \ (\ mu \) Mẫu trung bình \ (\ Overline {x} \) hoặc \ (\ widehat {\ mu} \) or \(\widehat{\mu}\)

Quay trở lại với 50 đồng xu được lấy mẫu của chúng tôi trong Hình 8.2, ước tính điểm quan tâm là trung bình mẫu \ (\ Overline {x} \) năm 1995.44. Số lượng này là một ước tính về dân số trung bình của tất cả các đồng xu của Hoa Kỳ \ (\ mu \).\(\overline{x}\) of 1995.44. This quantity is an estimate of the population mean year of all US pennies \(\mu\).

Hãy nhớ lại rằng chúng ta cũng đã thấy trong Chương 7 rằng các ước tính như vậy dễ bị biến đổi lấy mẫu. Ví dụ, trong mẫu cụ thể này trong Hình 8.2, chúng tôi đã quan sát ba đồng xu với năm 1999. Nếu chúng tôi lấy mẫu 50 đồng xu khác, chúng tôi có quan sát chính xác ba đồng xu với năm 1999 không? Nhiều khả năng không. Chúng tôi có thể quan sát không, một, hai, hoặc thậm chí tất cả 50! Điều tương tự có thể được nói trong 26 năm độc đáo khác được thể hiện trong mẫu 50 xu của chúng tôi.

Để nghiên cứu ảnh hưởng của biến thể lấy mẫu trong Chương 7, chúng tôi đã lấy nhiều mẫu, một điều chúng tôi có thể dễ dàng làm với xẻng của mình. Trong trường hợp của chúng tôi với đồng xu, tuy nhiên, làm thế nào chúng ta có được một mẫu khác? Bằng cách đi đến ngân hàng và nhận được một cuộn 50 xu khác.

Tuy nhiên, chúng tôi cảm thấy lười biếng, và don không muốn quay lại ngân hàng. Làm thế nào chúng ta có thể nghiên cứu ảnh hưởng của biến thể lấy mẫu bằng cách sử dụng mẫu đơn của chúng tôi? Chúng tôi sẽ làm như vậy bằng cách sử dụng một kỹ thuật được gọi là Bootstrap Respling với sự thay thế, mà bây giờ chúng tôi minh họa.

Lấy mẫu lại một lần

Bước 1: Hãy để in ra những miếng giấy có kích thước giống hệt nhau đại diện cho 50 đồng xu của chúng tôi như trong Hình 8.4.: Let’s print out identically sized slips of paper representing our 50 pennies as seen in Figure 8.4.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.4: Bước 1: 50 Slips của giấy đại diện cho 50 đồng xu của Hoa Kỳ.

Bước 2: Đặt 50 miếng giấy vào mũ hoặc tuque như trong Hình 8.5.: Put the 50 slips of paper into a hat or tuque as seen in Figure 8.5.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.5: Bước 2: Đặt 50 miếng giấy vào mũ.

Bước 3: Trộn các nội dung mũ và vẽ một tấm giấy một cách ngẫu nhiên như trong Hình 8.6. Ghi lại năm.: Mix the hat’s contents and draw one slip of paper at random as seen in Figure 8.6. Record the year.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.6: Bước 3: Vẽ một tờ giấy một cách ngẫu nhiên.

Bước 4: Đặt phiếu của giấy trở lại trong mũ! Nói cách khác, thay thế nó như trong Hình 8.7.: Put the slip of paper back in the hat! In other words, replace it as seen in Figure 8.7.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.7: Bước 4: Thay thế phiếu giấy.

Bước 5: Lặp lại các bước 3 và 4 Tổng cộng 49 lần nữa, dẫn đến 50 năm được ghi lại.: Repeat Steps 3 and 4 a total of 49 more times, resulting in 50 recorded years.

Những gì chúng tôi vừa thực hiện là việc lấy lại mẫu ban đầu của 50 đồng xu. Chúng tôi không lấy mẫu 50 đồng xu từ dân số của tất cả chúng tôi như chúng tôi đã làm trong chuyến đi đến ngân hàng. Thay vào đó, chúng tôi đang bắt chước hành động này bằng cách lấy lại 50 đồng xu từ mẫu ban đầu của chúng tôi là 50 đồng xu.

Bây giờ hãy tự hỏi, tại sao chúng tôi lại thay thế phiếu được lấy lại của chúng tôi vào mũ trong Bước 4? Bởi vì nếu chúng tôi để lại tấm giấy ra khỏi mũ mỗi khi chúng tôi thực hiện Bước 4, chúng tôi sẽ kết thúc với cùng 50 đồng xu ban đầu! Nói cách khác, việc thay thế các phiếu của giấy gây ra sự thay đổi lấy mẫu.

Chính xác hơn với thuật ngữ của chúng tôi, chúng tôi chỉ thực hiện lấy mẫu lại với sự thay thế từ mẫu ban đầu là 50 đồng xu. Nếu chúng tôi để lại tấm giấy ra khỏi mũ mỗi lần chúng tôi thực hiện Bước 4, điều này sẽ được lấy mẫu lại mà không cần thay thế.

Hãy cùng nghiên cứu 50 đồng xu được lấy lại của chúng tôi thông qua phân tích dữ liệu khám phá. Đầu tiên, hãy để tải dữ liệu vào R bằng cách tạo thủ công khung dữ liệu

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
27 trong số 50 giá trị được lấy lại của chúng tôi. Chúng tôi sẽ thực hiện việc này bằng cách sử dụng lệnh
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
28 từ gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12. Lưu ý rằng 50 giá trị bạn lấy lại gần như chắc chắn sẽ không giống như chúng tôi được đưa ra sự ngẫu nhiên vốn có.

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)

50 giá trị của

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
27 đại diện cho một mẫu lấy lại kích thước 50 từ mẫu ban đầu của 50 xu. Chúng tôi hiển thị 50 đồng xu được ghép lại trong Hình 8.8.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.8: 50 PENNIES Hoa Kỳ được lấy lại được dán nhãn.

Hãy để so sánh sự phân phối của biến số

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 trong số 50 đồng xu được lấy lại của chúng tôi với phân phối biến số
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 của mẫu ban đầu của chúng tôi là 50 đồng xu trong Hình 8.9.

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.9: So sánh

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
27 được lấy lại với mẫu ban đầu
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20.

Quan sát trong Hình 8.9 rằng trong khi các hình dạng chung của cả hai phân phối của

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 gần giống nhau, chúng không giống nhau.

Nhớ lại từ phần trước rằng trung bình mẫu của mẫu ban đầu là 50 đồng xu từ ngân hàng là 1995,44. Còn việc lấy mẫu của chúng tôi thì sao? Đoán nào? Hãy để Lừa có

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 giúp chúng tôi như trước:

pennies_resample %>% 
  summarize(mean_year = mean(year))

# A tibble: 1 × 1
  mean_year
      
1      1996

Chúng tôi đã thu được một năm trung bình khác nhau của năm 1996. Biến thể này được gây ra bởi việc lấy mẫu lại với sự thay thế mà chúng tôi đã thực hiện trước đó.

Điều gì sẽ xảy ra nếu chúng ta lặp lại bài tập lấy mẫu này nhiều lần? Chúng ta sẽ có được ý nghĩa tương tự

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 mỗi lần? Nói cách khác, liệu chúng ta có đoán vào năm trung bình của tất cả các đồng xu ở Mỹ năm 2019 là chính xác năm 1996 mỗi lần không? Giống như chúng tôi đã làm trong Chương 7, hãy để thực hiện hoạt động lấy mẫu này với sự giúp đỡ của một số người bạn của chúng tôi: tổng cộng 35 người bạn.

Đặt lại 35 lần

Mỗi trong số 35 người bạn của chúng tôi sẽ lặp lại năm bước giống nhau:

  1. Bắt đầu với 50 miếng giấy có kích thước giống hệt nhau đại diện cho 50 đồng xu.
  2. Đặt 50 mảnh giấy nhỏ vào mũ hoặc mũ beanie.
  3. Trộn các nội dung mũ và vẽ một tấm giấy một cách ngẫu nhiên. Ghi lại năm trong một bảng tính.
  4. Thay thế trượt giấy trở lại trong chiếc mũ!
  5. Lặp lại các bước 3 và 4 tổng cộng 49 lần nữa, dẫn đến 50 năm được ghi lại.

Vì chúng tôi đã có 35 người bạn thực hiện nhiệm vụ này, chúng tôi đã kết thúc với các giá trị \ (35 \ cdot 50 = 1750 \). Chúng tôi đã ghi lại các giá trị này trong một bảng tính được chia sẻ với 50 hàng (cộng với hàng tiêu đề) và 35 cột. Chúng tôi hiển thị một ảnh chụp nhanh của 10 hàng đầu tiên và năm cột của bảng tính được chia sẻ này trong Hình 8.10.\(35 \cdot 50 = 1750\) values. We recorded these values in a shared spreadsheet with 50 rows (plus a header row) and 35 columns. We display a snapshot of the first 10 rows and five columns of this shared spreadsheet in Figure 8.10.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.10: Ảnh chụp bảng tính chung của đồng xu được lấy lại.

Để thuận tiện cho bạn, chúng tôi đã lấy các giá trị 35 \ (\ cdot \) 50 = 1750 này và lưu chúng trong

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
40, một khung dữ liệu gọn gàng của Hồi giáo có trong gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19. Chúng tôi đã thấy ý nghĩa của một khung dữ liệu là gọn gàng trong tiểu mục 4.2.1.\(\cdot\) 50 = 1750 values and saved them in
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
40, a “tidy” data frame included in the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19 package. We saw what it means for a data frame to be “tidy” in Subsection 4.2.1.

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows

Mỗi 35 người bạn của chúng tôi có được là năm có nghĩa là gì? Một lần nữa,

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 để giải cứu! Sau khi nhóm các hàng với
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
43, chúng tôi tóm tắt từng nhóm gồm 50 hàng theo giá trị trung bình của chúng
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
0

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
1

Quan sát rằng

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
45 có 35 hàng tương ứng với 35 phương tiện dựa trên 35 mẫu lại. Hơn nữa, quan sát sự thay đổi trong 35 giá trị trong biến
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
46. Hãy để trực quan hóa biến thể này bằng cách sử dụng biểu đồ trong Hình 8.11. Hãy nhớ lại rằng việc thêm đối số
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
47 vào
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
48 đặt cấu trúc Binning sao cho một trong các ranh giới thùng ở năm 1990 chính xác.

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
2

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.11: Phân phối 35 phương tiện mẫu từ 35 mẫu.

Quan sát trong Hình 8.11 rằng phân phối có vẻ gần như bình thường và chúng tôi hiếm khi quan sát mẫu trung bình mẫu dưới năm 1992 hoặc lớn hơn 2000. Cũng quan sát cách phân phối tập trung gần như vào năm 1995, gần với trung bình mẫu của năm 1995,44 của mẫu ban đầu của 50 đồng xu từ ngân hàng.

Chúng ta vừa làm gì?

Những gì chúng tôi vừa thể hiện trong hoạt động này là quy trình thống kê được gọi là Bootstrap Respling với sự thay thế. Chúng tôi đã sử dụng lấy mẫu lại để bắt chước biến thể lấy mẫu mà chúng tôi đã nghiên cứu trong Chương 7 về lấy mẫu. Tuy nhiên, trong trường hợp này, chúng tôi đã làm như vậy chỉ sử dụng một mẫu duy nhất từ ​​dân số.

Trên thực tế, biểu đồ của các phương tiện mẫu từ 35 mẫu trong Hình 8.11 được gọi là phân phối bootstrap. Đó là một xấp xỉ cho phân phối lấy mẫu của giá trị trung bình mẫu, theo nghĩa là cả hai phân phối sẽ có hình dạng tương tự và sự lây lan tương tự. Trong thực tế trong phần 8.7 sắp tới, chúng tôi sẽ cho bạn thấy rằng đây là trường hợp. Sử dụng phân phối bootstrap này, chúng ta có thể nghiên cứu ảnh hưởng của sự thay đổi lấy mẫu đối với các ước tính của chúng tôi. Cụ thể, chúng tôi sẽ nghiên cứu các lỗi điển hình của các ước tính của chúng tôi, được gọi là lỗi tiêu chuẩn.

Trong Phần 8.2, chúng tôi sẽ bắt chước hoạt động lấy mẫu xúc giác của chúng tôi hầu như trên máy tính, cho phép chúng tôi nhanh chóng thực hiện lấy mẫu lại nhiều hơn 35 lần. Trong Phần 8.3, chúng tôi sẽ xác định khái niệm thống kê về khoảng tin cậy, xây dựng khái niệm phân phối bootstrap.

Trong Phần 8.4, chúng tôi sẽ xây dựng các khoảng tin cậy bằng cách sử dụng gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12, cũng như gói mới: gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 cho các bản tin gọn gàng và suy luận thống kê minh bạch. Chúng tôi sẽ giới thiệu khung suy luận thống kê của người Viking, đó là động lực cho đường ống gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50. Gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 sẽ là gói lái xe trong suốt phần còn lại của cuốn sách này.

Như chúng tôi đã làm trong Chương 7, chúng tôi sẽ gắn kết tất cả những ý tưởng này cùng với một nghiên cứu trường hợp thực tế trong Phần 8.6. Lần này, chúng tôi sẽ xem xét dữ liệu từ một thử nghiệm về việc ngáp từ chương trình truyền hình của Mỹ.

Mô phỏng máy tính lấy mẫu lại

Bây giờ, hãy bắt chước hoạt động tái định cư xúc giác của chúng tôi hầu như bằng máy tính.

Hầu như lại lấy mẫu một lần

Đầu tiên, hãy để thực hiện tương tự ảo của việc lấy mẫu lại một lần. Hãy nhớ lại rằng khung dữ liệu

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 có trong gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19 chứa các năm của mẫu ban đầu của chúng tôi là 50 đồng xu từ ngân hàng. Hơn nữa, hãy nhớ lại trong Chương 7 về lấy mẫu rằng chúng tôi đã sử dụng chức năng
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 như một cái xẻng ảo để lấy mẫu bóng từ bát ảo 2400 quả bóng như sau:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
3

Hãy để sửa đổi mã này để thực hiện lấy mẫu lại bằng cách thay thế 50 miếng giấy đại diện cho mẫu ban đầu của chúng tôi 50 đồng xu:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
4

Quan sát cách chúng tôi đặt một cách rõ ràng đối số

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
56 thành
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
57 để nói với
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 rằng chúng tôi muốn lấy mẫu đồng xu bằng cách thay thế. Nếu chúng tôi không đặt
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
59, chức năng sẽ đảm nhận giá trị mặc định là
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
60 và do đó thực hiện lại được lấy mẫu mà không thay thế. Ngoài ra, vì chúng tôi đã chỉ định số lượng bản sao thông qua đối số
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
61, hàm giả định mặc định của một bản sao
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
62. Cuối cùng, cũng quan sát rằng đối số
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
63 được đặt để phù hợp với cỡ mẫu ban đầu là 50 xu.

Chúng ta hãy nhìn vào chỉ 10 trong số 50 hàng đầu tiên của

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
64:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
5

Biến

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 chỉ có giá trị của 1 tương ứng với chúng tôi chỉ có
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
62, biến
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
22 cho biết trong số 50 đồng xu từ
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 đã được lấy lại và
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 biểu thị năm khai thác. Bây giờ, hãy tính toán trung bình
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 trong mẫu lại ảo của chúng tôi về kích thước 50 bằng cách sử dụng các chức năng gây tranh cãi dữ liệu có trong gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
6

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
7

Như chúng ta đã thấy khi chúng ta thực hiện bài tập lấy mẫu xúc giác của chúng ta, năm kết quả là năm khác với năm trung bình của 50 đồng xu được lấy mẫu ban đầu của chúng ta là 1995,44.

Hầu như lại lấy lại 35 lần

Bây giờ, hãy thực hiện tương tự ảo của 35 người bạn của chúng tôi. Sử dụng các kết quả này, chúng tôi sẽ có thể nghiên cứu tính thay đổi trong các phương tiện mẫu từ 35 mẫu có kích thước 50. Trước tiên, hãy thêm một đối số

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
72 vào
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 để cho biết chúng tôi muốn có 35 lần lặp lại. Do đó, chúng tôi muốn lặp lại việc lấy mẫu lại với việc thay thế 50 xu 35 lần.

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
8

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
9

Khung dữ liệu

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
74 kết quả có 35 \ (\ cdot \) 50 = 1750 hàng tương ứng với 35 mẫu người của 50 xu. Bây giờ, hãy để tính toán 35 mẫu kết quả có nghĩa là sử dụng cùng một mã
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 như chúng tôi đã làm trong phần trước, nhưng lần này là thêm một
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
76:\(\cdot\) 50 = 1750 rows corresponding to 35 resamples of 50 pennies. Let’s now compute the resulting 35 sample means using the same
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 code as we did in the previous section, but this time adding a
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
76:

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
0

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
1

Quan sát rằng

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
77 có 35 hàng, tương ứng với 35 phương tiện được ghép lại. Hơn nữa, quan sát rằng các giá trị của
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
46 khác nhau. Hãy để trực quan hóa biến thể này bằng cách sử dụng biểu đồ trong Hình 8.12.

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
2

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.12: Phân phối 35 phương tiện mẫu từ 35 mẫu.

Hãy để so sánh phân phối bootstrap gần như được xây dựng của chúng tôi với cái 35 người bạn của chúng tôi được xây dựng thông qua bài tập lấy mẫu xúc giác của chúng tôi trong Hình 8.13. Quan sát làm thế nào chúng có phần giống nhau, nhưng không giống nhau.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.13: So sánh phân phối các phương tiện từ các mẫu.

Hãy nhớ lại rằng trong bộ phận lại của người Viking với kịch bản thay thế, chúng tôi đang minh họa ở đây, cả hai biểu đồ này đều có một tên đặc biệt: phân phối bootstrap của trung bình mẫu. Hơn nữa, nhớ lại chúng là một xấp xỉ trong phân phối lấy mẫu của giá trị trung bình mẫu, một khái niệm bạn đã thấy trong Chương 7 về lấy mẫu. Các phân phối này cho phép chúng tôi nghiên cứu ảnh hưởng của sự thay đổi lấy mẫu đối với các ước tính của chúng tôi về trung bình dân số thực sự, trong trường hợp này là năm trung bình thực sự đối với tất cả các đồng xu của Hoa Kỳ. Tuy nhiên, không giống như trong Chương 7, nơi chúng tôi đã lấy nhiều mẫu (điều mà người ta sẽ không bao giờ làm trong thực tế), các bản phân phối bootstrap được xây dựng bằng cách lấy nhiều mẫu từ một mẫu: trong trường hợp này, 50 đồng xu ban đầu từ ngân hàng.

Hầu như lại lấy lại 1000 lần

Hãy nhớ rằng một trong những mục tiêu của việc lấy mẫu lại với sự thay thế là xây dựng phân phối bootstrap, đây là một xấp xỉ của phân phối lấy mẫu. Tuy nhiên, phân phối bootstrap trong Hình 8.12 chỉ dựa trên 35 mẫu và do đó trông hơi thô. Hãy để tăng số lượng các mẫu phân chia lên 1000, để chúng ta có thể hy vọng thấy rõ hơn về hình dạng và sự thay đổi giữa các mẫu khác nhau.

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
3

Tuy nhiên, vì lợi ích của sự ngắn gọn, trong tương lai, hãy để kết hợp hai hoạt động này thành một chuỗi các nhà khai thác đường ống (

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
79):

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
4

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
5

Trong Hình 8.14, hãy để trực quan hóa phân phối bootstrap của 1000 phương tiện này dựa trên 1000 mẫu người ảo:

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
6

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.14: Phân phối tái tạo Bootstrap dựa trên 1000 mẫu.

Lưu ý ở đây rằng hình dạng chuông đang bắt đầu trở nên rõ ràng hơn nhiều. Bây giờ chúng ta có một ý nghĩa chung cho phạm vi các giá trị mà mẫu trung bình có thể đảm nhận. Nhưng biểu đồ này ở đâu? Hãy để tính toán giá trị trung bình của 1000 mẫu lại có nghĩa là:

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
7

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
8

Giá trị trung bình của 1000 phương tiện này là 1995.36, khá gần với giá trị trung bình của mẫu ban đầu của chúng tôi là 50 đồng xu năm 1995,44. Đây là trường hợp vì mỗi trong số 1000 mẫu người dựa trên mẫu ban đầu là 50 đồng xu.

Xin chúc mừng! Bạn chỉ cần xây dựng phân phối bootstrap đầu tiên của bạn! Trong phần tiếp theo, bạn sẽ thấy cách sử dụng phân phối bootstrap này để xây dựng các khoảng tin cậy.

Kiểm tra học tập

(LC8.1) Sự khác biệt chính giữa phân phối bootstrap và phân phối lấy mẫu là gì? What is the chief difference between a bootstrap distribution and a sampling distribution?

. Looking at the bootstrap distribution for the sample mean in Figure 8.14, between what two values would you say most values lie?

Hiểu khoảng tin cậy

Hãy để bắt đầu phần này với một sự tương tự liên quan đến câu cá. Giả sử bạn đang cố gắng bắt một con cá. Một mặt, bạn có thể sử dụng một ngọn giáo, trong khi mặt khác bạn có thể sử dụng mạng. Sử dụng mạng có thể sẽ cho phép bạn bắt thêm cá!

Bây giờ hãy nghĩ lại với bài tập Pennies của chúng tôi, nơi bạn đang cố gắng ước tính dân số thực sự có nghĩa là năm \ (\ mu \) của tất cả các đồng xu của chúng tôi. Hãy nghĩ về giá trị của \ (\ mu \) như một con cá.\(\mu\) of all US pennies. Think of the value of \(\mu\) as a fish.

Một mặt, chúng ta có thể sử dụng thống kê ước tính/mẫu điểm thích hợp để ước tính \ (\ mu \), mà chúng ta đã thấy trong Bảng 8.1 là trung bình mẫu \ (\ Overline {x} \). Dựa trên mẫu 50 đồng xu của chúng tôi từ ngân hàng, giá trị trung bình của mẫu là 1995,44. Hãy nghĩ về việc sử dụng giá trị này như là câu cá với một ngọn giáo.\(\mu\), which we saw in Table 8.1 is the sample mean \(\overline{x}\). Based on our sample of 50 pennies from the bank, the sample mean was 1995.44. Think of using this value as “fishing with a spear.”

Câu cá nào với một mạng lưới tương ứng với một mạng lưới tương ứng với? Nhìn vào phân phối bootstrap trong Hình 8.14 một lần nữa. Giữa hai năm bạn sẽ nói rằng hầu hết các mẫu của người Viking có nghĩa là nói dối? Mặc dù câu hỏi này có phần chủ quan, nói rằng hầu hết các mẫu có nghĩa là nằm giữa năm 1992 và 2000 sẽ không phải là không hợp lý. Hãy nghĩ về khoảng thời gian này như mạng lưới.

Những gì chúng tôi chỉ minh họa là khái niệm về một khoảng tin cậy, mà chúng tôi sẽ viết tắt với các CI CI trong suốt cuốn sách này. Trái ngược với thống kê ước tính/mẫu điểm ước tính giá trị của tham số dân số chưa biết với một giá trị duy nhất, khoảng tin cậy đưa ra những gì có thể được hiểu là một phạm vi của các giá trị hợp lý. Quay trở lại với sự tương tự của chúng tôi, các ước tính điểm/thống kê mẫu có thể được coi là giáo, trong khi khoảng tin cậy có thể được coi là lưới.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.15: Sự tương tự của sự khác biệt giữa ước tính điểm và khoảng tin cậy.

Khoảng cách đề xuất của chúng tôi từ năm 1992 đến 2000 được xây dựng bằng mắt và do đó có phần chủ quan. Bây giờ chúng tôi giới thiệu hai phương pháp để xây dựng các khoảng thời gian như vậy theo cách chính xác hơn: phương pháp phần trăm và phương pháp lỗi tiêu chuẩn.

Cả hai phương pháp để xây dựng khoảng tin cậy chia sẻ một số điểm tương đồng. Đầu tiên, cả hai đều được xây dựng từ phân phối bootstrap, khi bạn xây dựng trong tiểu mục 8.2.3 và được hiển thị trong Hình 8.14.

Thứ hai, cả hai đều yêu cầu bạn chỉ định mức độ tin cậy. Mức độ tin cậy thường được sử dụng bao gồm 90%, 95%và 99%. Tất cả những thứ khác đều bằng nhau, mức độ tin cậy cao hơn tương ứng với khoảng tin cậy rộng hơn và mức độ tin cậy thấp hơn tương ứng với khoảng tin cậy hẹp hơn. Trong cuốn sách này, chúng tôi sẽ chủ yếu sử dụng 95% và do đó xây dựng khoảng tin cậy 95% cho \ (\ mu \) cho hoạt động của chúng tôi.\(\mu\)” for our pennies activity.

Phương pháp phần trăm

Một phương pháp để xây dựng khoảng tin cậy là sử dụng 95% giá trị của phân phối bootstrap. Chúng ta có thể làm điều này bằng cách tính toán phần trăm 2,5 và 97,5, lần lượt là 1991.059 và 1999.283. Đây được gọi là phương pháp phần trăm để xây dựng khoảng tin cậy.

Hiện tại, hãy để tập trung vào các khái niệm đằng sau một phương pháp phần trăm được xây dựng khoảng tin cậy; Chúng tôi sẽ hiển thị cho bạn mã tính toán các giá trị này trong phần tiếp theo.

Hãy để đánh dấu các phần trăm này trên phân phối bootstrap với các đường thẳng đứng trong Hình 8.16. Khoảng 95% các giá trị biến

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
46 trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
77 rơi vào khoảng thời gian năm 1991.059 và 1999.283, với 2,5% ở bên trái của dòng ngoài cùng bên trái và 2,5% ở bên phải của dòng ngoài cùng bên phải.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.16: Phương pháp phần trăm 95% Khoảng tin cậy. Các điểm cuối khoảng được đánh dấu bằng các đường thẳng đứng.

Phương pháp lỗi tiêu chuẩn

Nhớ lại trong Phụ lục A.2, chúng tôi đã thấy rằng nếu một biến số theo phân phối bình thường, hoặc, nói cách khác, biểu đồ của biến này có hình chuông, sau đó khoảng 95% giá trị nằm giữa \ (\ pm \) 1.96 Độ lệch chuẩn của giá trị trung bình. Cho rằng phân phối bootstrap của chúng tôi dựa trên 1000 mẫu người thay thế trong Hình 8.14 thường được định hình, hãy để sử dụng thực tế này về các phân phối bình thường để xây dựng khoảng tin cậy theo một cách khác.\(\pm\) 1.96 standard deviations of the mean. Given that our bootstrap distribution based on 1000 resamples with replacement in Figure 8.14 is normally shaped, let’s use this fact about normal distributions to construct a confidence interval in a different way.

Đầu tiên, nhớ lại phân phối bootstrap có giá trị trung bình bằng 1995.36. Giá trị này gần như trùng khớp chính xác với giá trị của giá trị trung bình mẫu \ (\ Overline {x} \) của 50 đồng xu ban đầu của chúng tôi là 1995.44. Thứ hai, hãy để tính toán độ lệch chuẩn của phân phối Bootstrap bằng cách sử dụng các giá trị của

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
46 trong khung dữ liệu
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
77:\(\overline{x}\) of our original 50 pennies of 1995.44. Second, let’s compute the standard deviation of the bootstrap distribution using the values of
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
46 in the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
77 data frame:

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
9

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
0

Giá trị này là gì? Hãy nhớ lại rằng phân phối bootstrap là một xấp xỉ cho phân phối lấy mẫu. Cũng nhớ rằng độ lệch chuẩn của phân phối lấy mẫu có tên đặc biệt: lỗi tiêu chuẩn. Đặt hai sự thật này lại với nhau, chúng ta có thể nói rằng 2.155 là một xấp xỉ của lỗi tiêu chuẩn của \ (\ Overline {x} \).\(\overline{x}\).

Do đó, bằng cách sử dụng quy tắc ngón tay cái 95% của chúng tôi về các phân phối bình thường từ Phụ lục A.2, chúng tôi có thể sử dụng công thức sau để xác định các điểm cuối dưới và trên của khoảng tin cậy 95% cho \ (\ mu \):\(\mu\):

A 1.96 \ CDOT 2.15, 1995.44 + 1.96 \ CDOT 2.15) \\ & = (1991.15, 1999.73) \ end {căn chỉnh} \]

Bây giờ, hãy để thêm khoảng tin cậy của phương thức SE với các đường đứt nét trong Hình 8.17.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.17: So sánh hai phương pháp khoảng tin cậy 95%.

Chúng tôi thấy rằng cả hai phương pháp đều tạo ra khoảng tin cậy gần như giống hệt nhau đối với \ (\ mu \) với phương pháp phần trăm năng suất \ ((1991.06, 1999.28) \) trong khi phương pháp lỗi tiêu chuẩn tạo ra \ ((1991.22, 1999.66) \). Tuy nhiên, hãy nhớ lại rằng chúng ta chỉ có thể sử dụng quy tắc lỗi tiêu chuẩn khi phân phối bootstrap thường được định hình.\(\mu\) with the percentile method yielding \((1991.06, 1999.28)\) while the standard error method produces \((1991.22, 1999.66)\). However, recall that we can only use the standard error rule when the bootstrap distribution is roughly normally shaped.

Bây giờ, chúng tôi đã giới thiệu khái niệm về khoảng tin cậy và đặt ra trực giác đằng sau hai phương pháp để xây dựng chúng, hãy để khám phá mã cho phép chúng tôi xây dựng chúng.

Kiểm tra học tập

. What condition about the bootstrap distribution must be met for us to be able to construct confidence intervals using the standard error method?

(Lc8.4) nói rằng chúng tôi muốn xây dựng khoảng tin cậy 68% thay vì khoảng tin cậy 95% cho \ (\ mu \). Mô tả những thay đổi là cần thiết để thực hiện điều này. Gợi ý: Chúng tôi khuyên bạn nên xem xét Phụ lục A.2 về phân phối bình thường. Say we wanted to construct a 68% confidence interval instead of a 95% confidence interval for \(\mu\). Describe what changes are needed to make this happen. Hint: we suggest you look at Appendix A.2 on the normal distribution.

Xây dựng khoảng tin cậy

Hãy nhớ lại rằng quá trình lấy mẫu lại với sự thay thế, chúng tôi đã thực hiện bằng tay trong Phần 8.1 và hầu như trong Phần 8.2 được gọi là bootstrapping. Thuật ngữ bootstrapping bắt nguồn từ sự thể hiện của việc kéo mình lên bởi bootstraps của họ, có nghĩa là thành công chỉ thành công bởi một nỗ lực hoặc khả năng của riêng mình.

Từ góc độ thống kê, việc bắt đầu các ám chỉ đến thành công trong việc có thể nghiên cứu các tác động của sự thay đổi lấy mẫu đối với các ước tính từ nỗ lực của một mẫu của một mẫu. Hoặc chính xác hơn, nó đề cập đến việc xây dựng một xấp xỉ cho phân phối lấy mẫu chỉ bằng một mẫu.

Để thực hiện việc lấy mẫu này với sự thay thế hầu như trong Phần 8.2, chúng tôi đã sử dụng hàm

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55, đảm bảo rằng kích thước của các mẫu lại phù hợp với kích thước mẫu ban đầu là 50. Trong phần này, chúng tôi sẽ xây dựng các ý tưởng này để xây dựng các khoảng tin cậy bằng cách sử dụng một Gói mới: Gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 cho các bản tin gọn gàng và suy luận thống kê minh bạch.

Quy trình công việc ban đầu

Hãy nhớ lại rằng trong Phần 8.2, chúng tôi hầu như đã thực hiện lấy mẫu Bootstrap với sự thay thế để xây dựng các bản phân phối Bootstrap. Các phân phối như vậy là xấp xỉ với các phân phối lấy mẫu mà chúng tôi đã thấy trong Chương 7, nhưng được xây dựng chỉ bằng một mẫu duy nhất. Hãy cùng xem lại quy trình làm việc ban đầu bằng cách sử dụng toán tử ống

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
79.

Đầu tiên, chúng tôi đã sử dụng hàm

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 để lấy mẫu lại
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
88 Pennies với sự thay thế từ mẫu ban đầu là 50 đồng xu trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 bằng cách đặt
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
59. Hơn nữa, chúng tôi đã lặp lại việc lấy mẫu này 1000 lần bằng cách đặt
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
91:

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
1

Thứ hai, vì đối với mỗi trong số 1000 mẫu của chúng tôi có kích thước 50, chúng tôi muốn tính toán một giá trị trung bình mẫu riêng biệt, chúng tôi đã sử dụng động từ

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
93 để quan sát nhóm/hàng với nhau bằng biến
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
2

Tiếp theo là sử dụng

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
95 để tính toán mẫu
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
96 năm cho mỗi nhóm
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65:

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
3

Đối với trường hợp đơn giản này, chúng ta có thể sử dụng chức năng

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 và một vài động từ
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 để xây dựng phân phối bootstrap. Tuy nhiên, chỉ sử dụng động từ
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 chỉ cung cấp cho chúng tôi một bộ công cụ hạn chế. Đối với các tình huống phức tạp hơn, chúng tôi sẽ cần thêm một chút hỏa lực. Hãy để lặp lại điều này bằng cách sử dụng gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50.

# A tibble: 50 × 2 ID year 1 1 2002 2 2 1986 3 3 2017 4 4 1988 5 5 2008 6 6 1983 7 7 2008 8 8 1996 9 9 2004 10 10 2000 # … with 40 more rows50 Quy trình làm việc gói

Gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 là gói R cho suy luận thống kê. Nó sử dụng hiệu quả toán tử ống
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
79 mà chúng tôi đã giới thiệu trong Phần 3.1 để đánh vần chuỗi các bước cần thiết để thực hiện suy luận thống kê theo cách gọn gàng và thời trang trong suốt. Hơn nữa, giống như gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 cung cấp các chức năng với các tên giống như động từ để thực hiện tranh cãi dữ liệu, gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 cung cấp các chức năng với các tên giống như động từ trực quan để thực hiện suy luận thống kê.

Hãy để Lùi trở lại với đồng xu của chúng tôi. Trước đây, chúng tôi đã tính toán giá trị của giá trị trung bình mẫu \ (\ Overline {x} \) bằng hàm

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
95:\(\overline{x}\) using the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 function
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
95:

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
4

Chúng tôi sẽ thấy rằng chúng tôi cũng có thể làm điều này bằng cách sử dụng các chức năng

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 và
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
11:

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
5

Bạn có thể tự hỏi mình: Mã là mã

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 lâu hơn? Tại sao tôi lại sử dụng mã đó? Mặc dù không rõ ràng ngay lập tức, bạn sẽ thấy rằng có ba lợi ích chính cho quy trình làm việc
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 trái ngược với quy trình làm việc
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12.

Đầu tiên, động từ

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 tên tốt hơn với khung lấy mẫu tổng thể mà bạn cần hiểu để xây dựng khoảng tin cậy và tiến hành các bài kiểm tra giả thuyết (trong Chương 9). Chúng tôi sẽ thấy các sơ đồ sơ đồ của khung này trong Hình 8.23 ​​và trong Chương 9 với Hình 9.14.

Thứ hai, bạn có thể nhảy qua lại liền mạch giữa khoảng tin cậy và kiểm tra giả thuyết với những thay đổi tối thiểu đối với mã của bạn. Điều này sẽ trở nên rõ ràng trong tiểu mục 9.3.2 khi chúng tôi sẽ so sánh mã

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 cho cả hai phương pháp suy luận này.

Thứ ba, quy trình làm việc

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 đơn giản hơn nhiều để tiến hành suy luận khi bạn có nhiều hơn một biến. Chúng tôi sẽ thấy hai tình huống như vậy. Trước tiên chúng ta sẽ thấy các tình huống của suy luận hai mẫu trong đó dữ liệu mẫu được thu thập từ hai nhóm, chẳng hạn như trong Phần 8.6 trong đó chúng ta nghiên cứu tính truyền nhiễm của ngáp và trong phần 9.1 trong đó chúng ta so sánh tỷ lệ khuyến mãi của hai nhóm tại các ngân hàng trong những năm 1970S . Sau đó, trong Phần 10.4, chúng tôi sẽ thấy các tình huống suy luận về hồi quy bằng cách sử dụng các mô hình hồi quy mà bạn phù hợp trong Chương 5.

Bây giờ, hãy minh họa cho chuỗi các động từ cần thiết để xây dựng một khoảng tin cậy cho \ (\ mu \), dân số có nghĩa là năm của tất cả các đồng xu của Hoa Kỳ trong năm 2019.\(\mu\), the population mean year of minting of all US pennies in 2019.

1.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
18 Biến

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.18: Sơ đồ của động từ chỉ định ().

Như được hiển thị trong Hình 8.18, hàm

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 được sử dụng để chọn biến nào trong khung dữ liệu sẽ là trọng tâm của suy luận thống kê của chúng tôi. Chúng tôi làm điều này bằng cách
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
18ing đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
21. Ví dụ: trong khung dữ liệu
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 của chúng tôi của 50 đồng xu được lấy mẫu từ ngân hàng, biến quan tâm là
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23:

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
6

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
7

Lưu ý cách chính dữ liệu không thay đổi, nhưng dữ liệu meta

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
24. Điều này tương tự như cách động từ
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
93 từ
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 không thay đổi dữ liệu, nhưng chỉ thêm dữ liệu meta nhóm nhóm nhóm, như chúng ta đã thấy trong Phần 3.4.

Chúng tôi cũng có thể chỉ định các biến nào sẽ là trọng tâm của suy luận thống kê của chúng tôi bằng cách sử dụng

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
27. Đây là ký hiệu công thức tương tự mà bạn đã thấy trong Chương 5 và 6 trên các mô hình hồi quy: biến phản hồi
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
28 được tách ra khỏi biến giải thích
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
29 bằng
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
30 (Hồi Tilde). Việc sử dụng
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 sau đây với đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
32 mang lại kết quả tương tự đã thấy trước đó:

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
8

Vì trong trường hợp đồng xu, chúng tôi chỉ có một biến phản hồi và không có biến giải thích quan tâm, chúng tôi đặt

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
29 ở phía bên phải của
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
30 thành
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
35.

Mặc dù trong trường hợp của các đồng xu hoặc đặc điểm kỹ thuật hoạt động tốt, chúng tôi sẽ thấy các ví dụ sau về nơi đặc tả

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
32 đơn giản hơn. Cụ thể, điều này xuất hiện trong phần 8.6 sắp tới về so sánh hai tỷ lệ và phần 10.4 về suy luận về hồi quy.

2.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
37 sao chép

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.19: Sơ đồ sao chép tạo ().

Sau khi chúng tôi

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 Các biến quan tâm, chúng tôi đưa kết quả vào hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 để tạo bản sao. Hình 8.19 cho thấy cách này được kết hợp với
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 để bắt đầu đường ống. Nói cách khác, lặp lại quá trình lấy mẫu lại một số lần lớn. Nhớ lại trong Phần 8.2.2 và 8.2.3, chúng tôi đã thực hiện 35 và 1000 lần này.

Chức năng

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 Đối số đầu tiên là
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
61, đặt số lượng bản sao mà chúng tôi muốn tạo. Vì chúng tôi muốn lấy mẫu lại 50 đồng xu trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
20 với sự thay thế 1000 lần, chúng tôi đặt
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
91. Đối số thứ hai
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
45 xác định loại mô phỏng máy tính mà chúng tôi muốn thực hiện. Chúng tôi đặt điều này thành
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
46 chỉ ra rằng chúng tôi muốn thực hiện lấy mẫu Bootstrap. Bạn sẽ thấy các tùy chọn khác nhau cho
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
45 trong Chương 9.

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
9

# A tibble: 1 × 1
  mean_year
      
1   1995.44
0

Quan sát rằng khung dữ liệu kết quả có 50.000 hàng. Điều này là do chúng tôi đã thực hiện lấy mẫu lại 50 xu với sự thay thế 1000 lần và 50.000 = 50 \ (\ cdot \) 1000.\(\cdot\) 1000.

Biến

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 chỉ ra mẫu lấy mẫu mà mỗi hàng thuộc về. Vì vậy, nó có giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
49 50 lần, giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
50 50 lần, cho đến giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
51 50 lần. Giá trị mặc định của đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
45 là
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
53 trong kịch bản này, vì vậy nếu dòng cuối cùng được viết là
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
54, chúng tôi sẽ có được kết quả tương tự.

So sánh với quy trình công việc ban đầu: Lưu ý rằng các bước của quy trình làm việc

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 cho đến nay tạo ra kết quả giống như quy trình công việc ban đầu sử dụng hàm
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 mà chúng tôi đã thấy trước đó. Nói cách khác, hai khối mã sau đây tạo ra kết quả tương tự:
: Note that the steps of the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 workflow so far produce the same results as the original workflow using the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 function we saw earlier. In other words, the following two code chunks produce similar results:

# A tibble: 1 × 1
  mean_year
      
1   1995.44
1

3. Thống kê tóm tắt ____257

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.20: Sơ đồ thống kê tóm tắt tính toán ().

Sau khi chúng tôi

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 nhiều lần sao chép lại Bootstrap Respling với sự thay thế, tiếp theo chúng tôi muốn tóm tắt từng mẫu của 1000 mẫu có kích thước 50 thành một giá trị thống kê mẫu duy nhất. Như đã thấy trong sơ đồ, hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
11 thực hiện điều này.

Trong trường hợp của chúng tôi, chúng tôi muốn tính toán trung bình

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
23 cho mỗi mẫu Bootstrap có kích thước 50. Để làm như vậy, chúng tôi đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61 thành
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
62. Bạn cũng có thể đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61 thành nhiều loại thống kê tóm tắt phổ biến khác, như
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
64,
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
65,
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
66 (độ lệch chuẩn) và
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
67 (tỷ lệ). Để xem danh sách tất cả các số liệu thống kê tóm tắt có thể bạn có thể sử dụng, nhập
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
68 và đọc tệp trợ giúp.

Hãy để lưu lại kết quả trong khung dữ liệu được gọi là

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
69 và khám phá nội dung của nó:

# A tibble: 1 × 1
  mean_year
      
1   1995.44
2

# A tibble: 1 × 1
  mean_year
      
1   1995.44
3

Quan sát rằng khung dữ liệu kết quả có 1000 hàng và 2 cột tương ứng với các giá trị 1000

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65. Nó cũng có năm trung bình cho mỗi mẫu Bootstrap được lưu trong biến
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61.

So sánh với quy trình công việc ban đầu: Bạn có thể đã nhận ra rằng bước

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
11 trong quy trình làm việc
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 tạo ra đầu ra tương tự như các bước ____274 trong quy trình công việc ban đầu.
: You may have recognized at this point that the
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
11 step in the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 workflow produces the same output as the
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
74 steps in the original workflow.

# A tibble: 1 × 1
  mean_year
      
1   1995.44
4

4.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
75 Kết quả

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.21: Sơ đồ kết quả trực quan hóa ().

Động từ

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 cung cấp một cách nhanh chóng để trực quan hóa phân phối bootstrap dưới dạng biểu đồ của các giá trị biến số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61. Đường ống của các động từ chính
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 được sử dụng để khám phá kết quả phân phối bootstrap được thể hiện trong Hình 8.21.

# A tibble: 1 × 1
  mean_year
      
1   1995.44
5

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.22: Phân phối Bootstrap.

So sánh với quy trình công việc ban đầu: Trên thực tế,

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 là hàm trình bao bọc cho hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
80 sử dụng lớp
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
48. Hãy nhớ lại rằng chúng tôi đã minh họa khái niệm về chức năng trình bao bọc trong Hình 5.5 trong Tiểu mục 5.1.2.
: In fact,
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 is a wrapper function for the
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
80 function that uses a
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
48 layer. Recall that we illustrated the concept of a wrapper function in Figure 5.5 in Subsection 5.1.2.

# A tibble: 1 × 1
  mean_year
      
1   1995.44
6

Hàm

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 có thể lấy nhiều đối số khác mà chúng tôi sẽ thấy trong giây lát để tùy chỉnh cốt truyện hơn nữa. Nó cũng hoạt động với các hàm trợ giúp để thực hiện tạo bóng cho các giá trị biểu đồ tương ứng với các giá trị khoảng tin cậy.

Hãy để tóm tắt lại các bước của quy trình làm việc

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 để xây dựng phân phối bootstrap và sau đó trực quan hóa nó trong Hình 8.23.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.23: Suy ra quy trình làm việc gói cho khoảng tin cậy.

Nhớ lại cách chúng tôi giới thiệu hai phương pháp khác nhau để xây dựng khoảng tin cậy 95% cho tham số dân số chưa biết trong Phần 8.3: Phương pháp phần trăm và phương pháp lỗi tiêu chuẩn. Bây giờ, hãy để kiểm tra mã gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 xây dựng rõ ràng chúng. Ngoài ra còn có một số chức năng gọn gàng bổ sung để trực quan hóa các khoảng tin cậy kết quả được tích hợp cho gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50!

Phương pháp phần trăm với # A tibble: 50 × 2 ID year 1 1 2002 2 2 1986 3 3 2017 4 4 1988 5 5 2008 6 6 1983 7 7 2008 8 8 1996 9 9 2004 10 10 2000 # … with 40 more rows50

Nhớ lại phương pháp phần trăm để xây dựng khoảng tin cậy 95% mà chúng tôi đã giới thiệu trong tiểu mục 8.3.1. Phương pháp này đặt điểm cuối thấp hơn của khoảng tin cậy ở phần trăm 2,5 của phân phối bootstrap và đặt tương tự điểm cuối trên ở phần trăm 97,5. Khoảng thời gian thu được thu được 95% giá trị của giá trị của mẫu trong phân phối bootstrap.

Chúng ta có thể tính khoảng tin cậy 95% bằng cách đường ống

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
69 vào hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
88 từ gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50, với độ tin cậy
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
90 được đặt thành 0,95 và khoảng tin cậy
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
45 là
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
92. Hãy để tiết kiệm kết quả trong
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
93.

# A tibble: 1 × 1
  mean_year
      
1   1995.44
7

# A tibble: 1 × 1
  mean_year
      
1   1995.44
8

Ngoài ra, chúng ta có thể hình dung khoảng thời gian (1991.24, 1999.42) bằng cách truyền khung dữ liệu

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
69 vào hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 và thêm lớp
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
96. Chúng tôi đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
97 là
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
93.

# A tibble: 1 × 1
  mean_year
      
1   1995.44
9

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.24: Phương pháp phần trăm 95% Khoảng tin cậy được tô bóng tương ứng với các giá trị tiềm năng.

Quan sát trong Hình 8.24 rằng 95% mẫu có nghĩa là được lưu trữ trong biến

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61 trong
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
69 giảm giữa hai điểm cuối được đánh dấu bằng các đường tối hơn, với 2,5% mẫu có nghĩa là bên trái của khu vực bóng mờ và 2,5% của phương tiện mẫu rẽ phải. Bạn cũng có tùy chọn để thay đổi màu sắc của bóng bằng cách sử dụng các đối số
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
01 và
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
02.

Bạn cũng có thể sử dụng hàm ngắn hơn được đặt tên

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
03 và kết quả sẽ giống nhau. Đây là dành cho những người không muốn gõ tất cả
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
04 và thay vào đó thích gõ
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
05. Hãy thử mã sau!

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
0

Phương pháp lỗi tiêu chuẩn với # A tibble: 50 × 2 ID year 1 1 2002 2 2 1986 3 3 2017 4 4 1988 5 5 2008 6 6 1983 7 7 2008 8 8 1996 9 9 2004 10 10 2000 # … with 40 more rows50

Nhớ lại phương pháp lỗi tiêu chuẩn để xây dựng khoảng tin cậy 95% mà chúng tôi đã giới thiệu trong Tiểu mục 8.3.2. Đối với bất kỳ phân phối nào thường được định hình, khoảng 95% các giá trị nằm trong hai độ lệch chuẩn của giá trị trung bình. Trong trường hợp phân phối Bootstrap, độ lệch chuẩn có tên đặc biệt: lỗi tiêu chuẩn.

Vì vậy, trong trường hợp của chúng tôi, 95% giá trị của phân phối bootstrap sẽ nằm trong các lỗi tiêu chuẩn \ (\ pm 1.96 \) của \ (\ Overline {x} \). Do đó, khoảng tin cậy 95% là\(\pm 1.96\) standard errors of \(\overline{x}\). Thus, a 95% confidence interval is

\ [A

Tính toán khoảng tin cậy 95% một lần nữa có thể được thực hiện bằng cách tạo ra khung dữ liệu

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
69 mà chúng tôi đã tạo vào hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
88. Tuy nhiên, lần này chúng tôi đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
45 đầu tiên là
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
10. Thứ hai, chúng ta phải chỉ định đối số
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
11 để đặt trung tâm của khoảng tin cậy. Chúng tôi đặt đây là trung bình mẫu của mẫu ban đầu là 50 đồng xu năm 1995.44 mà chúng tôi đã lưu vào
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
12 trước đó.

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
1

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
2
pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
3

Nếu chúng ta muốn hình dung khoảng thời gian (1991.35, 1999.53), chúng ta có thể một lần nữa đưa khung dữ liệu

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
69 vào hàm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 và thêm lớp
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
96 vào âm mưu của chúng ta. Chúng tôi đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
97 là
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
17. Phương pháp lỗi tiêu chuẩn kết quả dựa trên khoảng tin cậy 95% cho \ (\ mu \) có thể được nhìn thấy trong Hình 8.25.\(\mu\) can be seen in Figure 8.25.

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
4

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.25: Khoảng tin cậy 95% của phương pháp sai tiêu chuẩn.

Như đã lưu ý trong Phần 8.3, cả hai phương pháp đều tạo ra khoảng tin cậy tương tự:

  • Phương pháp phần trăm: (1991.24, 1999.42)
  • Phương pháp lỗi tiêu chuẩn: (1991.35, 1999.53)

Kiểm tra học tập

(LC8.5) Xây dựng khoảng tin cậy 95% cho năm trung bình của tất cả các đồng xu của Hoa Kỳ. Sử dụng phương pháp phần trăm và, nếu thích hợp, sau đó sử dụng phương pháp lỗi tiêu chuẩn. Construct a 95% confidence interval for the median year of minting of all US pennies. Use the percentile method and, if appropriate, then use the standard-error method.

Giải thích khoảng tin cậy

Bây giờ, chúng tôi đã chỉ cho bạn cách xây dựng các khoảng tin cậy bằng cách sử dụng một mẫu được rút ra từ dân số, hãy để Lôi tập trung vào cách diễn giải hiệu quả của chúng. Hiệu quả của khoảng tin cậy được đánh giá bằng việc nó có chứa giá trị thực của tham số dân số hay không. Quay trở lại với sự tương tự câu cá của chúng tôi trong Phần 8.3, điều này giống như hỏi, có phải mạng của chúng tôi bắt được cá không?

Vì vậy, ví dụ, khoảng tin cậy dựa trên phần trăm của chúng tôi (1991.24, 1999.42) Có phải nắm bắt của năm đó là năm thực sự \ (\ mu \) của tất cả các đồng xu của chúng tôi không? Than ôi, chúng tôi không bao giờ biết, bởi vì chúng tôi không biết giá trị thực của \ (\ mu \) là gì. Rốt cuộc, chúng tôi lấy mẫu để ước tính nó!\(\mu\) of all US pennies? Alas, we’ll never know, because we don’t know what the true value of \(\mu\) is. After all, we’re sampling to estimate it!

Để giải thích hiệu quả của khoảng tin cậy, chúng ta cần biết giá trị của tham số dân số là gì. Bằng cách đó, chúng ta có thể nói liệu một khoảng tin cậy có thể bắt được giá trị này hay không.

Hãy để xem lại bát lấy mẫu của chúng tôi từ Chương 7. Tỷ lệ bóng của bát 2400 có màu đỏ? Hãy để tính toán này:

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
5

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
6

Trong trường hợp này, chúng ta biết giá trị của tham số dân số là gì: chúng ta biết rằng tỷ lệ dân số \ (p \) là 0,375. Nói cách khác, chúng ta biết rằng 37,5% bóng bát có màu đỏ.\(p\) is 0.375. In other words, we know that 37.5% of the bowl’s balls are red.

Như chúng tôi đã nêu trong Tiểu mục 7.3.3, bài tập lấy mẫu không thực sự phản ánh cách lấy mẫu được thực hiện trong cuộc sống thực, nhưng là một hoạt động lý tưởng hóa. Trong cuộc sống thực, chúng tôi đã giành chiến thắng biết giá trị thực của tham số dân số là gì, do đó cần phải ước tính.

Bây giờ chúng ta hãy xây dựng khoảng tin cậy cho \ (p \) bằng cách sử dụng 33 nhóm bạn của chúng ta từ bát trong Chương 7. Sau đó, chúng ta sẽ xem liệu khoảng tin cậy có bắt được giá trị thực của \ (p \), mà chúng ta Biết là 37,5%. Điều đó có nghĩa là, đã có mạng bắt được cá?\(p\) using our 33 groups of friends’ samples from the bowl in Chapter 7. We’ll then see if the confidence intervals “captured” the true value of \(p\), which we know to be 37.5%. That is to say, “Did the net capture the fish?”.

Net có bắt được cá không?

Hãy nhớ lại rằng chúng tôi đã có 33 nhóm bạn lấy mẫu có kích thước 50 từ bát và sau đó tính tỷ lệ mẫu của các quả bóng đỏ \ (\ widhat {p} \). Điều này dẫn đến 33 ước tính như vậy của \ (p \). Hãy để tập trung vào mẫu ILYAS và YOHAN, được lưu trong khung dữ liệu

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18 trong gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19:\(\widehat{p}\). This resulted in 33 such estimates of \(p\). Let’s focus on Ilyas and Yohan’s sample, which is saved in the
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18 data frame in the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19 package:

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
7

Họ đã quan sát 21 quả bóng màu đỏ trong số 50 và do đó tỷ lệ mẫu của chúng \ (\ Widhat {p} \) là 21/50 = 0,42 = 42%. Hãy nghĩ về điều này như là Spear Spear từ sự tương tự câu cá của chúng tôi.\(\widehat{p}\) was 21/50 = 0.42 = 42%. Think of this as the “spear” from our fishing analogy.

Bây giờ, hãy theo dõi quy trình làm việc của gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 từ Tiểu mục 8.4.2 để tạo khoảng tin cậy 95% dựa trên phương pháp phần trăm cho \ (p \) bằng cách sử dụng mẫu ILYAS và YOHAN. Hãy nghĩ về điều này như mạng lưới.\(p\) using Ilyas and Yohan’s sample. Think of this as the “net.”

1.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
18 Biến

Đầu tiên, chúng tôi

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 Biến quan tâm
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
21
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
01:

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
8

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
9

Rất tiếc! Chúng ta cần xác định sự kiện nào được quan tâm!

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
25 hoặc
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
26 Balls? Vì chúng tôi quan tâm đến tỷ lệ màu đỏ, hãy để đặt
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
27 là
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
28:

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
0

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
1

2.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
37 sao chép

Thứ hai, chúng tôi

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 1000 sao chép lại Bootstrap Respling bằng cách thay thế từ
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18 bằng cách đặt
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
91 và
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
46.

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
2

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
3

Quan sát rằng khung dữ liệu kết quả có 50.000 hàng. Điều này là do chúng tôi đã thực hiện lấy mẫu lại 50 quả bóng với sự thay thế 1000 lần và do đó 50.000 = 50 \ (\ cdot \) 1000. Biến

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 chỉ ra mẫu lấy mẫu mà mỗi hàng thuộc về. Vì vậy, nó có giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
49 50 lần, giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
50 50 lần, cho đến giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
51 50 lần.\(\cdot\) 1000. The variable
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 indicates which resample each row belongs to. So it has the value
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
49 50 times, the value
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
50 50 times, all the way through to the value
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
51 50 times.

3. Thống kê tóm tắt ____257

Thứ ba, chúng tôi tóm tắt từng trong số 1000 mẫu người có kích thước 50 với tỷ lệ thành công. Nói cách khác, tỷ lệ của các quả bóng là

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
28. Chúng ta có thể đặt thống kê tóm tắt được tính theo tỷ lệ bằng cách đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61 là
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
67. Hãy để lưu kết quả là
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
42:

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
4

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
5

Quan sát có 1000 hàng trong khung dữ liệu này và do đó 1000 giá trị của biến

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61. 1000 giá trị này của
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61 đại diện cho 1000 giá trị được sao chép của chúng tôi về tỷ lệ, mỗi giá trị dựa trên một mẫu lại khác nhau.

4.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
75 Kết quả

Thứ tư và cuối cùng, hãy để tính toán khoảng tin cậy 95%.

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
6

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
7

Hãy để trực quan hóa phân phối bootstrap cùng với khoảng tin cậy 95% dựa trên phần trăm

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
46 cho \ (p \) trong Hình 8.26. Chúng tôi sẽ điều chỉnh số lượng thùng để thấy hình dạng kết quả tốt hơn. Hơn nữa, chúng tôi sẽ thêm một đường thẳng đứng đứt nét tại Ilyas và Yohan, đã quan sát \ (\ Widhat {p} \) = 21/50 = 0,42 = 42% bằng cách sử dụng
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
47.\(p\) in Figure 8.26. We’ll adjust the number of bins to better see the resulting shape. Furthermore, we’ll add a dashed vertical line at Ilyas and Yohan’s observed \(\widehat{p}\) = 21/50 = 0.42 = 42% using
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
47.

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
8

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.26: Phân phối bootstrap.

Có phải Ilyas và Yohan xông Net bắt cá? Có phải khoảng tin cậy 95% của họ cho \ (p \) dựa trên mẫu của chúng chứa giá trị thực của \ (p \) là 0,375? Đúng! 0,375 là giữa các điểm cuối của khoảng tin cậy của chúng (0,3, 0,56).\(p\) based on their sample contain the true value of \(p\) of 0.375? Yes! 0.375 is between the endpoints of their confidence interval (0.3, 0.56).

Tuy nhiên, mọi khoảng tin cậy 95% cho \ (p \) sẽ nắm bắt được giá trị này? Nói cách khác, nếu chúng ta có một mẫu khác gồm 50 quả bóng và xây dựng một khoảng tin cậy khác nhau, liệu nó có nhất thiết phải chứa \ (p \) = 0,375 không? Hãy xem nào!\(p\) capture this value? In other words, if we had a different sample of 50 balls and constructed a different confidence interval, would it necessarily contain \(p\) = 0.375 as well? Let’s see!

Trước tiên, hãy lấy một mẫu khác từ bát, lần này sử dụng máy tính như chúng ta đã làm trong Chương 7:

ggplot(pennies_resample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Resample of 50 pennies")
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white") +
  labs(title = "Original sample of 50 pennies")
9

pennies_resample %>% 
  summarize(mean_year = mean(year))
0

Hãy để Lừa lại cùng một hàm

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 trên
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
49 để tạo khoảng tin cậy 95% khác nhau cho \ (p \). Đầu tiên, chúng tôi tạo phân phối Bootstrap mới và lưu kết quả trong
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
50:\(p\). First, we create the new bootstrap distribution and save the results in
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
50:

pennies_resample %>% 
  summarize(mean_year = mean(year))
1

pennies_resample %>% 
  summarize(mean_year = mean(year))
2

Chúng tôi một lần nữa tính toán khoảng tin cậy 95% dựa trên phần trăm cho \ (p \):\(p\):

pennies_resample %>% 
  summarize(mean_year = mean(year))
3

pennies_resample %>% 
  summarize(mean_year = mean(year))
4

Mạng mới này có bắt được cá không? Nói cách khác, khoảng tin cậy 95% cho \ (p \) dựa trên mẫu mới có chứa giá trị thực của \ (p \) là 0,375 không? Có một lần nữa! 0,375 là giữa các điểm cuối của khoảng tin cậy của chúng tôi (0,2, 0,48).\(p\) based on the new sample contain the true value of \(p\) of 0.375? Yes again! 0.375 is between the endpoints of our confidence interval (0.2, 0.48).

Bây giờ, hãy lặp lại quá trình này 100 lần nữa: Chúng tôi lấy 100 mẫu ảo từ bát và xây dựng 100 khoảng tin cậy 95%. Hãy để trực quan hóa các kết quả trong Hình 8.27 trong đó:

  1. Chúng tôi đánh dấu giá trị thực của \ (p = 0,375 \) bằng một đường thẳng đứng.\(p = 0.375\) with a vertical line.
  2. Chúng tôi đánh dấu từng khoảng tin cậy 100 95% với các đường ngang. Đây là những mạng lưới của người Viking.
  3. Đường ngang có màu xám màu nếu khoảng tin cậy, thu thập giá trị thực của \ (p \) được đánh dấu bằng đường thẳng đứng. Các đường ngang có màu đen khác.\(p\) marked with the vertical line. The horizontal line is colored black otherwise.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.27: Khoảng tin cậy 95% dựa trên 100% cho \ (p \).\(p\).

Trong số 100 khoảng tin cậy 95%, 95 trong số đó đã nắm bắt được giá trị thực \ (p = 0,375 \), trong khi 5 trong số đó đã không. Nói cách khác, 95 lưới của chúng tôi bắt được cá, trong khi 5 lưới của chúng tôi đã không.\(p = 0.375\), whereas 5 of them didn’t. In other words, 95 of our nets caught the fish, whereas 5 of our nets didn’t.

Đây là nơi mà mức độ tin cậy của 95%, chúng tôi đã xác định trong Phần 8.3 xuất hiện: Cứ 100 khoảng tin cậy 95%, chúng tôi hy vọng rằng 95 trong số đó sẽ nắm bắt được \ (p \) và năm trong số họ giành chiến thắng.\(p\) and that five of them won’t.

Lưu ý rằng, kỳ vọng của người Viking là một tuyên bố xác suất đề cập đến mức trung bình dài hạn. Nói cách khác, với mỗi khoảng 100 khoảng tin cậy, chúng ta sẽ quan sát khoảng 95 khoảng tin cậy thu được \ (p \), nhưng không nhất thiết chính xác là 95. Trong Hình 8.27, ví dụ, 95 khoảng tin cậy bị bắt \ (p \).\(p\), but not necessarily exactly 95. In Figure 8.27 for example, 95 of the confidence intervals capture \(p\).

Để tiếp tục làm nổi bật quan điểm của chúng tôi về mức độ tin cậy, hãy để tạo ra một con số tương tự như Hình 8.27, nhưng lần này xây dựng khoảng tin cậy dựa trên phương pháp sai tiêu chuẩn 80%. Hãy để trực quan hóa các kết quả trong Hình 8.28 với tỷ lệ trên trục x giống như trong Hình 8.27 để so sánh dễ dàng. Hơn nữa, vì tất cả các khoảng tin cậy của phương pháp lỗi tiêu chuẩn cho \ (p \) được tập trung vào các ước tính điểm tương ứng của chúng \ (\ widhat {p} \), chúng tôi đánh dấu giá trị này trên mỗi dòng với các dấu chấm.\(p\) are centered at their respective point estimates \(\widehat{p}\), we mark this value on each line with dots.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.28: Khoảng tin cậy 80% dựa trên SE cho \ (p \) với trung tâm ước tính điểm được đánh dấu bằng các dấu chấm.\(p\) with point estimate center marked with dots.

Quan sát cách khoảng tin cậy 80% hẹp hơn so với khoảng tin cậy 95%, phản ánh mức độ tin cậy thấp hơn của chúng tôi. Hãy nghĩ về điều này như sử dụng một mạng lưới nhỏ hơn. Chúng tôi sẽ khám phá các yếu tố quyết định khác về chiều rộng khoảng tin cậy trong tiểu mục sắp tới 8.5.3.

Hơn nữa, quan sát rằng trong khoảng tin cậy 100%, 82 trong số đó đã chiếm được tỷ lệ dân số \ (p \) = 0,375, trong khi 18 trong số đó thì không. Vì chúng tôi giảm mức độ tin cậy từ 95% xuống 80%, giờ đây chúng tôi có một số lượng lớn hơn nhiều về độ tin cậy mà không bắt được cá.\(p\) = 0.375, whereas 18 of them did not. Since we lowered the confidence level from 95% to 80%, we now have a much larger number of confidence intervals that failed to “catch the fish.”

Giải thích chính xác và tốc ký

Hãy để Lôi trả sự chú ý của chúng tôi về khoảng tin cậy 95%. Giải thích chính xác và chính xác về mặt toán học về khoảng tin cậy 95% là một chút dài dòng:

Giải thích chính xác: Nếu chúng tôi lặp lại quy trình lấy mẫu của mình một số lượng lớn, chúng tôi hy vọng khoảng 95% khoảng tin cậy kết quả sẽ nắm bắt được giá trị của tham số dân số.

Đây là những gì chúng tôi quan sát trong Hình 8.27. Quy trình xây dựng khoảng tin cậy của chúng tôi là đáng tin cậy 95%. Điều đó có nghĩa là, chúng ta có thể mong đợi khoảng tin cậy của chúng ta bao gồm tham số dân số thực sự khoảng 95% thời gian.

Một cách giải thích phổ biến nhưng không chính xác là: Có xác suất 95% mà khoảng tin cậy chứa \ (p \). Nhìn vào Hình 8.27, mỗi khoảng tin cậy hoặc không chứa \ (p \). Nói cách khác, xác suất là 1 hoặc 0.\(p\).” Looking at Figure 8.27, each of the confidence intervals either does or doesn’t contain \(p\). In other words, the probability is either a 1 or a 0.

Vì vậy, nếu mức độ tin cậy 95% chỉ liên quan đến độ tin cậy của quy trình xây dựng khoảng tin cậy và không phải là một khoảng tin cậy nhất định, cái nhìn sâu sắc nào có thể được lấy từ một khoảng tin cậy nhất định? Ví dụ, quay trở lại ví dụ về đồng xu, chúng tôi thấy rằng phương pháp phần trăm khoảng tin cậy 95% cho \ (\ mu \) là (1991.24, 1999.42), trong khi phương pháp lỗi tiêu chuẩn 95% khoảng tin cậy là (1991.35, 1999.53). Những gì có thể được nói về hai khoảng thời gian này?\(\mu\) was (1991.24, 1999.42), whereas the standard error method 95% confidence interval was (1991.35, 1999.53). What can be said about these two intervals?

Nói một cách lỏng lẻo, chúng ta có thể nghĩ về những khoảng thời gian này như là phỏng đoán tốt nhất của chúng ta về một phạm vi giá trị hợp lý cho năm trung bình \ (\ mu \) của tất cả chúng ta. Đối với phần còn lại của cuốn sách này, chúng tôi sẽ sử dụng bản tóm tắt tốc ký sau đây về cách giải thích chính xác.\(\mu\) of all US pennies. For the rest of this book, we’ll use the following shorthand summary of the precise interpretation.

Giải thích tay ngắn: Chúng tôi tự tin 95% rằng khoảng tin cậy 95% nắm bắt được giá trị của tham số dân số.

Chúng tôi sử dụng các dấu ngoặc kép xung quanh các loại tự tin, để nhấn mạnh rằng trong khi 95% liên quan đến độ tin cậy của quy trình xây dựng khoảng tin cậy của chúng tôi, cuối cùng, khoảng tin cậy được xây dựng là dự đoán tốt nhất của chúng tôi về khoảng thời gian chứa tham số dân số. Nói cách khác, nó là mạng tốt nhất của chúng tôi.

Vì vậy, trở lại ví dụ về đồng xu của chúng tôi và tập trung vào phương pháp phần trăm, chúng tôi tự tin 95% rằng năm có nghĩa là năm thực sự của đồng xu trong năm 2019 là ở đâu đó trong khoảng thời gian từ 1991.24 đến 1999.42.

Chiều rộng của khoảng tin cậy

Bây giờ chúng ta đã biết cách diễn giải các khoảng tin cậy, hãy để đi qua một số yếu tố quyết định chiều rộng của chúng.

Tác động của mức độ tự tin

Một yếu tố quyết định độ rộng khoảng tin cậy là mức độ tin cậy được chỉ định trước. Ví dụ, trong Hình 8.27 và 8,28, chúng tôi đã so sánh chiều rộng của khoảng tin cậy 95% và 80% và quan sát thấy rằng khoảng tin cậy 95% rộng hơn. Việc định lượng mức độ tin cậy sẽ phù hợp với những gì nhiều người mong đợi ở từ tự tin. Để tự tin hơn trong dự đoán tốt nhất về một loạt các giá trị, chúng ta cần mở rộng phạm vi của các giá trị.

Để giải thích về vấn đề này, hãy tưởng tượng chúng tôi muốn đoán nhiệt độ cao dự báo ở Seoul, Hàn Quốc vào ngày 15 tháng 8. Với khí hậu ôn đới của Seoul với bốn mùa riêng biệt, chúng ta có thể nói hơi tự tin rằng nhiệt độ cao sẽ nằm trong khoảng 50 ° F - 95 ° F (10 ° C - 35 ° C). Tuy nhiên, nếu chúng tôi muốn một phạm vi nhiệt độ mà chúng tôi hoàn toàn tự tin, chúng tôi sẽ cần phải mở rộng nó.

Chúng ta cần phạm vi rộng hơn này để cho phép khả năng thời tiết dị thường, như một câu thần chú lạnh lùng hoặc sóng nhiệt cực đoan. Vì vậy, một phạm vi nhiệt độ chúng ta có thể gần như chắc chắn sẽ nằm trong khoảng từ 32 ° F - 110 ° F (0 ° C - 43 ° C). Mặt khác, nếu chúng ta có thể chịu đựng được một chút tự tin hơn, chúng ta có thể thu hẹp phạm vi này trong khoảng từ 70 ° F - 85 ° F (21 ° C - 30 ° C).

Hãy để xem lại bát lấy mẫu của chúng tôi từ Chương 7. Hãy so sánh \ (10 ​​\ cdot 3 = 30 \) Khoảng tin cậy cho \ (p \) dựa trên ba mức độ tin cậy khác nhau: 80%, 95%và 99%.\(10 \cdot 3 = 30\) confidence intervals for \(p\) based on three different confidence levels: 80%, 95%, and 99%.

Cụ thể, trước tiên chúng tôi sẽ lấy 30 mẫu ngẫu nhiên khác nhau có kích thước \ (n \) = 50 quả bóng từ bát. Sau đó, chúng tôi sẽ xây dựng các khoảng tin cậy dựa trên 10 phần trăm bằng cách sử dụng mỗi trong ba mức độ tin cậy khác nhau.\(n\) = 50 balls from the bowl. Then we’ll construct 10 percentile-based confidence intervals using each of the three different confidence levels.

Cuối cùng, chúng tôi sẽ so sánh chiều rộng của các khoảng này. Chúng tôi hình dung các khoảng tin cậy kết quả trong Hình 8.29 cùng với một đường thẳng đứng đánh dấu giá trị thực của \ (p \) = 0,375.\(p\) = 0.375.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8,29: Mười khoảng tin cậy 80, 95 và 99% cho \ (p \) dựa trên \ (n = 50 \).\(p\) based on \(n = 50\).

Quan sát rằng khi mức độ tin cậy tăng từ 80% đến 95% đến 99%, khoảng tin cậy có xu hướng rộng hơn như trong Bảng 8.2 khi chúng ta so sánh chiều rộng trung bình của chúng.

Bảng 8.2: Độ rộng trung bình của khoảng tin cậy 80, 95 và 99%Average width of 80, 95, and 99% confidence intervals
Mức độ tự tin Chiều rộng trung bình
80% 0.162
95% 0.262
99% 0.338

Vì vậy, để có mức độ tin cậy cao hơn, khoảng tin cậy của chúng tôi phải rộng hơn. Lý tưởng nhất, chúng tôi sẽ có cả mức độ tự tin cao và khoảng tin cậy hẹp. Tuy nhiên, chúng ta không thể có cả hai cách. Nếu chúng ta muốn tự tin hơn, chúng ta cần cho phép các khoảng thời gian rộng hơn. Ngược lại, nếu chúng ta muốn một khoảng thời gian hẹp, chúng ta phải chịu đựng mức độ tin cậy thấp hơn.

Đạo đức của câu chuyện là: mức độ tin cậy cao hơn có xu hướng tạo ra khoảng tin cậy rộng hơn. Khi nhìn vào Hình 8.29, điều quan trọng là phải nhớ rằng chúng tôi đã giữ kích thước mẫu cố định tại \ (n \) = 50. Do đó, tất cả \ (10 ​​\ cdot 3 = 30 \) mẫu ngẫu nhiên từ

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
51 kích thước. Điều gì xảy ra nếu thay vào đó chúng ta lấy các mẫu có kích thước khác nhau? Hãy nhớ lại rằng chúng tôi đã làm điều này trong Tiểu mục 7.2 bằng cách sử dụng xẻng ảo với 25, 50 và 100 khe cắm.Higher confidence levels tend to produce wider confidence intervals. When looking at Figure 8.29 it is important to keep in mind that we kept the sample size fixed at \(n\) = 50. Thus, all \(10 \cdot 3 = 30\) random samples from the
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
51 had the same sample size. What happens if instead we took samples of different sizes? Recall that we did this in Subsection 7.2 using virtual shovels with 25, 50, and 100 slots.

Tác động của cỡ mẫu

Lần này, hãy sửa mức độ tin cậy ở mức 95%, nhưng hãy xem xét ba cỡ mẫu khác nhau cho \ (n \): 25, 50 và 100. Cụ thể, trước tiên chúng ta sẽ lấy 10 mẫu ngẫu nhiên khác nhau có kích thước 25, 10 ngẫu nhiên khác nhau Các mẫu có kích thước 50 và 10 mẫu ngẫu nhiên khác nhau có kích thước 100. Sau đó, chúng tôi sẽ xây dựng khoảng tin cậy dựa trên tỷ lệ phần trăm 95% cho mỗi mẫu. Cuối cùng, chúng tôi sẽ so sánh chiều rộng của các khoảng này. Chúng tôi hình dung kết quả 30 khoảng tin cậy trong Hình 8.30. Cũng lưu ý đường thẳng đứng đánh dấu giá trị thực của \ (p \) = 0,375.\(n\): 25, 50, and 100. Specifically, we’ll first take 10 different random samples of size 25, 10 different random samples of size 50, and 10 different random samples of size 100. We’ll then construct 95% percentile-based confidence intervals for each sample. Finally, we’ll compare the widths of these intervals. We visualize the resulting 30 confidence intervals in Figure 8.30. Note also the vertical line marking the true value of \(p\) = 0.375.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8,30: Mười khoảng tin cậy 95% cho \ (p \) với \ (n = 25, 50, \) và \ (100 \).\(p\) with \(n = 25, 50,\) and \(100\).

Quan sát rằng khi các khoảng tin cậy được xây dựng từ các cỡ mẫu lớn hơn và lớn hơn, chúng có xu hướng hẹp hơn. Hãy để so sánh các chiều rộng trung bình trong Bảng 8.3.

Bảng 8.3: Độ rộng trung bình của khoảng tin cậy 95% dựa trên \ (n = 25 \), \ (50 \) và \ (100 \)Average width of 95% confidence intervals based on \(n = 25\), \(50\), and \(100\)
Cỡ mẫu Chiều rộng trung bình
n = 25 0.380
n = 50 0.268
n = 100 0.189

Đạo đức của câu chuyện là: cỡ mẫu lớn hơn có xu hướng tạo ra khoảng tin cậy hẹp hơn. Hãy nhớ lại rằng đây là một thông điệp chính trong tiểu mục 7.3.3. Khi chúng tôi sử dụng các xẻng lớn hơn và lớn hơn cho các mẫu của chúng tôi, tỷ lệ mẫu màu đỏ \ (\ widhat {p} \) có xu hướng thay đổi ít hơn. Nói cách khác, ước tính của chúng tôi ngày càng chính xác hơn.Larger sample sizes tend to produce narrower confidence intervals. Recall that this was a key message in Subsection 7.3.3. As we used larger and larger shovels for our samples, the sample proportions red \(\widehat{p}\) tended to vary less. In other words, our estimates got more and more precise.

Hãy nhớ lại rằng chúng tôi đã hình dung những kết quả này trong Hình 7.15, trong đó chúng tôi so sánh các phân phối lấy mẫu cho \ (\ widhat {p} \) dựa trên các mẫu có kích thước \ (n \) bằng 25, 50 và 100. Chúng tôi cũng định lượng biến thể lấy mẫu Trong số các phân phối lấy mẫu này bằng cách sử dụng độ lệch chuẩn của chúng, có tên đặc biệt đó: lỗi tiêu chuẩn. Vì vậy, khi kích thước mẫu tăng, lỗi tiêu chuẩn giảm.\(\widehat{p}\) based on samples of size \(n\) equal 25, 50, and 100. We also quantified the sampling variation of these sampling distributions using their standard deviation, which has that special name: the standard error. So as the sample size increases, the standard error decreases.

Trên thực tế, lỗi tiêu chuẩn là một yếu tố liên quan khác trong việc xác định độ rộng khoảng tin cậy. Chúng tôi sẽ khám phá thực tế này trong tiểu mục 8.7.2 khi chúng tôi thảo luận về các phương pháp dựa trên lý thuyết để xây dựng khoảng tin cậy bằng cách sử dụng các công thức toán học. Các phương pháp như vậy là một giải pháp thay thế cho các phương pháp dựa trên máy tính mà chúng tôi đã sử dụng cho đến nay.

Nghiên cứu trường hợp: Ngáp có truyền nhiễm không?

Hãy để áp dụng kiến ​​thức về khoảng tin cậy của chúng tôi để trả lời câu hỏi: Có phải ngáp không? Nếu bạn thấy người khác ngáp, bạn có nhiều khả năng ngáp không? Trong một tập của Hoa Kỳ cho thấy những người huyền thoại, đội chủ nhà đã tiến hành một thí nghiệm để trả lời câu hỏi này. Tập phim có sẵn để xem tại Hoa Kỳ trên trang web Discovery Network tại đây và thêm thông tin về tập phim cũng có sẵn trên IMDB.

Huyền thoại nghiên cứu dữ liệu

Năm mươi người tham gia trưởng thành nghĩ rằng họ đang được xem xét xuất hiện trong chương trình đã được phỏng vấn bởi một nhà tuyển dụng chương trình. Trong cuộc phỏng vấn, nhà tuyển dụng hoặc ngáp hoặc không. Những người tham gia sau đó ngồi một mình trong một chiếc xe tải lớn và được yêu cầu chờ đợi. Khi ở trong xe, nhóm huyền thoại đã xem những người tham gia sử dụng một camera ẩn để xem họ có ngáp không. Khung dữ liệu chứa kết quả thử nghiệm của họ có sẵn trong khung dữ liệu

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
52 có trong gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19:

pennies_resample %>% 
  summarize(mean_year = mean(year))
5

Các biến là:

  • x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    54: ID người tham gia có giá trị từ 1 đến 50.
  • x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    55: Một biến điều trị nhị phân cho biết liệu người tham gia có tiếp xúc với ngáp hay không.
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    56 cho thấy người tham gia đã tiếp xúc với việc ngáp trong khi
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    57 cho thấy người tham gia thì không.
  • x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    58: Một biến phản hồi nhị phân cho biết liệu người tham gia cuối cùng có ngáp không.

Hãy nhớ lại rằng bạn đã học về các biến điều trị và đáp ứng trong tiểu mục 5.3.1 trong cuộc thảo luận của chúng tôi về các biến gây nhiễu.

Hãy để sử dụng một số dữ liệu gây tranh cãi để có được số lượng của bốn kết quả có thể xảy ra:

pennies_resample %>% 
  summarize(mean_year = mean(year))
6

pennies_resample %>% 
  summarize(mean_year = mean(year))
7

Trước tiên, hãy tập trung vào những người tham gia nhóm

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
57, những người không tiếp xúc với ngáp. 12 người tham gia như vậy không ngáp, trong khi 4 người tham gia như vậy đã làm. Vì vậy, trong số 16 người không tiếp xúc với ngáp, 4/16 = 0,25 = 25% đã ngáp.

Bây giờ, hãy tập trung vào những người tham gia nhóm

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
56, những người tiếp xúc với việc ngáp trong đó 24 người tham gia như vậy không ngáp, trong khi 10 người tham gia như vậy đã ngáp. Vì vậy, trong số 34 người tiếp xúc với ngáp, 10/34 = 0,294 = 29,4% đã ngáp. So sánh hai tỷ lệ phần trăm này, những người tham gia tiếp xúc với ngáp ngáp 29,4% - 25% = 4,4% thường xuyên hơn so với những người không.

Kịch bản lấy mẫu

Hãy để xem xét các thuật ngữ và ký hiệu liên quan đến lấy mẫu mà chúng tôi đã nghiên cứu trong tiểu mục 7.3.1. Trong chương 7, dân số nghiên cứu của chúng tôi là bát \ (n \) = 2400 quả bóng. Thông số dân số của chúng tôi quan tâm là tỷ lệ dân số của những quả bóng màu đỏ, được biểu thị bằng toán học bằng \ (p \). Để ước tính \ (p \), chúng tôi đã trích xuất một mẫu gồm 50 quả bóng bằng xẻng và tính toán ước tính điểm có liên quan: tỷ lệ mẫu có màu đỏ, được biểu thị bằng toán học bằng \ (\ widhat {p} \).\(N\) = 2400 balls. Our population parameter of interest was the population proportion of these balls that were red, denoted mathematically by \(p\). In order to estimate \(p\), we extracted a sample of 50 balls using the shovel and computed the relevant point estimate: the sample proportion that were red, denoted mathematically by \(\widehat{p}\).

Dân số nghiên cứu ở đây là ai? Tất cả con người? Tất cả những người xem chương trình thần thoại? Khó mà nói ra được! Câu hỏi này chỉ có thể được trả lời nếu chúng tôi biết làm thế nào chương trình người dẫn chương trình đã tuyển dụng những người tham gia! Nói cách khác, phương pháp lấy mẫu được sử dụng bởi những người huyền thoại để tuyển dụng người tham gia là gì? Chúng tôi than ôi không được cung cấp thông tin này. Tuy nhiên, chỉ với mục đích của nghiên cứu trường hợp này, chúng tôi sẽ cho rằng 50 người tham gia là một mẫu đại diện của tất cả người Mỹ với sự phổ biến của chương trình này. Do đó, chúng tôi sẽ giả định rằng bất kỳ kết quả nào của thí nghiệm này sẽ khái quát cho tất cả \ (n \) = 327 triệu người Mỹ (dân số 2018).\(N\) = 327 million Americans (2018 population).

Giống như với bát lấy mẫu của chúng tôi, tham số dân số ở đây sẽ liên quan đến tỷ lệ. Tuy nhiên, trong trường hợp này, đó sẽ là sự khác biệt về tỷ lệ dân số \ (p_ {seed} - p_ {control} \), trong đó \ (p_ {Seed} \) là tỷ lệ của tất cả người Mỹ nếu tiếp xúc với việc ngáp sẽ ngáp tự ngáp tự ngáp sẽ ngáp ngáp tự ngáp ngáp và \ (p_ {control} \) là tỷ lệ của tất cả người Mỹ nếu không tiếp xúc với việc ngáp vẫn ngáp. Tương ứng, thống kê ước tính/mẫu điểm dựa trên mẫu huyền thoại của người tham gia sẽ là sự khác biệt về tỷ lệ mẫu \ (\ Widhat {P} _ {Seed} - \ Widhat {P} _ {Control} \). Hãy để mở rộng Bảng 7.5 của các kịch bản lấy mẫu để suy luận bao gồm kịch bản mới nhất của chúng tôi.\(p_{seed} - p_{control}\), where \(p_{seed}\) is the proportion of all Americans who if exposed to yawning will yawn themselves, and \(p_{control}\) is the proportion of all Americans who if not exposed to yawning still yawn themselves. Correspondingly, the point estimate/sample statistic based the Mythbusters’ sample of participants will be the difference in sample proportions \(\widehat{p}_{seed} - \widehat{p}_{control}\). Let’s extend Table 7.5 of scenarios of sampling for inference to include our latest scenario.

Bảng 8.4: Các kịch bản lấy mẫu cho suy luậnScenarios of sampling for inference
Kịch bản Số liệu dân số Ký hiệu Ước tính điểm (Các) biểu tượng
1 Tỷ lệ dân số \(P\) Tỷ lệ mẫu \ (\ widhat {p} \)
2 Dân số có nghĩa là \ (\ mu \) Mẫu trung bình \ (\ Overline {x} \) hoặc \ (\ widehat {\ mu} \) or \(\widehat{\mu}\)
3 Sự khác biệt về tỷ lệ dân số \ (P_1 - P_2 \) Sự khác biệt về tỷ lệ mẫu \ (A

Đây được gọi là tình huống suy luận hai mẫu vì chúng tôi có hai mẫu riêng biệt. Dựa trên hai mẫu có kích thước của họ \ (N_ {Seed} \) = 34 và \ (N_ {Control} \) = 16, ước tính điểm\(n_{seed}\) = 34 and \(n_{control}\) = 16, the point estimate is

\]

Tuy nhiên, giả sử các huyền thoại lặp lại thí nghiệm này. Nói cách khác, nói rằng họ đã tuyển dụng 50 người tham gia mới và tiếp xúc với 34 người trong số họ để ngáp và 16 không. Họ sẽ có được sự khác biệt chính xác tương tự là 4,4%? Có lẽ là không, một lần nữa, vì sự thay đổi lấy mẫu.

Làm thế nào để biến thể lấy mẫu này ảnh hưởng đến ước tính của họ là 4,4%? Nói cách khác, điều gì sẽ là một phạm vi giá trị hợp lý cho sự khác biệt này chiếm sự thay đổi lấy mẫu này? Chúng ta có thể trả lời câu hỏi này với khoảng tin cậy! Hơn nữa, vì những người huyền thoại chỉ có một mẫu hai người tham gia duy nhất, họ sẽ phải xây dựng khoảng tin cậy 95% cho \ (p_ {Seed} - p_ {control} \) bằng cách sử dụng thay thế bootstrap bằng cách thay thế.\(p_{seed} - p_{control}\) using bootstrap resampling with replacement.

Chúng tôi thực hiện một vài ghi chú quan trọng. Đầu tiên, để so sánh giữa các nhóm

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
56 và
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
57 để có ý nghĩa, tuy nhiên, cả hai nhóm cần phải độc lập với nhau. Nếu không, họ có thể ảnh hưởng đến kết quả của nhau. Điều này có nghĩa là một người tham gia được chọn cho nhóm
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
56 hoặc
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
57 không có ảnh hưởng đến người tham gia khác được chỉ định cho một trong hai nhóm. Ví dụ, nếu có một người mẹ và con của cô ấy là những người tham gia nghiên cứu, họ sẽ không nhất thiết phải ở trong cùng một nhóm. Mỗi người sẽ được chỉ định ngẫu nhiên cho một trong hai nhóm của biến giải thích.

Thứ hai, thứ tự của phép trừ trong sự khác biệt không có vấn đề gì miễn là bạn nhất quán và điều chỉnh các diễn giải của bạn cho phù hợp. Nói cách khác, sử dụng ước tính điểm của \ (\ Widhat {p} _ {Seed} - \ Widhat {P} _ {Control} \) hoặc \ (\ Widhat {P} _ {Control} - \ Widhat {P} _ {Seed} \) không tạo ra sự khác biệt về vật chất, bạn chỉ cần duy trì sự nhất quán và giải thích kết quả của mình cho phù hợp.\(\widehat{p}_{seed} - \widehat{p}_{control}\) or \(\widehat{p}_{control} - \widehat{p}_{seed}\) does not make a material difference, you just need to stay consistent and interpret your results accordingly.

Xây dựng khoảng tin cậy

Như chúng tôi đã làm trong tiểu mục 8.4.2, trước tiên chúng ta hãy xây dựng phân phối bootstrap cho \ ( \ (P_ {Seed} - P_ {Control} \). Chúng tôi sẽ làm điều này bằng cách sử dụng quy trình làm việc

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 một lần nữa. Tuy nhiên, vì sự khác biệt về tỷ lệ là một kịch bản mới để suy luận, chúng tôi sẽ cần sử dụng một số đối số mới trong các hàm
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 trên đường đi.\(\widehat{p}_{seed} - \widehat{p}_{control}\) and then use this to construct 95% confidence intervals for \(p_{seed} - p_{control}\). We’ll do this using the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 workflow again. However, since the difference in proportions is a new scenario for inference, we’ll need to use some new arguments in the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 functions along the way.

1.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
18 Biến

Hãy cùng lấy khung dữ liệu

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
52 của chúng tôi và
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
10 mà các biến được quan tâm bằng cách sử dụng giao diện công thức
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
70 trong đó:

  • Biến phản hồi của chúng tôi là
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    58: Có hay không người tham gia ngáp hay không. Nó có mức
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    72 và
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    73.
  • Biến giải thích là
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    55: Có phải người tham gia có tiếp xúc với ngáp hay không. Nó có mức
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    56 (tiếp xúc với ngáp) và
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    57 (không tiếp xúc với ngáp).

pennies_resample %>% 
  summarize(mean_year = mean(year))
8

pennies_resample %>% 
  summarize(mean_year = mean(year))
9

Than ôi, chúng tôi có một thông báo lỗi tương tự như từ Tiểu mục 8.5.1:

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 đang cho chúng tôi biết rằng một trong các cấp của biến phân loại
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
58 cần được định nghĩa là
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
27. Hãy nhớ lại rằng chúng tôi xác định
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
27 là sự kiện quan tâm mà chúng tôi đang cố gắng đếm và tính toán tỷ lệ. Chúng tôi có quan tâm đến những người tham gia
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
72 ngáp hoặc những người
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
73 đã không ngáp không? Điều này không rõ ràng với r hoặc ai đó chỉ cần chọn mã và kết quả lần đầu tiên, vì vậy chúng tôi cần đặt đối số
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
27 thành
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
72 như sau để cải thiện tính minh bạch của mã:

# A tibble: 1 × 1
  mean_year
      
1      1996
0

# A tibble: 1 × 1
  mean_year
      
1      1996
1

2.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
37 sao chép

Bước tiếp theo của chúng tôi là thực hiện thay thế bootstrap với sự thay thế như chúng tôi đã làm với các phiếu của giấy trong hoạt động đồng xu của chúng tôi trong Phần 8.1. Chúng tôi đã thấy cách nó hoạt động với cả một biến duy nhất trong điện toán Bootstrap có nghĩa là trong Phần 8.4 và trong các tỷ lệ bootstrap trong phần 8.5, nhưng chúng tôi đã làm việc với bootstrapping liên quan đến nhiều biến.

Trong gói

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50, bootstrapping với nhiều biến có nghĩa là mỗi hàng có khả năng được ghép lại. Hãy để điều tra điều này bằng cách chỉ tập trung vào sáu hàng đầu tiên của
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
52:

# A tibble: 1 × 1
  mean_year
      
1      1996
2

# A tibble: 1 × 1
  mean_year
      
1      1996
3

Khi chúng tôi khởi động dữ liệu này, chúng tôi có khả năng rút các bài đọc của chủ đề nhiều lần. Do đó, chúng ta có thể thấy các mục của

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
56 cho
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
55 và
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
73 cho
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
58 cùng nhau trong một hàng mới trong mẫu bootstrap. Điều này được nhìn thấy thêm bằng cách khám phá hàm
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
92 trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
12 trên khung dữ liệu 6 hàng nhỏ hơn này bao gồm
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
94. Hàm
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
92 có thể thực hiện quy trình bootstrapping này và tương tự như hàm
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55 trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50, ngoại trừ việc nó không được lặp lại, mà chỉ thực hiện một mẫu có hoặc không có thay thế.

# A tibble: 1 × 1
  mean_year
      
1      1996
4

# A tibble: 1 × 1
  mean_year
      
1      1996
5

Chúng ta có thể thấy rằng trong mẫu bootstrap này được tạo từ sáu hàng đầu tiên của

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
52, chúng ta có một số hàng được lặp lại. Điều tương tự cũng đúng khi chúng ta thực hiện bước
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 trong
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 như được thực hiện trong những gì tiếp theo. Sử dụng thực tế này, chúng tôi
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
37 1000 sao chép, hoặc, nói cách khác, chúng tôi bootstrap lấy mẫu lại 50 người tham gia với sự thay thế 1000 lần.

# A tibble: 1 × 1
  mean_year
      
1      1996
6

# A tibble: 1 × 1
  mean_year
      
1      1996
7

Quan sát rằng khung dữ liệu kết quả có 50.000 hàng. Điều này là do chúng tôi đã thực hiện lấy mẫu lại của 50 người tham gia với sự thay thế 1000 lần và 50.000 = 1000 \ (\ cdot \) 50. Biến

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 cho biết việc lấy mẫu mỗi hàng thuộc về. Vì vậy, nó có giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
49 50 lần, giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
50 50 lần, cho đến giá trị
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
51 50 lần.\(\cdot\) 50. The variable
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 indicates which resample each row belongs to. So it has the value
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
49 50 times, the value
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
50 50 times, all the way through to the value
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
51 50 times.

3. Thống kê tóm tắt ____257

Sau khi chúng tôi

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 nhiều lần sao chép lại Bootstrap với sự thay thế, tiếp theo chúng tôi muốn tóm tắt các mẫu Bootstrap có kích thước 50 với một thống kê tóm tắt duy nhất, sự khác biệt về tỷ lệ. Chúng tôi thực hiện điều này bằng cách đặt đối số
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61 thành
# A tibble: 1 × 1
  mean_year
      
1   1995.44
09:

# A tibble: 1 × 1
  mean_year
      
1      1996
8

# A tibble: 1 × 1
  mean_year
      
1      1996
9

Chúng tôi thấy một lỗi khác ở đây. Chúng ta cần chỉ định thứ tự của phép trừ. Có phải là \ (\ Widhat {P} _ {Seed} - \ Widhat {P} _ {Control} \) hoặc \ (\ Widhat {P} _ {Control} - \ Widhat {P} _ _ {Seed} \). Chúng tôi chỉ định nó là \ (\ Widhat {P} _ {Seed} - \ Widhat {P} _ {Control} \) bằng cách đặt

# A tibble: 1 × 1
  mean_year
      
1   1995.44
10. Lưu ý rằng bạn cũng có thể đặt
# A tibble: 1 × 1
  mean_year
      
1   1995.44
11. Như chúng tôi đã nêu trước đó, thứ tự của phép trừ không quan trọng, miễn là bạn duy trì sự nhất quán trong suốt phân tích của bạn và điều chỉnh các diễn giải của bạn cho phù hợp.\(\widehat{p}_{seed} - \widehat{p}_{control}\) or \(\widehat{p}_{control} - \widehat{p}_{seed}\). We specify it to be \(\widehat{p}_{seed} - \widehat{p}_{control}\) by setting
# A tibble: 1 × 1
  mean_year
      
1   1995.44
10. Note that you could’ve also set
# A tibble: 1 × 1
  mean_year
      
1   1995.44
11. As we stated earlier, the order of the subtraction does not matter, so long as you stay consistent throughout your analysis and tailor your interpretations accordingly.

Hãy để Lôi lưu đầu ra trong khung dữ liệu

# A tibble: 1 × 1
  mean_year
      
1   1995.44
12:

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
0

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
1

Quan sát rằng khung dữ liệu kết quả có 1000 hàng và 2 cột tương ứng với 1000

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
65 ID, và 1000 sự khác biệt về tỷ lệ cho mỗi mẫu Bootstrap trong
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
61.

4.
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
75 Kết quả

Trong Hình 8.31, chúng tôi

ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
76 Phân phối phân phối lại bootstrap kết quả. Hãy để thêm một đường thẳng đứng ở 0 bằng cách thêm lớp
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
47.

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
2

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.31: Phân phối Bootstrap.

Đầu tiên, hãy để tính toán khoảng tin cậy 95% cho \ (P_ {Seed} - P_ {Control} \) bằng phương pháp phần trăm, nói cách khác, bằng cách xác định phần trăm 2,5 và 97,5 bao gồm 95% giá trị giữa. Hãy nhớ lại rằng phương pháp này không yêu cầu phân phối bootstrap thường được định hình.\(p_{seed} - p_{control}\) using the percentile method, in other words, by identifying the 2.5th and 97.5th percentiles which include the middle 95% of values. Recall that this method does not require the bootstrap distribution to be normally shaped.

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
3

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
4

Thứ hai, vì phân phối bootstrap có hình chuông gần như, chúng ta cũng có thể xây dựng một khoảng tin cậy bằng phương pháp lỗi tiêu chuẩn. Hãy nhớ lại rằng để xây dựng khoảng tin cậy bằng phương pháp lỗi tiêu chuẩn, chúng ta cần chỉ định tâm của khoảng thời gian bằng đối số

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
11. Trong trường hợp của chúng tôi, chúng tôi cần đặt nó là sự khác biệt về tỷ lệ mẫu là 4,4% mà các huyền thoại quan sát được.

Chúng tôi cũng có thể sử dụng quy trình làm việc

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 để tính toán giá trị này bằng cách loại trừ bước sao chép
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39 1000 Bootstrap. Nói cách khác, không tạo ra các bản sao, mà chỉ sử dụng dữ liệu mẫu gốc. Chúng ta có thể đạt được điều này bằng cách nhận xét dòng
ggplot(pennies_sample, aes(x = year)) +
  geom_histogram(binwidth = 10, color = "white")
39, bảo R bỏ qua nó:

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
5

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
6

Do đó, chúng tôi cắm giá trị này vào như đối số

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
11.

# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
7

pennies_resample <- tibble(
  year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976, 
           2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997, 
           1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004, 
           2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015, 
           2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
2
# A tibble: 1,750 × 3
# Groups:   name [35]
   replicate name     year
           
 1         1 Arianna  1988
 2         1 Arianna  2002
 3         1 Arianna  2015
 4         1 Arianna  1998
 5         1 Arianna  1979
 6         1 Arianna  1971
 7         1 Arianna  1971
 8         1 Arianna  2015
 9         1 Arianna  1988
10         1 Arianna  1979
# … with 1,740 more rows
9

Hãy để trực quan hóa cả hai khoảng tin cậy trong Hình 8.32, với khoảng phương pháp tỷ lệ phần trăm được đánh dấu bằng các đường màu đen và phương pháp lỗi tiêu chuẩn được đánh dấu bằng các đường màu xám. Quan sát rằng cả hai đều giống nhau.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.32: Hai khoảng tin cậy 95%: Phương pháp phần trăm (màu đen) và phương pháp lỗi tiêu chuẩn (màu xám).

Diễn giải khoảng tin cậy

Cho rằng cả hai khoảng tin cậy đều khá giống nhau, hãy để tập trung vào cách giải thích của chúng tôi với chỉ khoảng tin cậy phương pháp phần trăm của (-0.238, 0.302). Nhớ lại từ Tiểu mục 8.5.2 rằng việc giải thích thống kê chính xác về khoảng tin cậy 95% là: Nếu quy trình xây dựng này được lặp lại 100 lần, thì chúng tôi hy vọng khoảng 95 khoảng tin cậy để nắm bắt giá trị thực của \ (P_ {Seed} - P_ {Control} \). Nói cách khác, nếu chúng tôi thu thập 100 mẫu \ (n \) = 50 người tham gia từ một nhóm người tương tự và xây dựng 100 khoảng tin cậy mỗi trong số 100 mẫu, khoảng 95 trong số chúng sẽ chứa giá trị thực của \ ( P_ {Seed} - P_ {Control} \) trong khi khoảng năm sẽ không. Cho rằng đây là một chút gió dài, chúng tôi sử dụng cách giải thích tốc ký: Chúng tôi 95% tự tin rằng sự khác biệt thực sự về tỷ lệ \ (p_ {Seed} - p_ {control} \) nằm giữa (-0.238, 0.302) .\(p_{seed} - p_{control}\). In other words, if we gathered 100 samples of \(n\) = 50 participants from a similar pool of people and constructed 100 confidence intervals each based on each of the 100 samples, about 95 of them will contain the true value of \(p_{seed} - p_{control}\) while about five won’t. Given that this is a little long winded, we use the shorthand interpretation: we’re 95% “confident” that the true difference in proportions \(p_{seed} - p_{control}\) is between (-0.238, 0.302).

Có một giá trị quan tâm đặc biệt mà khoảng tin cậy 95% này chứa: 0. Nếu \ (p_ {seed} - p_ {control} \) bằng 0, thì sẽ không có sự khác biệt về tỷ lệ ngáp giữa hai nhóm. Điều này sẽ gợi ý rằng không có hiệu ứng liên quan đến việc tiếp xúc với một nhà tuyển dụng ngáp về việc bạn có ngáp tự.\(p_{seed} - p_{control}\) were equal to 0, then there would be no difference in proportion yawning between the two groups. This would suggest that there is no associated effect of being exposed to a yawning recruiter on whether you yawn yourself.

Trong trường hợp của chúng tôi, vì khoảng tin cậy 95% bao gồm 0, chúng tôi không thể kết luận nếu một trong hai tỷ lệ lớn hơn. Trong số 1000 mẫu Bootstrap của chúng tôi với sự thay thế, đôi khi \ (\ Widhat {P} _ {Seed} \) cao hơn và do đó, những người tiếp xúc với ngáp ngáp thường xuyên hơn. Vào những lúc khác, điều ngược lại đã xảy ra.\(\widehat{p}_{seed}\) was higher and thus those exposed to yawning yawned themselves more often. At other times, the reverse happened.

Mặt khác, khoảng tin cậy 95% hoàn toàn trên không. Điều này sẽ gợi ý rằng \ (p_ {seed} - p_ {control}> 0 \), hoặc, nói cách khác Ngáp làm ngáp thường xuyên hơn.\(p_{seed} - p_{control} > 0\), or, in other words \(p_{seed} > p_{control}\), and thus we’d have evidence suggesting those exposed to yawning do yawn more often.

Sự kết luận

So sánh phân phối bootstrap và lấy mẫu

Hãy để nói chuyện nhiều hơn về mối quan hệ giữa phân phối lấy mẫu và phân phối bootstrap.

Nhớ lại trong tiểu mục 7.2, chúng tôi đã lấy 1000 mẫu ảo từ

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
51 bằng cách sử dụng xẻng ảo, tính toán 1000 giá trị của tỷ lệ mẫu đỏ \ (\ widehat {p} \), sau đó hiển thị phân phối của chúng trong biểu đồ. Hãy nhớ lại rằng phân phối này được gọi là phân phối lấy mẫu của \ (\ widhat {p} \). Hơn nữa, độ lệch chuẩn của phân phối lấy mẫu có tên đặc biệt: lỗi tiêu chuẩn.\(\widehat{p}\), then visualized their distribution in a histogram. Recall that this distribution is called the sampling distribution of \(\widehat{p}\). Furthermore, the standard deviation of the sampling distribution has a special name: the standard error.

Chúng tôi cũng đề cập rằng hoạt động lấy mẫu này không phản ánh cách lấy mẫu được thực hiện trong cuộc sống thực. Thay vào đó, nó là một phiên bản lý tưởng hóa của việc lấy mẫu để chúng ta có thể nghiên cứu các tác động của biến thể lấy mẫu đối với các ước tính, giống như tỷ lệ của các quả bóng xẻng có màu đỏ. Tuy nhiên, trong cuộc sống thực, người ta sẽ lấy một mẫu duy nhất mà LỚN càng lớn càng tốt, giống như trong cuộc thăm dò của Obama mà chúng ta đã thấy trong Phần 7.4. Nhưng làm thế nào chúng ta có thể hiểu được hiệu quả của sự thay đổi lấy mẫu đối với các ước tính nếu chúng ta chỉ có một mẫu và do đó chỉ có một ước tính? Chúng tôi cần nhiều mẫu và do đó nhiều ước tính?

Giải pháp thay thế để có một mẫu duy nhất là thực hiện thay thế bootstrap với sự thay thế từ mẫu đơn. Chúng tôi đã làm điều này trong hoạt động lấy mẫu lại trong Phần 8.1, nơi chúng tôi tập trung vào năm trung bình của việc khai thác đồng xu. Chúng tôi đã sử dụng các mảnh giấy đại diện cho mẫu ban đầu của 50 đồng xu từ ngân hàng và lấy lại chúng bằng cách thay thế từ một chiếc mũ. Chúng tôi đã có 35 người bạn thực hiện hoạt động này và hình dung 35 mẫu có nghĩa là \ (\ Overline {x} \) trong một biểu đồ trong Hình 8.11.\(\overline{x}\) in a histogram in Figure 8.11.

Phân phối này được gọi là phân phối bootstrap của \ (\ Overline {x} \). Chúng tôi đã tuyên bố tại thời điểm đó, phân phối bootstrap là một xấp xỉ với phân phối lấy mẫu của \ (\ Overline {x} \) theo nghĩa cả hai phân phối sẽ có hình dạng tương tự và lan truyền tương tự. Do đó, lỗi tiêu chuẩn của phân phối bootstrap có thể được sử dụng như là một xấp xỉ với sai số tiêu chuẩn của phân phối lấy mẫu.\(\overline{x}\). We stated at the time that the bootstrap distribution is an approximation to the sampling distribution of \(\overline{x}\) in the sense that both distributions will have a similar shape and similar spread. Thus the standard error of the bootstrap distribution can be used as an approximation to the standard error of the sampling distribution.

Hãy để cho bạn thấy rằng đây là trường hợp của bây giờ so sánh hai loại phân phối này. Cụ thể, chúng tôi sẽ so sánh

  1. Phân phối lấy mẫu của \ (\ widhat {p} \) dựa trên 1000 mẫu ảo từ
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    51 từ tiểu mục 7.2 đến\(\widehat{p}\) based on 1000 virtual samples from the
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    51 from Subsection 7.2 to
  2. Phân phối bootstrap của \ (\ widhat {p} \) dựa trên 1000 mẫu người ảo với sự thay thế từ mẫu đơn ILYAS và YOHAN,
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    18 từ tiểu mục 8.5.1.\(\widehat{p}\) based on 1000 virtual resamples with replacement from Ilyas and Yohan’s single sample
    x_bar <- pennies_sample %>% 
      summarize(mean_year = mean(year))
    x_bar
    18 from Subsection 8.5.1.

Phân phối lấy mẫu

Dưới đây là mã bạn đã thấy trong Tiểu mục 7.2 để xây dựng phân phối lấy mẫu của \ (\ Widhat {p} \) được hiển thị lại trong Hình 8.33, với một số thay đổi để kết hợp thuật ngữ thống kê liên quan đến lấy mẫu từ tiểu mục 7.3.1.\(\widehat{p}\) shown again in Figure 8.33, with some changes to incorporate the statistical terminology relating to sampling from Subsection 7.3.1.

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
00

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.33: Phân phối lấy mẫu trước đây của tỷ lệ mẫu màu đỏ cho \ (n = 1000 \).\(n = 1000\).

Một điều quan trọng cần ghi nhớ là giá trị mặc định cho

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
56 là
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
60 khi sử dụng
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
55. Điều này là do khi lấy mẫu 50 quả bóng bằng xẻng, chúng tôi đang trích xuất 50 quả bóng từng người mà không thay thế chúng. Điều này trái ngược với việc lấy mẫu bootstrap bằng cách thay thế, nơi chúng tôi lấy mẫu lại một quả bóng và đặt lại, và lặp lại quá trình này 50 lần.

Hãy để định lượng độ biến thiên trong phân phối lấy mẫu này bằng cách tính độ lệch chuẩn của biến

# A tibble: 1 × 1
  mean_year
      
1   1995.44
29 biểu thị 1000 giá trị của tỷ lệ mẫu \ (\ Widhat {p} \). Hãy nhớ rằng độ lệch chuẩn của phân phối lấy mẫu là lỗi tiêu chuẩn, thường được ký hiệu là
# A tibble: 1 × 1
  mean_year
      
1   1995.44
30.\(\widehat{p}\). Remember that the standard deviation of the sampling distribution is the standard error, frequently denoted as
# A tibble: 1 × 1
  mean_year
      
1   1995.44
30.

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
01

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
02

Phân phối bootstrap

Dưới đây là mã bạn đã thấy trước đây trong Tiểu mục 8.5.1 để xây dựng phân phối bootstrap của \ (\ Widhat {P} \) dựa trên mẫu ban đầu của Ilyas và Yohan, 50 quả bóng được lưu trong

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18.\(\widehat{p}\) based on Ilyas and Yohan’s original sample of 50 balls saved in
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18.

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
03

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.34: Phân phối bootstrap của màu đỏ tỷ lệ cho \ (n = 1000 \).\(n = 1000\).

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
04

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
05

So sánh

Bây giờ chúng tôi đã tính toán cả phân phối lấy mẫu và phân phối bootstrap, hãy để so sánh chúng cạnh nhau trong Hình 8.35. Chúng tôi sẽ làm cho cả hai biểu đồ có thang đo phù hợp trên trục X và Y để làm cho chúng tương đương hơn. Hơn nữa, chúng tôi sẽ thêm:

  1. Để phân phối lấy mẫu trên đầu: một đường liền nét biểu thị tỷ lệ của các quả bóng bát có màu đỏ \ (p \) = 0,375.\(p\) = 0.375.
  2. Để phân phối bootstrap ở phía dưới: một đường đứt nét ở tỷ lệ mẫu \ (\ widhat {p} \) = 21/50 = 0,42 = 42% mà ilyas và yohan quan sát được.\(\widehat{p}\) = 21/50 = 0.42 = 42% that Ilyas and Yohan observed.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.35: So sánh các bản phân phối lấy mẫu và bootstrap của \ (\ widhat {p} \).\(\widehat{p}\).

Có rất nhiều điều đang diễn ra trong Hình 8.35, vì vậy hãy để chia nhỏ tất cả các so sánh một cách từ từ. Đầu tiên, quan sát cách phân phối lấy mẫu trên đỉnh được tập trung tại \ (p \) = 0,375. Điều này là do việc lấy mẫu được thực hiện một cách ngẫu nhiên và theo kiểu không thiên vị. Vì vậy, các ước tính \ (\ widhat {p} \) được tập trung vào giá trị thực của \ (p \).\(p\) = 0.375. This is because the sampling is done at random and in an unbiased fashion. So the estimates \(\widehat{p}\) are centered at the true value of \(p\).

Tuy nhiên, đây không phải là trường hợp với phân phối bootstrap sau đây. Phân phối bootstrap được tập trung ở mức 0,42, là tỷ lệ màu đỏ của Ilyas và Yohan, 50 quả bóng được lấy mẫu. Điều này là do chúng tôi đang lấy mẫu từ cùng một mẫu nhiều lần. Do phân phối bootstrap được tập trung ở tỷ lệ mẫu ban đầu, nên nó không nhất thiết cung cấp ước tính tốt hơn \ (p \) = 0,375. Điều này dẫn chúng ta đến bài học đầu tiên về bootstrapping:\(p\) = 0.375. This leads us to our first lesson about bootstrapping:

Phân phối bootstrap có thể sẽ không có cùng trung tâm với phân phối lấy mẫu. Nói cách khác, bootstrapping không thể cải thiện chất lượng của một ước tính.

Thứ hai, bây giờ hãy so sánh sự lây lan của hai bản phân phối: chúng có phần giống nhau. Trong mã trước, chúng tôi cũng đã tính toán độ lệch chuẩn của cả hai bản phân phối. Hãy nhớ lại rằng độ lệch chuẩn như vậy có một tên đặc biệt: lỗi tiêu chuẩn. Hãy để so sánh chúng trong Bảng 8.5.

Bảng 8.5: So sánh các lỗi tiêu chuẩnComparing standard errors
Loại phân phối Lỗi tiêu chuẩn
Phân phối lấy mẫu 0.067
Phân phối bootstrap 0.071

Lưu ý rằng lỗi tiêu chuẩn phân phối Bootstrap là một xấp xỉ khá tốt với lỗi tiêu chuẩn phân phối lấy mẫu. Điều này dẫn chúng ta đến bài học thứ hai của chúng tôi về bootstrapping:

Ngay cả khi phân phối bootstrap có thể không có cùng trung tâm với phân phối lấy mẫu, nó có thể sẽ có hình dạng và lan truyền rất giống nhau. Nói cách khác, bootstrapping sẽ cung cấp cho bạn một ước tính tốt về lỗi tiêu chuẩn.

Do đó, bằng cách sử dụng thực tế là phân phối và phân phối lấy mẫu bootstrap có sự chênh lệch tương tự, chúng ta có thể xây dựng khoảng tin cậy bằng cách sử dụng bootstrapping như chúng ta đã thực hiện trong suốt chương này!

Khoảng tin cậy dựa trên lý thuyết

Cho đến nay trong chương này, chúng tôi đã xây dựng các khoảng tin cậy bằng hai phương pháp: phương pháp phần trăm và phương pháp lỗi tiêu chuẩn. Nhớ lại cũng từ Tiểu mục 8.3.2 rằng chúng ta chỉ có thể sử dụng phương pháp lỗi tiêu chuẩn nếu phân phối bootstrap có hình chuông (nghĩa là, thường được phân phối).

Trong một tĩnh mạch tương tự, nếu phân phối lấy mẫu thường được định hình, có một phương pháp khác để xây dựng các khoảng tin cậy không liên quan đến việc sử dụng máy tính của bạn. Bạn có thể sử dụng một phương pháp dựa trên lý thuyết liên quan đến các công thức toán học!

Công thức sử dụng quy tắc ngón tay cái mà chúng ta đã thấy trong Phụ lục A.2 rằng 95% giá trị trong phân phối bình thường nằm trong độ lệch chuẩn \ (\ pm 1.96 \) của giá trị trung bình. Trong trường hợp phân phối lấy mẫu và bootstrap, hãy nhớ rằng độ lệch chuẩn có tên đặc biệt: lỗi tiêu chuẩn. Nhớ lại thêm trong Tiểu mục 7.6.2 Bạn đã thấy rằng có một công thức dựa trên lý thuyết để xấp xỉ sai số tiêu chuẩn cho các tỷ lệ mẫu \ (\ Widhat {p} \):\(\pm 1.96\) standard deviations of the mean. In the case of sampling and bootstrap distributions, remember that the standard deviation has a special name: the standard error. Recall further in Subsection 7.6.2 you saw that there is a theory-based formula to approximate the standard error for sample proportions \(\widehat{p}\):

\]

Nếu bạn đã quên sự thật này và những gì nó nói về mối quan hệ giữa độ chính xác của các ước tính của bạn và cỡ mẫu của bạn \ (n \), chúng tôi khuyên bạn nên đọc lại tiểu mục 7.6.2.\(n\), we highly recommend you re-read Subsection 7.6.2.

Nhớ lại từ

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18 rằng Yohan và Ilyas đã lấy mẫu \ (n = 50 \) và quan sát một tỷ lệ mẫu \ (\ widhat {p} \) là 21/50 = 0,42. Do đó, một xấp xỉ của lỗi tiêu chuẩn của \ (\ Widhat {P} \) dựa trên mẫu Yohan và Ilyas, là: Do đó:\(n = 50\) balls and observed a sample proportion \(\widehat{p}\) of 21/50 = 0.42. An approximation of the standard error of \(\widehat{p}\) based on Yohan and Ilyas’ sample is thus:

\ [\ text {se} _ {\ widehat {p}} \ spect

Hãy để so sánh lỗi tiêu chuẩn dựa trên lý thuyết này với lỗi tiêu chuẩn của các bản phân phối lấy mẫu và bootstrap mà bạn đã tính toán trước đây trong tiểu mục 8.7.1 trong Bảng 8.6. Lưu ý làm thế nào tất cả đều giống nhau!

Bảng 8.6: So sánh các lỗi tiêu chuẩnComparing standard errors
Loại phân phối Lỗi tiêu chuẩn
Phân phối lấy mẫu 0.067
Phân phối bootstrap 0.071
Xấp xỉ công thức 0.070

Sử dụng lỗi tiêu chuẩn dựa trên lý thuyết, hãy để trình bày một phương pháp dựa trên lý thuyết để xây dựng các khoảng tin cậy 95% không liên quan đến việc sử dụng máy tính, mà là các công thức toán học. Lưu ý rằng phương pháp dựa trên lý thuyết này chỉ giữ nếu phân phối lấy mẫu thường được định hình, để chúng ta có thể sử dụng quy tắc ngón tay cái 95% về các phân phối bình thường được thảo luận trong Phụ lục A.2.

  1. Thu thập một mẫu đại diện duy nhất có kích thước \ (n \) mà càng lớn càng tốt.\(n\) that’s as large as possible.
  2. Tính toán ước tính điểm: Tỷ lệ mẫu \ (\ Widhat {p} \). Hãy nghĩ về điều này như là trung tâm của mạng lưới của bạn.\(\widehat{p}\). Think of this as the center of your “net.”
  3. Tính toán xấp xỉ với lỗi tiêu chuẩn

\]

  1. Nếu bạn đã quên sự thật này và những gì nó nói về mối quan hệ giữa độ chính xác của các ước tính của bạn và cỡ mẫu của bạn \ (n \), chúng tôi khuyên bạn nên đọc lại tiểu mục 7.6.2.

Nhớ lại từ

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
18 rằng Yohan và Ilyas đã lấy mẫu \ (n = 50 \) và quan sát một tỷ lệ mẫu \ (\ widhat {p} \) là 21/50 = 0,42. Do đó, một xấp xỉ của lỗi tiêu chuẩn của \ (\ Widhat {P} \) dựa trên mẫu Yohan và Ilyas, là: Do đó:

  1. \ [\ text {se} _ {\ widehat {p}} \ spect
    • Hãy để so sánh lỗi tiêu chuẩn dựa trên lý thuyết này với lỗi tiêu chuẩn của các bản phân phối lấy mẫu và bootstrap mà bạn đã tính toán trước đây trong tiểu mục 8.7.1 trong Bảng 8.6. Lưu ý làm thế nào tất cả đều giống nhau!\[\widehat{p} - \text{MoE}_{\widehat{p}} = \widehat{p} - 1.96 \cdot \text{SE}_{\widehat{p}} = \widehat{p} - 1.96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

    • Bảng 8.6: So sánh các lỗi tiêu chuẩn\[\widehat{p} + \text{MoE}_{\widehat{p}} = \widehat{p} + 1.96 \cdot \text{SE}_{\widehat{p}} = \widehat{p} + 1.96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]

    • Loại phân phối\(p\) using the \(\pm\) symbol:

    Lỗi tiêu chuẩn

Phân phối lấy mẫu\(n = 50\) balls that had 21 red balls, the 95% confidence interval for \(p\) is

Phân phối bootstrap

Xấp xỉ công thức\(p\) was 0.375, in this case they successfully captured the fish.

Sử dụng lỗi tiêu chuẩn dựa trên lý thuyết, hãy để trình bày một phương pháp dựa trên lý thuyết để xây dựng các khoảng tin cậy 95% không liên quan đến việc sử dụng máy tính, mà là các công thức toán học. Lưu ý rằng phương pháp dựa trên lý thuyết này chỉ giữ nếu phân phối lấy mẫu thường được định hình, để chúng ta có thể sử dụng quy tắc ngón tay cái 95% về các phân phối bình thường được thảo luận trong Phụ lục A.2.\(n\), and the standard error.

Thu thập một mẫu đại diện duy nhất có kích thước \ (n \) mà càng lớn càng tốt.\(n\) = 2089 young Americans, \(\widehat{p}\) = 0.41 = 41% supported President Obama.

Nếu bạn nhìn vào cuối bài viết, nó cũng tuyên bố: Biên độ lỗi của cuộc thăm dò ý kiến ​​là cộng hoặc trừ 2,1 điểm phần trăm. Đây chính xác là \ (\ text {moe} \):\(\text{MoE}\):

\] Đưa

Kết quả thăm dò ý kiến ​​của họ dựa trên mức độ tin cậy 95% và khoảng tin cậy 95% cho tỷ lệ của tất cả những người Mỹ trẻ hỗ trợ Obama là:

\]

Khoảng tin cậy dựa trên 33 mẫu xúc giác

Hãy cùng xem lại 33 mẫu bạn bè của chúng tôi từ

x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
51 từ tiểu mục 7.1.3. Chúng tôi sẽ sử dụng 33 mẫu của họ để xây dựng 33 khoảng tin cậy dựa trên lý thuyết cho \ (p \). Nhớ lại dữ liệu này đã được lưu trong khung dữ liệu
# A tibble: 1 × 1
  mean_year
      
1   1995.44
34 có trong gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19:\(p\). Recall this data was saved in the
# A tibble: 1 × 1
  mean_year
      
1   1995.44
34 data frame included in the
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
19 package:

  1. # A tibble: 1 × 1
      mean_year
          
    1   1995.44
    36 Biến
    # A tibble: 1 × 1
      mean_year
          
    1   1995.44
    29 đến
    # A tibble: 1 × 1
      mean_year
          
    1   1995.44
    38, tên thống kê của tỷ lệ mẫu \ (\ Widhat {p} \).\(\widehat{p}\).
  2. # A tibble: 1 × 1
      mean_year
          
    1   1995.44
    39 Một biến mới
    # A tibble: 1 × 1
      mean_year
          
    1   1995.44
    40 làm rõ kích thước mẫu là 50.
  3. # A tibble: 1 × 1
      mean_year
          
    1   1995.44
    39 Các biến mới tính toán:
    • Lỗi tiêu chuẩn
      # A tibble: 1 × 1
        mean_year
            
      1   1995.44
      42 cho \ (\ widhat {p} \) bằng công thức trước đó.\(\widehat{p}\) using the previous formula.
    • Biên độ lỗi
      # A tibble: 1 × 1
        mean_year
            
      1   1995.44
      43 bằng cách nhân
      # A tibble: 1 × 1
        mean_year
            
      1   1995.44
      42 với 1.96
    • Điểm cuối bên trái của khoảng tin cậy
      # A tibble: 1 × 1
        mean_year
            
      1   1995.44
      45
    • Điểm cuối bên phải của khoảng tin cậy
      # A tibble: 1 × 1
        mean_year
            
      1   1995.44
      46

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
06

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
07

Trong Hình 8.36, hãy để biểu thị các khoảng tin cậy 33 cho \ (p \) được lưu trong

# A tibble: 1 × 1
  mean_year
      
1   1995.44
47 cùng với một đường thẳng đứng ở \ (p \) = 0,375 cho thấy tỷ lệ thực của các quả bóng ________ 351 có màu đỏ. Hơn nữa, hãy để đánh dấu các tỷ lệ mẫu \ (\ Widhat {p} \) với các dấu chấm vì chúng đại diện cho các trung tâm của các khoảng tin cậy này.\(p\) saved in
# A tibble: 1 × 1
  mean_year
      
1   1995.44
47 along with a vertical line at \(p\) = 0.375 indicating the true proportion of the
x_bar <- pennies_sample %>% 
  summarize(mean_year = mean(year))
x_bar
51’s balls that are red. Furthermore, let’s mark the sample proportions \(\widehat{p}\) with dots since they represent the centers of these confidence intervals.

Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Hình 8.36: 33 khoảng tin cậy ở mức 95% dựa trên 33 mẫu xúc giác có kích thước \ (n = 50 \).\(n = 50\).

Quan sát rằng 31 trong số 33 khoảng tin cậy đã nắm bắt được giá trị thực của \ (p \), với tỷ lệ thành công là 31/33 = 93,94%. Mặc dù điều này không khá 95%, nhưng hãy nhớ lại rằng chúng tôi mong đợi khoảng 95% khoảng tin cậy như vậy để nắm bắt \ (p \). Tỷ lệ thành công quan sát thực tế sẽ thay đổi một chút.\(p\), for a success rate of 31 / 33 = 93.94%. While this is not quite 95%, recall that we expect about 95% of such confidence intervals to capture \(p\). The actual observed success rate will vary slightly.

Các phương pháp dựa trên lý thuyết như thế này phần lớn đã được sử dụng trong quá khứ vì chúng tôi đã có khả năng tính toán để thực hiện các phương pháp dựa trên mô phỏng như bootstrapping. Tuy nhiên, chúng vẫn thường được sử dụng và nếu phân phối lấy mẫu thường được phân phối, chúng tôi có quyền truy cập vào một phương pháp thay thế để xây dựng khoảng tin cậy cũng như thực hiện các bài kiểm tra giả thuyết như chúng ta sẽ thấy trong Chương 9.

Loại suy luận thống kê dựa trên máy tính mà chúng tôi đã thấy cho đến nay có một tên cụ thể trong lĩnh vực thống kê: suy luận dựa trên mô phỏng. Điều này là do chúng tôi đang thực hiện suy luận thống kê bằng cách sử dụng mô phỏng máy tính. Theo chúng tôi, hai lợi ích lớn của các phương pháp dựa trên mô phỏng so với các phương pháp dựa trên lý thuyết là (1) chúng dễ dàng hơn cho những người mới suy luận thống kê để hiểu và (2) chúng cũng hoạt động trong các tình huống trong đó các phương pháp dựa trên lý thuyết và công thức toán học Đừng tồn tại.

Tài nguyên bổ sung

Một tệp tập lệnh R của tất cả các mã R được sử dụng trong chương này có sẵn ở đây.

Nếu bạn muốn có thêm các ví dụ về quy trình làm việc

# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50 để xây dựng khoảng tin cậy, chúng tôi khuyên bạn nên kiểm tra trang chủ gói
# A tibble: 50 × 2
      ID  year
    
 1     1  2002
 2     2  1986
 3     3  2017
 4     4  1988
 5     5  2008
 6     6  1983
 7     7  2008
 8     8  1996
 9     9  2004
10    10  2000
# … with 40 more rows
50, đặc biệt, một loạt các phân tích ví dụ có sẵn tại https://infer.netlify.app/articles/.

Điều gì sẽ đến?

Bây giờ, chúng tôi đã trang bị cho mình các khoảng tin cậy, trong Chương 9, chúng tôi sẽ đề cập đến các công cụ phổ biến khác để suy luận thống kê: Kiểm tra giả thuyết. Giống như khoảng tin cậy, các bài kiểm tra giả thuyết được sử dụng để suy ra về dân số sử dụng mẫu. Tuy nhiên, chúng tôi sẽ thấy rằng khuôn khổ để đưa ra những suy luận như vậy là hơi khác nhau.

Làm thế nào để bootstrap ảnh hưởng đến khoảng tin cậy?

Bootstrap trong hành động, nó tạo ra nhiều mẫu (với sự thay thế) từ một bộ quan sát duy nhất và tính toán kích thước hiệu ứng quan tâm trên mỗi mẫu này. Các mô hình lại bootstrap của kích thước hiệu ứng sau đó có thể được sử dụng để xác định 95% CI.It creates multiple resamples (with replacement) from a single set of observations, and computes the effect size of interest on each of these resamples. The bootstrap resamples of the effect size can then be used to determine the 95% CI.

Mục đích chính của bootstrapping là gì?

Bootstrapping là một quy trình thống kê ghép lại một bộ dữ liệu duy nhất để tạo ra nhiều mẫu mô phỏng.Quá trình này cho phép bạn tính toán các lỗi tiêu chuẩn, xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết cho nhiều loại thống kê mẫu.resamples a single dataset to create many simulated samples. This process allows you to calculate standard errors, construct confidence intervals, and perform hypothesis testing for numerous types of sample statistics.

Khi nào nên sử dụng kỹ thuật bootstrapping?

Phương pháp Bootstrap là một kỹ thuật lấy mẫu lại được sử dụng để ước tính số liệu thống kê về dân số bằng cách lấy mẫu bộ dữ liệu với sự thay thế.Nó có thể được sử dụng để ước tính số liệu thống kê tóm tắt như trung bình hoặc độ lệch chuẩn.to estimate statistics on a population by sampling a dataset with replacement. It can be used to estimate summary statistics such as the mean or standard deviation.

Có bao nhiêu bản sao bootstrap là cần thiết cho khoảng tin cậy?

Theo Efron ("nhà phát minh" của kỹ thuật boostrap), bạn nên tạo 1600 bản sao.1600 replicas.