Hướng dẫn do we use bootstrap to build confidence intervals? - chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?
Lấy mẫu từ dân sốTrong một thí nghiệm khoa học điển hình, chúng tôi quan tâm đến hai quần thể (kiểm soát và kiểm tra) và liệu có sự khác biệt giữa các phương tiện của chúng không (MuffTest - MuffControl). Show
Chúng tôi đi về điều này bằng cách thu thập các quan sát từ dân số kiểm soát và từ dân số thử nghiệm. Chúng tôi có thể dễ dàng tính toán sự khác biệt trung bình trong các mẫu quan sát của chúng tôi. Đây là ước tính của chúng tôi về quy mô hiệu ứng dân số mà chúng tôi quan tâm. Nhưng làm thế nào để chúng ta có được một thước đo độ chính xác và niềm tin về ước tính của chúng ta? Chúng ta có thể hiểu được cách nó liên quan đến sự khác biệt có nghĩa là dân số? Giới thiệu khoảng tin cậy bootstrapChúng tôi muốn có được khoảng tin cậy 95% (95% CI) xung quanh ước tính của chúng tôi về sự khác biệt trung bình. 95% chỉ ra rằng bất kỳ khoảng tin cậy nào như vậy sẽ nắm bắt được sự khác biệt trung bình dân số 95% của thời gian11 nói cách khác, nếu chúng ta lặp lại thí nghiệm của mình 100 lần, thu thập 100 bộ quan sát độc lập và tính toán CI 95% cho sự khác biệt trung bình mỗi Thời gian, 95 trong số các khoảng tin cậy này sẽ thu được sự khác biệt trung bình dân số .. nghĩa là, chúng ta có thể tự tin 95% khoảng thời gian chứa trung bình thực sự của dân số.95% confidence interval (95% CI) around the our estimate of the mean difference. The 95% indicates that any such confidence interval will capture the population mean difference 95% of the time11 In other words, if we repeated our experiment 100 times, gathering 100 independent sets of observations, and computing a 95% CI for the mean difference each time, 95 of these confidence intervals would capture the population mean difference.. That is to say, we can be 95% confident the interval contains the true mean of the population. Chúng ta có thể tính toán CI 95% của chênh lệch trung bình bằng cách thực hiện lấy mẫu Bootstrap. Bootstrap trong hành độngBootstrap22 Tên có nguồn gốc từ câu nói của mình bởi một người bootstraps, thường được sử dụng như một sự hô hào để đạt được thành công mà không cần sự giúp đỡ bên ngoài. là một kỹ thuật đơn giản nhưng mạnh mẽ. Nó được mô tả đầu tiên bởi Bradley Efron.2 The name is derived from the saying “pull oneself by one’s bootstraps”, often used as an exhortation to achieve success without external help. is a simple but powerful technique. It was first described by Bradley Efron. Nó tạo ra nhiều mẫu người (với sự thay thế) từ một bộ quan sát duy nhất và tính toán kích thước hiệu ứng của lợi ích trên mỗi mẫu này. Các mô hình lại bootstrap của kích thước hiệu ứng sau đó có thể được sử dụng để xác định 95% CI. Với máy tính, chúng tôi có thể thực hiện 5000 resples rất dễ dàng. Sự phân phối lại của sự khác biệt trong phương tiện tiếp cận phân phối bình thường. Điều này là do định lý giới hạn trung tâm: Một số lượng lớn các mẫu ngẫu nhiên độc lập sẽ tiếp cận phân phối bình thường ngay cả khi dân số cơ bản không được phân phối bình thường. Bootstrap Resampling mang lại cho chúng ta hai lợi ích quan trọng:
Điều chỉnh các phân phối tái tạo không đối xứngMặc dù việc lấy mẫu lại phân phối của sự khác biệt về phương tiện thường có phân phối bình thường, nhưng không có gì lạ khi gặp phân phối sai lệch. Do đó, Efron đã phát triển Bootstrap được điều chỉnh và tăng tốc độ lệch (BCA Bootstrap) để giải thích cho độ lệch và vẫn có được 95% trung tâm của phân phối. Dabest áp dụng hiệu chỉnh BCA cho các phân phối bootstrap lấy mẫu lại của kích thước hiệu ứng. Các lô ước tính kết hợp lấy lại BootstrapBiểu đồ ước tính được tạo ra bởi 08 trình bày RawData và khoảng tin cậy bootstrap của kích thước hiệu ứng (sự khác biệt về phương tiện) cạnh nhau như một biểu đồ tích hợp duy nhất. Do đó, nó kết hợp chặt chẽ sự trình bày trực quan của dữ liệu thô với một dấu hiệu của sự khác biệt trung bình dân số và khoảng tin cậy của nó. Trong Chương 7, chúng tôi đã nghiên cứu lấy mẫu. Chúng tôi bắt đầu với một bài tập xúc giác của người Viking, nơi chúng tôi muốn biết tỷ lệ bóng trong bát lấy mẫu trong Hình 7.1 có màu đỏ. Mặc dù chúng tôi có thể đã thực hiện một số lượng toàn diện, đây sẽ là một quá trình tẻ nhạt. Vì vậy, thay vào đó, chúng tôi đã sử dụng một cái xẻng để trích xuất một mẫu gồm 50 quả bóng và sử dụng tỷ lệ kết quả có màu đỏ làm ước tính. Hơn nữa, chúng tôi đảm bảo trộn các nội dung bát trước khi sử dụng xẻng. Do tính ngẫu nhiên được tạo ra bởi sự pha trộn, các cách sử dụng khác nhau của xẻng mang lại các tỷ lệ khác nhau màu đỏ và do đó các ước tính khác nhau về tỷ lệ của các quả bóng bát có màu đỏ. Sau đó, chúng tôi đã bắt chước bài tập lấy mẫu xúc giác của người Viking này với một bài tập lấy mẫu ảo ảo tương đương được thực hiện trên máy tính. Sử dụng trình tạo số ngẫu nhiên máy tính của chúng tôi, chúng tôi đã nhanh chóng bắt chước quy trình lấy mẫu ở trên một số lượng lớn. Trong Tiểu mục 7.2, chúng tôi đã nhanh chóng lặp lại quy trình lấy mẫu này 1000 lần, sử dụng ba khe cắm ảo khác nhau với các khe 25, 50 và 100. Chúng tôi đã hình dung ba bộ 1000 ước tính trong Hình 7.15 và thấy rằng kích thước mẫu tăng lên, sự thay đổi trong ước tính giảm. Khi làm như vậy, những gì chúng tôi đã làm là xây dựng các phân phối lấy mẫu. Động lực để lấy 1000 mẫu lặp đi lặp lại và hình dung các ước tính kết quả là nghiên cứu cách các ước tính này thay đổi từ mẫu này sang mẫu khác; Nói cách khác, chúng tôi muốn nghiên cứu ảnh hưởng của biến thể lấy mẫu. Chúng tôi đã định lượng biến thể của các ước tính này bằng cách sử dụng độ lệch chuẩn của chúng, có tên đặc biệt: lỗi tiêu chuẩn. Cụ thể, chúng tôi đã thấy rằng kích thước mẫu tăng từ 25 đến 50, lỗi tiêu chuẩn giảm và do đó, các phân phối lấy mẫu bị thu hẹp. Kích thước mẫu lớn hơn dẫn đến các ước tính chính xác hơn khác nhau ít hơn xung quanh trung tâm. Sau đó, chúng tôi buộc các bài tập lấy mẫu này vào thuật ngữ và ký hiệu toán học liên quan đến lấy mẫu trong tiểu mục 7.3.1. Dân số nghiên cứu của chúng tôi là bát lớn với \ (n \) = 2400 quả bóng, trong khi tham số dân số, số lượng quan tâm không xác định, là tỷ lệ dân số \ (p \) của các quả bóng bát có màu đỏ. Vì việc thực hiện điều tra dân số sẽ tốn kém về thời gian và năng lượng, chúng tôi thay vào đó đã trích xuất một mẫu kích thước \ (n \) = 50. Ước tính điểm, còn được gọi là thống kê mẫu, được sử dụng để ước tính \ (p \) là Tỷ lệ mẫu \ (\ Widhat {p} \) của 50 quả bóng được lấy mẫu này có màu đỏ. Hơn nữa, vì mẫu được lấy ngẫu nhiên, nó có thể được coi là không thiên vị và đại diện cho dân số. Do đó, bất kỳ kết quả nào dựa trên mẫu có thể được khái quát cho dân số. Do đó, tỷ lệ của những quả bóng xẻng có màu đỏ là một dự đoán tốt của người Hồi giáo về tỷ lệ của những quả bóng bát có màu đỏ. Nói cách khác, chúng tôi đã sử dụng mẫu để suy ra về dân số.\(N\) = 2400 balls, while the population parameter, the unknown quantity of interest, was the population proportion \(p\) of the bowl’s balls that were red. Since performing a census would be expensive in terms of time and energy, we instead extracted a sample of size \(n\) = 50. The point estimate, also known as a sample statistic, used to estimate \(p\) was the sample proportion \(\widehat{p}\) of these 50 sampled balls that were red. Furthermore, since the sample was obtained at random, it can be considered as unbiased and representative of the population. Thus any results based on the sample could be generalized to the population. Therefore, the proportion of the shovel’s balls that were red was a “good guess” of the proportion of the bowl’s balls that are red. In other words, we used the sample to infer about the population. Tuy nhiên, như được mô tả trong Phần 7.2, cả các bài tập lấy mẫu ảo và ảo không phải là những gì người ta sẽ làm trong cuộc sống thực; Đây chỉ là một hoạt động được sử dụng để nghiên cứu ảnh hưởng của biến thể lấy mẫu. Trong một tình huống thực tế, chúng tôi sẽ không lấy 1000 mẫu có kích thước \ (n \), mà là lấy một mẫu đại diện duy nhất mà LỚN càng lớn càng tốt. Ngoài ra, chúng tôi biết rằng tỷ lệ thực sự của những quả bóng bát có màu đỏ là 37,5%. Trong một tình huống thực tế, chúng ta sẽ không biết giá trị này là gì. Bởi vì nếu chúng tôi đã làm, thì tại sao chúng tôi lại lấy một mẫu để ước tính nó?\(n\), but rather take a single representative sample that’s as large as possible. Additionally, we knew that the true proportion of the bowl’s balls that were red was 37.5%. In a real-life situation, we will not know what this value is. Because if we did, then why would we take a sample to estimate it? Một ví dụ về một tình huống lấy mẫu thực tế sẽ là một cuộc thăm dò, như cuộc thăm dò của Obama mà bạn đã thấy trong Phần 7.4. Những người gây ô nhiễm không biết tỷ lệ thực sự của tất cả những người Mỹ trẻ tuổi ủng hộ Tổng thống Obama vào năm 2013, và do đó họ đã lấy một mẫu có kích thước \ (n \) = 2089 thanh niên Mỹ ước tính giá trị này.\(n\) = 2089 young Americans to estimate this value. Vậy làm thế nào để một người định lượng các tác động của biến thể lấy mẫu khi bạn chỉ có một mẫu để làm việc? Bạn không thể nghiên cứu trực tiếp các tác động của biến thể lấy mẫu khi bạn chỉ có một mẫu. Một phương pháp phổ biến để nghiên cứu điều này là lấy mẫu bootstrapping, đó sẽ là trọng tâm của các phần trước của chương này. Hơn nữa, điều gì sẽ xảy ra nếu chúng ta muốn không chỉ một ước tính duy nhất về tham số dân số chưa biết, mà còn là một loạt các giá trị rất hợp lý? Quay trở lại bài báo của Obama Poll, nó tuyên bố rằng những người thăm dò ý kiến ước tính tỷ lệ của tất cả những người Mỹ trẻ ủng hộ Tổng thống Obama là 41%. Nhưng ngoài ra, nó đã tuyên bố rằng tỷ lệ lỗi của cuộc thăm dò là cộng hoặc trừ 2,1 điểm phần trăm. Phạm vi hợp lý của người Viking này là [41% - 2,1%, 41% + 2,1%] = [38,9%, 43,1%]. Phạm vi của các giá trị hợp lý này là những gì được gọi là khoảng tin cậy, đó sẽ là trọng tâm của các phần sau của chương này. Các gói cần thiếtHãy để tải tất cả các gói cần thiết cho chương này (điều này giả sử bạn đã cài đặt chúng). Nhớ lại từ cuộc thảo luận của chúng tôi trong Phần 4.4 tải gói 09 bằng cách chạy 10 tải các gói khoa học dữ liệu thường được sử dụng sau đây cùng một lúc:
Nếu cần, hãy đọc Phần 1.3 để biết thông tin về cách cài đặt và tải các gói R.
Hoạt động đồng xuNhư chúng tôi đã làm trong Chương 7, chúng tôi sẽ bắt đầu với một hoạt động xúc giác thực hành. Năm trung bình của chúng tôi là đồng xu năm 2019 là gì?Hãy cố gắng tưởng tượng tất cả các đồng xu đang được sử dụng ở Hoa Kỳ vào năm 2019. Đó là rất nhiều đồng xu! Bây giờ nói rằng chúng tôi quan tâm đến năm trung bình của tất cả các đồng xu này. Một cách để tính toán giá trị này là thu thập tất cả các đồng xu đang được sử dụng ở Mỹ, ghi lại năm và tính toán trung bình. Tuy nhiên, điều này sẽ gần như không thể! Vì vậy, thay vào đó, hãy để Lôi thu thập một mẫu gồm 50 đồng xu từ một ngân hàng địa phương ở trung tâm thành phố Northampton, Massachusetts, Hoa Kỳ như trong Hình 8.1.
Hình 8.1: Thu thập một mẫu 50 đồng xu của Hoa Kỳ từ một ngân hàng địa phương. Một hình ảnh của 50 đồng xu này có thể được nhìn thấy trong Hình 8.2. Đối với mỗi trong số 50 đồng xu bắt đầu ở phía trên bên trái, chuyển đổi từng hàng và kết thúc ở phía dưới bên phải, chúng tôi đã chỉ định một biến nhận dạng ID ID và được đánh dấu năm của việc khai thác.
Hình 8.2: 50 đồng xu Hoa Kỳ được dán nhãn. Gói 19 chứa dữ liệu này trên 50 đồng xu được lấy mẫu của chúng tôi trong khung dữ liệu 20:
Khung dữ liệu 20 có 50 hàng tương ứng với mỗi xu với hai biến. Biến đầu tiên 22 tương ứng với các nhãn ID trong Hình 8.2, trong khi biến thứ hai 23 tương ứng với năm khai thác được lưu dưới dạng biến số, còn được gọi là Double ( 24).Dựa trên 50 đồng xu được lấy mẫu này, chúng ta có thể nói gì về tất cả các đồng xu của Hoa Kỳ trong năm 2019? Hãy cùng nghiên cứu một số thuộc tính của mẫu của chúng tôi bằng cách thực hiện phân tích dữ liệu khám phá. Trước tiên, hãy trực quan hóa việc phân phối năm của 50 đồng xu này bằng cách sử dụng các công cụ trực quan hóa dữ liệu của chúng tôi từ Chương 2. Vì 23 là một biến số, chúng tôi sử dụng biểu đồ trong Hình 8.3 để trực quan hóa phân phối của nó.
Hình 8.3: Phân phối năm trên 50 đồng xu của Hoa Kỳ. Quan sát một phân phối sai lệch hơi trái, vì hầu hết các đồng xu giảm từ năm 1980 đến 2010 chỉ với một vài đồng xu lớn hơn 1970. Năm trung bình của 50 đồng xu được lấy mẫu là bao nhiêu? Nhờ biểu đồ biểu đồ mà nó dường như là vào khoảng năm 1990. Bây giờ, hãy tính toán chính xác giá trị này bằng cách sử dụng các công cụ Wrangling dữ liệu của chúng tôi từ Chương 3.
Do đó, nếu chúng tôi sẵn sàng cho rằng 20 là một mẫu đại diện từ tất cả các đồng xu của Hoa Kỳ, thì một dự đoán tốt của người Hồi giáo về việc khai thác trung bình của tất cả các đồng xu của Hoa Kỳ sẽ là năm 1995,44. Nói cách khác, khoảng năm 1995. Tất cả điều này sẽ bắt đầu nghe tương tự như những gì chúng ta đã làm trước đây trong Chương 7!Trong Chương 7, dân số nghiên cứu của chúng tôi là bát \ (n \) = 2400 quả bóng. Thông số dân số của chúng tôi là tỷ lệ dân số của những quả bóng có màu đỏ, được ký hiệu là \ (p \). Để ước tính \ (p \), chúng tôi đã trích xuất một mẫu 50 quả bóng bằng xẻng. Sau đó, chúng tôi đã tính toán ước tính điểm có liên quan: Tỷ lệ mẫu của 50 quả bóng màu đỏ, được biểu thị về mặt toán học bằng \ (\ Widhat {p} \).\(N\) = 2400 balls. Our population parameter was the population proportion of these balls that were red, denoted by \(p\). In order to estimate \(p\), we extracted a sample of 50 balls using the shovel. We then computed the relevant point estimate: the sample proportion of these 50 balls that were red, denoted mathematically by \(\widehat{p}\). Ở đây, dân số của chúng tôi là \ (n \) = bất kể số đồng xu đang được sử dụng ở Mỹ, một giá trị mà chúng tôi không biết và có lẽ sẽ không bao giờ. Tham số dân số quan tâm hiện là năm trung bình dân số của tất cả các đồng xu này, một giá trị được biểu thị bằng toán học bằng chữ Hy Lạp \ (\ mu \) (phát âm là Mu Mu Mu). Để ước tính \ (\ mu \), chúng tôi đã đến ngân hàng và lấy một mẫu gồm 50 đồng xu và tính toán ước tính điểm liên quan: Năm trung bình của 50 đồng xu này, được biểu thị bằng toán học bằng \ (\ Overline {x} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ ) (phát âm là X X-Bar). Một ký hiệu thay thế và trực quan hơn cho giá trị trung bình của mẫu là \ (\ widhat {\ mu} \). Tuy nhiên, điều này không may là không được sử dụng phổ biến, vì vậy trong cuốn sách này, chúng tôi sẽ gắn bó với quy ước và luôn biểu thị giá trị trung bình của mẫu là \ (\ Overline {x} \).\(N\) = whatever the number of pennies are being used in the US, a value which we don’t know and probably never will. The population parameter of interest is now the population mean year of all these pennies, a value denoted mathematically by the Greek letter \(\mu\) (pronounced “mu”). In order to estimate \(\mu\), we went to the bank and obtained a sample of 50 pennies and computed the relevant point estimate: the sample mean year of these 50 pennies, denoted mathematically by \(\overline{x}\) (pronounced “x-bar”). An alternative and more intuitive notation for the sample mean is \(\widehat{\mu}\). However, this is unfortunately not as commonly used, so in this book we’ll stick with convention and always denote the sample mean as \(\overline{x}\). Chúng tôi tóm tắt sự tương ứng giữa bài tập lấy mẫu trong Chương 7 và bài tập đồng xu của chúng tôi trong Bảng 8.1, là hai hàng đầu tiên của Bảng 7.5 đã thấy trước đó. Bảng 8.1: Các kịch bản lấy mẫu cho suy luậnScenarios of sampling for inference
Quay trở lại với 50 đồng xu được lấy mẫu của chúng tôi trong Hình 8.2, ước tính điểm quan tâm là trung bình mẫu \ (\ Overline {x} \) năm 1995.44. Số lượng này là một ước tính về dân số trung bình của tất cả các đồng xu của Hoa Kỳ \ (\ mu \).\(\overline{x}\) of 1995.44. This quantity is an estimate of the population mean year of all US pennies \(\mu\). Hãy nhớ lại rằng chúng ta cũng đã thấy trong Chương 7 rằng các ước tính như vậy dễ bị biến đổi lấy mẫu. Ví dụ, trong mẫu cụ thể này trong Hình 8.2, chúng tôi đã quan sát ba đồng xu với năm 1999. Nếu chúng tôi lấy mẫu 50 đồng xu khác, chúng tôi có quan sát chính xác ba đồng xu với năm 1999 không? Nhiều khả năng không. Chúng tôi có thể quan sát không, một, hai, hoặc thậm chí tất cả 50! Điều tương tự có thể được nói trong 26 năm độc đáo khác được thể hiện trong mẫu 50 xu của chúng tôi. Để nghiên cứu ảnh hưởng của biến thể lấy mẫu trong Chương 7, chúng tôi đã lấy nhiều mẫu, một điều chúng tôi có thể dễ dàng làm với xẻng của mình. Trong trường hợp của chúng tôi với đồng xu, tuy nhiên, làm thế nào chúng ta có được một mẫu khác? Bằng cách đi đến ngân hàng và nhận được một cuộn 50 xu khác. Tuy nhiên, chúng tôi cảm thấy lười biếng, và don không muốn quay lại ngân hàng. Làm thế nào chúng ta có thể nghiên cứu ảnh hưởng của biến thể lấy mẫu bằng cách sử dụng mẫu đơn của chúng tôi? Chúng tôi sẽ làm như vậy bằng cách sử dụng một kỹ thuật được gọi là Bootstrap Respling với sự thay thế, mà bây giờ chúng tôi minh họa. Lấy mẫu lại một lầnBước 1: Hãy để in ra những miếng giấy có kích thước giống hệt nhau đại diện cho 50 đồng xu của chúng tôi như trong Hình 8.4.: Let’s print out identically sized slips of paper representing our 50 pennies as seen in Figure 8.4.
Hình 8.4: Bước 1: 50 Slips của giấy đại diện cho 50 đồng xu của Hoa Kỳ. Bước 2: Đặt 50 miếng giấy vào mũ hoặc tuque như trong Hình 8.5.: Put the 50 slips of paper into a hat or tuque as seen in Figure 8.5.
Hình 8.5: Bước 2: Đặt 50 miếng giấy vào mũ. Bước 3: Trộn các nội dung mũ và vẽ một tấm giấy một cách ngẫu nhiên như trong Hình 8.6. Ghi lại năm.: Mix the hat’s contents and draw one slip of paper at random as seen in Figure 8.6. Record the year.
Hình 8.6: Bước 3: Vẽ một tờ giấy một cách ngẫu nhiên. Bước 4: Đặt phiếu của giấy trở lại trong mũ! Nói cách khác, thay thế nó như trong Hình 8.7.: Put the slip of paper back in the hat! In other words, replace it as seen in Figure 8.7.
Hình 8.7: Bước 4: Thay thế phiếu giấy. Bước 5: Lặp lại các bước 3 và 4 Tổng cộng 49 lần nữa, dẫn đến 50 năm được ghi lại.: Repeat Steps 3 and 4 a total of 49 more times, resulting in 50 recorded years. Những gì chúng tôi vừa thực hiện là việc lấy lại mẫu ban đầu của 50 đồng xu. Chúng tôi không lấy mẫu 50 đồng xu từ dân số của tất cả chúng tôi như chúng tôi đã làm trong chuyến đi đến ngân hàng. Thay vào đó, chúng tôi đang bắt chước hành động này bằng cách lấy lại 50 đồng xu từ mẫu ban đầu của chúng tôi là 50 đồng xu. Bây giờ hãy tự hỏi, tại sao chúng tôi lại thay thế phiếu được lấy lại của chúng tôi vào mũ trong Bước 4? Bởi vì nếu chúng tôi để lại tấm giấy ra khỏi mũ mỗi khi chúng tôi thực hiện Bước 4, chúng tôi sẽ kết thúc với cùng 50 đồng xu ban đầu! Nói cách khác, việc thay thế các phiếu của giấy gây ra sự thay đổi lấy mẫu. Chính xác hơn với thuật ngữ của chúng tôi, chúng tôi chỉ thực hiện lấy mẫu lại với sự thay thế từ mẫu ban đầu là 50 đồng xu. Nếu chúng tôi để lại tấm giấy ra khỏi mũ mỗi lần chúng tôi thực hiện Bước 4, điều này sẽ được lấy mẫu lại mà không cần thay thế. Hãy cùng nghiên cứu 50 đồng xu được lấy lại của chúng tôi thông qua phân tích dữ liệu khám phá. Đầu tiên, hãy để tải dữ liệu vào R bằng cách tạo thủ công khung dữ liệu 27 trong số 50 giá trị được lấy lại của chúng tôi. Chúng tôi sẽ thực hiện việc này bằng cách sử dụng lệnh 28 từ gói 12. Lưu ý rằng 50 giá trị bạn lấy lại gần như chắc chắn sẽ không giống như chúng tôi được đưa ra sự ngẫu nhiên vốn có.
50 giá trị của 23 trong 27 đại diện cho một mẫu lấy lại kích thước 50 từ mẫu ban đầu của 50 xu. Chúng tôi hiển thị 50 đồng xu được ghép lại trong Hình 8.8.
Hình 8.8: 50 PENNIES Hoa Kỳ được lấy lại được dán nhãn. Hãy để so sánh sự phân phối của biến số 23 trong số 50 đồng xu được lấy lại của chúng tôi với phân phối biến số 23 của mẫu ban đầu của chúng tôi là 50 đồng xu trong Hình 8.9.
Hình 8.9: So sánh 23 trong 27 được lấy lại với mẫu ban đầu 20.Quan sát trong Hình 8.9 rằng trong khi các hình dạng chung của cả hai phân phối của 23 gần giống nhau, chúng không giống nhau.Nhớ lại từ phần trước rằng trung bình mẫu của mẫu ban đầu là 50 đồng xu từ ngân hàng là 1995,44. Còn việc lấy mẫu của chúng tôi thì sao? Đoán nào? Hãy để Lừa có 12 giúp chúng tôi như trước:
Chúng tôi đã thu được một năm trung bình khác nhau của năm 1996. Biến thể này được gây ra bởi việc lấy mẫu lại với sự thay thế mà chúng tôi đã thực hiện trước đó. Điều gì sẽ xảy ra nếu chúng ta lặp lại bài tập lấy mẫu này nhiều lần? Chúng ta sẽ có được ý nghĩa tương tự 23 mỗi lần? Nói cách khác, liệu chúng ta có đoán vào năm trung bình của tất cả các đồng xu ở Mỹ năm 2019 là chính xác năm 1996 mỗi lần không? Giống như chúng tôi đã làm trong Chương 7, hãy để thực hiện hoạt động lấy mẫu này với sự giúp đỡ của một số người bạn của chúng tôi: tổng cộng 35 người bạn.Đặt lại 35 lầnMỗi trong số 35 người bạn của chúng tôi sẽ lặp lại năm bước giống nhau:
Vì chúng tôi đã có 35 người bạn thực hiện nhiệm vụ này, chúng tôi đã kết thúc với các giá trị \ (35 \ cdot 50 = 1750 \). Chúng tôi đã ghi lại các giá trị này trong một bảng tính được chia sẻ với 50 hàng (cộng với hàng tiêu đề) và 35 cột. Chúng tôi hiển thị một ảnh chụp nhanh của 10 hàng đầu tiên và năm cột của bảng tính được chia sẻ này trong Hình 8.10.\(35 \cdot 50 = 1750\) values. We recorded these values in a shared spreadsheet with 50 rows (plus a header row) and 35 columns. We display a snapshot of the first 10 rows and five columns of this shared spreadsheet in Figure 8.10.
Hình 8.10: Ảnh chụp bảng tính chung của đồng xu được lấy lại. Để thuận tiện cho bạn, chúng tôi đã lấy các giá trị 35 \ (\ cdot \) 50 = 1750 này và lưu chúng trong 40, một khung dữ liệu gọn gàng của Hồi giáo có trong gói 19. Chúng tôi đã thấy ý nghĩa của một khung dữ liệu là gọn gàng trong tiểu mục 4.2.1.\(\cdot\) 50 = 1750 values and saved them in 40, a “tidy” data frame included in the 19 package. We saw what it means for a data frame to be “tidy” in Subsection 4.2.1.
Mỗi 35 người bạn của chúng tôi có được là năm có nghĩa là gì? Một lần nữa, 12 để giải cứu! Sau khi nhóm các hàng với 43, chúng tôi tóm tắt từng nhóm gồm 50 hàng theo giá trị trung bình của chúng 23: 0 1Quan sát rằng 45 có 35 hàng tương ứng với 35 phương tiện dựa trên 35 mẫu lại. Hơn nữa, quan sát sự thay đổi trong 35 giá trị trong biến 46. Hãy để trực quan hóa biến thể này bằng cách sử dụng biểu đồ trong Hình 8.11. Hãy nhớ lại rằng việc thêm đối số 47 vào 48 đặt cấu trúc Binning sao cho một trong các ranh giới thùng ở năm 1990 chính xác. 2
Hình 8.11: Phân phối 35 phương tiện mẫu từ 35 mẫu. Quan sát trong Hình 8.11 rằng phân phối có vẻ gần như bình thường và chúng tôi hiếm khi quan sát mẫu trung bình mẫu dưới năm 1992 hoặc lớn hơn 2000. Cũng quan sát cách phân phối tập trung gần như vào năm 1995, gần với trung bình mẫu của năm 1995,44 của mẫu ban đầu của 50 đồng xu từ ngân hàng. Chúng ta vừa làm gì?Những gì chúng tôi vừa thể hiện trong hoạt động này là quy trình thống kê được gọi là Bootstrap Respling với sự thay thế. Chúng tôi đã sử dụng lấy mẫu lại để bắt chước biến thể lấy mẫu mà chúng tôi đã nghiên cứu trong Chương 7 về lấy mẫu. Tuy nhiên, trong trường hợp này, chúng tôi đã làm như vậy chỉ sử dụng một mẫu duy nhất từ dân số. Trên thực tế, biểu đồ của các phương tiện mẫu từ 35 mẫu trong Hình 8.11 được gọi là phân phối bootstrap. Đó là một xấp xỉ cho phân phối lấy mẫu của giá trị trung bình mẫu, theo nghĩa là cả hai phân phối sẽ có hình dạng tương tự và sự lây lan tương tự. Trong thực tế trong phần 8.7 sắp tới, chúng tôi sẽ cho bạn thấy rằng đây là trường hợp. Sử dụng phân phối bootstrap này, chúng ta có thể nghiên cứu ảnh hưởng của sự thay đổi lấy mẫu đối với các ước tính của chúng tôi. Cụ thể, chúng tôi sẽ nghiên cứu các lỗi điển hình của các ước tính của chúng tôi, được gọi là lỗi tiêu chuẩn. Trong Phần 8.2, chúng tôi sẽ bắt chước hoạt động lấy mẫu xúc giác của chúng tôi hầu như trên máy tính, cho phép chúng tôi nhanh chóng thực hiện lấy mẫu lại nhiều hơn 35 lần. Trong Phần 8.3, chúng tôi sẽ xác định khái niệm thống kê về khoảng tin cậy, xây dựng khái niệm phân phối bootstrap. Trong Phần 8.4, chúng tôi sẽ xây dựng các khoảng tin cậy bằng cách sử dụng gói 12, cũng như gói mới: gói 50 cho các bản tin gọn gàng và suy luận thống kê minh bạch. Chúng tôi sẽ giới thiệu khung suy luận thống kê của người Viking, đó là động lực cho đường ống gói 50. Gói 50 sẽ là gói lái xe trong suốt phần còn lại của cuốn sách này.Như chúng tôi đã làm trong Chương 7, chúng tôi sẽ gắn kết tất cả những ý tưởng này cùng với một nghiên cứu trường hợp thực tế trong Phần 8.6. Lần này, chúng tôi sẽ xem xét dữ liệu từ một thử nghiệm về việc ngáp từ chương trình truyền hình của Mỹ. Mô phỏng máy tính lấy mẫu lạiBây giờ, hãy bắt chước hoạt động tái định cư xúc giác của chúng tôi hầu như bằng máy tính. Hầu như lại lấy mẫu một lầnĐầu tiên, hãy để thực hiện tương tự ảo của việc lấy mẫu lại một lần. Hãy nhớ lại rằng khung dữ liệu 20 có trong gói 19 chứa các năm của mẫu ban đầu của chúng tôi là 50 đồng xu từ ngân hàng. Hơn nữa, hãy nhớ lại trong Chương 7 về lấy mẫu rằng chúng tôi đã sử dụng chức năng 55 như một cái xẻng ảo để lấy mẫu bóng từ bát ảo 2400 quả bóng như sau: 3Hãy để sửa đổi mã này để thực hiện lấy mẫu lại bằng cách thay thế 50 miếng giấy đại diện cho mẫu ban đầu của chúng tôi 50 đồng xu: 4Quan sát cách chúng tôi đặt một cách rõ ràng đối số 56 thành 57 để nói với 55 rằng chúng tôi muốn lấy mẫu đồng xu bằng cách thay thế. Nếu chúng tôi không đặt 59, chức năng sẽ đảm nhận giá trị mặc định là 60 và do đó thực hiện lại được lấy mẫu mà không thay thế. Ngoài ra, vì chúng tôi đã chỉ định số lượng bản sao thông qua đối số 61, hàm giả định mặc định của một bản sao 62. Cuối cùng, cũng quan sát rằng đối số 63 được đặt để phù hợp với cỡ mẫu ban đầu là 50 xu.Chúng ta hãy nhìn vào chỉ 10 trong số 50 hàng đầu tiên của 64: 5Biến 65 chỉ có giá trị của 1 tương ứng với chúng tôi chỉ có 62, biến 22 cho biết trong số 50 đồng xu từ 20 đã được lấy lại và 23 biểu thị năm khai thác. Bây giờ, hãy tính toán trung bình 23 trong mẫu lại ảo của chúng tôi về kích thước 50 bằng cách sử dụng các chức năng gây tranh cãi dữ liệu có trong gói 12: 6 7Như chúng ta đã thấy khi chúng ta thực hiện bài tập lấy mẫu xúc giác của chúng ta, năm kết quả là năm khác với năm trung bình của 50 đồng xu được lấy mẫu ban đầu của chúng ta là 1995,44. Hầu như lại lấy lại 35 lầnBây giờ, hãy thực hiện tương tự ảo của 35 người bạn của chúng tôi. Sử dụng các kết quả này, chúng tôi sẽ có thể nghiên cứu tính thay đổi trong các phương tiện mẫu từ 35 mẫu có kích thước 50. Trước tiên, hãy thêm một đối số 72 vào 55 để cho biết chúng tôi muốn có 35 lần lặp lại. Do đó, chúng tôi muốn lặp lại việc lấy mẫu lại với việc thay thế 50 xu 35 lần. 8 9Khung dữ liệu 74 kết quả có 35 \ (\ cdot \) 50 = 1750 hàng tương ứng với 35 mẫu người của 50 xu. Bây giờ, hãy để tính toán 35 mẫu kết quả có nghĩa là sử dụng cùng một mã 12 như chúng tôi đã làm trong phần trước, nhưng lần này là thêm một 76:\(\cdot\) 50 = 1750 rows corresponding to 35 resamples of 50 pennies. Let’s now compute the resulting 35 sample means using the same 12 code as we did in the previous section, but this time
adding a 76: 0 1Quan sát rằng 77 có 35 hàng, tương ứng với 35 phương tiện được ghép lại. Hơn nữa, quan sát rằng các giá trị của 46 khác nhau. Hãy để trực quan hóa biến thể này bằng cách sử dụng biểu đồ trong Hình 8.12. 2
Hình 8.12: Phân phối 35 phương tiện mẫu từ 35 mẫu. Hãy để so sánh phân phối bootstrap gần như được xây dựng của chúng tôi với cái 35 người bạn của chúng tôi được xây dựng thông qua bài tập lấy mẫu xúc giác của chúng tôi trong Hình 8.13. Quan sát làm thế nào chúng có phần giống nhau, nhưng không giống nhau.
Hình 8.13: So sánh phân phối các phương tiện từ các mẫu. Hãy nhớ lại rằng trong bộ phận lại của người Viking với kịch bản thay thế, chúng tôi đang minh họa ở đây, cả hai biểu đồ này đều có một tên đặc biệt: phân phối bootstrap của trung bình mẫu. Hơn nữa, nhớ lại chúng là một xấp xỉ trong phân phối lấy mẫu của giá trị trung bình mẫu, một khái niệm bạn đã thấy trong Chương 7 về lấy mẫu. Các phân phối này cho phép chúng tôi nghiên cứu ảnh hưởng của sự thay đổi lấy mẫu đối với các ước tính của chúng tôi về trung bình dân số thực sự, trong trường hợp này là năm trung bình thực sự đối với tất cả các đồng xu của Hoa Kỳ. Tuy nhiên, không giống như trong Chương 7, nơi chúng tôi đã lấy nhiều mẫu (điều mà người ta sẽ không bao giờ làm trong thực tế), các bản phân phối bootstrap được xây dựng bằng cách lấy nhiều mẫu từ một mẫu: trong trường hợp này, 50 đồng xu ban đầu từ ngân hàng. Hầu như lại lấy lại 1000 lầnHãy nhớ rằng một trong những mục tiêu của việc lấy mẫu lại với sự thay thế là xây dựng phân phối bootstrap, đây là một xấp xỉ của phân phối lấy mẫu. Tuy nhiên, phân phối bootstrap trong Hình 8.12 chỉ dựa trên 35 mẫu và do đó trông hơi thô. Hãy để tăng số lượng các mẫu phân chia lên 1000, để chúng ta có thể hy vọng thấy rõ hơn về hình dạng và sự thay đổi giữa các mẫu khác nhau. 3Tuy nhiên, vì lợi ích của sự ngắn gọn, trong tương lai, hãy để kết hợp hai hoạt động này thành một chuỗi các nhà khai thác đường ống ( 79): 4 5Trong Hình 8.14, hãy để trực quan hóa phân phối bootstrap của 1000 phương tiện này dựa trên 1000 mẫu người ảo: 6
Hình 8.14: Phân phối tái tạo Bootstrap dựa trên 1000 mẫu. Lưu ý ở đây rằng hình dạng chuông đang bắt đầu trở nên rõ ràng hơn nhiều. Bây giờ chúng ta có một ý nghĩa chung cho phạm vi các giá trị mà mẫu trung bình có thể đảm nhận. Nhưng biểu đồ này ở đâu? Hãy để tính toán giá trị trung bình của 1000 mẫu lại có nghĩa là: 7 8Giá trị trung bình của 1000 phương tiện này là 1995.36, khá gần với giá trị trung bình của mẫu ban đầu của chúng tôi là 50 đồng xu năm 1995,44. Đây là trường hợp vì mỗi trong số 1000 mẫu người dựa trên mẫu ban đầu là 50 đồng xu. Xin chúc mừng! Bạn chỉ cần xây dựng phân phối bootstrap đầu tiên của bạn! Trong phần tiếp theo, bạn sẽ thấy cách sử dụng phân phối bootstrap này để xây dựng các khoảng tin cậy. Kiểm tra học tập (LC8.1) Sự khác biệt chính giữa phân phối bootstrap và phân phối lấy mẫu là gì? What is the chief difference between a bootstrap distribution and a sampling distribution? . Looking at the bootstrap distribution for the sample mean in Figure 8.14, between what two values would you say most values lie? Hiểu khoảng tin cậyHãy để bắt đầu phần này với một sự tương tự liên quan đến câu cá. Giả sử bạn đang cố gắng bắt một con cá. Một mặt, bạn có thể sử dụng một ngọn giáo, trong khi mặt khác bạn có thể sử dụng mạng. Sử dụng mạng có thể sẽ cho phép bạn bắt thêm cá! Bây giờ hãy nghĩ lại với bài tập Pennies của chúng tôi, nơi bạn đang cố gắng ước tính dân số thực sự có nghĩa là năm \ (\ mu \) của tất cả các đồng xu của chúng tôi. Hãy nghĩ về giá trị của \ (\ mu \) như một con cá.\(\mu\) of all US pennies. Think of the value of \(\mu\) as a fish. Một mặt, chúng ta có thể sử dụng thống kê ước tính/mẫu điểm thích hợp để ước tính \ (\ mu \), mà chúng ta đã thấy trong Bảng 8.1 là trung bình mẫu \ (\ Overline {x} \). Dựa trên mẫu 50 đồng xu của chúng tôi từ ngân hàng, giá trị trung bình của mẫu là 1995,44. Hãy nghĩ về việc sử dụng giá trị này như là câu cá với một ngọn giáo.\(\mu\), which we saw in Table 8.1 is the sample mean \(\overline{x}\). Based on our sample of 50 pennies from the bank, the sample mean was 1995.44. Think of using this value as “fishing with a spear.” Câu cá nào với một mạng lưới tương ứng với một mạng lưới tương ứng với? Nhìn vào phân phối bootstrap trong Hình 8.14 một lần nữa. Giữa hai năm bạn sẽ nói rằng hầu hết các mẫu của người Viking có nghĩa là nói dối? Mặc dù câu hỏi này có phần chủ quan, nói rằng hầu hết các mẫu có nghĩa là nằm giữa năm 1992 và 2000 sẽ không phải là không hợp lý. Hãy nghĩ về khoảng thời gian này như mạng lưới. Những gì chúng tôi chỉ minh họa là khái niệm về một khoảng tin cậy, mà chúng tôi sẽ viết tắt với các CI CI trong suốt cuốn sách này. Trái ngược với thống kê ước tính/mẫu điểm ước tính giá trị của tham số dân số chưa biết với một giá trị duy nhất, khoảng tin cậy đưa ra những gì có thể được hiểu là một phạm vi của các giá trị hợp lý. Quay trở lại với sự tương tự của chúng tôi, các ước tính điểm/thống kê mẫu có thể được coi là giáo, trong khi khoảng tin cậy có thể được coi là lưới.
Hình 8.15: Sự tương tự của sự khác biệt giữa ước tính điểm và khoảng tin cậy. Khoảng cách đề xuất của chúng tôi từ năm 1992 đến 2000 được xây dựng bằng mắt và do đó có phần chủ quan. Bây giờ chúng tôi giới thiệu hai phương pháp để xây dựng các khoảng thời gian như vậy theo cách chính xác hơn: phương pháp phần trăm và phương pháp lỗi tiêu chuẩn. Cả hai phương pháp để xây dựng khoảng tin cậy chia sẻ một số điểm tương đồng. Đầu tiên, cả hai đều được xây dựng từ phân phối bootstrap, khi bạn xây dựng trong tiểu mục 8.2.3 và được hiển thị trong Hình 8.14. Thứ hai, cả hai đều yêu cầu bạn chỉ định mức độ tin cậy. Mức độ tin cậy thường được sử dụng bao gồm 90%, 95%và 99%. Tất cả những thứ khác đều bằng nhau, mức độ tin cậy cao hơn tương ứng với khoảng tin cậy rộng hơn và mức độ tin cậy thấp hơn tương ứng với khoảng tin cậy hẹp hơn. Trong cuốn sách này, chúng tôi sẽ chủ yếu sử dụng 95% và do đó xây dựng khoảng tin cậy 95% cho \ (\ mu \) cho hoạt động của chúng tôi.\(\mu\)” for our pennies activity. Phương pháp phần trămMột phương pháp để xây dựng khoảng tin cậy là sử dụng 95% giá trị của phân phối bootstrap. Chúng ta có thể làm điều này bằng cách tính toán phần trăm 2,5 và 97,5, lần lượt là 1991.059 và 1999.283. Đây được gọi là phương pháp phần trăm để xây dựng khoảng tin cậy. Hiện tại, hãy để tập trung vào các khái niệm đằng sau một phương pháp phần trăm được xây dựng khoảng tin cậy; Chúng tôi sẽ hiển thị cho bạn mã tính toán các giá trị này trong phần tiếp theo. Hãy để đánh dấu các phần trăm này trên phân phối bootstrap với các đường thẳng đứng trong Hình 8.16. Khoảng 95% các giá trị biến 46 trong 77 rơi vào khoảng thời gian năm 1991.059 và 1999.283, với 2,5% ở bên trái của dòng ngoài cùng bên trái và 2,5% ở bên phải của dòng ngoài cùng bên phải.
Hình 8.16: Phương pháp phần trăm 95% Khoảng tin cậy. Các điểm cuối khoảng được đánh dấu bằng các đường thẳng đứng. Phương pháp lỗi tiêu chuẩnNhớ lại trong Phụ lục A.2, chúng tôi đã thấy rằng nếu một biến số theo phân phối bình thường, hoặc, nói cách khác, biểu đồ của biến này có hình chuông, sau đó khoảng 95% giá trị nằm giữa \ (\ pm \) 1.96 Độ lệch chuẩn của giá trị trung bình. Cho rằng phân phối bootstrap của chúng tôi dựa trên 1000 mẫu người thay thế trong Hình 8.14 thường được định hình, hãy để sử dụng thực tế này về các phân phối bình thường để xây dựng khoảng tin cậy theo một cách khác.\(\pm\) 1.96 standard deviations of the mean. Given that our bootstrap distribution based on 1000 resamples with replacement in Figure 8.14 is normally shaped, let’s use this fact about normal distributions to construct a confidence interval in a different way. Đầu tiên, nhớ lại phân phối bootstrap có giá trị trung bình bằng 1995.36. Giá trị này gần như trùng khớp chính xác với giá trị của giá trị trung bình mẫu \ (\ Overline {x} \) của 50 đồng xu ban đầu của chúng tôi là 1995.44. Thứ hai, hãy để tính toán độ lệch chuẩn của phân phối Bootstrap bằng cách sử dụng các giá trị của 46 trong khung dữ liệu 77:\(\overline{x}\) of our
original 50 pennies of 1995.44. Second, let’s compute the standard deviation of the bootstrap distribution using the values of 46 in the 77 data frame: 9 0Giá trị này là gì? Hãy nhớ lại rằng phân phối bootstrap là một xấp xỉ cho phân phối lấy mẫu. Cũng nhớ rằng độ lệch chuẩn của phân phối lấy mẫu có tên đặc biệt: lỗi tiêu chuẩn. Đặt hai sự thật này lại với nhau, chúng ta có thể nói rằng 2.155 là một xấp xỉ của lỗi tiêu chuẩn của \ (\ Overline {x} \).\(\overline{x}\). Do đó, bằng cách sử dụng quy tắc ngón tay cái 95% của chúng tôi về các phân phối bình thường từ Phụ lục A.2, chúng tôi có thể sử dụng công thức sau để xác định các điểm cuối dưới và trên của khoảng tin cậy 95% cho \ (\ mu \):\(\mu\): A 1.96 \ CDOT 2.15, 1995.44 + 1.96 \ CDOT 2.15) \\ & = (1991.15, 1999.73) \ end {căn chỉnh} \] Bây giờ, hãy để thêm khoảng tin cậy của phương thức SE với các đường đứt nét trong Hình 8.17.
Hình 8.17: So sánh hai phương pháp khoảng tin cậy 95%. Chúng tôi thấy rằng cả hai phương pháp đều tạo ra khoảng tin cậy gần như giống hệt nhau đối với \ (\ mu \) với phương pháp phần trăm năng suất \ ((1991.06, 1999.28) \) trong khi phương pháp lỗi tiêu chuẩn tạo ra \ ((1991.22, 1999.66) \). Tuy nhiên, hãy nhớ lại rằng chúng ta chỉ có thể sử dụng quy tắc lỗi tiêu chuẩn khi phân phối bootstrap thường được định hình.\(\mu\) with the percentile method yielding \((1991.06, 1999.28)\) while the standard error method produces \((1991.22, 1999.66)\). However, recall that we can only use the standard error rule when the bootstrap distribution is roughly normally shaped. Bây giờ, chúng tôi đã giới thiệu khái niệm về khoảng tin cậy và đặt ra trực giác đằng sau hai phương pháp để xây dựng chúng, hãy để khám phá mã cho phép chúng tôi xây dựng chúng. Kiểm tra học tập . What condition about the bootstrap distribution must be met for us to be able to construct confidence intervals using the standard error method? (Lc8.4) nói rằng chúng tôi muốn xây dựng khoảng tin cậy 68% thay vì khoảng tin cậy 95% cho \ (\ mu \). Mô tả những thay đổi là cần thiết để thực hiện điều này. Gợi ý: Chúng tôi khuyên bạn nên xem xét Phụ lục A.2 về phân phối bình thường. Say we wanted to construct a 68% confidence interval instead of a 95% confidence interval for \(\mu\). Describe what changes are needed to make this happen. Hint: we suggest you look at Appendix A.2 on the normal distribution. Xây dựng khoảng tin cậyHãy nhớ lại rằng quá trình lấy mẫu lại với sự thay thế, chúng tôi đã thực hiện bằng tay trong Phần 8.1 và hầu như trong Phần 8.2 được gọi là bootstrapping. Thuật ngữ bootstrapping bắt nguồn từ sự thể hiện của việc kéo mình lên bởi bootstraps của họ, có nghĩa là thành công chỉ thành công bởi một nỗ lực hoặc khả năng của riêng mình. Từ góc độ thống kê, việc bắt đầu các ám chỉ đến thành công trong việc có thể nghiên cứu các tác động của sự thay đổi lấy mẫu đối với các ước tính từ nỗ lực của một mẫu của một mẫu. Hoặc chính xác hơn, nó đề cập đến việc xây dựng một xấp xỉ cho phân phối lấy mẫu chỉ bằng một mẫu. Để thực hiện việc lấy mẫu này với sự thay thế hầu như trong Phần 8.2, chúng tôi đã sử dụng hàm 55, đảm bảo rằng kích thước của các mẫu lại phù hợp với kích thước mẫu ban đầu là 50. Trong phần này, chúng tôi sẽ xây dựng các ý tưởng này để xây dựng các khoảng tin cậy bằng cách sử dụng một Gói mới: Gói 50 cho các bản tin gọn gàng và suy luận thống kê minh bạch.Quy trình công việc ban đầuHãy nhớ lại rằng trong Phần 8.2, chúng tôi hầu như đã thực hiện lấy mẫu Bootstrap với sự thay thế để xây dựng các bản phân phối Bootstrap. Các phân phối như vậy là xấp xỉ với các phân phối lấy mẫu mà chúng tôi đã thấy trong Chương 7, nhưng được xây dựng chỉ bằng một mẫu duy nhất. Hãy cùng xem lại quy trình làm việc ban đầu bằng cách sử dụng toán tử ống 79.Đầu tiên, chúng tôi đã sử dụng hàm 55 để lấy mẫu lại 88 Pennies với sự thay thế từ mẫu ban đầu là 50 đồng xu trong 20 bằng cách đặt 59. Hơn nữa, chúng tôi đã lặp lại việc lấy mẫu này 1000 lần bằng cách đặt 91: 1Thứ hai, vì đối với mỗi trong số 1000 mẫu của chúng tôi có kích thước 50, chúng tôi muốn tính toán một giá trị trung bình mẫu riêng biệt, chúng tôi đã sử dụng động từ 12 93 để quan sát nhóm/hàng với nhau bằng biến 65 2Tiếp theo là sử dụng 95 để tính toán mẫu 96 năm cho mỗi nhóm 65: 3Đối với trường hợp đơn giản này, chúng ta có thể sử dụng chức năng 55 và một vài động từ 12 để xây dựng phân phối bootstrap. Tuy nhiên, chỉ sử dụng động từ 12 chỉ cung cấp cho chúng tôi một bộ công cụ hạn chế. Đối với các tình huống phức tạp hơn, chúng tôi sẽ cần thêm một chút hỏa lực. Hãy để lặp lại điều này bằng cách sử dụng gói 50.
# A tibble: 50 × 2
ID year
Gói 50 là gói R cho suy luận thống kê. Nó sử dụng hiệu quả toán tử ống 79 mà chúng tôi đã giới thiệu trong Phần 3.1 để đánh vần chuỗi các bước cần thiết để thực hiện suy luận thống kê theo cách gọn gàng và thời trang trong suốt. Hơn nữa, giống như gói 12 cung cấp các chức năng với các tên giống như động từ để thực hiện tranh cãi dữ liệu, gói 50 cung cấp các chức năng với các tên giống như động từ trực quan để thực hiện suy luận thống kê.Hãy để Lùi trở lại với đồng xu của chúng tôi. Trước đây, chúng tôi đã tính toán giá trị của giá trị trung bình mẫu \ (\ Overline {x} \) bằng hàm 12 95:\(\overline{x}\) using the 12 function 95: 4Chúng tôi sẽ thấy rằng chúng tôi cũng có thể làm điều này bằng cách sử dụng các chức năng 50 10 và 11:
5Bạn có thể tự hỏi mình: Mã là mã 50 lâu hơn? Tại sao tôi lại sử dụng mã đó? Mặc dù không rõ ràng ngay lập tức, bạn sẽ thấy rằng có ba lợi ích chính cho quy trình làm việc 50 trái ngược với quy trình làm việc 12.Đầu tiên, động từ 50 tên tốt hơn với khung lấy mẫu tổng thể mà bạn cần hiểu để xây dựng khoảng tin cậy và tiến hành các bài kiểm tra giả thuyết (trong Chương 9). Chúng tôi sẽ thấy các sơ đồ sơ đồ của khung này trong Hình 8.23 và trong Chương 9 với Hình 9.14.Thứ hai, bạn có thể nhảy qua lại liền mạch giữa khoảng tin cậy và kiểm tra giả thuyết với những thay đổi tối thiểu đối với mã của bạn. Điều này sẽ trở nên rõ ràng trong tiểu mục 9.3.2 khi chúng tôi sẽ so sánh mã 50 cho cả hai phương pháp suy luận này.Thứ ba, quy trình làm việc 50 đơn giản hơn nhiều để tiến hành suy luận khi bạn có nhiều hơn một biến. Chúng tôi sẽ thấy hai tình huống như vậy. Trước tiên chúng ta sẽ thấy các tình huống của suy luận hai mẫu trong đó dữ liệu mẫu được thu thập từ hai nhóm, chẳng hạn như trong Phần 8.6 trong đó chúng ta nghiên cứu tính truyền nhiễm của ngáp và trong phần 9.1 trong đó chúng ta so sánh tỷ lệ khuyến mãi của hai nhóm tại các ngân hàng trong những năm 1970S . Sau đó, trong Phần 10.4, chúng tôi sẽ thấy các tình huống suy luận về hồi quy bằng cách sử dụng các mô hình hồi quy mà bạn phù hợp trong Chương 5.Bây giờ, hãy minh họa cho chuỗi các động từ cần thiết để xây dựng một khoảng tin cậy cho \ (\ mu \), dân số có nghĩa là năm của tất cả các đồng xu của Hoa Kỳ trong năm 2019.\(\mu\), the population mean year of minting of all US pennies in 2019. 1. ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white") |
Mức độ tự tin | Chiều rộng trung bình |
---|---|
80% | 0.162 |
95% | 0.262 |
99% | 0.338 |
Vì vậy, để có mức độ tin cậy cao hơn, khoảng tin cậy của chúng tôi phải rộng hơn. Lý tưởng nhất, chúng tôi sẽ có cả mức độ tự tin cao và khoảng tin cậy hẹp. Tuy nhiên, chúng ta không thể có cả hai cách. Nếu chúng ta muốn tự tin hơn, chúng ta cần cho phép các khoảng thời gian rộng hơn. Ngược lại, nếu chúng ta muốn một khoảng thời gian hẹp, chúng ta phải chịu đựng mức độ tin cậy thấp hơn.
Đạo đức của câu chuyện là: mức độ tin cậy cao hơn có xu hướng tạo ra khoảng tin cậy rộng hơn. Khi nhìn vào Hình 8.29, điều quan trọng là phải nhớ rằng chúng tôi đã giữ kích thước mẫu cố định tại \ (n \) = 50. Do đó, tất cả \ (10 \ cdot 3 = 30 \) mẫu ngẫu nhiên từ
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
51 kích thước. Điều gì xảy ra nếu thay vào đó chúng ta lấy các mẫu có kích thước khác nhau? Hãy nhớ lại rằng chúng tôi đã làm điều này trong Tiểu mục 7.2 bằng cách sử dụng xẻng ảo với 25, 50 và 100 khe cắm.Higher confidence levels tend to produce wider
confidence intervals. When looking at Figure 8.29 it is important to keep in mind that we kept the sample size fixed at \(n\) = 50. Thus, all \(10 \cdot 3 = 30\) random samples from the x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
51 had the same sample size. What happens if instead we took samples of different sizes? Recall that we did this in Subsection
7.2 using virtual shovels with 25, 50, and 100 slots. Tác động của cỡ mẫu
Lần này, hãy sửa mức độ tin cậy ở mức 95%, nhưng hãy xem xét ba cỡ mẫu khác nhau cho \ (n \): 25, 50 và 100. Cụ thể, trước tiên chúng ta sẽ lấy 10 mẫu ngẫu nhiên khác nhau có kích thước 25, 10 ngẫu nhiên khác nhau Các mẫu có kích thước 50 và 10 mẫu ngẫu nhiên khác nhau có kích thước 100. Sau đó, chúng tôi sẽ xây dựng khoảng tin cậy dựa trên tỷ lệ phần trăm 95% cho mỗi mẫu. Cuối cùng, chúng tôi sẽ so sánh chiều rộng của các khoảng này. Chúng tôi hình dung kết quả 30 khoảng tin cậy trong Hình 8.30. Cũng lưu ý đường thẳng đứng đánh dấu giá trị thực của \ (p \) = 0,375.\(n\): 25, 50, and 100. Specifically, we’ll first take 10 different random samples of size 25, 10 different random samples of size 50, and 10 different random samples of size 100. We’ll then construct 95% percentile-based confidence intervals for each sample. Finally, we’ll compare the widths of these intervals. We visualize the resulting 30 confidence intervals in Figure 8.30. Note also the vertical line marking the true value of \(p\) = 0.375.
Hình 8,30: Mười khoảng tin cậy 95% cho \ (p \) với \ (n = 25, 50, \) và \ (100 \).\(p\) with \(n = 25, 50,\) and \(100\).
Quan sát rằng khi các khoảng tin cậy được xây dựng từ các cỡ mẫu lớn hơn và lớn hơn, chúng có xu hướng hẹp hơn. Hãy để so sánh các chiều rộng trung bình trong Bảng 8.3.
Bảng 8.3: Độ rộng trung bình của khoảng tin cậy 95% dựa trên \ (n = 25 \), \ (50 \) và \ (100 \)Average width of 95% confidence intervals based on \(n = 25\), \(50\), and \(100\)Cỡ mẫu | Chiều rộng trung bình |
---|---|
n = 25 | 0.380 |
n = 50 | 0.268 |
n = 100 | 0.189 |
Đạo đức của câu chuyện là: cỡ mẫu lớn hơn có xu hướng tạo ra khoảng tin cậy hẹp hơn. Hãy nhớ lại rằng đây là một thông điệp chính trong tiểu mục 7.3.3. Khi chúng tôi sử dụng các xẻng lớn hơn và lớn hơn cho các mẫu của chúng tôi, tỷ lệ mẫu màu đỏ \ (\ widhat {p} \) có xu hướng thay đổi ít hơn. Nói cách khác, ước tính của chúng tôi ngày càng chính xác hơn.Larger sample sizes tend to produce narrower confidence intervals. Recall that this was a key message in Subsection 7.3.3. As we used larger and larger shovels for our samples, the sample proportions red \(\widehat{p}\) tended to vary less. In other words, our estimates got more and more precise.
Hãy nhớ lại rằng chúng tôi đã hình dung những kết quả này trong Hình 7.15, trong đó chúng tôi so sánh các phân phối lấy mẫu cho \ (\ widhat {p} \) dựa trên các mẫu có kích thước \ (n \) bằng 25, 50 và 100. Chúng tôi cũng định lượng biến thể lấy mẫu Trong số các phân phối lấy mẫu này bằng cách sử dụng độ lệch chuẩn của chúng, có tên đặc biệt đó: lỗi tiêu chuẩn. Vì vậy, khi kích thước mẫu tăng, lỗi tiêu chuẩn giảm.\(\widehat{p}\) based on samples of size \(n\) equal 25, 50, and 100. We also quantified the sampling variation of these sampling distributions using their standard deviation, which has that special name: the standard error. So as the sample size increases, the standard error decreases.
Trên thực tế, lỗi tiêu chuẩn là một yếu tố liên quan khác trong việc xác định độ rộng khoảng tin cậy. Chúng tôi sẽ khám phá thực tế này trong tiểu mục 8.7.2 khi chúng tôi thảo luận về các phương pháp dựa trên lý thuyết để xây dựng khoảng tin cậy bằng cách sử dụng các công thức toán học. Các phương pháp như vậy là một giải pháp thay thế cho các phương pháp dựa trên máy tính mà chúng tôi đã sử dụng cho đến nay.
Nghiên cứu trường hợp: Ngáp có truyền nhiễm không?
Hãy để áp dụng kiến thức về khoảng tin cậy của chúng tôi để trả lời câu hỏi: Có phải ngáp không? Nếu bạn thấy người khác ngáp, bạn có nhiều khả năng ngáp không? Trong một tập của Hoa Kỳ cho thấy những người huyền thoại, đội chủ nhà đã tiến hành một thí nghiệm để trả lời câu hỏi này. Tập phim có sẵn để xem tại Hoa Kỳ trên trang web Discovery Network tại đây và thêm thông tin về tập phim cũng có sẵn trên IMDB.
Huyền thoại nghiên cứu dữ liệu
Năm mươi người tham gia trưởng thành nghĩ rằng họ đang được xem xét xuất hiện trong chương trình đã được phỏng vấn bởi một nhà tuyển dụng chương trình. Trong cuộc phỏng vấn, nhà tuyển dụng hoặc ngáp hoặc không. Những người tham gia sau đó ngồi một mình trong một chiếc xe tải lớn và được yêu cầu chờ đợi. Khi ở trong xe, nhóm huyền thoại đã xem những người tham gia sử dụng một camera ẩn để xem họ có ngáp không. Khung dữ liệu chứa kết quả thử nghiệm của họ có sẵn trong khung dữ liệu
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
52 có trong gói # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
19:pennies_resample %>%
summarize(mean_year = mean(year))
5Các biến là:
54: ID người tham gia có giá trị từ 1 đến 50.x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
55: Một biến điều trị nhị phân cho biết liệu người tham gia có tiếp xúc với ngáp hay không.x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
56 cho thấy người tham gia đã tiếp xúc với việc ngáp trong khix_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
57 cho thấy người tham gia thì không.x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
58: Một biến phản hồi nhị phân cho biết liệu người tham gia cuối cùng có ngáp không.x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
Hãy nhớ lại rằng bạn đã học về các biến điều trị và đáp ứng trong tiểu mục 5.3.1 trong cuộc thảo luận của chúng tôi về các biến gây nhiễu.
Hãy để sử dụng một số dữ liệu gây tranh cãi để có được số lượng của bốn kết quả có thể xảy ra:
pennies_resample %>%
summarize(mean_year = mean(year))
6pennies_resample %>%
summarize(mean_year = mean(year))
7Trước tiên, hãy tập trung vào những người tham gia nhóm
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
57, những người không tiếp xúc với ngáp. 12 người tham gia như vậy không ngáp, trong khi 4 người tham gia như vậy đã làm. Vì vậy, trong số 16 người không tiếp xúc với ngáp, 4/16 = 0,25 = 25% đã ngáp.Bây giờ, hãy tập trung vào những người tham gia nhóm
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
56, những người tiếp xúc với việc ngáp trong đó 24 người tham gia như vậy không ngáp, trong khi 10 người tham gia như vậy đã ngáp. Vì vậy, trong số 34 người tiếp xúc với ngáp, 10/34 = 0,294 = 29,4% đã ngáp. So sánh hai tỷ lệ phần trăm này, những người tham gia tiếp xúc với ngáp ngáp 29,4% - 25% = 4,4% thường xuyên hơn so với những người không.Kịch bản lấy mẫu
Hãy để xem xét các thuật ngữ và ký hiệu liên quan đến lấy mẫu mà chúng tôi đã nghiên cứu trong tiểu mục 7.3.1. Trong chương 7, dân số nghiên cứu của chúng tôi là bát \ (n \) = 2400 quả bóng. Thông số dân số của chúng tôi quan tâm là tỷ lệ dân số của những quả bóng màu đỏ, được biểu thị bằng toán học bằng \ (p \). Để ước tính \ (p \), chúng tôi đã trích xuất một mẫu gồm 50 quả bóng bằng xẻng và tính toán ước tính điểm có liên quan: tỷ lệ mẫu có màu đỏ, được biểu thị bằng toán học bằng \ (\ widhat {p} \).\(N\) = 2400 balls. Our population parameter of interest was the population proportion of these balls that were red, denoted mathematically by \(p\). In order to estimate \(p\), we extracted a sample of 50 balls using the shovel and computed the relevant point estimate: the sample proportion that were red, denoted mathematically by \(\widehat{p}\).
Dân số nghiên cứu ở đây là ai? Tất cả con người? Tất cả những người xem chương trình thần thoại? Khó mà nói ra được! Câu hỏi này chỉ có thể được trả lời nếu chúng tôi biết làm thế nào chương trình người dẫn chương trình đã tuyển dụng những người tham gia! Nói cách khác, phương pháp lấy mẫu được sử dụng bởi những người huyền thoại để tuyển dụng người tham gia là gì? Chúng tôi than ôi không được cung cấp thông tin này. Tuy nhiên, chỉ với mục đích của nghiên cứu trường hợp này, chúng tôi sẽ cho rằng 50 người tham gia là một mẫu đại diện của tất cả người Mỹ với sự phổ biến của chương trình này. Do đó, chúng tôi sẽ giả định rằng bất kỳ kết quả nào của thí nghiệm này sẽ khái quát cho tất cả \ (n \) = 327 triệu người Mỹ (dân số 2018).\(N\) = 327 million Americans (2018 population).
Giống như với bát lấy mẫu của chúng tôi, tham số dân số ở đây sẽ liên quan đến tỷ lệ. Tuy nhiên, trong trường hợp này, đó sẽ là sự khác biệt về tỷ lệ dân số \ (p_ {seed} - p_ {control} \), trong đó \ (p_ {Seed} \) là tỷ lệ của tất cả người Mỹ nếu tiếp xúc với việc ngáp sẽ ngáp tự ngáp tự ngáp sẽ ngáp ngáp tự ngáp ngáp và \ (p_ {control} \) là tỷ lệ của tất cả người Mỹ nếu không tiếp xúc với việc ngáp vẫn ngáp. Tương ứng, thống kê ước tính/mẫu điểm dựa trên mẫu huyền thoại của người tham gia sẽ là sự khác biệt về tỷ lệ mẫu \ (\ Widhat {P} _ {Seed} - \ Widhat {P} _ {Control} \). Hãy để mở rộng Bảng 7.5 của các kịch bản lấy mẫu để suy luận bao gồm kịch bản mới nhất của chúng tôi.\(p_{seed} - p_{control}\), where \(p_{seed}\) is the proportion of all Americans who if exposed to yawning will yawn themselves, and \(p_{control}\) is the proportion of all Americans who if not exposed to yawning still yawn themselves. Correspondingly, the point estimate/sample statistic based the Mythbusters’ sample of participants will be the difference in sample proportions \(\widehat{p}_{seed} - \widehat{p}_{control}\). Let’s extend Table 7.5 of scenarios of sampling for inference to include our latest scenario.
Bảng 8.4: Các kịch bản lấy mẫu cho suy luậnScenarios of sampling for inferenceKịch bản | Số liệu dân số | Ký hiệu | Ước tính điểm | (Các) biểu tượng |
---|---|---|---|---|
1 | Tỷ lệ dân số | \(P\) | Tỷ lệ mẫu | \ (\ widhat {p} \) |
2 | Dân số có nghĩa là | \ (\ mu \) | Mẫu trung bình | \ (\ Overline {x} \) hoặc \ (\ widehat {\ mu} \) or \(\widehat{\mu}\) |
3 | Sự khác biệt về tỷ lệ dân số | \ (P_1 - P_2 \) | Sự khác biệt về tỷ lệ mẫu | \ (A |
Đây được gọi là tình huống suy luận hai mẫu vì chúng tôi có hai mẫu riêng biệt. Dựa trên hai mẫu có kích thước của họ \ (N_ {Seed} \) = 34 và \ (N_ {Control} \) = 16, ước tính điểm\(n_{seed}\) = 34 and \(n_{control}\) = 16, the point estimate is
\]
Tuy nhiên, giả sử các huyền thoại lặp lại thí nghiệm này. Nói cách khác, nói rằng họ đã tuyển dụng 50 người tham gia mới và tiếp xúc với 34 người trong số họ để ngáp và 16 không. Họ sẽ có được sự khác biệt chính xác tương tự là 4,4%? Có lẽ là không, một lần nữa, vì sự thay đổi lấy mẫu.
Làm thế nào để biến thể lấy mẫu này ảnh hưởng đến ước tính của họ là 4,4%? Nói cách khác, điều gì sẽ là một phạm vi giá trị hợp lý cho sự khác biệt này chiếm sự thay đổi lấy mẫu này? Chúng ta có thể trả lời câu hỏi này với khoảng tin cậy! Hơn nữa, vì những người huyền thoại chỉ có một mẫu hai người tham gia duy nhất, họ sẽ phải xây dựng khoảng tin cậy 95% cho \ (p_ {Seed} - p_ {control} \) bằng cách sử dụng thay thế bootstrap bằng cách thay thế.\(p_{seed} - p_{control}\) using bootstrap resampling with replacement.
Chúng tôi thực hiện một vài ghi chú quan trọng. Đầu tiên, để so sánh giữa các nhóm
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
56 và x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
57 để có ý nghĩa, tuy nhiên, cả hai nhóm cần phải độc lập với nhau. Nếu không, họ có thể ảnh hưởng đến kết quả của nhau. Điều này có nghĩa là một người tham gia được chọn cho nhóm x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
56 hoặc x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
57 không có ảnh hưởng đến người tham gia khác được chỉ định cho một trong hai nhóm. Ví dụ, nếu có một người mẹ và con của cô ấy là những người tham gia nghiên cứu, họ sẽ không nhất thiết phải ở trong cùng một nhóm. Mỗi người sẽ được chỉ định ngẫu nhiên cho một trong hai nhóm của biến giải thích.Thứ hai, thứ tự của phép trừ trong sự khác biệt không có vấn đề gì miễn là bạn nhất quán và điều chỉnh các diễn giải của bạn cho phù hợp. Nói cách khác, sử dụng ước tính điểm của \ (\ Widhat {p} _ {Seed} - \ Widhat {P} _ {Control} \) hoặc \ (\ Widhat {P} _ {Control} - \ Widhat {P} _ {Seed} \) không tạo ra sự khác biệt về vật chất, bạn chỉ cần duy trì sự nhất quán và giải thích kết quả của mình cho phù hợp.\(\widehat{p}_{seed} - \widehat{p}_{control}\) or \(\widehat{p}_{control} - \widehat{p}_{seed}\) does not make a material difference, you just need to stay consistent and interpret your results accordingly.
Xây dựng khoảng tin cậy
Như chúng tôi đã làm trong tiểu mục 8.4.2, trước tiên chúng ta hãy xây dựng phân phối bootstrap cho \ ( \ (P_ {Seed} - P_ {Control} \). Chúng tôi sẽ làm điều này bằng cách sử dụng quy trình làm việc
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 một lần nữa. Tuy nhiên, vì sự khác biệt về tỷ lệ là một kịch bản mới để suy luận, chúng tôi sẽ cần sử dụng một số đối số mới trong các hàm # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 trên đường đi.\(\widehat{p}_{seed} - \widehat{p}_{control}\) and then use this to construct 95% confidence intervals for \(p_{seed} - p_{control}\). We’ll do this using the # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 workflow again. However, since the difference in proportions is a new scenario for inference, we’ll need to use some new arguments in the # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50
functions along the way.1. ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
18 Biến
ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
Hãy cùng lấy khung dữ liệu
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
52 của chúng tôi và ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
10 mà các biến được quan tâm bằng cách sử dụng giao diện công thức x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
70 trong đó:- Biến phản hồi của chúng tôi là
58: Có hay không người tham gia ngáp hay không. Nó có mứcx_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
72 vàx_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
73.x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
- Biến giải thích là
55: Có phải người tham gia có tiếp xúc với ngáp hay không. Nó có mứcx_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
56 (tiếp xúc với ngáp) vàx_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
57 (không tiếp xúc với ngáp).x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
pennies_resample %>%
summarize(mean_year = mean(year))
8pennies_resample %>%
summarize(mean_year = mean(year))
9Than ôi, chúng tôi có một thông báo lỗi tương tự như từ Tiểu mục 8.5.1:
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 đang cho chúng tôi biết rằng một trong các cấp của biến phân loại x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
58 cần được định nghĩa là x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
27. Hãy nhớ lại rằng chúng tôi xác định x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
27 là sự kiện quan tâm mà chúng tôi đang cố gắng đếm và tính toán tỷ lệ. Chúng tôi có quan tâm đến những người tham gia x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
72 ngáp hoặc những người x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
73 đã không ngáp không? Điều này không rõ ràng với r hoặc ai đó chỉ cần chọn mã và kết quả lần đầu tiên, vì vậy chúng tôi cần đặt đối số x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
27 thành x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
72 như sau để cải thiện tính minh bạch của mã:# A tibble: 1 × 1
mean_year
1 1996
0# A tibble: 1 × 1
mean_year
1 1996
12. ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
37 sao chép
ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
Bước tiếp theo của chúng tôi là thực hiện thay thế bootstrap với sự thay thế như chúng tôi đã làm với các phiếu của giấy trong hoạt động đồng xu của chúng tôi trong Phần 8.1. Chúng tôi đã thấy cách nó hoạt động với cả một biến duy nhất trong điện toán Bootstrap có nghĩa là trong Phần 8.4 và trong các tỷ lệ bootstrap trong phần 8.5, nhưng chúng tôi đã làm việc với bootstrapping liên quan đến nhiều biến.
Trong gói
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50, bootstrapping với nhiều biến có nghĩa là mỗi hàng có khả năng được ghép lại. Hãy để điều tra điều này bằng cách chỉ tập trung vào sáu hàng đầu tiên của x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
52:# A tibble: 1 × 1
mean_year
1 1996
2# A tibble: 1 × 1
mean_year
1 1996
3Khi chúng tôi khởi động dữ liệu này, chúng tôi có khả năng rút các bài đọc của chủ đề nhiều lần. Do đó, chúng ta có thể thấy các mục của
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
56 cho x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
55 và x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
73 cho x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
58 cùng nhau trong một hàng mới trong mẫu bootstrap. Điều này được nhìn thấy thêm bằng cách khám phá hàm x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
92 trong # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
12 trên khung dữ liệu 6 hàng nhỏ hơn này bao gồm x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
94. Hàm x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
92 có thể thực hiện quy trình bootstrapping này và tương tự như hàm # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
55 trong # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50, ngoại trừ việc nó không được lặp lại, mà chỉ thực hiện một mẫu có hoặc không có thay thế.# A tibble: 1 × 1
mean_year
1 1996
4# A tibble: 1 × 1
mean_year
1 1996
5Chúng ta có thể thấy rằng trong mẫu bootstrap này được tạo từ sáu hàng đầu tiên của
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
52, chúng ta có một số hàng được lặp lại. Điều tương tự cũng đúng khi chúng ta thực hiện bước ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
39 trong # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 như được thực hiện trong những gì tiếp theo. Sử dụng thực tế này, chúng tôi ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
37 1000 sao chép, hoặc, nói cách khác, chúng tôi bootstrap lấy mẫu lại 50 người tham gia với sự thay thế 1000 lần.# A tibble: 1 × 1
mean_year
1 1996
6# A tibble: 1 × 1
mean_year
1 1996
7Quan sát rằng khung dữ liệu kết quả có 50.000 hàng. Điều này là do chúng tôi đã thực hiện lấy mẫu lại của 50 người tham gia với sự thay thế 1000 lần và 50.000 = 1000 \ (\ cdot \) 50. Biến
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
65 cho biết việc lấy mẫu mỗi hàng thuộc về. Vì vậy, nó có giá trị ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
49 50 lần, giá trị ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
50 50 lần, cho đến giá trị ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
51 50 lần.\(\cdot\) 50. The variable # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
65 indicates which resample each row belongs to. So it has the value ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
49 50 times, the value ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
50 50 times, all the way through to the value ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
51 50 times.3. Thống kê tóm tắt ____257
Sau khi chúng tôi
ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
39 nhiều lần sao chép lại Bootstrap với sự thay thế, tiếp theo chúng tôi muốn tóm tắt các mẫu Bootstrap có kích thước 50 với một thống kê tóm tắt duy nhất, sự khác biệt về tỷ lệ. Chúng tôi thực hiện điều này bằng cách đặt đối số ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
61 thành # A tibble: 1 × 1
mean_year
1 1995.44
09:# A tibble: 1 × 1
mean_year
1 1996
8# A tibble: 1 × 1
mean_year
1 1996
9Chúng tôi thấy một lỗi khác ở đây. Chúng ta cần chỉ định thứ tự của phép trừ. Có phải là \ (\ Widhat {P} _ {Seed} - \ Widhat {P} _ {Control} \) hoặc \ (\ Widhat {P} _ {Control} - \ Widhat {P} _ _ {Seed} \). Chúng tôi chỉ định nó là \ (\ Widhat {P} _ {Seed} - \ Widhat {P} _ {Control} \) bằng cách đặt
# A tibble: 1 × 1
mean_year
1 1995.44
10. Lưu ý rằng bạn cũng có thể đặt # A tibble: 1 × 1
mean_year
1 1995.44
11. Như chúng tôi đã nêu trước đó, thứ tự của phép trừ không quan trọng, miễn là bạn duy trì sự nhất quán trong suốt phân tích của bạn và điều chỉnh các diễn giải của bạn cho phù hợp.\(\widehat{p}_{seed} - \widehat{p}_{control}\) or \(\widehat{p}_{control} - \widehat{p}_{seed}\). We specify it to be \(\widehat{p}_{seed} - \widehat{p}_{control}\) by setting # A tibble: 1 × 1
mean_year
1 1995.44
10. Note that you could’ve also set # A tibble: 1 × 1
mean_year
1 1995.44
11. As we stated earlier, the order of the subtraction does not matter, so long as you stay consistent throughout your analysis and tailor your interpretations accordingly.Hãy để Lôi lưu đầu ra trong khung dữ liệu
# A tibble: 1 × 1
mean_year
1 1995.44
12:# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
0# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
1Quan sát rằng khung dữ liệu kết quả có 1000 hàng và 2 cột tương ứng với 1000
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
65 ID, và 1000 sự khác biệt về tỷ lệ cho mỗi mẫu Bootstrap trong ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
61.4. ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
75 Kết quả
ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
Trong Hình 8.31, chúng tôi
ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
76 Phân phối phân phối lại bootstrap kết quả. Hãy để thêm một đường thẳng đứng ở 0 bằng cách thêm lớp x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
47.# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
2
Hình 8.31: Phân phối Bootstrap.
Đầu tiên, hãy để tính toán khoảng tin cậy 95% cho \ (P_ {Seed} - P_ {Control} \) bằng phương pháp phần trăm, nói cách khác, bằng cách xác định phần trăm 2,5 và 97,5 bao gồm 95% giá trị giữa. Hãy nhớ lại rằng phương pháp này không yêu cầu phân phối bootstrap thường được định hình.\(p_{seed} - p_{control}\) using the percentile method, in other words, by identifying the 2.5th and 97.5th percentiles which include the middle 95% of values. Recall that this method does not require the bootstrap distribution to be normally shaped.
# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
3# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
4Thứ hai, vì phân phối bootstrap có hình chuông gần như, chúng ta cũng có thể xây dựng một khoảng tin cậy bằng phương pháp lỗi tiêu chuẩn. Hãy nhớ lại rằng để xây dựng khoảng tin cậy bằng phương pháp lỗi tiêu chuẩn, chúng ta cần chỉ định tâm của khoảng thời gian bằng đối số
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
11. Trong trường hợp của chúng tôi, chúng tôi cần đặt nó là sự khác biệt về tỷ lệ mẫu là 4,4% mà các huyền thoại quan sát được.Chúng tôi cũng có thể sử dụng quy trình làm việc
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 để tính toán giá trị này bằng cách loại trừ bước sao chép ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
39 1000 Bootstrap. Nói cách khác, không tạo ra các bản sao, mà chỉ sử dụng dữ liệu mẫu gốc. Chúng ta có thể đạt được điều này bằng cách nhận xét dòng ggplot(pennies_sample, aes(x = year)) +
geom_histogram(binwidth = 10, color = "white")
39, bảo R bỏ qua nó:# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
5# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
6Do đó, chúng tôi cắm giá trị này vào như đối số
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
11.# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
7pennies_resample <- tibble(
year = c(1976, 1962, 1976, 1983, 2017, 2015, 2015, 1962, 2016, 1976,
2006, 1997, 1988, 2015, 2015, 1988, 2016, 1978, 1979, 1997,
1974, 2013, 1978, 2015, 2008, 1982, 1986, 1979, 1981, 2004,
2000, 1995, 1999, 2006, 1979, 2015, 1979, 1998, 1981, 2015,
2000, 1999, 1988, 2017, 1992, 1997, 1990, 1988, 2006, 2000)
)
2# A tibble: 1,750 × 3
# Groups: name [35]
replicate name year
1 1 Arianna 1988
2 1 Arianna 2002
3 1 Arianna 2015
4 1 Arianna 1998
5 1 Arianna 1979
6 1 Arianna 1971
7 1 Arianna 1971
8 1 Arianna 2015
9 1 Arianna 1988
10 1 Arianna 1979
# … with 1,740 more rows
9Hãy để trực quan hóa cả hai khoảng tin cậy trong Hình 8.32, với khoảng phương pháp tỷ lệ phần trăm được đánh dấu bằng các đường màu đen và phương pháp lỗi tiêu chuẩn được đánh dấu bằng các đường màu xám. Quan sát rằng cả hai đều giống nhau.
Hình 8.32: Hai khoảng tin cậy 95%: Phương pháp phần trăm (màu đen) và phương pháp lỗi tiêu chuẩn (màu xám).
Diễn giải khoảng tin cậy
Cho rằng cả hai khoảng tin cậy đều khá giống nhau, hãy để tập trung vào cách giải thích của chúng tôi với chỉ khoảng tin cậy phương pháp phần trăm của (-0.238, 0.302). Nhớ lại từ Tiểu mục 8.5.2 rằng việc giải thích thống kê chính xác về khoảng tin cậy 95% là: Nếu quy trình xây dựng này được lặp lại 100 lần, thì chúng tôi hy vọng khoảng 95 khoảng tin cậy để nắm bắt giá trị thực của \ (P_ {Seed} - P_ {Control} \). Nói cách khác, nếu chúng tôi thu thập 100 mẫu \ (n \) = 50 người tham gia từ một nhóm người tương tự và xây dựng 100 khoảng tin cậy mỗi trong số 100 mẫu, khoảng 95 trong số chúng sẽ chứa giá trị thực của \ ( P_ {Seed} - P_ {Control} \) trong khi khoảng năm sẽ không. Cho rằng đây là một chút gió dài, chúng tôi sử dụng cách giải thích tốc ký: Chúng tôi 95% tự tin rằng sự khác biệt thực sự về tỷ lệ \ (p_ {Seed} - p_ {control} \) nằm giữa (-0.238, 0.302) .\(p_{seed} - p_{control}\). In other words, if we gathered 100 samples of \(n\) = 50 participants from a similar pool of people and constructed 100 confidence intervals each based on each of the 100 samples, about 95 of them will contain the true value of \(p_{seed} - p_{control}\) while about five won’t. Given that this is a little long winded, we use the shorthand interpretation: we’re 95% “confident” that the true difference in proportions \(p_{seed} - p_{control}\) is between (-0.238, 0.302).
Có một giá trị quan tâm đặc biệt mà khoảng tin cậy 95% này chứa: 0. Nếu \ (p_ {seed} - p_ {control} \) bằng 0, thì sẽ không có sự khác biệt về tỷ lệ ngáp giữa hai nhóm. Điều này sẽ gợi ý rằng không có hiệu ứng liên quan đến việc tiếp xúc với một nhà tuyển dụng ngáp về việc bạn có ngáp tự.\(p_{seed} - p_{control}\) were equal to 0, then there would be no difference in proportion yawning between the two groups. This would suggest that there is no associated effect of being exposed to a yawning recruiter on whether you yawn yourself.
Trong trường hợp của chúng tôi, vì khoảng tin cậy 95% bao gồm 0, chúng tôi không thể kết luận nếu một trong hai tỷ lệ lớn hơn. Trong số 1000 mẫu Bootstrap của chúng tôi với sự thay thế, đôi khi \ (\ Widhat {P} _ {Seed} \) cao hơn và do đó, những người tiếp xúc với ngáp ngáp thường xuyên hơn. Vào những lúc khác, điều ngược lại đã xảy ra.\(\widehat{p}_{seed}\) was higher and thus those exposed to yawning yawned themselves more often. At other times, the reverse happened.
Mặt khác, khoảng tin cậy 95% hoàn toàn trên không. Điều này sẽ gợi ý rằng \ (p_ {seed} - p_ {control}> 0 \), hoặc, nói cách khác Ngáp làm ngáp thường xuyên hơn.\(p_{seed} - p_{control} > 0\), or, in other words \(p_{seed} > p_{control}\), and thus we’d have evidence suggesting those exposed to yawning do yawn more often.
Sự kết luận
So sánh phân phối bootstrap và lấy mẫu
Hãy để nói chuyện nhiều hơn về mối quan hệ giữa phân phối lấy mẫu và phân phối bootstrap.
Nhớ lại trong tiểu mục 7.2, chúng tôi đã lấy 1000 mẫu ảo từ
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
51 bằng cách sử dụng xẻng ảo, tính toán 1000 giá trị của tỷ lệ mẫu đỏ \ (\ widehat {p} \), sau đó hiển thị phân phối của chúng trong biểu đồ. Hãy nhớ lại rằng phân phối này được gọi là phân phối lấy mẫu của \ (\ widhat {p} \). Hơn nữa, độ lệch chuẩn của phân phối lấy mẫu có tên đặc biệt: lỗi tiêu chuẩn.\(\widehat{p}\), then visualized their distribution in a histogram. Recall that this distribution is called the sampling distribution of \(\widehat{p}\). Furthermore, the standard deviation of the sampling distribution has a special name: the standard error.Chúng tôi cũng đề cập rằng hoạt động lấy mẫu này không phản ánh cách lấy mẫu được thực hiện trong cuộc sống thực. Thay vào đó, nó là một phiên bản lý tưởng hóa của việc lấy mẫu để chúng ta có thể nghiên cứu các tác động của biến thể lấy mẫu đối với các ước tính, giống như tỷ lệ của các quả bóng xẻng có màu đỏ. Tuy nhiên, trong cuộc sống thực, người ta sẽ lấy một mẫu duy nhất mà LỚN càng lớn càng tốt, giống như trong cuộc thăm dò của Obama mà chúng ta đã thấy trong Phần 7.4. Nhưng làm thế nào chúng ta có thể hiểu được hiệu quả của sự thay đổi lấy mẫu đối với các ước tính nếu chúng ta chỉ có một mẫu và do đó chỉ có một ước tính? Chúng tôi cần nhiều mẫu và do đó nhiều ước tính?
Giải pháp thay thế để có một mẫu duy nhất là thực hiện thay thế bootstrap với sự thay thế từ mẫu đơn. Chúng tôi đã làm điều này trong hoạt động lấy mẫu lại trong Phần 8.1, nơi chúng tôi tập trung vào năm trung bình của việc khai thác đồng xu. Chúng tôi đã sử dụng các mảnh giấy đại diện cho mẫu ban đầu của 50 đồng xu từ ngân hàng và lấy lại chúng bằng cách thay thế từ một chiếc mũ. Chúng tôi đã có 35 người bạn thực hiện hoạt động này và hình dung 35 mẫu có nghĩa là \ (\ Overline {x} \) trong một biểu đồ trong Hình 8.11.\(\overline{x}\) in a histogram in Figure 8.11.
Phân phối này được gọi là phân phối bootstrap của \ (\ Overline {x} \). Chúng tôi đã tuyên bố tại thời điểm đó, phân phối bootstrap là một xấp xỉ với phân phối lấy mẫu của \ (\ Overline {x} \) theo nghĩa cả hai phân phối sẽ có hình dạng tương tự và lan truyền tương tự. Do đó, lỗi tiêu chuẩn của phân phối bootstrap có thể được sử dụng như là một xấp xỉ với sai số tiêu chuẩn của phân phối lấy mẫu.\(\overline{x}\). We stated at the time that the bootstrap distribution is an approximation to the sampling distribution of \(\overline{x}\) in the sense that both distributions will have a similar shape and similar spread. Thus the standard error of the bootstrap distribution can be used as an approximation to the standard error of the sampling distribution.
Hãy để cho bạn thấy rằng đây là trường hợp của bây giờ so sánh hai loại phân phối này. Cụ thể, chúng tôi sẽ so sánh
- Phân phối lấy mẫu của \ (\ widhat {p} \) dựa trên 1000 mẫu ảo từ
51 từ tiểu mục 7.2 đến\(\widehat{p}\) based on 1000 virtual samples from thex_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
51 from Subsection 7.2 tox_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
- Phân phối bootstrap của \ (\ widhat {p} \) dựa trên 1000 mẫu người ảo với sự thay thế từ mẫu đơn ILYAS và YOHAN,
18 từ tiểu mục 8.5.1.\(\widehat{p}\) based on 1000 virtual resamples with replacement from Ilyas and Yohan’s single samplex_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
18 from Subsection 8.5.1.x_bar <- pennies_sample %>% summarize(mean_year = mean(year)) x_bar
Phân phối lấy mẫu
Dưới đây là mã bạn đã thấy trong Tiểu mục 7.2 để xây dựng phân phối lấy mẫu của \ (\ Widhat {p} \) được hiển thị lại trong Hình 8.33, với một số thay đổi để kết hợp thuật ngữ thống kê liên quan đến lấy mẫu từ tiểu mục 7.3.1.\(\widehat{p}\) shown again in Figure 8.33, with some changes to incorporate the statistical terminology relating to sampling from Subsection 7.3.1.
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
00
Hình 8.33: Phân phối lấy mẫu trước đây của tỷ lệ mẫu màu đỏ cho \ (n = 1000 \).\(n = 1000\).
Một điều quan trọng cần ghi nhớ là giá trị mặc định cho
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
56 là # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
60 khi sử dụng # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
55. Điều này là do khi lấy mẫu 50 quả bóng bằng xẻng, chúng tôi đang trích xuất 50 quả bóng từng người mà không thay thế chúng. Điều này trái ngược với việc lấy mẫu bootstrap bằng cách thay thế, nơi chúng tôi lấy mẫu lại một quả bóng và đặt lại, và lặp lại quá trình này 50 lần.Hãy để định lượng độ biến thiên trong phân phối lấy mẫu này bằng cách tính độ lệch chuẩn của biến
# A tibble: 1 × 1
mean_year
1 1995.44
29 biểu thị 1000 giá trị của tỷ lệ mẫu \ (\ Widhat {p} \). Hãy nhớ rằng độ lệch chuẩn của phân phối lấy mẫu là lỗi tiêu chuẩn, thường được ký hiệu là # A tibble: 1 × 1
mean_year
1 1995.44
30.\(\widehat{p}\). Remember that the
standard deviation of the sampling distribution is the standard error, frequently denoted as # A tibble: 1 × 1
mean_year
1 1995.44
30.# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
01# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
02Phân phối bootstrap
Dưới đây là mã bạn đã thấy trước đây trong Tiểu mục 8.5.1 để xây dựng phân phối bootstrap của \ (\ Widhat {P} \) dựa trên mẫu ban đầu của Ilyas và Yohan, 50 quả bóng được lưu trong
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
18.\(\widehat{p}\) based on Ilyas and Yohan’s original sample of 50 balls saved in x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
18.# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
03
Hình 8.34: Phân phối bootstrap của màu đỏ tỷ lệ cho \ (n = 1000 \).\(n = 1000\).
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
04# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
05So sánh
Bây giờ chúng tôi đã tính toán cả phân phối lấy mẫu và phân phối bootstrap, hãy để so sánh chúng cạnh nhau trong Hình 8.35. Chúng tôi sẽ làm cho cả hai biểu đồ có thang đo phù hợp trên trục X và Y để làm cho chúng tương đương hơn. Hơn nữa, chúng tôi sẽ thêm:
- Để phân phối lấy mẫu trên đầu: một đường liền nét biểu thị tỷ lệ của các quả bóng bát có màu đỏ \ (p \) = 0,375.\(p\) = 0.375.
- Để phân phối bootstrap ở phía dưới: một đường đứt nét ở tỷ lệ mẫu \ (\ widhat {p} \) = 21/50 = 0,42 = 42% mà ilyas và yohan quan sát được.\(\widehat{p}\) = 21/50 = 0.42 = 42% that Ilyas and Yohan observed.
Hình 8.35: So sánh các bản phân phối lấy mẫu và bootstrap của \ (\ widhat {p} \).\(\widehat{p}\).
Có rất nhiều điều đang diễn ra trong Hình 8.35, vì vậy hãy để chia nhỏ tất cả các so sánh một cách từ từ. Đầu tiên, quan sát cách phân phối lấy mẫu trên đỉnh được tập trung tại \ (p \) = 0,375. Điều này là do việc lấy mẫu được thực hiện một cách ngẫu nhiên và theo kiểu không thiên vị. Vì vậy, các ước tính \ (\ widhat {p} \) được tập trung vào giá trị thực của \ (p \).\(p\) = 0.375. This is because the sampling is done at random and in an unbiased fashion. So the estimates \(\widehat{p}\) are centered at the true value of \(p\).
Tuy nhiên, đây không phải là trường hợp với phân phối bootstrap sau đây. Phân phối bootstrap được tập trung ở mức 0,42, là tỷ lệ màu đỏ của Ilyas và Yohan, 50 quả bóng được lấy mẫu. Điều này là do chúng tôi đang lấy mẫu từ cùng một mẫu nhiều lần. Do phân phối bootstrap được tập trung ở tỷ lệ mẫu ban đầu, nên nó không nhất thiết cung cấp ước tính tốt hơn \ (p \) = 0,375. Điều này dẫn chúng ta đến bài học đầu tiên về bootstrapping:\(p\) = 0.375. This leads us to our first lesson about bootstrapping:
Phân phối bootstrap có thể sẽ không có cùng trung tâm với phân phối lấy mẫu. Nói cách khác, bootstrapping không thể cải thiện chất lượng của một ước tính.
Thứ hai, bây giờ hãy so sánh sự lây lan của hai bản phân phối: chúng có phần giống nhau. Trong mã trước, chúng tôi cũng đã tính toán độ lệch chuẩn của cả hai bản phân phối. Hãy nhớ lại rằng độ lệch chuẩn như vậy có một tên đặc biệt: lỗi tiêu chuẩn. Hãy để so sánh chúng trong Bảng 8.5.
Bảng 8.5: So sánh các lỗi tiêu chuẩnComparing standard errorsLoại phân phối | Lỗi tiêu chuẩn |
---|---|
Phân phối lấy mẫu | 0.067 |
Phân phối bootstrap | 0.071 |
Lưu ý rằng lỗi tiêu chuẩn phân phối Bootstrap là một xấp xỉ khá tốt với lỗi tiêu chuẩn phân phối lấy mẫu. Điều này dẫn chúng ta đến bài học thứ hai của chúng tôi về bootstrapping:
Ngay cả khi phân phối bootstrap có thể không có cùng trung tâm với phân phối lấy mẫu, nó có thể sẽ có hình dạng và lan truyền rất giống nhau. Nói cách khác, bootstrapping sẽ cung cấp cho bạn một ước tính tốt về lỗi tiêu chuẩn.
Do đó, bằng cách sử dụng thực tế là phân phối và phân phối lấy mẫu bootstrap có sự chênh lệch tương tự, chúng ta có thể xây dựng khoảng tin cậy bằng cách sử dụng bootstrapping như chúng ta đã thực hiện trong suốt chương này!
Khoảng tin cậy dựa trên lý thuyết
Cho đến nay trong chương này, chúng tôi đã xây dựng các khoảng tin cậy bằng hai phương pháp: phương pháp phần trăm và phương pháp lỗi tiêu chuẩn. Nhớ lại cũng từ Tiểu mục 8.3.2 rằng chúng ta chỉ có thể sử dụng phương pháp lỗi tiêu chuẩn nếu phân phối bootstrap có hình chuông (nghĩa là, thường được phân phối).
Trong một tĩnh mạch tương tự, nếu phân phối lấy mẫu thường được định hình, có một phương pháp khác để xây dựng các khoảng tin cậy không liên quan đến việc sử dụng máy tính của bạn. Bạn có thể sử dụng một phương pháp dựa trên lý thuyết liên quan đến các công thức toán học!
Công thức sử dụng quy tắc ngón tay cái mà chúng ta đã thấy trong Phụ lục A.2 rằng 95% giá trị trong phân phối bình thường nằm trong độ lệch chuẩn \ (\ pm 1.96 \) của giá trị trung bình. Trong trường hợp phân phối lấy mẫu và bootstrap, hãy nhớ rằng độ lệch chuẩn có tên đặc biệt: lỗi tiêu chuẩn. Nhớ lại thêm trong Tiểu mục 7.6.2 Bạn đã thấy rằng có một công thức dựa trên lý thuyết để xấp xỉ sai số tiêu chuẩn cho các tỷ lệ mẫu \ (\ Widhat {p} \):\(\pm 1.96\) standard deviations of the mean. In the case of sampling and bootstrap distributions, remember that the standard deviation has a special name: the standard error. Recall further in Subsection 7.6.2 you saw that there is a theory-based formula to approximate the standard error for sample proportions \(\widehat{p}\):
\]
Nếu bạn đã quên sự thật này và những gì nó nói về mối quan hệ giữa độ chính xác của các ước tính của bạn và cỡ mẫu của bạn \ (n \), chúng tôi khuyên bạn nên đọc lại tiểu mục 7.6.2.\(n\), we highly recommend you re-read Subsection 7.6.2.
Nhớ lại từ
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
18 rằng Yohan và Ilyas đã lấy mẫu \ (n = 50 \) và quan sát một tỷ lệ mẫu \ (\ widhat {p} \) là 21/50 = 0,42. Do đó, một xấp xỉ của lỗi tiêu chuẩn của \ (\ Widhat {P} \) dựa trên mẫu Yohan và Ilyas, là: Do đó:\(n = 50\) balls and observed a sample proportion \(\widehat{p}\) of 21/50 = 0.42. An approximation of the standard error of \(\widehat{p}\) based on Yohan and Ilyas’ sample is thus:\ [\ text {se} _ {\ widehat {p}} \ spect
Hãy để so sánh lỗi tiêu chuẩn dựa trên lý thuyết này với lỗi tiêu chuẩn của các bản phân phối lấy mẫu và bootstrap mà bạn đã tính toán trước đây trong tiểu mục 8.7.1 trong Bảng 8.6. Lưu ý làm thế nào tất cả đều giống nhau!
Bảng 8.6: So sánh các lỗi tiêu chuẩnComparing standard errorsLoại phân phối | Lỗi tiêu chuẩn |
---|---|
Phân phối lấy mẫu | 0.067 |
Phân phối bootstrap | 0.071 |
Xấp xỉ công thức | 0.070 |
Sử dụng lỗi tiêu chuẩn dựa trên lý thuyết, hãy để trình bày một phương pháp dựa trên lý thuyết để xây dựng các khoảng tin cậy 95% không liên quan đến việc sử dụng máy tính, mà là các công thức toán học. Lưu ý rằng phương pháp dựa trên lý thuyết này chỉ giữ nếu phân phối lấy mẫu thường được định hình, để chúng ta có thể sử dụng quy tắc ngón tay cái 95% về các phân phối bình thường được thảo luận trong Phụ lục A.2.
- Thu thập một mẫu đại diện duy nhất có kích thước \ (n \) mà càng lớn càng tốt.\(n\) that’s as large as possible.
- Tính toán ước tính điểm: Tỷ lệ mẫu \ (\ Widhat {p} \). Hãy nghĩ về điều này như là trung tâm của mạng lưới của bạn.\(\widehat{p}\). Think of this as the center of your “net.”
- Tính toán xấp xỉ với lỗi tiêu chuẩn
\]
- Nếu bạn đã quên sự thật này và những gì nó nói về mối quan hệ giữa độ chính xác của các ước tính của bạn và cỡ mẫu của bạn \ (n \), chúng tôi khuyên bạn nên đọc lại tiểu mục 7.6.2.
Nhớ lại từ
18 rằng Yohan và Ilyas đã lấy mẫu \ (n = 50 \) và quan sát một tỷ lệ mẫu \ (\ widhat {p} \) là 21/50 = 0,42. Do đó, một xấp xỉ của lỗi tiêu chuẩn của \ (\ Widhat {P} \) dựa trên mẫu Yohan và Ilyas, là: Do đó:x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
- \ [\ text {se} _ {\ widehat {p}} \ spect
Hãy để so sánh lỗi tiêu chuẩn dựa trên lý thuyết này với lỗi tiêu chuẩn của các bản phân phối lấy mẫu và bootstrap mà bạn đã tính toán trước đây trong tiểu mục 8.7.1 trong Bảng 8.6. Lưu ý làm thế nào tất cả đều giống nhau!\[\widehat{p} - \text{MoE}_{\widehat{p}} = \widehat{p} - 1.96 \cdot \text{SE}_{\widehat{p}} = \widehat{p} - 1.96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]
Bảng 8.6: So sánh các lỗi tiêu chuẩn\[\widehat{p} + \text{MoE}_{\widehat{p}} = \widehat{p} + 1.96 \cdot \text{SE}_{\widehat{p}} = \widehat{p} + 1.96 \cdot \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}\]
Loại phân phối\(p\) using the \(\pm\) symbol:
Phân phối lấy mẫu\(n = 50\) balls that had 21 red balls, the 95% confidence interval for \(p\) is
Phân phối bootstrap
Xấp xỉ công thức\(p\) was 0.375, in this case they successfully captured the fish.
Sử dụng lỗi tiêu chuẩn dựa trên lý thuyết, hãy để trình bày một phương pháp dựa trên lý thuyết để xây dựng các khoảng tin cậy 95% không liên quan đến việc sử dụng máy tính, mà là các công thức toán học. Lưu ý rằng phương pháp dựa trên lý thuyết này chỉ giữ nếu phân phối lấy mẫu thường được định hình, để chúng ta có thể sử dụng quy tắc ngón tay cái 95% về các phân phối bình thường được thảo luận trong Phụ lục A.2.\(n\), and the standard error.
Thu thập một mẫu đại diện duy nhất có kích thước \ (n \) mà càng lớn càng tốt.\(n\) = 2089 young Americans, \(\widehat{p}\) = 0.41 = 41% supported President Obama.
Nếu bạn nhìn vào cuối bài viết, nó cũng tuyên bố: Biên độ lỗi của cuộc thăm dò ý kiến là cộng hoặc trừ 2,1 điểm phần trăm. Đây chính xác là \ (\ text {moe} \):\(\text{MoE}\):
\] Đưa
Kết quả thăm dò ý kiến của họ dựa trên mức độ tin cậy 95% và khoảng tin cậy 95% cho tỷ lệ của tất cả những người Mỹ trẻ hỗ trợ Obama là:
\]
Khoảng tin cậy dựa trên 33 mẫu xúc giác
Hãy cùng xem lại 33 mẫu bạn bè của chúng tôi từ
x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
51 từ tiểu mục 7.1.3. Chúng tôi sẽ sử dụng 33 mẫu của họ để xây dựng 33 khoảng tin cậy dựa trên lý thuyết cho \ (p \). Nhớ lại dữ liệu này đã được lưu trong khung dữ liệu # A tibble: 1 × 1
mean_year
1 1995.44
34 có trong gói # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
19:\(p\). Recall this data was saved in the # A tibble: 1 × 1
mean_year
1 1995.44
34 data frame included in the # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
19 package:
36 Biến# A tibble: 1 × 1 mean_year
1 1995.44
29 đến# A tibble: 1 × 1 mean_year
1 1995.44
38, tên thống kê của tỷ lệ mẫu \ (\ Widhat {p} \).\(\widehat{p}\).# A tibble: 1 × 1 mean_year
1 1995.44
39 Một biến mới# A tibble: 1 × 1 mean_year
1 1995.44
40 làm rõ kích thước mẫu là 50.# A tibble: 1 × 1 mean_year
1 1995.44
39 Các biến mới tính toán:# A tibble: 1 × 1 mean_year
1 1995.44 - Lỗi tiêu chuẩn
42 cho \ (\ widhat {p} \) bằng công thức trước đó.\(\widehat{p}\) using the previous formula.# A tibble: 1 × 1 mean_year
1 1995.44 - Biên độ lỗi
43 bằng cách nhân# A tibble: 1 × 1 mean_year
1 1995.44
42 với 1.96# A tibble: 1 × 1 mean_year
1 1995.44 - Điểm cuối bên trái của khoảng tin cậy
45# A tibble: 1 × 1 mean_year
1 1995.44 - Điểm cuối bên phải của khoảng tin cậy
46# A tibble: 1 × 1 mean_year
1 1995.44
- Lỗi tiêu chuẩn
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
06# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
07Trong Hình 8.36, hãy để biểu thị các khoảng tin cậy 33 cho \ (p \) được lưu trong
# A tibble: 1 × 1
mean_year
1 1995.44
47 cùng với một đường thẳng đứng ở \ (p \) = 0,375 cho thấy tỷ lệ thực của các quả bóng ________ 351 có màu đỏ. Hơn nữa, hãy để đánh dấu các tỷ lệ mẫu \ (\ Widhat {p} \) với các dấu chấm vì chúng đại diện cho các trung tâm của các khoảng tin cậy này.\(p\) saved in # A tibble: 1 × 1
mean_year
1 1995.44
47 along with a vertical line at \(p\) = 0.375 indicating the true proportion of the x_bar <- pennies_sample %>%
summarize(mean_year = mean(year))
x_bar
51’s balls that are red. Furthermore, let’s mark the sample proportions \(\widehat{p}\) with dots since they represent the centers of these confidence intervals.
Hình 8.36: 33 khoảng tin cậy ở mức 95% dựa trên 33 mẫu xúc giác có kích thước \ (n = 50 \).\(n = 50\).
Quan sát rằng 31 trong số 33 khoảng tin cậy đã nắm bắt được giá trị thực của \ (p \), với tỷ lệ thành công là 31/33 = 93,94%. Mặc dù điều này không khá 95%, nhưng hãy nhớ lại rằng chúng tôi mong đợi khoảng 95% khoảng tin cậy như vậy để nắm bắt \ (p \). Tỷ lệ thành công quan sát thực tế sẽ thay đổi một chút.\(p\), for a success rate of 31 / 33 = 93.94%. While this is not quite 95%, recall that we expect about 95% of such confidence intervals to capture \(p\). The actual observed success rate will vary slightly.
Các phương pháp dựa trên lý thuyết như thế này phần lớn đã được sử dụng trong quá khứ vì chúng tôi đã có khả năng tính toán để thực hiện các phương pháp dựa trên mô phỏng như bootstrapping. Tuy nhiên, chúng vẫn thường được sử dụng và nếu phân phối lấy mẫu thường được phân phối, chúng tôi có quyền truy cập vào một phương pháp thay thế để xây dựng khoảng tin cậy cũng như thực hiện các bài kiểm tra giả thuyết như chúng ta sẽ thấy trong Chương 9.
Loại suy luận thống kê dựa trên máy tính mà chúng tôi đã thấy cho đến nay có một tên cụ thể trong lĩnh vực thống kê: suy luận dựa trên mô phỏng. Điều này là do chúng tôi đang thực hiện suy luận thống kê bằng cách sử dụng mô phỏng máy tính. Theo chúng tôi, hai lợi ích lớn của các phương pháp dựa trên mô phỏng so với các phương pháp dựa trên lý thuyết là (1) chúng dễ dàng hơn cho những người mới suy luận thống kê để hiểu và (2) chúng cũng hoạt động trong các tình huống trong đó các phương pháp dựa trên lý thuyết và công thức toán học Đừng tồn tại.
Tài nguyên bổ sung
Một tệp tập lệnh R của tất cả các mã R được sử dụng trong chương này có sẵn ở đây.
Nếu bạn muốn có thêm các ví dụ về quy trình làm việc
# A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50 để xây dựng khoảng tin cậy, chúng tôi khuyên bạn nên kiểm tra trang chủ gói # A tibble: 50 × 2
ID year
1 1 2002
2 2 1986
3 3 2017
4 4 1988
5 5 2008
6 6 1983
7 7 2008
8 8 1996
9 9 2004
10 10 2000
# … with 40 more rows
50, đặc biệt, một loạt các phân tích ví dụ có sẵn tại https://infer.netlify.app/articles/.
Điều gì sẽ đến?
Bây giờ, chúng tôi đã trang bị cho mình các khoảng tin cậy, trong Chương 9, chúng tôi sẽ đề cập đến các công cụ phổ biến khác để suy luận thống kê: Kiểm tra giả thuyết. Giống như khoảng tin cậy, các bài kiểm tra giả thuyết được sử dụng để suy ra về dân số sử dụng mẫu. Tuy nhiên, chúng tôi sẽ thấy rằng khuôn khổ để đưa ra những suy luận như vậy là hơi khác nhau.