Hướng dẫn when to use bootstrapping statistics - khi nào nên sử dụng số liệu thống kê bootstrapping

Bootstrapping là một quy trình thống kê ghép lại một bộ dữ liệu duy nhất để tạo ra nhiều mẫu mô phỏng. Quá trình này cho phép bạn tính toán các lỗi tiêu chuẩn, xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết cho nhiều loại thống kê mẫu. Phương pháp bootstrap là cách tiếp cận thay thế cho thử nghiệm giả thuyết truyền thống và đáng chú ý là dễ hiểu và hợp lệ hơn cho nhiều điều kiện hơn.

Trong bài đăng trên blog này, tôi giải thích những điều cơ bản về bootstrapping, so sánh bootstrapping với các phương pháp thống kê thông thường và giải thích khi nào nó có thể là phương pháp tốt hơn. Ngoài ra, tôi sẽ làm việc thông qua một ví dụ sử dụng dữ liệu thực để tạo khoảng tin cậy bootstrapping.

Bootstrapping và kiểm tra giả thuyết truyền thống là các thủ tục thống kê suy luận

Hướng dẫn when to use bootstrapping statistics - khi nào nên sử dụng số liệu thống kê bootstrapping
Cả hai phương pháp bootstrapping và truyền thống đều sử dụng các mẫu để rút ra các suy luận về quần thể. Để thực hiện mục tiêu này, các quy trình này xử lý một mẫu duy nhất mà một nghiên cứu có được chỉ là một trong nhiều mẫu ngẫu nhiên mà nghiên cứu có thể thu thập được.

Từ một mẫu duy nhất, bạn có thể tính toán một loạt các số liệu thống kê mẫu, chẳng hạn như giá trị trung bình, trung bình và độ lệch chuẩn nhưng chúng tôi sẽ tập trung vào giá trị trung bình ở đây.

Bây giờ, giả sử một nhà phân tích lặp lại nghiên cứu của họ nhiều lần. Trong tình huống này, giá trị trung bình sẽ thay đổi từ mẫu này sang mẫu khác và tạo thành phân phối các phương tiện mẫu. Các nhà thống kê đề cập đến loại phân phối này như là một phân phối lấy mẫu. Phân phối lấy mẫu là rất quan trọng vì chúng đặt giá trị của thống kê mẫu của bạn vào bối cảnh rộng hơn của nhiều giá trị có thể khác.

Trong khi thực hiện một nghiên cứu nhiều lần là không khả thi, cả hai phương pháp đều có thể ước tính phân phối lấy mẫu. Sử dụng bối cảnh lớn hơn mà các phân phối lấy mẫu cung cấp, các quy trình này có thể xây dựng các khoảng tin cậy và thực hiện kiểm tra giả thuyết.

Bài viết liên quan: Sự khác biệt giữa thống kê mô tả và suy luận: Differences between Descriptive and Inferential Statistics

Sự khác biệt giữa kiểm tra giả thuyết truyền thống và bootstrapping

Một sự khác biệt chính giữa bootstrapping và thống kê truyền thống là cách họ ước tính phân phối lấy mẫu.

Các quy trình kiểm tra giả thuyết truyền thống yêu cầu các phương trình ước tính phân phối lấy mẫu bằng cách sử dụng các thuộc tính của dữ liệu mẫu, thiết kế thử nghiệm và thống kê thử nghiệm. Để có được kết quả hợp lệ, bạn sẽ cần sử dụng thống kê kiểm tra thích hợp và đáp ứng các giả định. Tôi mô tả quá trình này chi tiết hơn trong các bài viết khác liên kết dưới đây.

Phương pháp Bootstrap sử dụng một cách tiếp cận rất khác để ước tính phân phối lấy mẫu. Phương pháp này lấy dữ liệu mẫu mà một nghiên cứu có được, và sau đó lấy lại nó nhiều lần để tạo ra nhiều mẫu mô phỏng. Mỗi mẫu mô phỏng này có tính chất riêng, chẳng hạn như giá trị trung bình. Khi bạn vẽ đồ thị phân phối của các phương tiện này trên biểu đồ, bạn có thể quan sát phân phối lấy mẫu của giá trị trung bình. Bạn không cần phải lo lắng về số liệu thống kê, công thức và giả định kiểm tra.

Quy trình bootstrap sử dụng các phân phối lấy mẫu này làm nền tảng cho khoảng tin cậy và thử nghiệm giả thuyết. Hãy cùng xem cách thức hoạt động của quá trình lấy mẫu này.

Bài viết liên quan: Cách làm việc t-tests hoạt động và cách thức hoạt động của F: How t-Tests Work and How the F-test Works in ANOVA

Cách thức bắt chước Bootstrapping Dữ liệu của bạn để tạo bộ dữ liệu mô phỏng

Bootstrapping sắp xếp lại bộ dữ liệu ban đầu với sự thay thế hàng ngàn lần để tạo bộ dữ liệu mô phỏng. Quá trình này liên quan đến việc vẽ các mẫu ngẫu nhiên từ bộ dữ liệu gốc. Ở đây, cách thức hoạt động của nó:

  1. Phương pháp Bootstrap có xác suất ngẫu nhiên vẽ ngẫu nhiên từng điểm dữ liệu gốc để đưa vào các bộ dữ liệu được lấy lại.
  2. Quy trình có thể chọn một điểm dữ liệu nhiều lần cho bộ dữ liệu được lấy lại. Tài sản này là khía cạnh thay thế của quy trình.
  3. Quy trình tạo ra các bộ dữ liệu được ghép lại có cùng kích thước với bộ dữ liệu gốc.

Quá trình kết thúc với các bộ dữ liệu mô phỏng của bạn có nhiều kết hợp các giá trị khác nhau tồn tại trong bộ dữ liệu gốc. Mỗi bộ dữ liệu mô phỏng có bộ thống kê mẫu riêng, chẳng hạn như giá trị trung bình, trung bình và độ lệch chuẩn. Các quy trình bootstrapping sử dụng phân phối số liệu thống kê mẫu trên các mẫu mô phỏng làm phân phối lấy mẫu.

Ví dụ về các mẫu bootstrap

Hãy cùng làm việc thông qua một trường hợp dễ dàng. Giả sử một nghiên cứu thu thập năm điểm dữ liệu và tạo ra bốn mẫu bootstrap, như được hiển thị bên dưới.

Hướng dẫn when to use bootstrapping statistics - khi nào nên sử dụng số liệu thống kê bootstrapping

Ví dụ đơn giản này minh họa các thuộc tính của các mẫu bootstrap. Các bộ dữ liệu được ghép lại có cùng kích thước với bộ dữ liệu gốc và chỉ chứa các giá trị tồn tại trong bộ gốc. Hơn nữa, các giá trị này có thể xuất hiện ít nhiều thường xuyên trong các bộ dữ liệu được ghép lại so với bộ dữ liệu gốc. Cuối cùng, quá trình lấy mẫu lại là ngẫu nhiên và có thể đã tạo ra một tập hợp các bộ dữ liệu mô phỏng khác nhau.

Tất nhiên, trong một nghiên cứu thực tế, bạn sẽ hy vọng có kích thước mẫu lớn hơn và bạn đã tạo ra hàng ngàn bộ dữ liệu được lấy lại. Với số lượng khổng lồ của các bộ dữ liệu được lấy lại, bạn sẽ luôn sử dụng máy tính để thực hiện các phân tích này.

Bootstrapping hoạt động tốt như thế nào?

Hướng dẫn when to use bootstrapping statistics - khi nào nên sử dụng số liệu thống kê bootstrapping
Việc lấy mẫu liên quan đến việc sử dụng lại một bộ dữ liệu của bạn nhiều lần. Nó gần như có vẻ quá tốt để trở thành sự thật! Trên thực tế, thuật ngữ bootstrapping của người Viking xuất phát từ cụm từ không thể kéo mình lên bằng bootstraps của riêng bạn! Tuy nhiên, sử dụng sức mạnh của máy tính để lấy mẫu ngẫu nhiên một bộ dữ liệu của bạn để tạo hàng ngàn bộ dữ liệu mô phỏng tạo ra kết quả có ý nghĩa.

Phương pháp bootstrap đã xuất hiện từ năm 1979, và việc sử dụng của nó đã tăng lên. Các nghiên cứu khác nhau trong các thập kỷ can thiệp đã xác định rằng các phân phối lấy mẫu bootstrap gần đúng với các phân phối lấy mẫu chính xác.

Để hiểu cách thức hoạt động, hãy nhớ rằng bootstrapping không tạo ra dữ liệu mới. Thay vào đó, nó coi mẫu ban đầu là một proxy cho dân số thực và sau đó rút các mẫu ngẫu nhiên từ nó. Do đó, giả định trung tâm cho bootstrapping là mẫu ban đầu đại diện chính xác cho dân số thực tế.

Quá trình lấy mẫu lại tạo ra nhiều mẫu có thể mà một nghiên cứu có thể rút ra. Các kết hợp khác nhau của các giá trị trong các mẫu mô phỏng cùng cung cấp một ước tính về sự biến đổi giữa các mẫu ngẫu nhiên được rút ra từ cùng một dân số. Phạm vi của các mẫu tiềm năng này cho phép quy trình xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết. Điều quan trọng, khi kích thước mẫu tăng lên, bootstrapping hội tụ vào phân phối lấy mẫu chính xác trong hầu hết các điều kiện.

Bây giờ, hãy để xem một ví dụ về thủ tục này trong hành động!

Ví dụ về việc sử dụng bootstrapping để tạo khoảng tin cậy

Trong ví dụ này, tôi sẽ sử dụng bootstrapping để xây dựng khoảng tin cậy cho một bộ dữ liệu chứa tỷ lệ phần trăm chất béo cơ thể của 92 cô gái vị thành niên. Tôi đã sử dụng bộ dữ liệu này trong bài viết của mình về việc xác định phân phối dữ liệu của bạn. Những dữ liệu này không tuân theo phân phối bình thường. Bởi vì nó không đáp ứng giả định tính bình thường của các số liệu thống kê truyền thống, nên nó là một ứng cử viên tốt cho bootstrapping. Mặc dù, cỡ mẫu lớn có thể cho phép chúng tôi bỏ qua giả định này. Biểu đồ dưới đây hiển thị phân phối dữ liệu mẫu gốc.

Hướng dẫn when to use bootstrapping statistics - khi nào nên sử dụng số liệu thống kê bootstrapping

Tải xuống bộ dữ liệu CSV để tự mình thử: Body_Fat.

Thực hiện thủ tục bootstrap

Để tạo các mẫu bootstrapping, tôi đã sử dụng Statistic101, đây là một chương trình phần mềm quà tặng. Đây là một chương trình mô phỏng tuyệt vời mà tôi cũng đã sử dụng để giải quyết vấn đề Monty Hall!

Sử dụng ngôn ngữ lập trình của nó, tôi đã viết một tập lệnh lấy bộ dữ liệu ban đầu của tôi và ghép lại nó bằng cách thay thế 500.000 lần. Quá trình này tạo ra 500.000 mẫu bootstrapping với 92 quan sát trong mỗi mẫu. Chương trình tính toán từng mẫu trung bình của mẫu và biểu đồ phân phối 500.000 phương tiện này trong biểu đồ dưới đây. Các nhà thống kê đề cập đến loại phân phối này là phân phối lấy mẫu của phương tiện. Các phương pháp bootstrapping tạo ra các phân phối này bằng cách sử dụng mẫu lại, trong khi các phương pháp truyền thống sử dụng các phương trình cho phân phối xác suất. Tải xuống tập lệnh này để tự chạy nó: BodyFatbootStrapci.

Hướng dẫn when to use bootstrapping statistics - khi nào nên sử dụng số liệu thống kê bootstrapping

Để tạo khoảng tin cậy bootstrapping, chúng tôi chỉ cần sử dụng phần trăm. Đối với khoảng tin cậy 95%, chúng ta cần xác định mức trung bình 95% của phân phối. Để làm điều đó, chúng tôi sử dụng phần trăm 97,5 và phần trăm 2,5 (97,5 - 2,5 = 95). Nói cách khác, nếu chúng ta đặt hàng tất cả các phương tiện mẫu từ thấp đến cao, sau đó cắt giảm 2,5% thấp nhất và cao nhất 2,5% của phương tiện, 95% trung bình còn lại. Phạm vi đó là khoảng tin cậy bootstrapping của chúng tôi!

Đối với dữ liệu chất béo cơ thể, chương trình tính toán khoảng tin cậy khởi động 95% của giá trị trung bình [27.16 30.01]. Chúng tôi có thể tự tin 95% rằng dân số có nghĩa là nằm trong phạm vi này.

Khoảng thời gian này có cùng chiều rộng với khoảng tin cậy truyền thống cho các dữ liệu này và nó chỉ khác với một vài điểm phần trăm. Hai phương pháp rất gần.

Lưu ý cách phân phối lấy mẫu trong biểu đồ xấp xỉ phân phối bình thường mặc dù phân phối dữ liệu cơ bản bị sai lệch. Xấp xỉ này xảy ra nhờ định lý giới hạn trung tâm. Khi kích thước mẫu tăng lên, phân phối lấy mẫu hội tụ trên phân phối bình thường bất kể phân phối dữ liệu cơ bản (với một vài ngoại lệ). Để biết thêm thông tin về định lý này, hãy đọc bài viết của tôi về định lý giới hạn trung tâm.

So sánh quá trình này với cách các phương pháp thống kê truyền thống tạo ra khoảng tin cậy.

Lợi ích của việc bootstrapping so với số liệu thống kê truyền thống

Độc giả của blog của tôi biết rằng tôi yêu thích những giải thích trực quan về các phương pháp thống kê phức tạp. Và, bootstrapping phù hợp với triết lý này. Quá trình này dễ hiểu hơn nhiều so với các phương trình phức tạp cần thiết cho phân phối xác suất của các phương pháp truyền thống. Tuy nhiên, bootstrapping cung cấp nhiều lợi ích hơn là dễ hiểu!

Bootstrapping không đưa ra các giả định về phân phối dữ liệu của bạn. Bạn chỉ lấy mẫu lại dữ liệu của mình và sử dụng bất kỳ phân phối lấy mẫu nào xuất hiện. Sau đó, bạn làm việc với phân phối đó, bất kể nó có thể, như chúng tôi đã làm trong ví dụ.

Ngược lại, các phương thức truyền thống thường cho rằng dữ liệu tuân theo phân phối bình thường hoặc một số phân phối khác. Đối với phân phối bình thường, định lý giới hạn trung tâm có thể cho phép bạn bỏ qua giả định này cho các cỡ mẫu lớn hơn ~ 30. Do đó, bạn có thể sử dụng bootstrapping cho nhiều loại phân phối, phân phối không xác định và kích thước mẫu nhỏ hơn. Cỡ mẫu nhỏ như 10 có thể sử dụng được.

Trong tĩnh mạch này, tất cả các phương pháp truyền thống sử dụng các phương trình ước tính phân phối lấy mẫu cho một thống kê mẫu cụ thể khi dữ liệu tuân theo một phân phối cụ thể. Thật không may, các công thức cho tất cả các kết hợp thống kê mẫu và phân phối dữ liệu không tồn tại! Ví dụ, không có phân phối lấy mẫu được biết đến cho các trung vị, điều này làm cho bootstrapping trở thành những phân tích hoàn hảo cho nó. Các phân tích khác có các giả định như bình đẳng của phương sai. Tuy nhiên, không có vấn đề nào trong số này là vấn đề cho bootstrapping.

Đối với số liệu thống kê mẫu nào tôi có thể sử dụng bootstrapping?

Mặc dù bài đăng trên blog này tập trung vào trung bình mẫu, phương pháp Bootstrap có thể phân tích một loạt các thống kê và thuộc tính mẫu. Những thống kê này bao gồm giá trị trung bình, trung bình, chế độ, độ lệch chuẩn, phân tích phương sai, tương quan, hệ số hồi quy, tỷ lệ, tỷ lệ chênh lệch, phương sai trong dữ liệu nhị phân và thống kê đa biến giữa những người khác.

Có một số điều kiện, chủ yếu là bí truyền khi không phù hợp, chẳng hạn như khi phương sai dân số là vô hạn hoặc khi các giá trị dân số không liên tục ở trung bình. Và, có nhiều điều kiện khác nhau trong đó các điều chỉnh cho quá trình bootstrapping là cần thiết để điều chỉnh sự thiên vị. Tuy nhiên, những trường hợp đó vượt ra ngoài phạm vi của bài đăng trên blog giới thiệu này.

Các số liệu thống kê mẫu cho bootstrapping là gì?

Mỗi bộ dữ liệu mô phỏng có bộ thống kê mẫu riêng, chẳng hạn như giá trị trung bình, trung bình và độ lệch chuẩn. Các quy trình bootstrapping sử dụng phân phối số liệu thống kê mẫu trên các mẫu mô phỏng làm phân phối lấy mẫu.

Bootstrapping là gì và tại sao nó hữu ích?

Bootstrapping là một kỹ thuật thống kê mạnh mẽ. Nó đặc biệt hữu ích khi cỡ mẫu mà chúng tôi đang làm việc là nhỏ. Trong các trường hợp thông thường, kích thước mẫu dưới 40 không thể được xử lý bằng cách giả sử phân phối bình thường hoặc phân phối T.

Khi nào nên sử dụng phương thức phân phối bootstrap?

Phương pháp này có thể được áp dụng cho bất kỳ thống kê. Nó sẽ hoạt động tốt trong trường hợp phân phối bootstrap là đối xứng và tập trung vào thống kê quan sát được và trong đó thống kê mẫu không liên quan trung bình và có nồng độ tối đa (hoặc rủi ro tối thiểu đối với hàm mất giá trị tuyệt đối).

Bootstrapping có chính xác hơn khoảng tiêu chuẩn không?

Mặc dù đối với hầu hết các vấn đề, không thể biết khoảng tin cậy thực sự, nhưng Bootstrap không chính xác hơn về mặt đối xứng so với các khoảng tiêu chuẩn thu được bằng phương sai mẫu và các giả định về tính quy tắc. Bootstrapping cũng là một phương pháp thuận tiện để tránh chi phí lặp lại thí nghiệm để có được các nhóm dữ liệu mẫu khác.

Khi nào tôi nên sử dụng Phương pháp Bootstrap?

Phương pháp Bootstrap là một kỹ thuật lấy mẫu lại được sử dụng để ước tính số liệu thống kê về dân số bằng cách lấy mẫu bộ dữ liệu với sự thay thế. Nó có thể được sử dụng để ước tính số liệu thống kê tóm tắt như trung bình hoặc độ lệch chuẩn.to estimate statistics on a population by sampling a dataset with replacement. It can be used to estimate summary statistics such as the mean or standard deviation.

Trong những trường hợp nào nên sử dụng bootstrapping?

Hãy nhớ rằng bootstrapping không chỉ hữu ích để tính toán các lỗi tiêu chuẩn, nó cũng có thể được sử dụng để xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết. Vì vậy, hãy chắc chắn có các kỹ thuật bootstrapping khi bạn phải đối mặt với dữ liệu dường như không thể thực hiện được với các kỹ thuật truyền thống.when you are faced with data that doesn't appear to be workable with traditional techniques.

Tại sao bootstrapping được sử dụng chỉ số?

Bootstrapping là một quy trình thống kê ghép lại một bộ dữ liệu duy nhất để tạo ra nhiều mẫu mô phỏng.Quá trình này cho phép bạn tính toán các lỗi tiêu chuẩn, xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết cho nhiều loại thống kê mẫu.allows you to calculate standard errors, construct confidence intervals, and perform hypothesis testing for numerous types of sample statistics.

Khi nào bạn không nên sử dụng bootstrapping?

Nó không thực hiện hiệu chỉnh sai lệch, vv Không có cách chữa trị cho cỡ mẫu nhỏ.Bootstrap rất mạnh mẽ, nhưng nó không phải là phép thuật - nó chỉ có thể hoạt động với thông tin có sẵn trong mẫu ban đầu.Nếu các mẫu không đại diện cho toàn bộ dân số, thì bootstrap sẽ không chính xác lắm.If the samples are not representative of the whole population, then bootstrap will not be very accurate.