Hướng dẫn when to use bootstrap confidence interval - khi nào sử dụng khoảng tin cậy bootstrap

Sampling from Populations

In a typical scientific experiment, we are interested in two populations (Control and Test), and whether there is a difference between their means (µTest - µControl).

Nội dung chính Show

Sampling from Populations
Giới thiệu khoảng tin cậy bootstrap
Bootstrap trong hành động
Điều chỉnh các phân phối tái tạo không đối xứng
Các lô ước tính kết hợp lấy lại Bootstrap
Giới thiệu
Phương pháp khoảng tin cậy bootstrap
Phương pháp bootstrap phần trăm
Phương pháp bootstrap được điều chỉnh và tăng tốc sai lệch
Phương pháp t bootstrap của sinh viên
Thiết kế mô phỏng
Tiêu chí đánh giá
Kết quả
Tải cho các chỉ số phân phối bình thường
Tải cho các chỉ số phân phối không bình thường
Các hệ số đường dẫn với các chỉ số phân phối bình thường
Path Coefficients With Non-normally Distributed Indicators
Tuyên bố sẵn có dữ liệu
Sự đóng góp của tác giả
Xung đột lợi ích
Tài liệu bổ sung
Chú thích
Người giới thiệu
Mục đích của khoảng tin cậy bootstrap là gì?
Khi nào bạn sẽ sử dụng lấy mẫu bootstrap?
Chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?
Khi nào bạn nên bootstrap thống kê?

We go about this by collecting observations from the control population, and from the test population.

We can easily compute the mean difference in our observed samples. This is our estimate of the population effect size that we are interested in.

But how do we obtain a measure of precision and confidence about our estimate? Can we get a sense of how it relates to the population mean difference?

Giới thiệu khoảng tin cậy bootstrap

Chúng tôi muốn có được khoảng tin cậy 95% (95% CI) xung quanh ước tính của chúng tôi về sự khác biệt trung bình. 95% chỉ ra rằng bất kỳ khoảng tin cậy nào như vậy sẽ nắm bắt được sự khác biệt trung bình dân số 95% của thời gian11 nói cách khác, nếu chúng ta lặp lại thí nghiệm của mình 100 lần, thu thập 100 bộ quan sát độc lập và tính toán CI 95% cho sự khác biệt trung bình mỗi Thời gian, 95 trong số các khoảng tin cậy này sẽ thu được sự khác biệt trung bình dân số .. nghĩa là, chúng ta có thể tự tin 95% khoảng thời gian chứa trung bình thực sự của dân số.95% confidence interval (95% CI) around the our estimate of the mean difference. The 95% indicates that any such confidence interval will capture the population mean difference 95% of the time11 In other words, if we repeated our experiment 100 times, gathering 100 independent sets of observations, and computing a 95% CI for the mean difference each time, 95 of these confidence intervals would capture the population mean difference.. That is to say, we can be 95% confident the interval contains the true mean of the population.

Chúng ta có thể tính toán CI 95% của chênh lệch trung bình bằng cách thực hiện lấy mẫu Bootstrap.

Bootstrap trong hành động

Bootstrap22 Tên có nguồn gốc từ câu nói của mình bởi một người bootstraps, thường được sử dụng như một sự hô hào để đạt được thành công mà không cần sự giúp đỡ bên ngoài. là một kỹ thuật đơn giản nhưng mạnh mẽ. Nó được mô tả đầu tiên bởi Bradley Efron.2 The name is derived from the saying “pull oneself by one’s bootstraps”, often used as an exhortation to achieve success without external help. is a simple but powerful technique. It was first described by Bradley Efron.

Khi nào bạn sẽ sử dụng lấy mẫu bootstrap?

Chúng ta có sử dụng bootstrap để xây dựng khoảng tin cậy không?

Bootstrap là một phương pháp để ước tính các lỗi tiêu chuẩn và khoảng tin cậy tính toán. Bootstrapping bắt đầu vào năm 1970 bởi Bradley Efron; Nó đã tồn tại hơn 40 năm, vì vậy nhiều loại và phương pháp bootstrapping khác nhau đã được phát triển kể từ đó.
Khi nào bạn nên bootstrap thống kê?

Điều chỉnh các phân phối tái tạo không đối xứng

Mặc dù việc lấy mẫu lại phân phối của sự khác biệt về phương tiện thường có phân phối bình thường, nhưng không có gì lạ khi gặp phân phối sai lệch. Do đó, Efron đã phát triển Bootstrap được điều chỉnh và tăng tốc độ lệch (BCA Bootstrap) để giải thích cho độ lệch và vẫn có được 95% trung tâm của phân phối. Dabest áp dụng hiệu chỉnh BCA cho các phân phối bootstrap lấy mẫu lại của kích thước hiệu ứng.

Các lô ước tính kết hợp lấy lại Bootstrap

Biểu đồ ước tính được tạo ra bởi dabest trình bày RawData và khoảng tin cậy bootstrap của kích thước hiệu ứng (sự khác biệt về phương tiện) cạnh nhau như một biểu đồ tích hợp duy nhất. Do đó, nó kết hợp chặt chẽ sự trình bày trực quan của dữ liệu thô với một dấu hiệu của sự khác biệt trung bình dân số và khoảng tin cậy của nó.

Giới thiệu

Phân tích thành phần có cấu trúc tổng quát (GSCA; Hwang và Takane, 2004, 2014) là một cách tiếp cận mô hình phương trình cấu trúc dựa trên thành phần (SEM), trong đó các cấu trúc được biểu diễn bằng vật liệu tổng hợp hoặc các thành phần của các chỉ số (các biến quan sát; 2012). Kể từ khi Hwang và Takane (2004) công trình tinh dịch, khả năng phân tích dữ liệu của GSCA đã được cải thiện rõ rệt cho phép các nhà nghiên cứu ứng dụng, ví dụ, xử lý tính không đồng nhất của người trả lời ở cấp độ cụm (Hwang et al., 2007a), mô hình hóa đa cấp (Hwang et Al., 2007b; Jung et al., 2016), Hiệu ứng kiểm duyệt của các cấu trúc (Hwang et al., 2010), và dữ liệu theo chiều dọc và chuỗi thời gian/dữ liệu chức năng (Jung et al., 2012, 2016; Suk và Hwang, 2016 ).

GSCA sử dụng thuật toán bình phương tối thiểu thay thế (De Leeuw et al., 1976) để giảm thiểu hàm bình phương nhỏ nhất để ước tính tham số mà không yêu cầu các giả định phân phối như tính quy tắc đa biến. Vì vậy, nó là một cách tiếp cận không phân phối. Tuy nhiên, như một sự đánh đổi, nó không thể ước tính các lỗi tiêu chuẩn hoặc khoảng tin cậy của các ước tính tham số của nó dựa trên xấp xỉ tiệm cận (lý thuyết bình thường) (Hwang và Takane, 2014, trang 24 .2525). Thay vào đó, nó sử dụng phương pháp bootstrap (Efron, 1982) để có được các lỗi tiêu chuẩn và khoảng tin cậy không theo phương pháp. Trong bước đầu tiên, các mẫu ngẫu nhiên có kích thước N (bằng kích thước của tập dữ liệu gốc) được lấy mẫu liên tục từ tập dữ liệu gốc bằng cách thay thế. Trong bước thứ hai, các tham số được ước tính bằng cách sử dụng từng mẫu bootstrap. Cuối cùng, các lỗi tiêu chuẩn và khoảng tin cậy được lấy từ phân phối tần số tương đối của các ước tính so với các mẫu được coi là một xấp xỉ thực nghiệm của phân phối lấy mẫu của nó. Các lỗi tiêu chuẩn và khoảng tin cậy bootstrap có thể được sử dụng để kiểm tra ý nghĩa thống kê của các ước tính tham số. Ví dụ, một thống kê bootstrap t, còn được gọi là tỷ lệ tới hạn (CR), có thể được tính bằng cách chia ước tính tham số cho lỗi tiêu chuẩn bootstrap của nó. Nếu giá trị bootstrap t bằng hoặc lớn hơn giá trị tới hạn của phân phối T, ước tính tham số được coi là có ý nghĩa thống kê ở mức alpha danh nghĩa theo giả định rằng phân phối lấy mẫu thực nghiệm của tham số xấp xỉ T. GSCA hiện cung cấp khoảng tin cậy phần trăm (Kim et al., 2017; Hwang et al., 2019). Khoảng tin cậy (CI) được định nghĩa là khoảng giữa giới hạn dưới và trên của ước tính tham số ở mức độ tin cậy được chỉ định trước (ví dụ: khoảng tin cậy 95%). Việc sử dụng các CI phần trăm được khuyến nghị qua các tỷ lệ quan trọng vì các CI phần trăm cung cấp thêm thông tin về các thuộc tính của các ước tính tham số, bao gồm cả độ chính xác và ý nghĩa thống kê mà không có giả định quy tắc của các ước tính (Efron, 1982).

Gần đây, CI đã được sửa đổi và tăng tốc (BCA) đã được đề xuất để sử dụng với mô hình đường dẫn bình phương nhỏ nhất một phần (Hair et al., 2016, trang 155 Chuyện159), một cách tiếp cận khác đối với SEM dựa trên thành phần (Wold, 1982 ). Gần đây, Aguirre-Alreta và Rönkkö (2018) đã thực hiện một nghiên cứu mô phỏng nghiêm ngặt và cho thấy rằng, về tổng thể, phương pháp phần trăm có xu hướng tạo ra các cis bảo thủ hơn Tiết kiệm (tức là, CIS hẹp hơn). Tuy nhiên, nghiên cứu này đã khuyến nghị sử dụng phương pháp phần trăm so với phương pháp BCA cho mô hình đường dẫn bình phương nhỏ nhất một phần vì giá trị dân số thường không đủ bởi BCA CIS. Chưa có nghiên cứu nào điều tra hiệu suất của các phương pháp CI Bootstrap cho GSCA. Do đó, trong nghiên cứu này, chúng tôi thực hiện phương pháp BCA CI thành GSCA và tiến hành mô phỏng nghiêm ngặt để kiểm tra hiệu suất của các phương pháp CI bootstrap khác nhau cho GSCA, bao gồm các phương pháp Tỷ lệ phần trăm, BCA và sinh viên.

Tổ chức của bài viết như sau: Chúng tôi bắt đầu bằng cách cung cấp một mô tả về các phương thức CI Bootstrap khác nhau. Sau đó, chúng tôi thảo luận về quy trình thiết kế và phân tích của nghiên cứu mô phỏng Monte Carlo của chúng tôi và báo cáo kết quả của nó. Phần cuối cùng tóm tắt những phát hiện và ý nghĩa của nghiên cứu cũng như thảo luận về những hạn chế và hướng dẫn của nó cho nghiên cứu trong tương lai.

Phương pháp khoảng tin cậy bootstrap

Như đã nói, chúng tôi tập trung vào ba phương pháp CI bootstrap phổ biến nhất trong thực tế: phần trăm, CI được điều chỉnh và tăng tốc thiên vị, và Student T (Efron và Tibshirani, 1993; Chernick, 2011).

Phương pháp bootstrap phần trăm

Khoảng thời gian bootstrap phần trăm chỉ là khoảng giữa phần trăm 100 × (α2) và 100 × (1-α2) của phân phối θ ước tính thu được từ việc lấy mẫu lại, trong đó θ đại diện cho một tham số quan tâm và α là mức độ quan trọng (ví dụ: , α = 0,05 cho 95% CIS) (Efron, 1982). Một CI phần trăm bootstrap của θ^ (một công cụ ước tính θ) có thể thu được như sau: (1) b Các mẫu bootstrap ngẫu nhiên được tạo ra, (2) Một ước tính tham số được tính từ mỗi mẫu bootstrap, (3) được đặt hàng từ thấp nhất đến cao nhất và (4) CI được xây dựng như sau,

[θ^Lower & nbsp; giới hạn, & nbsp; θ^trên & nbsp; giới hạn] = [θ^j*, & nbsp; θ^k*],

trong đó θ^j* biểu thị lượng tử thứ j (giới hạn dưới) và θ^k* biểu thị lượng tử thứ k (giới hạn trên); j = [α2 × b], & nbsp; k = [(1-α 2) × b]. Ví dụ, CI bootstrap 95% với 1.000 mẫu bootstrap là khoảng giữa giá trị lượng tử thứ 25 và giá trị lượng tử thứ 955 của ước tính tham số 1.000 bootstrap.

Phương pháp bootstrap được điều chỉnh và tăng tốc sai lệch

Để khắc phục các vấn đề quá mức trong phần trăm bootstrap cis (Efron và Tibshirani, 1993), phương pháp BCA sửa chữa cho cả sai lệch và độ lệch của tham số bootstrap ước tính bằng cách kết hợp yếu tố điều chỉnh sai lệch và yếu tố tăng tốc (Efron, 1987; , 1993). Hệ số điều chỉnh sai lệch ẑ0 được ước tính là tỷ lệ của ước tính bootstrap nhỏ hơn ước tính tham số ban đầu θ^,

trong đó φ 1 là hàm nghịch đảo của hàm phân phối tích lũy bình thường tiêu chuẩn (ví dụ: 1 (0,975) = 1,96). Yếu tố gia tốc được ước tính thông qua việc lấy mẫu jackknife (tức là, Rời khỏi một lần lấy mẫu ra khỏi), bao gồm việc tạo n lần lặp lại mẫu ban đầu, trong đó n là số lượng quan sát trong mẫu. Bản sao jackknife đầu tiên thu được bằng cách bỏ trường hợp đầu tiên (i = 1) của mẫu ban đầu, mẫu thứ hai bằng cách bỏ trường hợp thứ hai (i = 2), v.v. . Đối với mỗi mô hình của Jackknife, θ^(-i) thu được. Trung bình của các ước tính này là,

Sau đó, hệ số gia tốc Â được tính toán như sau,

â = ∑i = 1n (θ^(·) -θ^(-i)) 36 & nbsp; {∑i = 1n (θ^(·) -θ^(-i)) 2 & nbsp;} 3/2.

Với các giá trị của ẑ0 và Â, các giá trị α1and α2 được tính toán,

α1 = {0+0+& nbsp; z (α/2) 1 -â (ẑ0+& nbsp; z (α/2))} α2 = {ẑ0+0+& nbsp; Z (1-α/2) 1 -Â (ẑ0+& nbsp; z (1-α/2))}

Ở đây, Z (α/2) là điểm phần trăm thứ 100 × (α2) của phân phối bình thường tiêu chuẩn (ví dụ: Z (.05/2) = −1.96). Sau đó, một ci [θ^j*, & nbsp;

Phương pháp t bootstrap của sinh viên

Phương thức t của học sinh giả định rằng θ^ Bootstrap Student T CI cho một cấp độ alpha nhất định (ví dụ: α = 0,05 cho 95% CI) được xây dựng như sau,

[θ^-tn-1 (a2) · se^, & nbsp;

Lỗi tiêu chuẩn bootstrap của mỗi ước tính, se^(θ^*), được sử dụng cho se^. Lưu ý rằng khoảng tin cậy T của sinh viên không có tính năng nào để điều chỉnh khoảng tin cậy, chiếm bất kỳ loại sai lệch nào khác từ phân phối T.

Thiết kế mô phỏng

Chúng tôi đánh giá hiệu suất của ba phương pháp bootstrap (phần trăm, BCA và sinh viên T) trong GSCA, sử dụng mô phỏng Monte Carlo. Hình 1 mô tả bố cục cấu trúc của mô hình tạo dữ liệu (nghĩa là mô hình dân số), trước đây cũng được sử dụng trong Cho et al. (2019) 1. Mô hình cấu trúc chứa bốn biến tiềm ẩn ngoại sinh và hai biến nội sinh2 và một vài đường hồi quy được chỉ định giữa chúng với các giá trị hệ số đường dẫn từ .70,75 đến 0,55. Phương sai của các biến tiềm ẩn nội sinh được giải thích bởi các biến tiềm ẩn ngoại sinh (R2) là 0,168 cho γ5 và 0,383 cho γ6. Phần đo của mô hình dân số (tức là mô hình đo lường) là đồng nhất cho các biến tiềm ẩn. Đó là, mỗi biến tiềm ẩn có ba chỉ số trong đó tải tiêu chuẩn hóa là 0,7, 0,8 hoặc 0,9. Lưu ý rằng các ký hiệu cho các thuật ngữ lỗi trong các mô hình đo và cấu trúc được bỏ qua trong hình cho sự đơn giản.

Hướng dẫn when to use bootstrap confidence interval - khi nào sử dụng khoảng tin cậy bootstrap

Hình 1. Mô hình phương trình cấu trúc dân số được chỉ định cho nghiên cứu mô phỏng.. The population structural equation model specified for the simulation study.

Chúng tôi đã xem xét hai phân phối khác nhau cho các chỉ số được phân phối theo phương pháp thông thường với phương sai trung bình và đơn vị không phân phối không bình thường thông qua chuyển đổi logn bình thường của các chỉ số phân phối thông thường. Đối với các chỉ số phân phối không bình thường, các biến thể ngẫu nhiên thông thường độc lập đã được tạo ra và chúng được chuyển thành các biến thể ngẫu nhiên lognatural bằng cách sử dụng, và sau đó các biến thể ngẫu nhiên được thao tác này đã được tiêu chuẩn hóa. Cấu trúc tương quan mong muốn thu được bằng cách nhân ma trận dữ liệu với yếu tố cholesky của ma trận hiệp phương sai được chỉ định trước (Ringle et al., 2014). Đối với các chỉ số không bình thường, độ lệch trung bình dao động từ 1,41 đến 2,53 và kurtosis trung bình dao động từ 6,32 đến 18,28. Lưu ý rằng độ lệch và kurtosis của phân phối bình thường lần lượt là 0 và 3. Chúng tôi cũng đã xem xét bốn cỡ mẫu khác nhau: n = 50, 100, 200 và 500. Năm trăm mẫu ngẫu nhiên được rút ra trong mỗi tám điều kiện (hai phân phối × bốn cỡ mẫu), mang lại tổng cộng 4.000 lần lặp lại. Chúng tôi đã áp dụng GSCA để phù hợp với mô hình cho từng mẫu và sau đó, đã thu được tỷ lệ phần trăm, BCA và T cis của sinh viên về ước tính hệ số tải và đường dẫn dựa trên 1.000 mẫu bootstrap (b = 1.000). Cụ thể, chúng tôi đã sửa đổi gói Gesca R (Hwang et al., 2016; R Core Team, 2017) với các chức năng R mới của các phương thức Bootstrap. Các mã MATLAB được sử dụng để tạo dữ liệu và các hàm R cho ba tính toán CI có sẵn dưới dạng tài liệu bổ sung. Xem thêm Cho et al. (2019) và Dijkstra (2017) để biết thêm chi tiết về quy trình tạo dữ liệu của SEM dựa trên thành phần. Không có trường hợp nào về mô hình không chuyển đổi hoặc giải pháp không thể chấp nhận được trong mô phỏng hiện tại.

Tiêu chí đánh giá

Chúng tôi đã đánh giá hai tính chất của CI trong mô phỏng: (a) phạm vi bảo hiểm và (b) số dư (Aguirre-Aurreta và Rönkkö, 2018). Độ bao phủ của CI là tỷ lệ giá trị tham số được bao gồm trong CI trên các mẫu được sao chép. Giá trị bảo hiểm phải gần với mức độ tin cậy được xác định trước của khoảng thời gian. Ví dụ, lý tưởng nhất là 95% CI (phạm vi bảo hiểm danh nghĩa) nên bao gồm tham số quan tâm 95% thời gian so với các bản sao. Nói cách khác, trong 5% các bản sao, khoảng thời gian sẽ không nắm bắt được giá trị tham số thực sự của người dùng trong dân số.

Sự cân bằng của một CI đề cập đến cách phân chia không bao phủ. Đó là, bao nhiêu lần giá trị dân số lớn hơn giới hạn trên của khoảng và bao nhiêu lần giá trị dân số nhỏ hơn giới hạn thấp hơn của khoảng. Trong một tình huống lý tưởng, CI nên được cân bằng sao cho giá trị dân số lớn hơn giới hạn trên hoặc nhỏ hơn giới hạn dưới cùng với cùng một số lần lặp lại (ví dụ: 2,5% lần đối với CI 95%), trong khi đạt được mức độ bảo hiểm mong muốn.

Kết quả

Phần này cung cấp kết quả của nghiên cứu mô phỏng, hiển thị một loạt các ô cho thấy hiệu suất của ba phương pháp Bootstrap CI về độ bao phủ và cân bằng trung bình trên sáu biến tiềm ẩn. Trong các ô này, trục x biểu thị kích thước mẫu (n = 50, 100, 200, 500) và trục y Tỷ lệ tải (0,7, 0,8, 0,9) hoặc hệ số đường dẫn (−0,75, .250,25,----- 0,2, −0,15, 0,35, 0,55) trên giới hạn trên hoặc dưới giới hạn dưới của CI. Đối với CI 95%, điều này không nên xảy ra quá 5%. Hơn nữa, giá trị tham số dự kiến sẽ ở trên (bên dưới) giới hạn trên (dưới) của CI theo cách cân bằng. Đường đứt ngang ngang cho biết phạm vi bảo hiểm lý thuyết của CI 95% cân bằng hoàn hảo. Do đó, dòng càng gần một phương thức CI bootstrap đến các đường đứt nét, phương pháp cụ thể càng gần với phạm vi bảo hiểm và sự cân bằng lý tưởng mà CI nên thể hiện.

Tải cho các chỉ số phân phối bình thường

Hình 2 cho thấy mức độ bao phủ và số dư của tỷ lệ phần trăm, BCA và 95% TCTT của sinh viên của các tải trọng từ 0,7 đến 0,9 dưới các phân phối bình thường. Trong trường hợp tải 0,9, mỗi phương pháp được tạo ra các CI bao gồm giá trị dân số này hơn 95% thời gian, ngụ ý phạm vi bảo hiểm rộng hơn bảo thủ với mức ít hơn tỷ lệ lỗi 5% danh nghĩa. Các kết quả tương tự đã được tìm thấy trong điều kiện tải 0,8, ngoại trừ một mẫu nhỏ (n = 50). Khi tải là 0,7, T cis của sinh viên đã loại trừ giá trị dân số này hơn 5% thời gian nếu chúng được xây dựng bằng một mẫu nhỏ (n = 100). Đối với một mẫu lớn hơn (tức là,> 200), về tổng thể, mỗi phần trăm, BCA và T Cis của học sinh cách xa mức độ bao phủ mong muốn (thấp hơn đường nét ngang ngang ở mức 5%), cho thấy các CIS rộng hơn của θ ^. Xu hướng này trở nên lớn hơn khi kích thước tải trở nên lớn hơn. Nói chung, phương pháp phần trăm tạo ra phạm vi bảo hiểm tốt hơn trong CIS (nghĩa là, gần với đường nét ngang ngang) so với hai phương pháp khác.

Hình 2. Độ bao phủ và sự cân bằng của phần trăm, độ lệch được điều chỉnh và tăng tốc bootstrap (BCA) và khoảng tin cậy T 95% của sinh viên (CIS) là 0,7, 0,8 và 0,9 tải cho các chỉ số thông thường.. The coverage and balance of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of 0.7, 0.8, and 0.9 loadings for normal indicators.

Tất cả ba phương pháp bootstrap có xu hướng thay đổi CIS của chúng lên trên và sự dịch chuyển như vậy là có vấn đề đặc biệt với các tải trọng nhỏ hơn (0,7, 0,8) và kích thước mẫu nhỏ hơn (n = 50, 100). Do đó, CIS bị mất cân bằng sao cho giới hạn dưới lớn hơn giá trị dân số thường xuyên hơn mong muốn (2,5%), trong khi giới hạn trên nhỏ hơn giá trị dân số ít thường xuyên hơn mong muốn (2,5%). Đối với việc tải 0,7, số dư trong CIS được cải thiện khi kích thước mẫu tăng lên (tức là, gần hơn với mức danh nghĩa là 2,5%). Trong các điều kiện tải 0,9 và kích thước mẫu> 100, giá trị dân số nhỏ hơn giới hạn thấp hơn hoặc lớn hơn giới hạn trên ít hơn so với mong muốn chủ yếu do độ bao phủ tăng cao (tức là,> 95%) . Nhìn chung, phạm vi bảo hiểm mất cân bằng và tăng cao đã được quan sát trên tất cả các phương pháp.

Tải cho các chỉ số phân phối không bình thường

Hình 3 trình bày phạm vi bảo hiểm và số dư của tỷ lệ phần trăm, BCA và TCT TCT 95% của sinh viên là 0,7, 0,8 và 0,9 tải cho các chỉ số phân phối không bình thường. Kết quả tương tự như các kết quả có các chỉ số phân phối bình thường, cho thấy rằng việc phân phối các chỉ số có ít tác động đến các cis bootstrap của tải. Hơn 95% thời gian, giá trị dân số được bao gồm trong các TCTD bất kể kích thước tải, và tỷ lệ này trở nên lớn hơn khi kích thước mẫu tăng lên. Nói chung, phạm vi bảo hiểm có thể so sánh giữa ba phương pháp, mặc dù tỷ lệ phần trăm và T CIS của học sinh gần với cấp độ danh nghĩa hơn so với BCA CIS trong trường hợp tải nhỏ hơn (0,7, 0,8). Nói chung, phương pháp phần trăm tạo ra phạm vi bảo hiểm tốt hơn trong CIS so với hai phương pháp khác.

Hình 3. Độ bao phủ và sự cân bằng của phần trăm, bootstrap được điều chỉnh và tăng tốc (BCA) và khoảng tin cậy T 95% của sinh viên (CIS) là 0,7, 0,8 và 0,9 tải cho các chỉ số không phân phối thông thường.. The coverage and balance of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of 0.7, 0.8, and 0.9 loadings for non-normally distributed indicators.

CIS của mỗi phương pháp được chuyển hướng lên đặc biệt là khi tải tương đối nhỏ (0,7, 0,8) được ước tính với một mẫu nhỏ (n = 50, 100). Trong các điều kiện của 0,7 tải và kích thước mẫu lớn hơn (n = 200, 500), giới hạn thấp hơn của CIS gần với phạm vi bảo hiểm lý thuyết nếu được so sánh, gần với mức mong muốn hơn (2,5%) theo tỷ lệ phần trăm và học sinh của học sinh Ph phương pháp. Đối với 0,9 tải, các TCTD rộng (tức là, độ bao phủ tăng cao đạt tới 100%) để giá trị dân số nhỏ hơn giới hạn dưới hoặc lớn hơn giới hạn trên ít hơn ít hơn so với mong muốn (2,5%). Nhìn chung, sự cân bằng trong CIS không khác biệt đáng kể giữa ba phương pháp.

Các hệ số đường dẫn với các chỉ số phân phối bình thường

Kết quả mô phỏng cho các hệ số đường dẫn tương tự nhau hơn giữa các giá trị tải khác nhau (0,7, 0,8, 0,9), cho thấy kích thước tải có ảnh hưởng tối thiểu đến các CIS bootstrap. Do đó, kết quả được tổng hợp trong ba điều kiện tải dân số và kết quả tổng hợp được báo cáo ở đây. Một phạm vi đầy đủ của kết quả mô phỏng sẽ có sẵn theo yêu cầu.

Hình 4 trình bày phạm vi bảo hiểm của phần trăm, BCA và T 95% của các hệ số đường dẫn của học sinh ở kích thước khác nhau (.70,75, .250,25, −0,20, −0,15, 0,35, 0,55). Đầu tiên, phương pháp phần trăm được tạo ra rõ ràng phạm vi bảo hiểm tốt hơn trong CIS (nghĩa là, gần với đường nét ngang ngang hơn) so với hai phương pháp khác, bất kể kích thước của các hệ số đường dẫn nhưng ngoại trừ hệ số đường dẫn lớn nhất (.70,75). Thứ hai, các phương pháp T của BCA và sinh viên đã tạo ra các CIS rộng hơn mức độ bao phủ mong muốn và xu hướng này rõ ràng hơn khi giá trị tuyệt đối của hệ số đường dẫn tăng lên. Thứ ba, CIS trở nên rộng hơn (tức là độ che phủ tăng cao) khi kích thước mẫu tăng lên. Nhìn chung, các CI phần trăm gần với phạm vi bảo hiểm lý thuyết so với hai phương pháp khác.

Hình 4. Độ bao phủ của phần trăm, bootstrap được điều chỉnh và tăng tốc (BCA) và khoảng tin cậy (CIS) của sinh viên (CIS) của các hệ số đường dẫn trong điều kiện chỉ báo thông thường.. The coverage of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of path coefficients in the normal indicator condition.

Hình 5, 6 cho thấy các CIS của các hệ số đường dẫn từ nhỏ đến trung bình (−0,25,. . Ngược lại, đối với các hệ số đường dẫn tương đối lớn (−0,75, 0,55), giá trị dân số nhỏ hơn mức thấp hơn hoặc lớn hơn giới hạn trên ít hơn ít hơn so với mong muốn. Nhìn chung, phương pháp BCA ít bị mất cân bằng hơn so với các phương pháp T tỷ lệ phần trăm và học sinh.

Figure 5. The lower limits of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of path coefficients in the normal indicator condition.

Figure 6. The upper limits of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of path coefficients in the normal indicator condition.

Path Coefficients With Non-normally Distributed Indicators

Figure 7 presents the coverage of percentile, BCa, and Student's t 95% CIs of path coefficients when the indicators were non-normally distributed. The results were somewhat different from what we found with normally distributed indicators. Specifically, the CIs of each method were still close to the theoretical coverage range (95%) when the population value of path coefficients was relatively small to moderate (−0.25, −0.20, −0.15), whereas the CIs that included the population value of large path coefficients (−0.75, 0.35, 0.55) had much wider CIs (i.e., much more than 95% of time). Such inflation in coverage worsened as sample size increased. For instance, when path coefficient was −0.75 and sample size was >100, all three methods produced CIs that included the population value almost always over replications. Nevertheless, overall, the percentile CIs were less sensitive to the population value and sample size, showing closer to the nominal level of 95%, compared to the other two methods.

Figure 7. The coverage of percentile, BCa, and Student's t 95% CIs of path coefficients in the non-normally distributed indicator condition.

Figures 8, 9 show that the CIs of small to moderate path coefficients (−0.25, −0.20, −0.15) were shifted slightly downward—i.e., the lower limit was lower than the desired level (2.5%), and the upper limit was higher than the desired level (2.5%). The balance somewhat improved as sample size increased (i.e., closer to the nominal level of 2.5%). In contrast, for relatively large path coefficients (−0.75, 0.55), the population value was smaller than the lower limit or greater than the upper limit many fewer times than would be desired, probably due to the inflated coverage (i.e., wide CI) observed earlier. Similar to the findings in the normal indicator condition, the BCa method was less prone to imbalance than the percentile and Student's t methods.

Figure 8. The lower limits of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of path coefficients in the non-normally distributed indicator condition.

Figure 9. The upper limits of percentile, bias-corrected and accelerated bootstrap (BCa), and Student's t 95% confidence intervals (CIs) of path coefficients in the non-normally distributed indicator condition.

Discussion

The present study successfully implemented percentile, BCa, and Student's t CI methods into GSCA, further exploring the capability of statistical inference with GSCA, and investigated the performance of the different bootstrap methods in terms of coverage and balance of their CIs. A number of important findings emerged from our simulation work. First, the distribution of indicators had little impact on the bootstrap CIs of a loading. Second, all three methods produced wider CIs that included the population loading value more frequently than would be desired. Such inflation in coverage was greater when the CIs were constructed with a larger sample. Third, the CIs of a loading were shifted upward, causing imbalance of CIs. Fourth, the size of indicator loadings did little to affect the bootstrap CIs of a path coefficient, but the distribution of indicators had substantial impact, yielding fairly different performances of the CIs. When the indicators were normally distributed, the percentile CIs produced closer to the theoretical coverage range as compared to BCa and Student's t CIs, while the CIs of the BCa method were better balanced than the other two methods. When the indicators were non-normal rather than normal, the CIs of each method included the population value of large path coefficients more often than would be desired (i.e., inflated coverage), while the CIs of small path coefficients showed ideal levels of coverage and balance. Lastly, the coverage of percentile CIs was less sensitive to the population value and sample size than BCa CIs and Student's t CIs, while the BCa method was less prone to imbalance than the other two methods.

Các phát hiện nghiên cứu hiện tại có ý nghĩa quan trọng đối với các nhà nghiên cứu trong các lĩnh vực suy luận thống kê thực sự sử dụng bootstrap cis trong GSCA. Sự lựa chọn trên các phương pháp CI khác nhau nên được xem xét cẩn thận, đặc biệt là khi cỡ mẫu nhỏ (ví dụ: 50 hoặc 100). Kết quả kích thích của chúng tôi cho thấy sự vượt trội của phương pháp phần trăm so với cả BCA và sinh viên đối với phạm vi bảo hiểm mong muốn của CIS. Phương pháp BCA có xu hướng tạo ra các CI cân bằng tốt hơn một chút so với hai phương pháp khác, nhưng nhìn chung, nó bị phá hoại do các CI hẹp hơn so với mức độ bao phủ mong muốn. Đối với nghiên cứu thực nghiệm, hiệu quả tính toán của ba phương pháp cũng sẽ được xem xét. Phương pháp phần trăm hiệu quả hơn về tốc độ tính toán so với phương pháp BCA vì phương pháp sau có các bước tính toán bổ sung cho các tham số của tăng tốc và hiệu chỉnh sai lệch. Một thuật toán hiệu quả được mong muốn, đặc biệt là trong các tình huống trong đó các giải pháp phải được lấy nhiều lần, như nghiên cứu mô phỏng hiện tại. Do đó, chúng tôi sẽ đề xuất việc áp dụng phương pháp phần trăm như một quy trình tiêu chuẩn cho GSCA do phạm vi bảo hiểm CI tốt hơn ở cấp độ danh nghĩa và hiệu quả tính toán của nó.

Các nghiên cứu trong tương lai sẽ mở rộng phạm vi mô phỏng hiện tại sang các phương pháp ước tính GSCA khác và các mô hình GSCA nâng cao khác nhau để so sánh giữa các phương pháp CI khác nhau. Một hướng cho các nghiên cứu trong tương lai là so sánh các phương pháp CI bootstrap khác nhau trong việc mở rộng GSCA (RGSCA; Hwang, 2009) thường xuyên, kết hợp một loại chính quy hóa thành GSCA trong một khung thống nhất, do đó xử lý các vấn đề đa chiền tiềm ẩn hiệu quả hơn. Trong một nghiên cứu mô phỏng, RGSCA đã được tìm thấy để cung cấp các ước tính tham số tốt như hoặc tốt hơn so với các ước tính từ GSCA ban đầu trong các điều kiện khác nhau của dữ liệu được phân phối thông thường. Hơn nữa, chúng tôi cũng có thể xem xét một nghiên cứu mô phỏng để so sánh các phương pháp CI trong GSCA với các thuật ngữ duy nhất để điều chỉnh lỗi đo lường (GSCAM; Hwang et al., 2017), đã được đề xuất để mở rộng GSCA ban đầu để giải thích các lỗi trong các chỉ số rõ ràng. Phần mở rộng này dự tính cả các phần phổ biến và duy nhất của các chỉ số và ước tính một tổng hợp các chỉ số có trọng số với các phần độc đáo của chúng bị loại bỏ. Không giống như GSCA ban đầu, GSCAM có phương pháp sửa sai, xử lý các lỗi đo lường trong các chỉ số. Do đó, sẽ được đảm bảo để xem xét mô phỏng Monte Carlo về hiệu suất tương đối của các phương pháp CI khác nhau với GSCAM cũng như RGSCA.

Một hướng khác cho các nghiên cứu trong tương lai là so sánh các phương pháp CI khác nhau trong một loạt các điều kiện và mô hình để điều tra nghiêm ngặt hơn. Cụ thể, cần phải kiểm tra hiệu suất tương đối của từng phương pháp CI với các mô hình biến thể GSCA như GSCA mờ trong cụm để xử lý sự không đồng nhất của người cấp cấp cụm, GSCA đa cấp Dữ liệu chuỗi thời gian (Hwang và Takane, 2014). Nghiên cứu hiện tại tập trung vào mức độ tin cậy 95% và kích thước mẫu ≤ 500 vì chúng thường gặp nhất trong thực tế. Nghiên cứu trong tương lai về việc sử dụng các mức độ tin cậy khác nhau và các mẫu lớn hơn (ví dụ: 1.000 ,3.000) cũng được bảo đảm để cung cấp ý nghĩa thực tế hơn cho nghiên cứu ứng dụng. Những nghiên cứu nghiêm ngặt này trong khung mô hình nâng cao sẽ cung cấp cho các nhà nghiên cứu ứng dụng thông tin về phương pháp CI nào sẽ tốt hơn trong các điều kiện và mô hình thử nghiệm khác nhau. Điều này sẽ xác định lợi ích tương đối của từng phương pháp CI.

Tuyên bố sẵn có dữ liệu

Mã MATLAB để tạo dữ liệu có sẵn trong tài liệu bổ sung.

Sự đóng góp của tác giả

KJ, JL và VG đã đóng góp cho phát triển kỹ thuật, phân tích thực nghiệm và viết bản thảo. GC đã đóng góp cho phát triển kỹ thuật và viết bản thảo.

Xung đột lợi ích

Các tác giả tuyên bố rằng nghiên cứu được thực hiện trong trường hợp không có bất kỳ mối quan hệ thương mại hoặc tài chính nào có thể được hiểu là xung đột lợi ích tiềm năng.

Tài liệu bổ sung

Tài liệu bổ sung cho bài viết này có thể được tìm thấy trực tuyến tại: https://www.frontiersin.org/articles/10.3389/fpsyg.2019.02215

Chú thích

1. ^Không giống như Cho et al. (2019), các thuật ngữ lỗi cấu trúc được cho là độc lập với nhau để đơn giản.

2. ^Chúng tôi sử dụng thay thế các thuật ngữ các biến và vật liệu tổng hợp/thành phần tiềm ẩn bởi vì, trong GSCA, một biến tiềm ẩn được định nghĩa là một tổng hợp hoặc thành phần có trọng số của các biến quan sát.

Người giới thiệu

Aguirre-Alreta, M. I. và Rönkkö, M. (2018). Suy luận thống kê với PLSC sử dụng khoảng tin cậy bootstrap. Mis Q. 42, 1001 Từ1020. doi: 10.25300/MISQ/2018/ 13587