Ví dụ chọn mẫu ngẫu nhiên có hệ thống

Estimated reading time: 11 minutes

Nội dung trang:

Khái niệm

Phương pháp lấy mẫu xác suất là cung cấp các thông tin thống kê về tính đại diện mẫu của tổng thể. Trong chọn mẫu ngẫu nhiên, mỗi một cá thể được xác định là có cùng xác suất lựa chọn làm mẫu điều tra.

Các phương pháp chọn mẫu ngẫu nhiên

  • Chọn mẫu ngẫu nhiên đơn (simple random sampling)

  • Chọn mẫu ngẫu nhiên hệ thống (systematic random sampling)

  • Chọn mẫu ngẫu nhiên phân tầng (stratified random sampling)

  • Chọn mẫu ngẫu nhiên cụm (cluster sampling)

  • Chọn mẫu nhiều bậc (Multistage sampling)

Simple random sampling

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

Chọn mẫu ngẫu nhiên đơn là phương pháp lấy mẫu hoàn toàn ngẫu nhiên, không qua một sự sắp xếp nào. Theo đó, các đơn vị mẫu được chọn bằng cách bốc thăm, quay số hoặc theo bảng số ngẫu nhiên.

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

Cách thức thực hiện

  1. Cần lập danh sách các đơn vị của tổng thể chung theo một trật tự (theo tên/địa chỉ/qui mô ...)
  2. Đánh số thứ tự vào trong danh sách.
  3. Dùng các phương pháp ngẫu nhiên như rút thăm, dùng bảng số ngẫu nhiên, dùng hàm random của máy tính để đảm bảo tính ngẫu nhiên.

Lưu ý:

Có thể cho kết quả tốt nếu giữa các đơn vị của tổng thể không có khác biệt nhiều. Ngược lại, nếu tổng thể các đơn vị có sự khác biệt nhau đáng kể thì cách chọn này khó đảm bảo tính đại diện.

Ví dụ:

Tiến hành chọn ra 293 doanh nghiệp trong một địa phương có 3000 doanh nghiệp. Từ danh sách các doanh nghiệp, tiến hành chọn mẫu các doanh nghiệp theo phương pháp chọn mẫu ngẫu nhiên đơn giản.

  • Cách làm đơn giản, tính đại diện cao nếu giữa các đơn vị của tổng thể không có khác biệt nhiều.

  • Có thể lồng vào các kỹ thuật chọn mẫu khác.

  • Có đủ cơ sở tính xác suất (biết rõ xác xuất).

  • Nếu tổng thể các đơn vị có sự khác biệt nhau đáng kể thì cách chọn này khó đảm bảo tính đại diện.

  • Tổng thể quá lớn thì việc chọn mẫu ngẫu nhiên cũng gặp khó khăn

  • Mẫu được chọn có thể phân tán -> khó thu thập.

Systematic sampling

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

Chọn mẫu ngẫu nhiên hệ thống là lấy mẫu mà mỗi đơn vị mẫu được chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã được sắp xếp sẵn của tổng thể chung.

Trong phương pháp lấy mẫu này, một danh sách gồm toàn bộ các phần tử thuộc tập tổng thể được tạo ra và phần tử đầu tiên trong tập mẫu được lựa chọn ngẫu nhiên từ k đối tượng đầu tiên. Sau đó, mỗi phần tử thứ k sẽ được chọn ra từ danh sách.

Cách thức thực hiện

  • Tính khoảng cách mẫu
    k=Nnk = \frac{N}{n}k=nN
    Trong đó:

NNN: dân số chọn mẫu (trong khung mẫu)

nnn: cỡ mẫu

  • Chọn ngẫu nhiên một số r, 1 < r < k
  • Chọn một nhóm gồm các đơn vị lấy mẫu r, r+k, r+2k,…

Ví dụ:

Quần thể nghiên cứu có 360 đối tượng. Mẫu cần chọn là 120. Như vậy khoảng cách mẫu = 360/120=3. Đơn vị mẫu đầu tiên được chọn có số thứ tự là 2. Như vậy các đối tượng được chọn vào danh sách sẽ là 2 + 3i (i=1-120), tức là các đối tượng có số thứ tự 2, 5, 8, 11, 14, 17…

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

  • Thay ngẫu nhiên đơn khi không có khung mẫu chính xác.
  • Có tính đại diện hơn ngẫu nhiên đơn.

  • Khung mẫu được thiết lập có tính chu kỳ = k -> mẫu có thể bị sai lệch.

Stratified random sampling

Chọn mẫu ngẫu nhiên phân tầng là phương pháp chọn mẫu trong đó nghiên cứu viên chia quần thể nghiên cứu thành các tầng có đặc tính giống nhau (ví dụ tầng nông thôn và tầng thành thị) sau đó chọn ra các đơn vị mẫu trong từng tầng theo phương pháp chọn mẫu ngẫu nhiên theo cụm, ngẫu nhiên theo hệ thống hay ngẫu nhiên đơn.

Sử dụng khi:

  • Các tầng có khác nhau về biến số quan tâm (nhóm tuổi, giới tính, ..)

  • Sự khác biệt là ở mục tiêu của nghiên cứu.

Cách thức thực hiện

  1. Chia tổng thể thành các tổ theo một tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu.
  2. Trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu.
  3. Tỷ lệ mẫu lấy trong từng tổ bằng với tỷ lệ của tổ đó trong tổng thể.


Chọn mẫu ngẫu nhiên phân tầng đảm bảo mẫu nghiên cứu bao gồm đại diện của tất cả các tầng. Mẫu ngẫu nhiên phân tầng có thể theo tỷ lệ (proportionate stratified random sampling) hoặc không theo tỷ lệ (disproportionate stratified sampling)

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

Chọn mẫu ngẫu nhiên phân tầng không theo tỷ lệ (Disproportionate stratified sampling)

Cỡ mẫu cần chọn từ mỗi tầng không tỷ lệ với kích cỡ của tầng đó.

Chọn mẫu ngẫu nhiên phân tầng theo tỷ lệ (Proportionate stratified random sampling)

Cỡ mẫu cần chọn từ mỗi tầng sẽ tỷ lệ với kích cỡ của tầng đó trong quần thể.

  • Phổ biến nhất vì tính chính xác và đại diện cao, ít tốn kém.

  • Có thể biết được hình ảnh của từng tầng.

  • Về mặt quản lý, mẫu phân tầng dễ hơn ngẫu nhiên đơn.

  • Cần thiết lập khung mẫu chi tiết của từng tầng.

Cluster sampling

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

Phương pháp chọn mẫu dựa trên các nhóm đối tượng nghiên cứu (cụm hay chùm) thay cho việc chọn từng đối tượng nghiên cứu.

  • Các cụm (chùm) thường được xác định theo địa lý hoặc những đơn vị tổ chức.

Cách thức thực hiện

  1. Lập danh sách tổng thể chung theo từng khối (cluster).
  2. Chọn ngẫu nhiên một số khối, điều tra các khối đó.
  3. Áp dụng phương pháp này khi không có sẵn danh sách đầy đủ các đơn vị trong tổng thể cần nghiên cứu.
Ví dụ chọn mẫu ngẫu nhiên có hệ thống

  • Không cần lập danh sách tổng thể, tiết kiệm 1 phần chi phí.

  • Không xác định số phần tử mẫu cần lấy là bao nhiêu, tính đại diện mẫu chưa cao.

Multistage sampling

Chọn mẫu nhiều giai đoạn là dạng đặc biệt của chọn mẫu cụm khi quá trình chọn mẫu được thực hiện theo nhiều giai đoạn.

Cách thức thực hiện

  1. Trước tiên phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II.
  2. Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra các đơn vị mẫu.

Ví dụ:

Quá trình chọn mẫu được bắt đầu với việc lựa chọn các cụm lớn như tỉnh (chọn tỉnh nghiên cứu từ danh sách tất cả các tỉnh trong toàn quốc), sau đó từ các tỉnh đựa lựa chọn, chọn ra các huyện nghiên cứu, rồi từ các huyện được lựa chọn, chọn ra các xã nghiên cứu, rồi từ các xã được lựa chọn chọn ra các hộ gia đình được nghiên cứu.

Ví dụ chọn mẫu ngẫu nhiên có hệ thống

  • Có thể áp dụng trong điều tra phạm vi rộng, phân tán, không có được danh sách các đơn vị nghiên cứu.

  • Khung mẫu đơn giản, dễ lập.

  • Điều tra dễ, nhanh vì đối tượng nghiên cứu được nhóm lại.

  • Nâng cao chất lượng giám sát và đảm bảo chất lượng số liệu.

  • Tiết kiệm kinh phí, thời gian.

  • Không xác định số phần tử mẫu cần lấy là bao nhiêu, tính đại diện mẫu chưa cao.

  • Tính chính xác và đại diện thấp.

probability sampling, simple random sampling, systematic random sampling, cluster sampling, multistage sampling, mẫu ngẫu nhiên đơn, mẫu ngẫu nhiên hệ thống, mẫu ngẫu nhiên phân tầng, mẫu cụm, mẫu nhiều bậc