BÀI GIẢNG XÁC SUẤT THỐNG KÊ Nguyễn Thị Thu Thủy–SAMI-HUS
Chương 2 Biến ngẫu nhiên và quy luật phân phối xác suất
Mục tiêu1. Thông qua các công cụ giải tích, cung cấp cho sinh viên khái niệm về biến ngẫu nhiên, phân loại các biến ngẫu nhiên, các quy luật phân phối xác suất của biến ngẫu nhiên, các tham số đặc trưng của biến ngẫu nhiên cùng một số quy luật phân phối xác suất thông dụng của biến ngẫu nhiên.
2. Với các kiến thức nền tảng đó, sinh viên biết tính các tham số đặc trưng của biến ngẫu nhiên; hiểu và vận dụng được ý nghĩa của các đặc trưng của biến ngẫu nhiên cùng các quy luật phân phối xác suất trong các bài toán xác suất thuộc các lĩnh vực kỹ thuật, kinh tế, xã hội. . .
Nội dungHai nội dung quan trọng nhất của chương là quy luật phân phối xác suất và các tham số đặc trưng của một biến ngẫu nhiên.1. Định nghĩa và phân loại biến ngẫu nhiên2. Quy luật phân phối xác suất của biến ngẫu nhiên [bảng phân phối xác suất, hàm phân phối xác suất, hàm mật độ xác suất]3. Các tham số đặc trưng của biến ngẫu nhiên [kỳ vọng, phương sai, độ lệch chuẩn, mốt, trung vị. . . ]
4. Một số phân phối xác suất thông dụng
2.4 Một số phân phối xác suất thông dụng
2.4.1 Phân phối đều
2.4.1a Phân phối đều rời rạc
Định nghĩa 2.13 [Phân phối đều rời rạc]. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối đều rời rạc [discrete uniform distribution] với tham số n, ký hiệu là X ∼ U [ n ] , nếu X có bảng phân phối xác suất
Định lý 2.10. Kỳ vọng, phương sai của biến ngẫu nhiên có phân phối đều rời rạc:
Định nghĩa 2.14 [Phân phối đều liên tục]. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối đều liên tục [continuous uniform distribution] trên [ a, b ] [a < b], ký hiệu là X ∼ U [[ a, b ]] , nếu X có hàm mật độ
1. Hàm phân phối xác suất là
Nhận xét 2.9.1. X có khả năng nhận giá trị trong khoảng [ a, b ] là "đều nhau".2. Phân phối đều có nhiều ứng dụng trong thống kê toán như mô phỏng thống kê, đặc biệt trong phương pháp phi tham số.3. Trong một số lý thuyết kết luận thống kê người ta thường xuất phát từ quy tắc sau đây:Nếu ta không biết gì về giá trị của tham số cần ước lượng, mỗi giá trị có thể có của tham số đó là đồng khả năng, điều đó dẫn đến việc quan niệm tham số cần ước lượng như một biến ngẫu nhiên có phân phối đều.
Ví dụ 2.26. Lịch chạy của xe bus tại một trạm xe bus như sau: chiếc xe bus đầu tiên trong ngày sẽ khởi hành từ trạm này lúc 7 giờ, cứ sau 15 phút sẽ có một xe khác đến trạm. Giả sử một hành khách đến trạm ngẫu nhiên trong khoảng thời gian từ 7 giờ đến 7 giờ 30. Tìm xác suất để hành khách này chờ [a] Ít hơn 5 phút; [b] Ít nhất 12 phút.
Lời giải Ví dụ 2.26 Gọi X là số phút từ 7 giờ đến 7 giờ 30 hành khách đến trạm, ta có X ∼ U [[ 0, 30 ]] . [a] Hành khách chờ ít hơn 5 phút nếu đến trạm giữa 7 giờ 10 và 7 giờ 15 hoặc giữa 7 giờ 25 và 7 giờ 30. Do đó xác suất cần tìm là:
[a] Tìm hàm phân phối xác suất của biến ngẫu nhiên Y chỉ diện tích tam giác AMB.
[b] Tìm kỳ vọng của Y.
Hàm phân phối xác suất của Y là
Định nghĩa 2.15 [Phân phối Béc–nu–li]. Biến ngẫu nhiên rời rạc X được gọi là tuân theo luật phân phối Béc–nu–li [Bernoulli distribution] với tham số p, ký hiệu là X ∼ B[ 1, p ] , nếu X nhận hai giá trị 0, 1 với xác suất tương ứng
Định lý 2.12. Nếu X là biến ngẫu nhiên có phân phối Béc-nu-li B[ 1; p ] thì
Định nghĩa 2.16 [Phân phối nhị thức]. Biến ngẫu nhiên rời rạc X được gọi là tuân theo luật phân phối nhị thức [binomial distribution] với tham số n và p, ký hiệu là X ∼ B[ n, p ] , nếu X có bảng phân phối xác suất
Phân phối nhị thức xuất phát từ tên thực tế của khai triển nhị thức [ p + q ] n có n + 1 số hạng:
Nhận xét 2.11.1. Thực hiện n phép thử Béc–nu–li với xác suất thành công của sự kiện A trong mỗi lần thử là p. Với mỗi i = 1, 2, . . . , n, nếu ở lần thử thứ i sự kiện A xuất hiện ta
cho X i nhận giá trị 1, nếu sự kiện A không xuất hiện ta cho X i nhận giá trị 0. Như vậy X i ∼ B[ 1, p ] . Gọi X là số lần thành công trong n phép thử Béc–nu–li này thì
Định lý 2.13. Kỳ vọng và phương sai của biến ngẫu nhiên có phân phối nhị thức là
[b]
Định nghĩa 2.17 [Phân phối Poa–xông]. Biến ngẫu nhiên rời rạc X được gọi là tuân theo luật phân phối Poa-xông [Poisson distribution] với tham số λ, ký hiệu là X ∼ P [ λ ] , nếu X có bảng phân phối xác suất
2. Sử dụng Định nghĩa 2.8
2. Nếu X 1 , X 2 là hai biến ngẫu nhiên độc lập có phân phối Poa–xông tham số lần lượt λ 1 , λ 2 , thì X 1 + X 2 cũng có phân phối Poa–xông tham số λ 1 + λ 2 [xem Chương 3].
3. Trong thực tế với một số giả thiết thích hợp thì các biến ngẫu nhiên là các quá trình đếm sau: số cuộc gọi đến một tổng đài; số khách hàng đến một điểm phục vụ; số xe cộ qua một ngã tư; số tai nạn [xe cộ]; số các sự cố xảy ra ở một địa điểm . . . trong một khoảng thời gian xác định nào đó sẽ có phân phối Poa–xông với tham số λ, trong đó λ là tốc độ trung bình diễn ra trong khoảng thời gian này. Ví dụ 2.29. Ở một tổng đài bưu điện, các cuộc điện thoại gọi đến xuất hiện ngẫu nhiên, độc lập với nhau với tốc độ trung bình 2 cuộc gọi trong một phút. Tìm xác suất để
[a] Có đúng 5 cuộc điện thoại trong vòng 2 phút;
[b] Không có cuộc điện thoại nào trong khoảng thời gian 30 giây;
[c] Có ít nhất 1 cuộc điện thoại trong khoảng thời gian 10 giây.Lời giải Ví dụ 2.29
[a] Gọi X là số cuộc điện thoại xuất hiện trong vòng 2 phút. X ∼ P [ λ ] , λ chính là số cuộc điện thoại trung bình đến trong vòng 2 phút, λ = 4.
Ví dụ 2.30. Một ga ra cho thuê ô tô thấy rằng số người đến thuê ô tô vào thứ bảy cuối tuần là một biến ngẫu nhiên tuân theo luật phân phối Poa-xông với tham số λ = 2. Giả sử gara có 4 chiếc ô tô.
[a] Tìm xác suất để tất cả 4 ô tô đều được thuê vào thứ 7.
[b] Tìm xác suất gara không đáp ứng được yêu cầu [thiếu xe cho thuê] vào thứ 7.
[c] Trung bình có bao nhiêu ô tô được thuê vào ngày thứ 7?
Lời giải Ví dụ 2.30 Gọi X là biến ngẫu nhiên chỉ "số người đến thuê ô tô vào thứ bảy".
Theo giả thiết X là biến ngẫu nhiên phân phối tuân theo quy luật Poa-xông P [ λ ] với λ = 2. Gọi Y là biến ngẫu nhiên chỉ "số xe ô tô được thuê vào thứ bảy".
[a] Áp dụng phân phối Poa-xôngChú ý 2.3. Giá trị xác suất của phân phối Poa–xông được tính sẵn trong bảng Phụ lục 5.
2.4.4 Xấp xỉ phân phối nhị thức bằng phân phối Poa-xông
Trong Mục 1.5.5 ta đã đề cập đến việc tính xấp xỉ công thức Béc–nu–y [1.19] khi số phép thử n khá lớn bởi công thức [1.21]. Ở đây ta xét mối liên hệ của hai phân phối tương ứng.
Lời giải Ví dụ 2.31 Gọi X là số người chết trong một năm [xác định]. X là biến ngẫu nhiên có phân phối nhị thức tham số n = 5000 và p = 0, 001. Khi đó,