샘플의 수가 커질수록 이항분포가 포아송분포로 근사하는 것을 시각화를 통해서 확인해 보자.
2005-07-17 네이버 블로그에 게시된 내용을 옮겨 온 글입니다. 지금의 R 환경과 다소 내용이 다를 수 있음을 밝여둡니다.
이항분포 B(n,p)에서 평균인 np값은 고정하고 n값이 충분히 커지면 이 분포는 평균 m이 np인 포아송분포에 근사하게 된다. 이것을 그래프로 그려 포아송분포로 근사하는 것을 추적해 보았다. np=5이고 n=10, 20, 50, 100인 이항분포를 한 좌표에 그려 보았다. 그리고 평균이 5인 포아송 분포도 같이 그려 보았다.
mean <- 5
par(family = "NanumSquare")
plot(dbinom(0:15, 10, mean / 10), type = "l",
main = "이항분포의 포아송분포 근사; B(n,p), np=5",
xlab = "X", ylab = "Probability")
lines(dbinom(0:15, 20, mean / 20), lty = 2, col = 2)
lines(dbinom(0:15, 50, mean / 50), lty = 3, col = 3)
lines(dbinom(0:15, 100, mean / 100), lty = 4, col = 4)
lines(dpois(0:15, mean), lty = 5, col = 5)
legend(10.5, 0.2, legend = c("Bin(10,0.5)","Bin(20,0.25)","Bin(50,0.1)",
"Bin(100,0.05)","Pos(5)"),
lty = 1:5, col = 1:5)
[1] 0.00576 0.02392 0.04028 0.02319 -0.02961 -0.07063 -0.05886
[8] -0.01274 0.02133 0.02650 0.01716 0.00824 0.00343 0.00132
[15] 0.00047 0.00016
[1] 0.00357 0.01255 0.01728 0.00648 -0.01422 -0.02686 -0.02239
[8] -0.00796 0.00439 0.00920 0.00821 0.00524 0.00268 0.00117
[15] 0.00045 0.00015
[1] 0.00158 0.00506 0.00628 0.00181 -0.00544 -0.00946 -0.00788
[8] -0.00318 0.00100 0.00294 0.00295 0.00211 0.00122 0.00060
[15] 0.00026 0.00010
[1] 0.00082 0.00253 0.00304 0.00080 -0.00268 -0.00455 -0.00379
[8] -0.00158 0.00041 0.00136 0.00142 0.00104 0.00062 0.00032
[15] 0.00014 0.00006
For attribution, please cite this work as
유충현 (2005, July 17). Dataholic: 이항분포의 포아송분포 근사. Retrieved from https://choonghyunryu.github.io/posts/2005-07-17-poss/
BibTeX citation
@misc{유충현2005이항분포의, author = {유충현, }, title = {Dataholic: 이항분포의 포아송분포 근사}, url = {https://choonghyunryu.github.io/posts/2005-07-17-poss/}, year = {2005} }