99 MMLAB ½ÅÀÔ»ý±³À° ¼öÇÐ º¸Ãæ±³Àç À̼öÇü ¾¸
Á¦ 1 °ú È®·ü º¯¼ö (Random Variable)
¹öÀü 1.1 ÃÖÁ¾¼öÁ¤ÀÏ 990108
È®·üº¯¼ö(random variable)¶õ ÄÄÇ»ÅÍ ÇÁ·Î±×·¡¹Ö¿¡¼ÀÇ º¯¼ö¿Í °°Àº °ÍÀε¥, ¾î¶² °ªÀ» ÃëÇÏ´À³Ä°¡ È®·üÀûÀ¸·Î °áÁ¤µÇ´Â º¯¼öÀÌ´Ù. ±×·¡¼ ¾ÕÀ¸·Î´Â °£·«ÇÏ°Ô 'º¯¼ö'¶ó°í ±â¼úÇϱâ·Î ÇÑ´Ù.
È®·üº¯¼ö´Â ¿µ¹®ÀÚ ´ë¹®ÀÚ·Î ¾²°í ±× º¯¼ö°¡ ÃëÇÒ ¼ö ÀÖ´Â °ª ÇϳªÇϳª¿¡ ´ëÇØ¼´Â ¼Ò¹®ÀÚ·Î ¾´´Ù.
¿¹¸¦ µé¾î º¸ÀÚ. ÁÖ»çÀ§¸¦ Çѹø ±¼·Á ³ª¿Â °ªÀ» ³ªÅ¸³»´Â º¯¼ö X´Â 1,2, ...,6ÀÇ °ªÀ» °¡Áú ¼ö Àִµ¥, °¢ °ªÀ» °¡Áú ¼ö ÀÖ´Â È®·üÀº ¸ðµç °ªÀÌ µ¿ÀÏÇØ¼ ¸ðµÎ 1/6ÀÌ´Ù.
º¯¼ö¿¡ °áºÎµÇ¾îÀÖ´Â È®·üÀ» Ç¥ÇöÇÏ´Â µ¥¿¡´Â µÎ °¡Áö ¹æ¹ýÀÌ ÀÖ´Ù. ¹Ðµµ(ȤÀº Áú·®)°ú ºÐÆ÷°¡ ±×°ÍÀÌ´Ù.
¸ÕÀú ¹Ðµµ(ȤÀº Áú·®)Àº ´ÙÀ½°ú °°Àº °ÍÀÌ´Ù. (³ëÆÄ½É¿¡¼ ÇÏ´Â ¸»Àε¥, ÇÔ¼öÀÇ ±×·¡ÇÁ¸¦ º¸´Â ¿ä·ÉÀ̶õ ¸ÕÀú °¢ ÃàÀÌ ¹«¾ùÀ» ÀǹÌÇÏ´Â °ÍÀÎÁö¸¦ ºÁ¾ßÇϰí ÈòÁ¾À̸¦ µ¤¾î¼ °¡¸°´ÙÀ½¿¡ ¿À¸¥ÂÊÀ¸·Î Á¶±Ý¾¿ ¹Ð¾î°¡¸é¼ º»´Ù´Â ½ÄÀ¸·Î, Áï Á¤ÀÇ¿ªÀÇ ¿ø¼Ò Çϳª´ç °øº¯¿ªÀÇ ¾î¶² ¿ø¼Ò°¡ ¸ÅÇεǴÂÁö¸¦ º¸´Â °ÍÀÌ´Ù. ÀÌ°Ç ±×¸² °¨»óÀÌ ¾Æ´Ñ °ÍÀÌ´Ù.)
ºÐÆ÷´Â ´ÙÀ½°ú °°Àº °ÍÀÌ´Ù.
Áï ºÐÆ÷ÇÔ¼ö´Â Áú·®À» ´©ÀûÇÕÇÑ °Í(¶Ç´Â ¹Ðµµ¸¦ ÀûºÐÇÑ °Í)ÀÌ´Ù.
ÀÌ°É ¼ö½ÄÀ¸·Î´Â ´ÙÀ½°ú °°ÀÌ ¾´´Ù.
À̻꺯¼ö X°¡ °ª x¸¦ °¡Áú È®·üÀ» È®·üÁú·®ÇÔ¼ö(probability mass
function; pmf)¶ó ºÎ¸£°í ¶ó°í ¾´´Ù.
.
(P[X=x]¶õ 'probability that X equals x'¶ó°í Àд´Ù. P[¡¤] ¾È¿¡ µé¾î°¡´Â °ÍÀ» '»ç°Ç'À̶ó ºÎ¸£¸ç, ½°Ç¥°¡ ÀÖ´Ù¸é ANDÀÇ ÀǹÌÀÌ´Ù. ½°Ç¥°¡ ¿¬°áÇÏ´Â °¢°¢µµ ¹°·Ð »ç°ÇÀÌ´Ù. ¼¼·Î¸·´ë±â |°¡ ÀÖÀ¸¸é ±× µÚ¿¡ ÀÖ´Â °ÍÀº Á¶°ÇÀýÀÌ´Ù. Á¶°ÇºÎ È®·üÀÎ °ÍÀÌ´Ù.)
º¯¼ö X°¡ °ª xÀÌÇϸ¦ °¡Áú È®·üÀ» È®·üºÐÆ÷ÇÔ¼ö(cumulative distribution
function; cdf)¶ó ºÎ¸£°í ¶ó°í ¾´´Ù.
.
¿¬¼Óº¯¼ö X°¡ °ª x ÁÖº¯¿¡¼ °¡Áú È®·ü¹Ðµµ¸¦ È®·ü¹ÐµµÇÔ¼ö(probability
density function; pdf)¶ó ºÎ¸£°í ¶ó°í ¾´´Ù.
.
ÀÍÈ÷ Àß ¾Ë°í ÀÖ´Â Á¤±ÔºÐÆ÷ÀÇ Á¾ ¸ð¾ç ±×¸²ÀÌ ¹Ù·Î ¹ÐµµÇÔ¼öÀÇ ±×¸²ÀÌ´Ù.
ºÐÆ÷ÇÔ¼ö´Â ¹ÐµµÇÔ¼ö(ȤÀº Áú·®ÇÔ¼ö)¸¦ ÀûºÐÇÑ °ÍÀ¸·Î¼, ¹«ÇÑ´ë·Î °¡¸é ¹Ýµå½Ã 1ÀÇ °ªÀ» °¡Áö¸ç À½ÀÇ ¹«ÇÑ´ë·Î °¡¸é 0À» °¡Áú °ÍÀÌ´Ù.
Æò±ÕÀº º¯¼ö¸¦ »ùÇøµÇÒ ¶§ ¾òÀ» ¼ö ÀÖ´Â °ª¿¡ ´ëÇÑ ±â´ëÄ¡Àε¥,
ÁÖ»çÀ§ÀÇ °æ¿ì 1À» ³¾ È®·üÀÌ 1/6 ,... , 6À» ³¾ È®·üÀÌ 1/6À̹ǷÎ
1* 1/6 + ...+ 6* 1/6 = 3.5 °¡ µÈ´Ù.
À̸¦ ¼ö½ÄÀ¸·Î ¾²¸é ´ÙÀ½°ú °°´Ù.
º¯¼ö XÀÇ Æò±ÕÀ» E[X]¶ó Ç¥±âÇϰí, ´ÙÀ½°ú °°ÀÌ Á¤ÀǵȴÙ.
¿©±â¿¡¼ ´ÙÀ½ÀÌ À¯µµµÈ´Ù.
ºÐ»êÀº º¯¼öÀÇ °ªÀ» Âï¾î¾ß ÇÒ ¶§ Æò±Õ°ªÀ¸·Î Âï´Â´Ù¸é ¾ó¸¶³ª Àß ¸ÂÀ»Áö¸¦ ³ªÅ¸³»´Â ôµµ·Î¼ °í¾ÈµÈ °ÍÀÌ´Ù. Æò±Õ°ª¿¡¼ ¹þ¾î³ª´Â Á¤µµ¸¦ ±×¶§ÀÇ È®·ü·Î °¡Á߯ò±ÕÇÏ¸é µÉ ÅÙµ¥, Æò±Õ°ª¿¡¼ ¹þ¾î³ª´Â Á¤µµ¸¦ ¹»·Î ÇÒ °ÍÀΰ¡°¡ ¹®Á¦¿´´Ù.
°ª x´Â Æò±Õ ·ÎºÎÅÍ ¾ó¸¶³ª ¶³¾îÁ® ÀÖ´Â °É±î?
(À̸¦ 'ÆíÂ÷'¶ó ºÎ¸¥´Ù)·Î ÇÏ´Â °É ÀÏ´Ü »ý°¢ÇÒ ¼ö Àִµ¥ ±×°Ç È®·ü·Î °¡Á߯ò±ÕÇϸé
¹«Á¶°Ç 0ÀÌ ³ª¿À¹Ç·Î °üµÎ°í, Àý´ë°ªÀ» ÃëÇØ¼
·Î ÇÏ´Â °Ô ÁÁ¾Æº¸ÀÌÁö¸¸ °è»êÀÌ Á» Èûµé¾îÁ®¼ (¹°·Ð ÀǹÌÀûÀ¸·Î ÀÌÇØ°¡ ½¬¿ì¹Ç·Î
Åë°è¿¡¼´Â ¾²ÀδÙ. ÇÏÁö¸¸ °ö¼À°ø½ÄÀ̳ª ÀμöºÐÇØ µîÀ» Àû¿ëÇÒ ¼ö ¾ø±â ¶§¹®¿¡ È®·ü·Ð¿¡¼´Â
Ȱ¿ëµµ°¡ ¶³¾îÁö´Â °ÍÀÌ´Ù.),
¿Í °°ÀÌ Á¦°öÀ» ÇÏ´Â °ÍÀ» »ý°¢Çس»¾ú´Ù.
º¯¼ö XÀÇ ºÐ»êÀº Var[X]·Î ¾²°í, ´ÙÀ½°ú °°ÀÌ Á¤ÀǵȴÙ. (ÀûºÐ ¾ÈÀÇ E[X]´Â ÀÌ¹Ì »ó¼ö¶ó´Â °ÍÀ» ¿°µÎ¿¡ µÑ °Í)
¿©±â¼ E[¡¤]À̶ó´Â ±âÈ£¸¦ Á» Àß ½áº¸¸é À̸¦ Á»´õ ¸ÚÀÖ°Ô Ç¥ÇöÇÒ ¼ö ÀÖ´Ù.
XÀÇ Æò±Õ À̶õ (X·Î¼ °¡´ÉÇÑ °ª)*(X°¡ ±× °ªÀÌ ³ª¿Ã È®·ü)À» ¸ðµç °¡´ÉÇÑ °ª¿¡ ´ëÇØ ´õÇÑ
°ÍÀ̶ó´Â °É »ý°¢ÇÏÀÚ.
XÀÇ È®Á¤ÀûÀÎ ÇÔ¼ö g(X)ÀÇ Æò±ÕÀ» ±¸Çغ¸ÀÚ. ¿ì¼± g(X)´Â X°¡ °ªÀ»
ÃëÇÔ¿¡ µû¶ó ²ÀµÎ°¢½Ãó·³ ±×¿¡ »óÀÀÇÏ´Â °ªÀ» ÃëÇÏ´Â »õ·Î¿î º¯¼ö¶ó´Â °ÍÀ» ¾Ë ¼ö
ÀÖ´Ù. (±× ¿¹·Î´Â 2X+1 °°Àº °É µé ¼ö ÀÖ´Ù.) µû¶ó¼ g(X)¶ó´Â º¯¼öÀÇ Æò±ÕÀ» ±¸ÇÒ
¶§, g(X)ÀÇ ¹ÐµµÇÔ¼ö¸¦ ¾²´Â °Ô ¾Æ´Ï¶ó XÀÇ ¹ÐµµÇÔ¼ö¸¦ ½á¼ ³ªÅ¸³¾ ¼ö ÀÖ´Ù´Â °ÍÀ»
¾Ë ¼ö ÀÖ´Ù. .
ÀÌ¿Í °°Àº ³í¸®·Î, .
(E[¡¤]¶ó´Â ±âÈ£°¡ »ç¿ëµÈ °æ¿ì ±×°ÍÀ» ÀÌÇØÇÏ´Â ¿ä·ÉÀº ´ë°ýÈ£ ¾È¿¡
È®·üº¯¼ö°¡ ¹«¾ùÀΰ¡¸¦ ÆÄ¾ÇÇÏ´Â °ÍÀÌ´Ù. µÎ °³ÀÇ º¯¼ö°¡ µé¾îÀÖ´Â °æ¿ì¿¡´Â ´ÙÀ½°ú
°°ÀÌ µÇ±â ¶§¹®ÀÌ´Ù, . )
ÀÌ°É ¶Ç Ç®¾îº¸¸é,
.
ºÐ»êÀÇ ·çÆ®´Â Ç¥ÁØÆíÂ÷¶ó ÇÏ°í ¶ó Ç¥½ÃÇÑ´Ù. Ç¥ÁØÆíÂ÷°¡ ºÐ»ê¿¡ ´ëÇØ °¡Áö´Â ÀåÁ¡Àº Á¦°öµÈ °ªÀÌ ¾Æ´Ï¶ó´Â µ¥
ÀÖ´Ù. sec¿¡¼ msec·Î ´ÜÀ§¸¦ ¹Ù²Ù¾îµµ ¹é¸¸ ¹è°¡ µÇÁö ¾Ê°í ¾äÀüÈ÷ õ ¹è°¡ µÇ´Â
°ÍÀÌ´Ù.
Ç¥ÁØÆíÂ÷¸¦ Æò±ÕÀ¸·Î ³ª´« °ÍÀ» C.O.V.(Coefficient of variation)À̶ó ºÎ¸£¸ç ´ÜÀ§¿¡ ¹«°üÇÑ ¹«¸í¼ö¶ó´Â ÀåÁ¡ÀÌ ÀÖ´Ù.
nÂ÷ ¸ð¸àÆ®´Â °ªÀ» n½Â ÇØ¼ Æò±ÕÇÑ °Í, ¸¦ ¸»Çϸç 'Áß½É(central)'À̶ó´Â ¸»ÀÌ ¾Õ¿¡ ºÙÀ¸¸é ÆíÂ÷¸¦ n½ÂÇØ¼ Æò±ÕÇÑ °Í,
ÀÌ´Ù. ºÐ»êÀº 2Â÷ Á߽ɸð¸àÆ®ÀÎ °ÍÀÌ´Ù.
XÀÇ range´Â XÀÇ ÃÖ´ë°ª¿¡¼ ÃÖ¼Ò°ªÀ» »« °ÍÀÌ´Ù.
XÀÇ È®·ü¹Ðµµ(¶Ç´Â Áú·®)ÇÔ¼ö¿¡¼ ÃÖ´ë°ªÀ» °®´Â Á¡À» mode¶ó ÇÑ´Ù. mode´Â °¡Àå ³ª¿Ã È®·üÀÌ ³ôÀº ´ëÇ¥°ªÀÎ °ÍÀÌ´Ù. bimodalÀº °°Àº ³ôÀÌÀÇ ºÀ¿ì¸®°¡ µÎ °³ÀÎ ¹ÐµµÇÔ¼ö¸¦ ¸»ÇÏ´Â °ÍÀÌ´Ù. Åë°è¿¡¼´Â È®·üºÐÆ÷ . ¹Ðµµ . Áú·® µûÀ§´Â ¾Ë ÅÎÀÌ ¾ø°í °üÃøÄ¡ÀÇ ºóµµ(frequency)¸¸À» ¾Ë ¼ö ÀÖÀ» »ÓÀε¥, bimodal ¿î¿îÀº Åë°è¿¡¼´Â ºóµµ¸¦ º¸°í ¸»ÇÏ°Ô µÈ´Ù.
Åë°èÇп¡¼´Â »ùÇÃÀ» ¶°¼ ±× ºÐÆ÷¸¦ ¾Ë¾Æ³»·Á´Â ½Ãµµ¸¦ ÇϰԵǴµ¥, »ùÇà ¾È¿¡ °üÃøÄ¡(observation)°¡ 100°³ ÀÖ´Ù¸é ¼ÒÆÃÇØ¼ 50¹øÂ° °ªÀ» medianÀ̶ó Çϰí, 25¹øÂ° °ª°ú 75¹øÂ° °ªµéÀ» °¢°¢ ù° ¼Â° quartileÀ̶ó Çϰí, ±×°Í¸»°í ´Ù¸¥ °Íµéµµ ¹éºÐÀ§(1~100À̸é percentile, 0~1À̸é quantile)À̶óÇÏ¿© ÁöÁ¤ÇÒ ¼ö ÀÖ´Ù. medianÀº ¾û¶×ÇÑ °üÃøÄ¡(À̸¦ outlier¶ó ºÎ¸¥´Ù.)°¡ Æ÷ÇԵǾ mean¿¡ ºñÇØ ¿µÇâÀ» ´ú ¹ÞÀ¸¹Ç·Î Åë°èÇп¡¼ Áß¿ä½ÃµÈ´Ù. ù° ¼Â° quartileÀÇ Â÷¸¦ inter-quartile range¶ó ÇÏ°í ±× ¹ÝÀ» SIQRÀ̶ó ºÎ¸£´Âµ¥, À̴ ǥÁØÆíÂ÷ °°Àº °ÍÀÇ ´ë¿ëÀ¸·Î ¾²ÀÌ°í ¿ª½Ã outlier¿¡ ´ëÇØ °ÇÑ Æ¯¼ºÀ» º¸ÀδÙ. ÀÌ »ùÇÃÀÌ ¾î¶² È®·üº¯¼ö·Î ¸ðµ¨¸µµÉ ¼ö ÀÖÀ» °ÍÀΰ¡¸¦ ÆÇº°Çϱâ À§Çؼ´Â, »ùÇÿ¡¼ÀÇ ¹éºÐÀ§ °ªµé°ú ±× ºÐÆ÷¿¡¼ÀÇ ¹éºÐÀ§ °ªÀ» ºñ±³ÇÏ´Â ¹æ¹ýÀÌ »ç¿ëµÈ´Ù. median, quartile, ¹éºÐÀ§ µîÀº ¿ø·¡ Åë°è¿¡¼ ¿Â °ÍÀÌÁö¸¸ È®·ü·Ð¿¡¼µµ Á¤ÀÇÇÒ ¼ö Àִµ¥, ÀÌ´Â È®·üºÐÆ÷ÇÔ¼öÀÇ ¿ªÇÔ¼ö¸¦ »ý°¢ÇÔÀ¸·Î½á ÀÌ·ç¾îÁø´Ù. ºÐÆ÷¿¡¼ÀÇ median °ªÀº ºÐÆ÷ÇÔ¼ö°ªÀÌ 0.5°¡ µÇ´Â °ªÀ» ¸»ÇÏ´Â °ÍÀ̰í, ù° quartileÀº 0.25ÀÏ ¶§ÀÇ °ªÀ¸·Î Á¤ÀǵǴ °ÍÀÌ´Ù.
ÆíÂ÷ÀÇ Àý´ë°ªÀ» Æò±ÕÇÑ °ÍÀº Æò±ÕÀý´ëÆíÂ÷(mean absolute deviation)¶ó°í ÇÑ´Ù.
ÆíÂ÷ÀÇ 3½ÂÀ» Æò±ÕÇØ¼ Ç¥ÁØÆíÂ÷ÀÇ 3½ÂÀ¸·Î ³ª´« °Í, (À̸¦ coefficient of skewness¶ó ºÎ¸¥´Ù)µµ Àִµ¥ ÀÌ´Â Æò±ÕÀ» ±âÁØÀ¸·Î ¾ó¸¶³ª
¸ð¾çÀÌ ´ëĪÀΰ¡ µîÀ» ÆÇº°ÇÏ´Â µ¥ ¾²ÀδÙ. ¹ÐµµÇÔ¼ö°¡ ´ëĪÀÌ ¾Æ´Ñ °æ¿ì¸¦ skewedµÇ¾îÀÖ´Ù°í
Çϴµ¥ ÀÌ´Â median°ú meanÀ» ºñ±³ÇÔÀ¸·Î½áµµ ÀÌ·ç¾îÁú ¼ö ÀÖ´Ù.(±× µÑÀº ÀϹÝÀûÀ¸·Î
°°Áö ¾Ê´Ù. ³·°Ô ³Î¸® ÆÛÁ®ÀÖ´Â ÂÊÀ¸·Î Æò±ÕÀÌ ¿òÁ÷ÀδÙ.) meanÀÌ medianº¸´Ù Ŭ
¶§´Â skewed to the right¶ó°í ÇÑ´Ù.
ÆíÂ÷ÀÇ 4½ÂÀ» Æò±ÕÇØ¼ Ç¥ÁØÆíÂ÷ÀÇ 4½ÂÀ¸·Î ³ª´« °Í, (À̸¦ kurtosis¶ó ºÎ¸¥´Ù)µµ Àִµ¥ ÀÌ °ªÀº Á¤±ÔºÐÆ÷ÀÏ ¶§ 3À» °®°ÔµÇ°í Å« ÆíÂ÷°¡
»ó´ëÀûÀ¸·Î ´õ È®·üÀÌ ³ôÀ» ¶§¿¡´Â 3º¸´Ù Å©°Ô µÇ¹Ç·Î, Á¤±ÔºÐÆ÷¿Í ºñ±³ÇÒ ¶§ ¾ó¸¶³ª
´õ ÆÛÁ³´Â°¡¸¦ ÆÇº°ÇÏ´Â µ¥ ¾²ÀδÙ. [p.462 Allen]
ºÐ»ê, Ç¥ÁØÆíÂ÷, range, C.O.V., SIQR, Æò±ÕÀý´ëÆíÂ÷ °°ÀÌ ¹ÐµµÇÔ¼ö°¡ ¾ó¸¶³ª ÆÛÁ®Àִ°¡¸¦ ³ªÅ¸³»´Â ôµµµéÀ» ÅëÆ²¾î indices of dispersionÀ̶ó ºÎ¸£°í, Æò±ÕÀ̳ª median, mode¿Í °°ÀÌ È®·üº¯¼öÀÇ ´ëÇ¥°ªÀ̶ó ÇÒ ¼ö ÀÖ´Â °ÍÀ» indices of central tendency¶ó ºÎ¸¥´Ù. skewness, kurtosis´Â indices of shape¶ó°í ºÎ¸¥´Ù.
¿©±â¼´Â ÀϺη¯ È®·ü·Ð°ú Åë°è·Ð¿¡¼ ¾²À̴ ôµµµéÀ» ¼¯¾î¼ ±â¼úÇߴµ¥, È®·üº¯¼ö´Â °á±¹ ½Ç¼¼°èÀÇ ¾î¶² Çö»óÀ» ¸ðµ¨¸µÇϱâ À§ÇÑ °ÍÀ̰í(¸ðµ¨¸µÀº ¿Ö ÇϳÄÇÏ¸é ½Ã¹Ä·¹À̼ÇÀ̳ª ¼öÇÐÀû ÇØ¼®À» Çϱâ À§Çؼ ÇÏ´Â °ÍÀÌ´Ù.), ¸ðµ¨¸µÀ» Á¦´ë·Î ÇÏ·Á¸é Åë°è·ÐÀ» »ç¿ëÇÏÁö ¾Ê°í¼´Â ¾ÈµÉ °ÍÀ̱⠶§¹®ÀÌ´Ù. ±× Çö»óÀÇ Æ¯¼ºÀ» ÆÄ¾ÇÇÏ·Á ÇÒ ¶§ ÀÏ´ÜÀº °üÃøÀ» ÅëÇØ »ùÇÃÀ» ¾òÀº ÈÄ Åë°èÇÐÀÇ ÈûÀ» ºô·Á¼ ¾Õ¼ ¸»ÇÑ ¿©·¯ ôµµµéÀ» ±¸ÇØ¾ß ÇÑ´Ù. ±× ´ÙÀ½¿¡¾ß ºñ·Î¼Ò À̰ÍÀÌ ¾î¶² ºÎ·ùÀÇ È®·üº¯¼ö·Î ¸ðµ¨¸µµÉ ¼ö ÀÖ´ÂÁö ¹àÇôÁö´Â °ÍÀÌ´Ù.
¸¶Áö¸·À¸·Î ÁöÀûÇÏ°í ½ÍÀº °ÍÀº, È®·üº¯¼ö¿¡ ´ëÇØ¼ Ư¼ºÀ» ¸»ÇÒ ¶§, º¸ÅëÀº Æò±Õ°ú ºÐ»ê °°Àº ôµµ¸¸À» ¾ð±ÞÇϳª È®·üº¯¼öÀÇ Æ¯¼º ¸ðµç °ÍÀ» ¾Ë·ÁÁÖ´Â °ÍÀº ¹Ù·Î ºÐÆ÷ÇÔ¼ö(ȤÀº ¹ÐµµÇÔ¼ö, ȤÀº Áú·®ÇÔ¼ö)¶ó´Â °ÍÀÌ´Ù.
Á¦ 2 °ú È®·ü º¯¼öµé »çÀÌÀÇ °ü°è
¿ì¸®°¡ ÇØ¼®À» ¿øÇÏ´Â ½Ã½ºÅÛÀº ¸¹Àº º¯¼ö°¡ ÀÖ´Â ½Ã½ºÅÛÀÌ´Ù.(¿ì¸®°¡ Â¥´Â ÄÄÇ»ÅÍ ÇÁ·Î±×·¥¿¡µµ ¼ö¸¹Àº º¯¼ö°¡ ÀÖÁö ¾ÊÀº°¡.) À̶§ º¯¼öµé »çÀÌ¿¡´Â È®Á¤Àû(deterministic) °ü°è½ÄÀ̳ª È®·üÀû °ü°è°¡ ¼º¸³µÉ ¼ö ÀÖ´Ù.
È®Á¤Àû °ü°è¶ó¸é ÀüÀÚȸ·Î¿¡¼ Àü¾ÐÀÌ °¡ÇØÁö¸é °¢ ±¸¼ººÎǰ¿¡ °É¸®´Â Àü¾ÐÀÌ Á¤ÇØÁö´Â °Í°ú °°Àº °Ô ÀÖ°Ú°í, È®·üÀû °ü°è¶ó¸é Ű¿Í ¸ö¹«°ÔÀÇ »ó°ü°ü°è³ª ù ¹øÂ° ½ÃÇè°ú Çб⸻ ÃÖÁ¾ ¼ºÀû°úÀÇ »ó°ü°ü°è¸¦ »ý°¢ÇÏ¸é µÉ °ÍÀÌ´Ù.
¿©±â¼´Â È®·üÀû °ü°è¿¡ ´ëÇØ¼ ¾Ë¾Æº¼ °ÍÀ̸ç, ¿ì¼± µÎ º¯¼ö »çÀÌÀÇ °ü°è¿¡ ´ëÇØ¼ ±× ´ÙÀ½Àº ¿©·¯ º¯¼ö»çÀÌÀÇ °ü°è¿¡ ´ëÇØ¼ ¾Ë¾Æº»´Ù.
º¯¼ö¶ó´Â °Ô ÀÖ¾î È®·üÀûÀ¸·Î °ªÀ» ÃëÇÑ´Ù°í´Â ÇßÀ¸³ª, »ç½ÇÀº ¾ÆÁÖ ¹Ì¼¼ÇÏ°Ô À̸éÀ» µé¿©´Ùº¸¸é È®Á¤ÀûÀÎ °ø½ÄÀÌ ¼º¸³ÇÏ´Â ½Ã½ºÅÛÀÌ ÀÖÀ» °ÍÀÌ´Ù. ºê¶ó¿î ¿îµ¿À» ¼³¸íÇÏ´Â µ¥ ÀÖ¾î °ø±âºÐÀÚµéÀÇ »óŸ¦ ¸ðµÎ ¸ðµ¨¸µÇÑ´Ù¸é È®Á¤ÀûÀ¸·Î ¿¬±âºÐÀÚÀÇ ¿òÁ÷ÀÓÀ» ¾Ë ¼ö ÀÖÀ»Áö ¸ð¸¥´Ù. ±×·¯³ª ±×°ÍÀº ³Ê¹«³ª ¸¹Àº ¸Þ¸ð¸®¿Í ÇÁ·Î¼¼¼¸¦ ¼Ò¸ðÇÏ°ÔµÉ °ÍÀ̹ǷÎ, ´ë½Å ºê¶ó¿î ¿îµ¿Àº È®·üÀûÀ¸·Î °£´ÜÇÏ°Ô ¼³¸íµÇ¾îÁö°ï ÇÑ´Ù. ÀÌ °æ¿ì¿¡¼ º¼ ¼ö ÀÖµíÀÌ È®·üÀ» µµÀÔÇÏ´Â °ÍÀº ½Ã½ºÅÛÀ» º¸´Ù °£´ÜÇÏ°Ô ¹Ù¶óº¼ ¼ö ÀÖµµ·Ï ÇØÁÖ´Â °ÍÀÌ´Ù.
±×·¯³ª È®·üÀ» µµÀÔÇØ¼ ½Ã½ºÅÛÀÇ º¯¼ö ¼ö¸¦ ÁÙÀδ٠ÇÏ´õ¶óµµ, ³Ê¹« ÁÙÀÌ¸é °£´ÜÇÔÀ» ¾òÀº ´ë½Å Á¤È®¼ºÀÌ °á¿©µÇ´Â °ÍÀÌ Åë·ÊÀÌ´Ù. ´ÙÀ½ÀÇ ¿¹¿¡¼´Â ´Ùº¯¼ö ½Ã½ºÅÛÀÇ ÀåÁ¡À» º¸¿©ÁÖ¸ç, ±×¸¦ ÅëÇØ º¯¼öµé°£ÀÇ °ü°è¸¦ Ç¥½ÃÇϱâ À§ÇÑ ¼ö½ÄµéÀÇ ±âº»À» º¸¿©ÁØ´Ù.
³» ³ó´ã¿¡ ´ëÇØ A¶ó´Â Ä£±¸°¡ ÁÁ¾ÆÇÒ È®·ü°ú ±×·¸Áö¾ÊÀ» È®·üÀÌ ¹Ý¹ÝÀÏ ¶§¿¡´Â À§ÇèºÎ´ãÀÌ ¹ÝÀ̳ª µÇ´Ï ÀÔÀ» ´Ù¹°ÀÚ¶ó°í »ý°¢ÇÒ ¼öµµ ÀÖÁö¸¸, ±×¿¡ ´ëÇØ¼ ¾Ë¾Æ¼ ±×ÀÇ ±âºÐÀÌ ÁÁÀ» ¶§´Â 2/3ÀÇ È®·ü·Î ÁÁ¾ÆÇÏ°í ±âºÐÀÌ ±×Àú±×·¸°Å³ª ³ª»Ü ¶§´Â 1/3ÀÇ È®·ü·Î ÁÁ¾ÆÇÏ°í ±×ÀÇ ±âºÐÀÌ ÁÁÀ» È®·üÀº µü Àý¹ÝÀ̶ó°í ÇÒ ¶§¿¡´Â ´«Ä¡²¯ ±×ÀÇ ¸¶À½À» ÀÐÀ» ÁÙ¸¸ ¾È´Ù¸é ³ó´ãÀÌ ¼º°øÇÒ ¼ö ÀÖ´Â È®·üÀÌ ³ô¾ÆÁö´Â °ÍÀÌ´Ù.
ÀÌ °£´ÜÇÑ °æ¿ì¿¡ ´ëÇØ ¼ö½ÄÀ¸·Î Ç¥ÇöÇÑ´Ù¸é ¿ì¼± ´ÙÀ½ÀÇ µÎ º¯¼ö¸¦ Á¤ÀÇÇÒ ¼ö ÀÖ´Ù,
X = AÀÇ ±âºÐÀÌ ÁÁÀ» ¶§ 1, ¾Æ´Ï¸é 0
Y = ³» ³ó´ã¿¡ A°¡ ÁÁ¾ÆÇÑ´Ù¸é 1, ¾Æ´Ï¸é 0
P[X=1] =P[X=0] =P[Y=1]= P[Y=0]= 1/2
'AÀÇ ±âºÐÀÌ ÁÁÀ» ¶§'¶ó´Â ¸»Àº Á¶°ÇºÎ È®·üÀÌ´Ù,
P[Y=1|X=1]=2/3 , P[Y=0|X=1]=1/3
P[Y=1|X=0]=1/3 , P[Y=0|X=0]=2/3
X,YÀÇ µÎ º¯¼ö¿¡´Â ºÐ¸íÈ÷ ¿øÀΰú °á°úÀÇ °ü°è°¡ ÀÖ±â´Â ÇÏ´Ù. ÇÏÁö¸¸ ±âºÐÀÌ ÁÁÀºÁö ¾Ë±â À§Çؼ´Â ³ó´ãÀ» ´øÁ®º¸´Â °Íµµ ÇѰ¡Áö ¹æ¹ýÀ̱⠶§¹®¿¡ ±×·± Àΰú°ü°è¸¦ ¿ªÀ¸·Î µÚÁýÀ» ¼öµµ ÀÖ¾î¾ß ÇÑ´Ù. ±×°É ¾î¶»°Ô ¾Ë±î?
¸ÕÀú (±âºÐ°ú ¹ÝÀÀÀ» µ¿Àϼ±»ó¿¡ ³õ°íº¼ ¶§) ±âºÐÀÌ ÁÁÀº µ¿½Ã¿¡ ³ó´ãÀ» ÁÁ¾ÆÇÒ È®·üÀº ´ÙÀ½°ú °°ÀÌ ±¸ÇØÁø´Ù.
P[X=1, Y=1] = P[Y=1|X=1]P[X=1]= 1/3
¸¶Âù°¡Áö·Î
P[X=1, Y=0] = P[Y=0|X=1]P[X=1]= 1/6
P[X=0, Y=1] = P[Y=1|X=0]P[X=0]= 1/6
P[X=0, Y=0] = P[Y=0|X=0]P[X=0]= 1/3
ÀÌÁ¦ ³ó´ã¿¡ ¹ÝÀÀÀÌ ÁÁ¾ÒÀ» ¶§ ±âºÐÀÌ ÁÁ¾ÒÀ» È®·üÀ» ±¸ÇÒ ¼ö ÀÖ°Ô µÈ´Ù.
P[X=1|Y=1] = P[Y=1, X=1] /P[Y=1]= 2/3
¿ì¿¬È÷ °°¾ÒÁö¸¸ ´Ù¸¥ °Ô Åë·ÊÀÌ´Ù.
º¯¼ö X, Y °¡ ÀÖÀ» ¶§ ÀÌ µÑÀ» ¸ðµÎ °ü½ÉÇÏ¿¡ µÎ°í °øÆòÇÏ°Ô º¸´Â °Ô joint È®·üÀÌ´Ù.
joint Áú·®ÇÔ¼ö¸¦ Á¤ÀÇÇϸé .
ÀÌ joint Áú·®ÇÔ¼ö´Â ¸ðµç °¡´ÉÇÑ x,y Á¶ÇÕ¿¡ ´ëÇØ ´Ù ´õÇϸé 1ÀÌ
µÈ´Ù, .
¿©·¯ º¯¼ö¸¦ °í·ÁÇÏ°ÔµÇ¸é °æ¿ìÀÇ ¼ö°¡ ¸¹¾ÆÁö¹Ç·Î °¢ °æ¿ì¿¡ ´ëÇÑ È®·üÀº ´õ ÀÛ¾ÆÁø´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù.
¿©±â¼ ÇÑ º¯¼ö Y¸¦ ¹«½ÃÇÏ·Á¸é .
À̰ÍÀ» joint ºÐÆ÷ÇÔ¼ö ·Î Ç¥ÇöÇϸé,
. ¿©±â¼ ¿¬À¯µÇ¾î, joint°¡ ¾Æ´Ñ ÇÑ °³ÀÇ º¯¼ö¿¡ ´ëÇÑ °ÍÀ» marginal('°¡ÀåÀÚ¸®ÀÇ')À̶ó°í
ºÎ¸£°Ô µÇ¾ú´Ù. marginalÀ̶ó´Â À̸§ÀÌ joint ºÐÆ÷·ÎºÎÅÍ ¾ò¾îÁö±â´Â ÇßÀ¸³ª, ½ÇÁ¦ÀÇ
°æ¿ì Åë°è¸¦ ÅëÇØ marginalÀº ½±°Ô ¾Ë ¼ö ÀÖÀ¸³ª joint ºÐÆ÷´Â ¾Ë ¼ö ¾ø´Â
°ÍÀÌ Åë·ÊÀÌ´Ù.
µÎ º¯¼ö »çÀÌÀÇ »ó°ü°ü°èÀÇ ±âº»Àº ±× µÑÀÌ µ¶¸³Àΰ¡ ¾Æ´Ñ°¡¸¦ ¹àÈ÷´Â ÀÏÀÌ´Ù.
µ¶¸³À̶ó ÇÔÀº È®·üÀûÀ¸·Î ¹«°üÇÏ´Ù´Â °ÍÀ» ¸»ÇÑ´Ù. ÀÇ Á¶°ÇÀ» ¸¸Á·½ÃŰ¸é µÈ´Ù. ¿¬¼ÓÀÇ °æ¿ì¿¡´Â
. ¹Ù·Î ÀÌ¿Í °°ÀÌ joint ¹Ðµµ . Áú·® ÇÔ¼ö¸¦ marginalÀÇ °öÀ¸·Î Ç¥ÇöÇϱâ À§ÇÏ¿©
µ¶¸³¼º °¡Á¤ÀÌ ³Î¸® (³²¿ë¿¡ °¡±õ°Ô) »ç¿ëµÇ°í ÀÖ´Ù. µ¶¸³¼º °¡Á¤ÀÌ ¾ø´Â °æ¿ì joint
È®·üÀ» ¾Ë¾Æ³»±â¶õ Åë°è¸¦ ÅëÇØ¼´Â °ÅÀÇ ºÒ°¡´É¿¡ °¡±õ³ª.
(»ç½Ç µ¶¸³»ç°ÇÀÇ °³³äÀº »ç°Ç A,B¿¡ ÀÖ¾î P[A, B] = P[A] P[B]ÀÎ °æ¿ì·Î Á¤ÀÇµÇ¸ç ±×·¸±â ¶§¹®¿¡ Áú·®.¹Ðµµ.ºÐÆ÷ÇÔ¼ö µî¿¡ ´ëÇØ¼ À§¿Í °°ÀÌ Á¤ÀÇµÈ °ÍÀÌ´Ù.)
µ¶¸³À̶ó´Â °ÍÀ» ¹àÇô³»¸é ¿©·¯ Æí¸®ÇÑ Á¡ÀÌ Àִµ¥, ´õÇÑ °ÍÀÇ ºÐ»êÀÌ ºÐ»êÀ» ´õÇÑ °ÍÀÌ µÉ ¼ö ÀÖ°í, °öÇÑ °ÍÀÇ Æò±ÕÀÌ Æò±ÕÀ» °öÇÑ °ÍÀÌ µÉ ¼ö ÀÖ´Ù´Â °Í, ±×¸®°í Á¤ÀÇ ±×´ë·Î joint ¹ÐµµÇÔ¼ö°¡ marginal ¹ÐµµÇÔ¼öÀÇ °öÀ¸·Î Ç¥ÇöµÈ´Ù´Â °ÍÀ» ¿ì¼± µé ¼ö ÀÖ´Ù.
µÎ º¯¼ö »çÀÌÀÇ µ¶¸³¿©ºÎ¸¦ ¹àÈ÷´Â µ¥ ÀÖ¾î¼ joint ºÐÆ÷¸¦ ´Ù ¾Ë¾Æ³»°í ¸ðµç °æ¿ì¿¡ ´ëÇØ À§ÀÇ Á¶°ÇÀ» °Ë»çÇÏ±ä ±ÍÂú±âµµ ÇÏ°í ºÒ°¡´ÉÇϰųª ºñ½Ç¿ëÀûÀÎ °æ¿ì°¡ ¸¹À¸¹Ç·Î, Á»´õ ½±°Ô ÆÇº°Çϴ ôµµ·Î¼ covariance µîÀ» »ç¿ëÇÑ´Ù.
correlation˼
covariance´Â
correlation coefficient´Â
Àß º¸¸é covariance´Â °¢°¢ÀÇ Æò±ÕÀ» 0À¸·Î ¸¸µé±â À§ÇÑ Á¤±ÔÈ(normalization), correlation coefficient´Â (Ç¥ÁØÁ¤±ÔºÐÆ÷¿¡¼ ±×·¨´ø °Íó·³) °Å±â¿¡ ´õÇØ °¢°¢ÀÇ Ç¥ÁØÆíÂ÷¸¦ 1·Î ¸¸µé±â À§ÇÑ Á¤±Ôȸ¦ ÇÑ °ÍÀÓÀ» ¾Ë ¼ö ÀÖ´Ù.
100% ÀÇÁ¸ÀûÀÎ (Áï ¶È°°Àº) º¯¼ö µÑ »çÀÌÀÇ covariance´Â ¹Ù·Î ºÐ»êÀÌ µÈ´Ù. ±×¶§ÀÇ correlation coefficient´Â 1ÀÌ µÊÀ» ¾Ë ¼ö ÀÖ´Ù.
covariance³ª correlation coefficient°¡ 0ÀÏ ¶§ ÀÌ µÑÀº uncorrelatedµÇ¾ú´Ù°í ÇÑ´Ù. (correlationÀÌ 0ÀÏ ¶§¿¡´Â orthogonalÇÏ´Ù°í ÇÑ´Ù.) µÎ º¯¼ö°¡ ¼·Î µ¶¸³À̶ó¸é uncorrelatedÀÌÁö¸¸, uncorrelated¶ó ÇØ¼ µ¶¸³À̶ó´Â º¸ÀåÀº ¾ø´Ù.
¶ÇÇÑ correlation coefficient°¡ 1À̳ª -1ÀÏ ¶§´Â µÎ º¯¼ö »çÀÌ¿¡´Â È®Á¤ÀûÀÎ ¼±Çü°ü°è½ÄÀÌ ¼º¸³ÇÑ´Ù. (ÁÖ¾îÁø ½ÇÇè°á°ú ³»Áö Åë°è¼öÄ¡µé·ÎºÎÅÍ È®Á¤ÀûÀÎ ¼±Çü°ü°è½ÄÀ» ã´Â ÀÏÀ» ¼±Çüȸ±Í(linear regression)¶ó Çϸç, ¾Æ¸¶ ¿©·¯ºÐÀº À̰Ͱú À¯»çÇÑ ÀÏÀ» ÇкÎ1Çг⠹°¸®³ª ÈÇÐ ½ÇÇè½Ã°£ ¶Ç´Â 2Çг⠼±Çü´ë¼ö ½Ã°£¿¡ ´Ù·ç°Å³ª Á÷Á¢ ½áº» ¹Ù ÀÖÀ» °ÍÀÌ´Ù.)