99 MMLAB ½ÅÀÔ»ý±³À° ¼öÇÐ º¸Ãæ±³Àç                                         À̼öÇü ¾¸

Á¦ 1 °ú  È®·ü º¯¼ö (Random Variable)

¹öÀü 1.1 ÃÖÁ¾¼öÁ¤ÀÏ 990108

 

È®·üº¯¼ö(random variable)¶õ ÄÄÇ»ÅÍ ÇÁ·Î±×·¡¹Ö¿¡¼­ÀÇ º¯¼ö¿Í °°Àº °ÍÀε¥, ¾î¶² °ªÀ» ÃëÇÏ´À³Ä°¡ È®·üÀûÀ¸·Î °áÁ¤µÇ´Â º¯¼öÀÌ´Ù. ±×·¡¼­ ¾ÕÀ¸·Î´Â °£·«ÇÏ°Ô 'º¯¼ö'¶ó°í ±â¼úÇϱâ·Î ÇÑ´Ù.

È®·üº¯¼ö´Â ¿µ¹®ÀÚ ´ë¹®ÀÚ·Î ¾²°í ±× º¯¼ö°¡ ÃëÇÒ ¼ö ÀÖ´Â °ª ÇϳªÇϳª¿¡ ´ëÇØ¼­´Â ¼Ò¹®ÀÚ·Î ¾´´Ù.

 

¿¹¸¦ µé¾î º¸ÀÚ. ÁÖ»çÀ§¸¦ Çѹø ±¼·Á ³ª¿Â °ªÀ» ³ªÅ¸³»´Â º¯¼ö X´Â 1,2, ...,6ÀÇ °ªÀ» °¡Áú ¼ö Àִµ¥, °¢ °ªÀ» °¡Áú ¼ö ÀÖ´Â È®·üÀº ¸ðµç °ªÀÌ µ¿ÀÏÇØ¼­ ¸ðµÎ 1/6ÀÌ´Ù.

º¯¼ö¿¡ °áºÎµÇ¾îÀÖ´Â È®·üÀ» Ç¥ÇöÇÏ´Â µ¥¿¡´Â µÎ °¡Áö ¹æ¹ýÀÌ ÀÖ´Ù. ¹Ðµµ(ȤÀº Áú·®)°ú ºÐÆ÷°¡ ±×°ÍÀÌ´Ù.

¸ÕÀú ¹Ðµµ(ȤÀº Áú·®)Àº ´ÙÀ½°ú °°Àº °ÍÀÌ´Ù. (³ëÆÄ½É¿¡¼­ ÇÏ´Â ¸»Àε¥, ÇÔ¼öÀÇ ±×·¡ÇÁ¸¦ º¸´Â ¿ä·ÉÀ̶õ ¸ÕÀú °¢ ÃàÀÌ ¹«¾ùÀ» ÀǹÌÇÏ´Â °ÍÀÎÁö¸¦ ºÁ¾ßÇϰí ÈòÁ¾À̸¦ µ¤¾î¼­ °¡¸°´ÙÀ½¿¡ ¿À¸¥ÂÊÀ¸·Î Á¶±Ý¾¿ ¹Ð¾î°¡¸é¼­ º»´Ù´Â ½ÄÀ¸·Î, Áï Á¤ÀÇ¿ªÀÇ ¿ø¼Ò Çϳª´ç °øº¯¿ªÀÇ ¾î¶² ¿ø¼Ò°¡ ¸ÅÇεǴÂÁö¸¦ º¸´Â °ÍÀÌ´Ù. ÀÌ°Ç ±×¸² °¨»óÀÌ ¾Æ´Ñ °ÍÀÌ´Ù.)

 

 

ºÐÆ÷´Â ´ÙÀ½°ú °°Àº °ÍÀÌ´Ù.

 

 

Áï ºÐÆ÷ÇÔ¼ö´Â Áú·®À» ´©ÀûÇÕÇÑ °Í(¶Ç´Â ¹Ðµµ¸¦ ÀûºÐÇÑ °Í)ÀÌ´Ù.

 

ÀÌ°É ¼ö½ÄÀ¸·Î´Â ´ÙÀ½°ú °°ÀÌ ¾´´Ù.

À̻꺯¼ö X°¡ °ª x¸¦ °¡Áú È®·üÀ» È®·üÁú·®ÇÔ¼ö(probability mass function; pmf)¶ó ºÎ¸£°í ¶ó°í ¾´´Ù. .

(P[X=x]¶õ 'probability that X equals x'¶ó°í Àд´Ù. P[¡¤] ¾È¿¡ µé¾î°¡´Â °ÍÀ» '»ç°Ç'À̶ó ºÎ¸£¸ç, ½°Ç¥°¡ ÀÖ´Ù¸é ANDÀÇ ÀǹÌÀÌ´Ù. ½°Ç¥°¡ ¿¬°áÇÏ´Â °¢°¢µµ ¹°·Ð »ç°ÇÀÌ´Ù. ¼¼·Î¸·´ë±â |°¡ ÀÖÀ¸¸é ±× µÚ¿¡ ÀÖ´Â °ÍÀº Á¶°ÇÀýÀÌ´Ù. Á¶°ÇºÎ È®·üÀÎ °ÍÀÌ´Ù.)

º¯¼ö X°¡ °ª xÀÌÇϸ¦ °¡Áú È®·üÀ» È®·üºÐÆ÷ÇÔ¼ö(cumulative distribution function; cdf)¶ó ºÎ¸£°í ¶ó°í ¾´´Ù. .

¿¬¼Óº¯¼ö X°¡ °ª x ÁÖº¯¿¡¼­ °¡Áú È®·ü¹Ðµµ¸¦ È®·ü¹ÐµµÇÔ¼ö(probability density function; pdf)¶ó ºÎ¸£°í ¶ó°í ¾´´Ù. .

 

ÀÍÈ÷ Àß ¾Ë°í ÀÖ´Â Á¤±ÔºÐÆ÷ÀÇ Á¾ ¸ð¾ç ±×¸²ÀÌ ¹Ù·Î ¹ÐµµÇÔ¼öÀÇ ±×¸²ÀÌ´Ù.

ºÐÆ÷ÇÔ¼ö´Â ¹ÐµµÇÔ¼ö(ȤÀº Áú·®ÇÔ¼ö)¸¦ ÀûºÐÇÑ °ÍÀ¸·Î¼­, ¹«ÇÑ´ë·Î °¡¸é ¹Ýµå½Ã 1ÀÇ °ªÀ» °¡Áö¸ç À½ÀÇ ¹«ÇÑ´ë·Î °¡¸é 0À» °¡Áú °ÍÀÌ´Ù.

 

Æò±ÕÀº º¯¼ö¸¦ »ùÇøµÇÒ ¶§ ¾òÀ» ¼ö ÀÖ´Â °ª¿¡ ´ëÇÑ ±â´ëÄ¡Àε¥,

ÁÖ»çÀ§ÀÇ °æ¿ì 1À» ³¾ È®·üÀÌ 1/6 ,... , 6À» ³¾ È®·üÀÌ 1/6À̹ǷÎ

1* 1/6 + ...+ 6* 1/6 = 3.5 °¡ µÈ´Ù.

 

À̸¦ ¼ö½ÄÀ¸·Î ¾²¸é ´ÙÀ½°ú °°´Ù.

º¯¼ö XÀÇ Æò±ÕÀ» E[X]¶ó Ç¥±âÇϰí, ´ÙÀ½°ú °°ÀÌ Á¤ÀǵȴÙ.

 

¿©±â¿¡¼­ ´ÙÀ½ÀÌ À¯µµµÈ´Ù.

 

ºÐ»êÀº º¯¼öÀÇ °ªÀ» Âï¾î¾ß ÇÒ ¶§ Æò±Õ°ªÀ¸·Î Âï´Â´Ù¸é ¾ó¸¶³ª Àß ¸ÂÀ»Áö¸¦ ³ªÅ¸³»´Â ôµµ·Î¼­ °í¾ÈµÈ °ÍÀÌ´Ù. Æò±Õ°ª¿¡¼­ ¹þ¾î³ª´Â Á¤µµ¸¦ ±×¶§ÀÇ È®·ü·Î °¡Á߯ò±ÕÇÏ¸é µÉ ÅÙµ¥, Æò±Õ°ª¿¡¼­ ¹þ¾î³ª´Â Á¤µµ¸¦ ¹»·Î ÇÒ °ÍÀΰ¡°¡ ¹®Á¦¿´´Ù.

°ª x´Â Æò±Õ ·ÎºÎÅÍ ¾ó¸¶³ª ¶³¾îÁ® ÀÖ´Â °É±î? (À̸¦ 'ÆíÂ÷'¶ó ºÎ¸¥´Ù)·Î ÇÏ´Â °É ÀÏ´Ü »ý°¢ÇÒ ¼ö Àִµ¥ ±×°Ç È®·ü·Î °¡Á߯ò±ÕÇÏ¸é ¹«Á¶°Ç 0ÀÌ ³ª¿À¹Ç·Î °üµÎ°í, Àý´ë°ªÀ» ÃëÇØ¼­ ·Î ÇÏ´Â °Ô ÁÁ¾Æº¸ÀÌÁö¸¸ °è»êÀÌ Á» Èûµé¾îÁ®¼­ (¹°·Ð ÀǹÌÀûÀ¸·Î ÀÌÇØ°¡ ½¬¿ì¹Ç·Î Åë°è¿¡¼­´Â ¾²ÀδÙ. ÇÏÁö¸¸ °ö¼À°ø½ÄÀ̳ª ÀμöºÐÇØ µîÀ» Àû¿ëÇÒ ¼ö ¾ø±â ¶§¹®¿¡ È®·ü·Ð¿¡¼­´Â Ȱ¿ëµµ°¡ ¶³¾îÁö´Â °ÍÀÌ´Ù.), ¿Í °°ÀÌ Á¦°öÀ» ÇÏ´Â °ÍÀ» »ý°¢Çس»¾ú´Ù.

 

º¯¼ö XÀÇ ºÐ»êÀº Var[X]·Î ¾²°í, ´ÙÀ½°ú °°ÀÌ Á¤ÀǵȴÙ. (ÀûºÐ ¾ÈÀÇ E[X]´Â ÀÌ¹Ì »ó¼ö¶ó´Â °ÍÀ» ¿°µÎ¿¡ µÑ °Í)

 

¿©±â¼­ E[¡¤]À̶ó´Â ±âÈ£¸¦ Á» Àß ½áº¸¸é À̸¦ Á»´õ ¸ÚÀÖ°Ô Ç¥ÇöÇÒ ¼ö ÀÖ´Ù.

XÀÇ Æò±Õ À̶õ (X·Î¼­ °¡´ÉÇÑ °ª)*(X°¡ ±× °ªÀÌ ³ª¿Ã È®·ü)À» ¸ðµç °¡´ÉÇÑ °ª¿¡ ´ëÇØ ´õÇÑ °ÍÀ̶ó´Â °É »ý°¢ÇÏÀÚ.

XÀÇ È®Á¤ÀûÀÎ ÇÔ¼ö g(X)ÀÇ Æò±ÕÀ» ±¸Çغ¸ÀÚ. ¿ì¼± g(X)´Â X°¡ °ªÀ» ÃëÇÔ¿¡ µû¶ó ²ÀµÎ°¢½Ãó·³ ±×¿¡ »óÀÀÇÏ´Â °ªÀ» ÃëÇÏ´Â »õ·Î¿î º¯¼ö¶ó´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. (±× ¿¹·Î´Â 2X+1 °°Àº °É µé ¼ö ÀÖ´Ù.) µû¶ó¼­ g(X)¶ó´Â º¯¼öÀÇ Æò±ÕÀ» ±¸ÇÒ ¶§, g(X)ÀÇ ¹ÐµµÇÔ¼ö¸¦ ¾²´Â °Ô ¾Æ´Ï¶ó XÀÇ ¹ÐµµÇÔ¼ö¸¦ ½á¼­ ³ªÅ¸³¾ ¼ö ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. .

ÀÌ¿Í °°Àº ³í¸®·Î, .

 

(E[¡¤]¶ó´Â ±âÈ£°¡ »ç¿ëµÈ °æ¿ì ±×°ÍÀ» ÀÌÇØÇÏ´Â ¿ä·ÉÀº ´ë°ýÈ£ ¾È¿¡ È®·üº¯¼ö°¡ ¹«¾ùÀΰ¡¸¦ ÆÄ¾ÇÇÏ´Â °ÍÀÌ´Ù. µÎ °³ÀÇ º¯¼ö°¡ µé¾îÀÖ´Â °æ¿ì¿¡´Â ´ÙÀ½°ú °°ÀÌ µÇ±â ¶§¹®ÀÌ´Ù, . )

 

ÀÌ°É ¶Ç Ç®¾îº¸¸é,

.

 

ºÐ»êÀÇ ·çÆ®´Â Ç¥ÁØÆíÂ÷¶ó ÇÏ°í ¶ó Ç¥½ÃÇÑ´Ù. Ç¥ÁØÆíÂ÷°¡ ºÐ»ê¿¡ ´ëÇØ °¡Áö´Â ÀåÁ¡Àº Á¦°öµÈ °ªÀÌ ¾Æ´Ï¶ó´Â µ¥ ÀÖ´Ù. sec¿¡¼­ msec·Î ´ÜÀ§¸¦ ¹Ù²Ù¾îµµ ¹é¸¸ ¹è°¡ µÇÁö ¾Ê°í ¾äÀüÈ÷ õ ¹è°¡ µÇ´Â °ÍÀÌ´Ù.

Ç¥ÁØÆíÂ÷¸¦ Æò±ÕÀ¸·Î ³ª´« °ÍÀ» C.O.V.(Coefficient of variation)À̶ó ºÎ¸£¸ç ´ÜÀ§¿¡ ¹«°üÇÑ ¹«¸í¼ö¶ó´Â ÀåÁ¡ÀÌ ÀÖ´Ù.

nÂ÷ ¸ð¸àÆ®´Â °ªÀ» n½Â ÇØ¼­ Æò±ÕÇÑ °Í, ¸¦ ¸»Çϸç 'Áß½É(central)'À̶ó´Â ¸»ÀÌ ¾Õ¿¡ ºÙÀ¸¸é ÆíÂ÷¸¦ n½ÂÇØ¼­ Æò±ÕÇÑ °Í, ÀÌ´Ù. ºÐ»êÀº 2Â÷ Á߽ɸð¸àÆ®ÀÎ °ÍÀÌ´Ù.

 

XÀÇ range´Â XÀÇ ÃÖ´ë°ª¿¡¼­ ÃÖ¼Ò°ªÀ» »« °ÍÀÌ´Ù.

XÀÇ È®·ü¹Ðµµ(¶Ç´Â Áú·®)ÇÔ¼ö¿¡¼­ ÃÖ´ë°ªÀ» °®´Â Á¡À» mode¶ó ÇÑ´Ù. mode´Â °¡Àå ³ª¿Ã È®·üÀÌ ³ôÀº ´ëÇ¥°ªÀÎ °ÍÀÌ´Ù. bimodalÀº °°Àº ³ôÀÌÀÇ ºÀ¿ì¸®°¡ µÎ °³ÀÎ ¹ÐµµÇÔ¼ö¸¦ ¸»ÇÏ´Â °ÍÀÌ´Ù. Åë°è¿¡¼­´Â È®·üºÐÆ÷ . ¹Ðµµ . Áú·® µûÀ§´Â ¾Ë ÅÎÀÌ ¾ø°í °üÃøÄ¡ÀÇ ºóµµ(frequency)¸¸À» ¾Ë ¼ö ÀÖÀ» »ÓÀε¥, bimodal ¿î¿îÀº Åë°è¿¡¼­´Â ºóµµ¸¦ º¸°í ¸»ÇÏ°Ô µÈ´Ù.

Åë°èÇп¡¼­´Â »ùÇÃÀ» ¶°¼­ ±× ºÐÆ÷¸¦ ¾Ë¾Æ³»·Á´Â ½Ãµµ¸¦ ÇϰԵǴµ¥, »ùÇà ¾È¿¡ °üÃøÄ¡(observation)°¡ 100°³ ÀÖ´Ù¸é ¼ÒÆÃÇØ¼­ 50¹øÂ° °ªÀ» medianÀ̶ó Çϰí, 25¹øÂ° °ª°ú 75¹øÂ° °ªµéÀ» °¢°¢ ù° ¼Â° quartileÀ̶ó Çϰí, ±×°Í¸»°í ´Ù¸¥ °Íµéµµ ¹éºÐÀ§(1~100À̸é percentile, 0~1À̸é quantile)À̶óÇÏ¿© ÁöÁ¤ÇÒ ¼ö ÀÖ´Ù. medianÀº ¾û¶×ÇÑ °üÃøÄ¡(À̸¦ outlier¶ó ºÎ¸¥´Ù.)°¡ Æ÷ÇԵǾ mean¿¡ ºñÇØ ¿µÇâÀ» ´ú ¹ÞÀ¸¹Ç·Î Åë°èÇп¡¼­ Áß¿ä½ÃµÈ´Ù. ù° ¼Â° quartileÀÇ Â÷¸¦ inter-quartile range¶ó ÇÏ°í ±× ¹ÝÀ» SIQRÀ̶ó ºÎ¸£´Âµ¥, À̴ ǥÁØÆíÂ÷ °°Àº °ÍÀÇ ´ë¿ëÀ¸·Î ¾²ÀÌ°í ¿ª½Ã outlier¿¡ ´ëÇØ °­ÇÑ Æ¯¼ºÀ» º¸ÀδÙ. ÀÌ »ùÇÃÀÌ ¾î¶² È®·üº¯¼ö·Î ¸ðµ¨¸µµÉ ¼ö ÀÖÀ» °ÍÀΰ¡¸¦ ÆÇº°Çϱâ À§Çؼ­´Â, »ùÇÿ¡¼­ÀÇ ¹éºÐÀ§ °ªµé°ú ±× ºÐÆ÷¿¡¼­ÀÇ ¹éºÐÀ§ °ªÀ» ºñ±³ÇÏ´Â ¹æ¹ýÀÌ »ç¿ëµÈ´Ù. median, quartile, ¹éºÐÀ§ µîÀº ¿ø·¡ Åë°è¿¡¼­ ¿Â °ÍÀÌÁö¸¸ È®·ü·Ð¿¡¼­µµ Á¤ÀÇÇÒ ¼ö Àִµ¥, ÀÌ´Â È®·üºÐÆ÷ÇÔ¼öÀÇ ¿ªÇÔ¼ö¸¦ »ý°¢ÇÔÀ¸·Î½á ÀÌ·ç¾îÁø´Ù. ºÐÆ÷¿¡¼­ÀÇ median °ªÀº ºÐÆ÷ÇÔ¼ö°ªÀÌ 0.5°¡ µÇ´Â °ªÀ» ¸»ÇÏ´Â °ÍÀ̰í, ù° quartileÀº 0.25ÀÏ ¶§ÀÇ °ªÀ¸·Î Á¤ÀǵǴ °ÍÀÌ´Ù.

ÆíÂ÷ÀÇ Àý´ë°ªÀ» Æò±ÕÇÑ °ÍÀº Æò±ÕÀý´ëÆíÂ÷(mean absolute deviation)¶ó°í ÇÑ´Ù.

ÆíÂ÷ÀÇ 3½ÂÀ» Æò±ÕÇØ¼­ Ç¥ÁØÆíÂ÷ÀÇ 3½ÂÀ¸·Î ³ª´« °Í, (À̸¦ coefficient of skewness¶ó ºÎ¸¥´Ù)µµ Àִµ¥ ÀÌ´Â Æò±ÕÀ» ±âÁØÀ¸·Î ¾ó¸¶³ª ¸ð¾çÀÌ ´ëĪÀΰ¡ µîÀ» ÆÇº°ÇÏ´Â µ¥ ¾²ÀδÙ. ¹ÐµµÇÔ¼ö°¡ ´ëĪÀÌ ¾Æ´Ñ °æ¿ì¸¦ skewedµÇ¾îÀÖ´Ù°í Çϴµ¥ ÀÌ´Â median°ú meanÀ» ºñ±³ÇÔÀ¸·Î½áµµ ÀÌ·ç¾îÁú ¼ö ÀÖ´Ù.(±× µÑÀº ÀϹÝÀûÀ¸·Î °°Áö ¾Ê´Ù. ³·°Ô ³Î¸® ÆÛÁ®ÀÖ´Â ÂÊÀ¸·Î Æò±ÕÀÌ ¿òÁ÷ÀδÙ.) meanÀÌ medianº¸´Ù Ŭ ¶§´Â skewed to the right¶ó°í ÇÑ´Ù.

ÆíÂ÷ÀÇ 4½ÂÀ» Æò±ÕÇØ¼­ Ç¥ÁØÆíÂ÷ÀÇ 4½ÂÀ¸·Î ³ª´« °Í, (À̸¦ kurtosis¶ó ºÎ¸¥´Ù)µµ Àִµ¥ ÀÌ °ªÀº Á¤±ÔºÐÆ÷ÀÏ ¶§ 3À» °®°ÔµÇ°í Å« ÆíÂ÷°¡ »ó´ëÀûÀ¸·Î ´õ È®·üÀÌ ³ôÀ» ¶§¿¡´Â 3º¸´Ù Å©°Ô µÇ¹Ç·Î, Á¤±ÔºÐÆ÷¿Í ºñ±³ÇÒ ¶§ ¾ó¸¶³ª ´õ ÆÛÁ³´Â°¡¸¦ ÆÇº°ÇÏ´Â µ¥ ¾²ÀδÙ. [p.462 Allen]

 

ºÐ»ê, Ç¥ÁØÆíÂ÷, range, C.O.V., SIQR, Æò±ÕÀý´ëÆíÂ÷ °°ÀÌ ¹ÐµµÇÔ¼ö°¡ ¾ó¸¶³ª ÆÛÁ®Àִ°¡¸¦ ³ªÅ¸³»´Â ôµµµéÀ» ÅëÆ²¾î indices of dispersionÀ̶ó ºÎ¸£°í, Æò±ÕÀ̳ª median, mode¿Í °°ÀÌ È®·üº¯¼öÀÇ ´ëÇ¥°ªÀ̶ó ÇÒ ¼ö ÀÖ´Â °ÍÀ» indices of central tendency¶ó ºÎ¸¥´Ù. skewness, kurtosis´Â indices of shape¶ó°í ºÎ¸¥´Ù.

¿©±â¼­´Â ÀϺη¯ È®·ü·Ð°ú Åë°è·Ð¿¡¼­ ¾²À̴ ôµµµéÀ» ¼¯¾î¼­ ±â¼úÇߴµ¥, È®·üº¯¼ö´Â °á±¹ ½Ç¼¼°èÀÇ ¾î¶² Çö»óÀ» ¸ðµ¨¸µÇϱâ À§ÇÑ °ÍÀ̰í(¸ðµ¨¸µÀº ¿Ö ÇϳÄÇÏ¸é ½Ã¹Ä·¹À̼ÇÀ̳ª ¼öÇÐÀû ÇØ¼®À» Çϱâ À§Çؼ­ ÇÏ´Â °ÍÀÌ´Ù.), ¸ðµ¨¸µÀ» Á¦´ë·Î ÇÏ·Á¸é Åë°è·ÐÀ» »ç¿ëÇÏÁö ¾Ê°í¼­´Â ¾ÈµÉ °ÍÀ̱⠶§¹®ÀÌ´Ù. ±× Çö»óÀÇ Æ¯¼ºÀ» ÆÄ¾ÇÇÏ·Á ÇÒ ¶§ ÀÏ´ÜÀº °üÃøÀ» ÅëÇØ »ùÇÃÀ» ¾òÀº ÈÄ Åë°èÇÐÀÇ ÈûÀ» ºô·Á¼­ ¾Õ¼­ ¸»ÇÑ ¿©·¯ ôµµµéÀ» ±¸ÇØ¾ß ÇÑ´Ù. ±× ´ÙÀ½¿¡¾ß ºñ·Î¼Ò À̰ÍÀÌ ¾î¶² ºÎ·ùÀÇ È®·üº¯¼ö·Î ¸ðµ¨¸µµÉ ¼ö ÀÖ´ÂÁö ¹àÇôÁö´Â °ÍÀÌ´Ù.

 

¸¶Áö¸·À¸·Î ÁöÀûÇÏ°í ½ÍÀº °ÍÀº, È®·üº¯¼ö¿¡ ´ëÇØ¼­ Ư¼ºÀ» ¸»ÇÒ ¶§, º¸ÅëÀº Æò±Õ°ú ºÐ»ê °°Àº ôµµ¸¸À» ¾ð±ÞÇϳª È®·üº¯¼öÀÇ Æ¯¼º ¸ðµç °ÍÀ» ¾Ë·ÁÁÖ´Â °ÍÀº ¹Ù·Î ºÐÆ÷ÇÔ¼ö(ȤÀº ¹ÐµµÇÔ¼ö, ȤÀº Áú·®ÇÔ¼ö)¶ó´Â °ÍÀÌ´Ù.

 

Á¦ 2 °ú  È®·ü º¯¼öµé »çÀÌÀÇ °ü°è

 

¿ì¸®°¡ ÇØ¼®À» ¿øÇÏ´Â ½Ã½ºÅÛÀº ¸¹Àº º¯¼ö°¡ ÀÖ´Â ½Ã½ºÅÛÀÌ´Ù.(¿ì¸®°¡ Â¥´Â ÄÄÇ»ÅÍ ÇÁ·Î±×·¥¿¡µµ ¼ö¸¹Àº º¯¼ö°¡ ÀÖÁö ¾ÊÀº°¡.) À̶§ º¯¼öµé »çÀÌ¿¡´Â È®Á¤Àû(deterministic) °ü°è½ÄÀ̳ª È®·üÀû °ü°è°¡ ¼º¸³µÉ ¼ö ÀÖ´Ù.

È®Á¤Àû °ü°è¶ó¸é ÀüÀÚȸ·Î¿¡¼­ Àü¾ÐÀÌ °¡ÇØÁö¸é °¢ ±¸¼ººÎǰ¿¡ °É¸®´Â Àü¾ÐÀÌ Á¤ÇØÁö´Â °Í°ú °°Àº °Ô ÀÖ°Ú°í, È®·üÀû °ü°è¶ó¸é Ű¿Í ¸ö¹«°ÔÀÇ »ó°ü°ü°è³ª ù ¹øÂ° ½ÃÇè°ú Çб⸻ ÃÖÁ¾ ¼ºÀû°úÀÇ »ó°ü°ü°è¸¦ »ý°¢ÇÏ¸é µÉ °ÍÀÌ´Ù.

¿©±â¼­´Â È®·üÀû °ü°è¿¡ ´ëÇØ¼­ ¾Ë¾Æº¼ °ÍÀ̸ç, ¿ì¼± µÎ º¯¼ö »çÀÌÀÇ °ü°è¿¡ ´ëÇØ¼­ ±× ´ÙÀ½Àº ¿©·¯ º¯¼ö»çÀÌÀÇ °ü°è¿¡ ´ëÇØ¼­ ¾Ë¾Æº»´Ù.

 

º¯¼ö¶ó´Â °Ô ÀÖ¾î È®·üÀûÀ¸·Î °ªÀ» ÃëÇÑ´Ù°í´Â ÇßÀ¸³ª, »ç½ÇÀº ¾ÆÁÖ ¹Ì¼¼ÇÏ°Ô À̸éÀ» µé¿©´Ùº¸¸é È®Á¤ÀûÀÎ °ø½ÄÀÌ ¼º¸³ÇÏ´Â ½Ã½ºÅÛÀÌ ÀÖÀ» °ÍÀÌ´Ù. ºê¶ó¿î ¿îµ¿À» ¼³¸íÇÏ´Â µ¥ ÀÖ¾î °ø±âºÐÀÚµéÀÇ »óŸ¦ ¸ðµÎ ¸ðµ¨¸µÇÑ´Ù¸é È®Á¤ÀûÀ¸·Î ¿¬±âºÐÀÚÀÇ ¿òÁ÷ÀÓÀ» ¾Ë ¼ö ÀÖÀ»Áö ¸ð¸¥´Ù. ±×·¯³ª ±×°ÍÀº ³Ê¹«³ª ¸¹Àº ¸Þ¸ð¸®¿Í ÇÁ·Î¼¼¼­¸¦ ¼Ò¸ðÇÏ°ÔµÉ °ÍÀ̹ǷÎ, ´ë½Å ºê¶ó¿î ¿îµ¿Àº È®·üÀûÀ¸·Î °£´ÜÇÏ°Ô ¼³¸íµÇ¾îÁö°ï ÇÑ´Ù. ÀÌ °æ¿ì¿¡¼­ º¼ ¼ö ÀÖµíÀÌ È®·üÀ» µµÀÔÇÏ´Â °ÍÀº ½Ã½ºÅÛÀ» º¸´Ù °£´ÜÇÏ°Ô ¹Ù¶óº¼ ¼ö ÀÖµµ·Ï ÇØÁÖ´Â °ÍÀÌ´Ù.

±×·¯³ª È®·üÀ» µµÀÔÇØ¼­ ½Ã½ºÅÛÀÇ º¯¼ö ¼ö¸¦ ÁÙÀδ٠ÇÏ´õ¶óµµ, ³Ê¹« ÁÙÀÌ¸é °£´ÜÇÔÀ» ¾òÀº ´ë½Å Á¤È®¼ºÀÌ °á¿©µÇ´Â °ÍÀÌ Åë·ÊÀÌ´Ù. ´ÙÀ½ÀÇ ¿¹¿¡¼­´Â ´Ùº¯¼ö ½Ã½ºÅÛÀÇ ÀåÁ¡À» º¸¿©ÁÖ¸ç, ±×¸¦ ÅëÇØ º¯¼öµé°£ÀÇ °ü°è¸¦ Ç¥½ÃÇϱâ À§ÇÑ ¼ö½ÄµéÀÇ ±âº»À» º¸¿©ÁØ´Ù.

 

³» ³ó´ã¿¡ ´ëÇØ A¶ó´Â Ä£±¸°¡ ÁÁ¾ÆÇÒ È®·ü°ú ±×·¸Áö¾ÊÀ» È®·üÀÌ ¹Ý¹ÝÀÏ ¶§¿¡´Â À§ÇèºÎ´ãÀÌ ¹ÝÀ̳ª µÇ´Ï ÀÔÀ» ´Ù¹°ÀÚ¶ó°í »ý°¢ÇÒ ¼öµµ ÀÖÁö¸¸, ±×¿¡ ´ëÇØ¼­ ¾Ë¾Æ¼­ ±×ÀÇ ±âºÐÀÌ ÁÁÀ» ¶§´Â 2/3ÀÇ È®·ü·Î ÁÁ¾ÆÇÏ°í ±âºÐÀÌ ±×Àú±×·¸°Å³ª ³ª»Ü ¶§´Â 1/3ÀÇ È®·ü·Î ÁÁ¾ÆÇÏ°í ±×ÀÇ ±âºÐÀÌ ÁÁÀ» È®·üÀº µü Àý¹ÝÀ̶ó°í ÇÒ ¶§¿¡´Â ´«Ä¡²¯ ±×ÀÇ ¸¶À½À» ÀÐÀ» ÁÙ¸¸ ¾È´Ù¸é ³ó´ãÀÌ ¼º°øÇÒ ¼ö ÀÖ´Â È®·üÀÌ ³ô¾ÆÁö´Â °ÍÀÌ´Ù.

 

ÀÌ °£´ÜÇÑ °æ¿ì¿¡ ´ëÇØ ¼ö½ÄÀ¸·Î Ç¥ÇöÇÑ´Ù¸é ¿ì¼± ´ÙÀ½ÀÇ µÎ º¯¼ö¸¦ Á¤ÀÇÇÒ ¼ö ÀÖ´Ù,

X = AÀÇ ±âºÐÀÌ ÁÁÀ» ¶§ 1, ¾Æ´Ï¸é 0

Y = ³» ³ó´ã¿¡ A°¡ ÁÁ¾ÆÇÑ´Ù¸é 1, ¾Æ´Ï¸é 0

P[X=1] =P[X=0] =P[Y=1]= P[Y=0]= 1/2

 

'AÀÇ ±âºÐÀÌ ÁÁÀ» ¶§'¶ó´Â ¸»Àº Á¶°ÇºÎ È®·üÀÌ´Ù,

P[Y=1|X=1]=2/3 , P[Y=0|X=1]=1/3

P[Y=1|X=0]=1/3 , P[Y=0|X=0]=2/3

 

X,YÀÇ µÎ º¯¼ö¿¡´Â ºÐ¸íÈ÷ ¿øÀΰú °á°úÀÇ °ü°è°¡ ÀÖ±â´Â ÇÏ´Ù. ÇÏÁö¸¸ ±âºÐÀÌ ÁÁÀºÁö ¾Ë±â À§Çؼ­´Â ³ó´ãÀ» ´øÁ®º¸´Â °Íµµ ÇѰ¡Áö ¹æ¹ýÀ̱⠶§¹®¿¡ ±×·± Àΰú°ü°è¸¦ ¿ªÀ¸·Î µÚÁýÀ» ¼öµµ ÀÖ¾î¾ß ÇÑ´Ù. ±×°É ¾î¶»°Ô ¾Ë±î?

 

¸ÕÀú (±âºÐ°ú ¹ÝÀÀÀ» µ¿Àϼ±»ó¿¡ ³õ°íº¼ ¶§) ±âºÐÀÌ ÁÁÀº µ¿½Ã¿¡ ³ó´ãÀ» ÁÁ¾ÆÇÒ È®·üÀº ´ÙÀ½°ú °°ÀÌ ±¸ÇØÁø´Ù.

P[X=1, Y=1] = P[Y=1|X=1]P[X=1]= 1/3

¸¶Âù°¡Áö·Î

P[X=1, Y=0] = P[Y=0|X=1]P[X=1]= 1/6

P[X=0, Y=1] = P[Y=1|X=0]P[X=0]= 1/6

P[X=0, Y=0] = P[Y=0|X=0]P[X=0]= 1/3

 

ÀÌÁ¦ ³ó´ã¿¡ ¹ÝÀÀÀÌ ÁÁ¾ÒÀ» ¶§ ±âºÐÀÌ ÁÁ¾ÒÀ» È®·üÀ» ±¸ÇÒ ¼ö ÀÖ°Ô µÈ´Ù.

P[X=1|Y=1] = P[Y=1, X=1] /P[Y=1]= 2/3

¿ì¿¬È÷ °°¾ÒÁö¸¸ ´Ù¸¥ °Ô Åë·ÊÀÌ´Ù.

 

º¯¼ö X, Y °¡ ÀÖÀ» ¶§ ÀÌ µÑÀ» ¸ðµÎ °ü½ÉÇÏ¿¡ µÎ°í °øÆòÇÏ°Ô º¸´Â °Ô joint È®·üÀÌ´Ù.

joint Áú·®ÇÔ¼ö¸¦ Á¤ÀÇÇϸé .

ÀÌ joint Áú·®ÇÔ¼ö´Â ¸ðµç °¡´ÉÇÑ x,y Á¶ÇÕ¿¡ ´ëÇØ ´Ù ´õÇϸé 1ÀÌ µÈ´Ù, .

¿©·¯ º¯¼ö¸¦ °í·ÁÇÏ°ÔµÇ¸é °æ¿ìÀÇ ¼ö°¡ ¸¹¾ÆÁö¹Ç·Î °¢ °æ¿ì¿¡ ´ëÇÑ È®·üÀº ´õ ÀÛ¾ÆÁø´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù.

¿©±â¼­ ÇÑ º¯¼ö Y¸¦ ¹«½ÃÇÏ·Á¸é .

À̰ÍÀ» joint ºÐÆ÷ÇÔ¼ö ·Î Ç¥ÇöÇϸé, . ¿©±â¼­ ¿¬À¯µÇ¾î, joint°¡ ¾Æ´Ñ ÇÑ °³ÀÇ º¯¼ö¿¡ ´ëÇÑ °ÍÀ» marginal('°¡ÀåÀÚ¸®ÀÇ')À̶ó°í ºÎ¸£°Ô µÇ¾ú´Ù. marginalÀ̶ó´Â À̸§ÀÌ joint ºÐÆ÷·ÎºÎÅÍ ¾ò¾îÁö±â´Â ÇßÀ¸³ª, ½ÇÁ¦ÀÇ °æ¿ì Åë°è¸¦ ÅëÇØ marginalÀº ½±°Ô ¾Ë ¼ö ÀÖÀ¸³ª  joint ºÐÆ÷´Â ¾Ë ¼ö ¾ø´Â °ÍÀÌ Åë·ÊÀÌ´Ù.

 

µÎ º¯¼ö »çÀÌÀÇ »ó°ü°ü°èÀÇ ±âº»Àº ±× µÑÀÌ µ¶¸³Àΰ¡ ¾Æ´Ñ°¡¸¦ ¹àÈ÷´Â ÀÏÀÌ´Ù.

µ¶¸³À̶ó ÇÔÀº È®·üÀûÀ¸·Î ¹«°üÇÏ´Ù´Â °ÍÀ» ¸»ÇÑ´Ù. ÀÇ Á¶°ÇÀ» ¸¸Á·½ÃŰ¸é µÈ´Ù. ¿¬¼ÓÀÇ °æ¿ì¿¡´Â . ¹Ù·Î ÀÌ¿Í °°ÀÌ joint ¹Ðµµ . Áú·® ÇÔ¼ö¸¦ marginalÀÇ °öÀ¸·Î Ç¥ÇöÇϱâ À§ÇÏ¿© µ¶¸³¼º °¡Á¤ÀÌ ³Î¸® (³²¿ë¿¡ °¡±õ°Ô) »ç¿ëµÇ°í ÀÖ´Ù. µ¶¸³¼º °¡Á¤ÀÌ ¾ø´Â °æ¿ì joint È®·üÀ» ¾Ë¾Æ³»±â¶õ Åë°è¸¦ ÅëÇØ¼­´Â °ÅÀÇ ºÒ°¡´É¿¡ °¡±õ³ª.

(»ç½Ç µ¶¸³»ç°ÇÀÇ °³³äÀº »ç°Ç A,B¿¡ ÀÖ¾î P[A, B] = P[A] P[B]ÀÎ °æ¿ì·Î Á¤ÀÇµÇ¸ç ±×·¸±â ¶§¹®¿¡ Áú·®.¹Ðµµ.ºÐÆ÷ÇÔ¼ö µî¿¡ ´ëÇØ¼­ À§¿Í °°ÀÌ Á¤ÀÇµÈ °ÍÀÌ´Ù.)

µ¶¸³À̶ó´Â °ÍÀ» ¹àÇô³»¸é ¿©·¯ Æí¸®ÇÑ Á¡ÀÌ Àִµ¥, ´õÇÑ °ÍÀÇ ºÐ»êÀÌ ºÐ»êÀ» ´õÇÑ °ÍÀÌ µÉ ¼ö ÀÖ°í, °öÇÑ °ÍÀÇ Æò±ÕÀÌ Æò±ÕÀ» °öÇÑ °ÍÀÌ µÉ ¼ö ÀÖ´Ù´Â °Í, ±×¸®°í Á¤ÀÇ ±×´ë·Î joint ¹ÐµµÇÔ¼ö°¡ marginal ¹ÐµµÇÔ¼öÀÇ °öÀ¸·Î Ç¥ÇöµÈ´Ù´Â °ÍÀ» ¿ì¼± µé ¼ö ÀÖ´Ù.

 

µÎ º¯¼ö »çÀÌÀÇ µ¶¸³¿©ºÎ¸¦ ¹àÈ÷´Â µ¥ À־ joint ºÐÆ÷¸¦ ´Ù ¾Ë¾Æ³»°í ¸ðµç °æ¿ì¿¡ ´ëÇØ À§ÀÇ Á¶°ÇÀ» °Ë»çÇÏ±ä ±ÍÂú±âµµ ÇÏ°í ºÒ°¡´ÉÇϰųª ºñ½Ç¿ëÀûÀÎ °æ¿ì°¡ ¸¹À¸¹Ç·Î, Á»´õ ½±°Ô ÆÇº°Çϴ ôµµ·Î¼­ covariance µîÀ» »ç¿ëÇÑ´Ù.

correlation˼

covariance´Â

correlation coefficient´Â

Àß º¸¸é covariance´Â °¢°¢ÀÇ Æò±ÕÀ» 0À¸·Î ¸¸µé±â À§ÇÑ Á¤±ÔÈ­(normalization), correlation coefficient´Â (Ç¥ÁØÁ¤±ÔºÐÆ÷¿¡¼­ ±×·¨´ø °Íó·³) °Å±â¿¡ ´õÇØ °¢°¢ÀÇ Ç¥ÁØÆíÂ÷¸¦ 1·Î ¸¸µé±â À§ÇÑ Á¤±ÔÈ­¸¦ ÇÑ °ÍÀÓÀ» ¾Ë ¼ö ÀÖ´Ù.

100% ÀÇÁ¸ÀûÀÎ (Áï ¶È°°Àº) º¯¼ö µÑ »çÀÌÀÇ covariance´Â ¹Ù·Î ºÐ»êÀÌ µÈ´Ù. ±×¶§ÀÇ correlation coefficient´Â 1ÀÌ µÊÀ» ¾Ë ¼ö ÀÖ´Ù.

 

covariance³ª correlation coefficient°¡ 0ÀÏ ¶§ ÀÌ µÑÀº uncorrelatedµÇ¾ú´Ù°í ÇÑ´Ù. (correlationÀÌ 0ÀÏ ¶§¿¡´Â orthogonalÇÏ´Ù°í ÇÑ´Ù.) µÎ º¯¼ö°¡ ¼­·Î µ¶¸³À̶ó¸é uncorrelatedÀÌÁö¸¸, uncorrelated¶ó ÇØ¼­ µ¶¸³À̶ó´Â º¸ÀåÀº ¾ø´Ù.

¶ÇÇÑ correlation coefficient°¡ 1À̳ª -1ÀÏ ¶§´Â µÎ º¯¼ö »çÀÌ¿¡´Â È®Á¤ÀûÀÎ ¼±Çü°ü°è½ÄÀÌ ¼º¸³ÇÑ´Ù. (ÁÖ¾îÁø ½ÇÇè°á°ú ³»Áö Åë°è¼öÄ¡µé·ÎºÎÅÍ È®Á¤ÀûÀÎ ¼±Çü°ü°è½ÄÀ» ã´Â ÀÏÀ» ¼±Çüȸ±Í(linear regression)¶ó Çϸç, ¾Æ¸¶ ¿©·¯ºÐÀº À̰Ͱú À¯»çÇÑ ÀÏÀ» ÇкÎ1Çг⠹°¸®³ª È­ÇÐ ½ÇÇè½Ã°£ ¶Ç´Â 2Çг⠼±Çü´ë¼ö ½Ã°£¿¡ ´Ù·ç°Å³ª Á÷Á¢ ½áº» ¹Ù ÀÖÀ» °ÍÀÌ´Ù.)