ÄÛ½º¿þÀ̺ê´Â ÀΰøÁö´É(AI) ¾ÈÀü¼º°ú AI Á¤·Ä(Alignment) ºÐ¾ßÀÇ ¿¬±¸¸¦ ÁÖµµÇÏ´Â À̱â¹Î Ä«À̽ºÆ® ±³¼ö¸¦ ¾îµå¹ÙÀÌÀú·Î ¿µÀÔÇß´Ù°í 10ÀÏ ¹àÇû´Ù.
À̱â¹Î ¾îµå¹ÙÀÌÀú´Â ±¹Á¦¸Ó½Å·¯´×ÇÐȸ(ICML)¿Í ½Å°æÁ¤º¸Ã³¸®½Ã½ºÅÛÇÐȸ(NeurIPS), ±¹Á¦Ç¥ÇöÇнÀÇÐȸ(ICLR) µî ¼¼°è AI ºÐ¾ß ÃÖ°í ¼öÁØÀÇ ÇÐȸ¿¡¼ ³í¹®À» ´Ù¼ö °ÔÀçÇÏ°í ¿öÅ©¼óÀ» ÁÖÃÖÇÑ Â÷¼¼´ë ¿¬±¸ÀÚ´Ù. ½ÅÁø¿ì Ä«À̽ºÆ® ¼®Á±³¼öÀÇ Áöµµ ¾Æ·¡ ¹Ú»ç ÇÐÀ§ Ãëµæ ÈÄ AI °ÈÇнÀ ºÐ¾ßÀÇ ±ÇÀ§ÀÚÀÎ UC ¹öŬ¸®ÀÇ ÇÇÅÍ ¾Æºô ±³¼ö ¿¬±¸½Ç¿¡¼ ¹Ú»çÈÄ °úÁ¤À» ¼ö·áÇß´Ù. ÀÌÈÄ ±¸±Û ¸®¼Ä¡ ¼Ò¼Ó ¸®¼Ä¡ »çÀ̾ðƼ½ºÆ®¸¦ °ÅÃÄ ÇöÀç ±èÀçö Ä«À̽ºÆ® AI ´ëÇпø¿¡¼ ºÎ±³¼ö·Î ÀçÁ÷ ÁßÀÌ´Ù.
ÄÛ½º¿þÀ̺ê´Â À̹ø ¾îµå¹ÙÀÌÀú ¼±ÀÓÀ¸·Î AI Á¦Ç° ºÐ¼® Ç÷§Æû '¾ó¶óÀÎ AI'ÀÇ ¾ÈÀü¼ºÀ» °ÈÇÏ°í ³ª¾Æ°¡ ¾ÈÀüÇÑ AI »ýÅ°è Á¶¼º¿¡ ¾ÕÀå¼±´Ù´Â °èȹÀÌ´Ù. ÀÌ ±³¼ö´Â ¾ÈÀüÇÑ AI °³¹ßÀ» À§ÇØ AI ¸ðµ¨ÀÌ À߸øµÈ °á°ú¹°À» ³ÂÀ» ¶§ Àΰ£ÀÌ Çǵå¹éÀ» ÁÖ¸ç °È ÇнÀÀ» ½ÃÅ°´Â RLHF(Reinforcement learning from human feedback)¸¦ Áö¼Ó ¿¬±¸ÇØ¿Ô´Ù. ÀÌ °°Àº ¿¬±¸ ¹æ½ÄÀ» '¾ó¶óÀÎ AI'¿¡ Àû¿ëÇØ AI ½Ã½ºÅÛÀÌ °ÞÀ» ¼ö ÀÖ´Â ÁÖ¿ä À§Çè ¹× ¾Ç¿ë »ç·Ê¸¦ ½Äº°ÇÏ°í AI ¸ðµ¨ÀÇ Ãë¾àÁ¡À» º¸¿ÏÇÒ ¿¹Á¤ÀÌ´Ù.
À̱â¹Î ¾îµå¹ÙÀÌÀú´Â "AI ¾ÈÀü¼º¿¡ ´ëÇÑ ³íÀÇ°¡ È°¹ßÇØÁö´Â °¡¿îµ¥ ¿¬±¸ ¹× ³íÀÇ¿¡ ±×Ä¡Áö ¾Ê°í À̸¦ Àû¿ëÇÏ¿© ´õ ³ªÀº Á¦Ç°À» Á¦°øÇÏ°íÀÚ ÇÏ´Â ÄÛ½º¿þÀ̺êÀÇ »ç¾÷ ¹æÇ⼺°ú °¡Ä¡°ü¿¡ °ø°¨ÇØ ÇÕ·ù¸¦ °áÁ¤Çß´Ù"¸ç "¸ðµç ±â¾÷°ú ¼ÒºñÀÚ°¡ ¾È½ÉÇÏ°í AI Á¦Ç°À» ÀÌ¿ëÇÒ ¼ö ÀÖµµ·Ï ¿¬±¸ ¹× Á¦Ç° °³¹ß¿¡ ±â¿©ÇÏ°Ú´Ù"°í ¸»Çß´Ù.
ÃÖÀ¯¸® ±âÀÚ yrchoi@asiae.co.kr <¨ÏÅõÀÚ°¡¸¦ À§ÇÑ °æÁ¦ÄÜÅÙÃ÷ Ç÷§Æû, ¾Æ½Ã¾Æ°æÁ¦ ¹«´ÜÀüÀç ¹èÆ÷±ÝÁö> |