¸¶À½¿¡À̾ÆÀÌ°¡ ¼¼°è ÃÖ°í ±ÇÀ§ÀÇ ÀΰøÁö´É(AI) ÇÐȸÀÎ ½Å°æÁ¤º¸Ã³¸®½Ã½ºÅÛÇÐȸ(NeurIPS) 2024¿¡¼ ÃÖ¿ì¼ö³í¹®»óÀ» ¼ö»óÇß´Ù°í 26ÀÏ ¹àÇû´Ù. NeurIPS´Â AI ºÐ¾ß¿¡¼ °¡Àå ±ÇÀ§ ÀÖ´Â ÇÐȸ·Î, ¸Å³â ¼ö¸¸ °ÇÀÇ ³í¹® Áß ±Ø¼Ò¼ö¸¸ÀÌ ÃÖÁ¾ äÅõȴÙ. ¸¶À½¿¡À̾ÆÀÌ´Â ±× Áß¿¡¼µµ ÃÖ°í ÁßÀÇ ÃÖ°í¸¦ °¡¸®´Â ÃÖ¿ì¼ö³í¹®»ó¿¡ ¼±Á¤µÅ, ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®, µö¸¶Àεå¿Í ¾î±ú¸¦ ³ª¶õÈ÷ Çß´Ù. À̹ø¿¡ ¼ö»óÇÑ ³í¹® "Integrating Visual and Linguistic Instructions for Context-Aware Navigation Agents"´Â ¸¶À½¿¡À̾ÆÀÌ¿Í ¿¬¼¼´ëÇб³ ¹Ì¸£·¦ÀÌ °øµ¿ ¿¬±¸ÇÑ °á°ú¹°·Î, ÃÖ±Ù AI ¾÷°è¿¡¼ °¡Àå ÁÖ¸ñ¹Þ´Â ¿£µåÅõ¿£µå ·Îº¿ ±âÃÊ ¸ðµ¨(End-to-End Robot Foundation Model) ºÐ¾ßÀÇ ¼±±¸ÀûÀÎ ¿¬±¸´Ù. ÀÌ ³í¹®¿¡¼ ¸¶À½¿¡À̾ÆÀÌ´Â ±¹³» ÃÖÃÊ·Î ÀÎÁö ÀÌÇØ Á¦¾î(Vision Language Action) ¸ðµ¨ 'CANVAS'¸¦ °ø°³Çϸç, Ä«¸Þ¶ó·Î ȯ°æÀ» ÀÎÁöÇÏ°í(Vision), À̸¦ ¾ð¾îÀûÀ¸·Î ÀÌÇØÇϸç(Language), ·Îº¿À» Á¦¾î(Action)ÇÏ´Â »õ·Î¿î AI ±â¼úÀÇ Ç¥ÁØÀ» Á¦¾ÈÇß´Ù. ³í¹®ÀÇ 1ÀúÀÚÀÌÀÚ NeurIPS ÇÐȸ¿¡¼ Á÷Á¢ ³í¹®À» ¹ßÇ¥ÇÑ Á¶¿ëÁØ ¸¶À½¿¡À̾ÆÀÌ ¼±ÀÓ¿¬±¸¿øÀº “À̹ø ÇÐȸ ±â°£ µ¿¾È Å×½½¶ó, ±¸±Û ¿þÀ̸ð, Å©·çÁî µî ÁÖ¿ä ÀÚÀ²ÁÖÇà ·Îº¿ ȸ»çÀÇ ¿¬±¸¿øµé°ú ±³·ùÇϸç, VLA ±â¼ú¿¡ ´ëÇÑ ¶ß°Å¿î °ü½ÉÀ» È®ÀÎÇÒ ¼ö ÀÖ¾ú´Ù”¸ç, “À̵é ÃÖ°í ȸ»ç ¼Ò¼ÓÀÇ ¿¬±¸¿øµéµµ ¸¶À½¿¡À̾ÆÀÌÀÇ ¿¬±¸°¡ VLA ±â¼ú »ó¿ëȸ¦ À§ÇÑ ¹æÇâÀ» Àß Àâ¾Ò´Ù´Â Á¡À» ÀÎÁ¤Çß´Ù”´Â ÀڽۨÀ» ³»ºñÃÆ´Ù. ¸¶À½¿¡À̾ÆÀÌ´Â ÃÖ±Ù ÀÌ ±â¼úÀ» ±â¹ÝÀ¸·Î ÁÖÇà ºÐ¾ß¿¡ Æ¯ÈµÈ Á¦Ç° '¿öºê(WoRV)'¸¦ Ãâ½ÃÇß´Ù. ³»³â »ó¹Ý±â ³»¿¡ ±¹³» ³ó±â°è ÀÚÀ²ÁÖÇà ½ºÅ¸Æ®¾÷°úÀÇ Çù¾÷À» ÅëÇØ ½ÇÁ¦ »ó¿ëÈµÈ Á¦Ç°À¸·Î Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù. ÇÑÆí, ¸¶À½¿¡À̾ÆÀÌ´Â À̹ø¿¡ ¼ö»óÇÑ ³í¹®°ú °°ÀÌ »õ·Î¿î AI ¸ðµ¨À» °³¹ßÇÏ´Â °Í°ú µ¿½Ã¿¡, À̸¦ °æ·®ÈÇØ ¿Âµð¹ÙÀ̽ºAI¿ë Ĩ¿¡ žÀçÇÏ´Â ¿¬±¸µµ È°¹ßÇÏ°Ô ÁøÇà ÁßÀÌ´Ù. ³»³â 2¿ù ¸»¿¡´Â ¿öºê ¸ðµ¨À» žÀçÇÑ Â÷·®.·Îº¿ ÀÚÀ²ÁÖÇà Á¦¾î¿ë ¿Âµð¹ÙÀ̽ºAI ¸ðµâ Á¦Ç°À» Á¤½Ä Ãâ½ÃÇÒ ¿¹Á¤ÀÌ´Ù. ¾ÆÁÖ°æÁ¦=¹é¼Çö ¼ö½À±âÀÚ qortjgus0602@ajunews.com |