[Å×ũȦ¸¯] »ï¼ºÀüÀÚ°¡ Åë·¹ø¿ª, ÀÚÀ²ÁÖÇà µî ºÐ¾ßÀÇ ±Û·Î¹ú ÀΰøÁö´É(AI) Å×½ºÆ® ´ëȸ¿¡¼ 1À§¸¦ Â÷ÁöÇÏ¸ç ±â¼ú ÁÖµµ±ÇÀ» À̾°í ÀÖ´Ù. °¢ ´ëȸ¿¡¼ È°¿ëÇÑ AI ¾Ë°í¸®ÁòÀº ½Ç»ýÈ°°ú ¹ÐÁ¢ÇÑ ±â¼úµéÀÌ¾î¼ ´õ °ü½ÉÀ» ²ö´Ù.
»ï¼ºÀüÀÚ´Â ¼¼Æ®ºÎ¹® ¼±Çà ¿¬±¸°³¹ß(R&D) Á¶Á÷ÀÎ »ï¼º¸®¼Ä¡ÀÇ Æú¶õµå¿¬±¸¼Ò°¡ Áö³´Þ ¿µ±¹ ¿¡µç¹ö·¯ ´ëÇаú °øµ¿À¸·Î ±Û·Î¹ú Åë·¹ø¿ª AI ´ëȸÀÎ ‘IWSLT(International Workshop on Spoken Language Translation)’¿¡ Âü°¡ÇØ 1À§¿¡ ¿Ã¶ú´Ù°í 23ÀÏ ¹ßÇ¥Çß´Ù.
IWSLT´Â AI¸¦ È°¿ëÇØ Å뿪, ¹ø¿ªÀÇ Á¤È®¼ºÀ» °Ü·ç´Â ´ëȸ Áß ‘WMT(Workshop on Machine Translation)’¿Í ÇÔ²² ½Öº®À» ÀÌ·é´Ù. »ï¼º¸®¼Ä¡ Æú¶õµå¿¬±¸¼Ò´Â IWSLT¿¡¼ Áö³ÇØ¿¡ À̾î 2³â ¿¬¼Ó 1À§¸¦ ±â·ÏÇÏ¸ç °æÀï·ÂÀ» ÀÔÁõÇß´Ù.
IWSLT´Â µÎ °³ ºÎ¹®À¸·Î ³ª´² ´ëȸ¸¦ ÁøÇàÇÑ´Ù. Æú¶õµå¿¬±¸¼Ò´Â ÀÚ·á°¡ ºÎÁ·ÇÑ »óȲ¿¡¼ ¹ø¿ªÀ» ½ÇÇàÇÏ´Â ºÎ¹®(Low Resource Machine Translation)¿¡ Âü°¡Çß´Ù. ´ëȸ´Â AI ±â¼úÀ» È°¿ëÇØ ½ºÆäÀÎ ºÏµ¿ºÎ Áö¿ª¿¡¼ ¾²´Â ¹Ù½ºÅ©¾î ±â¹ÝÀÇ Å×µå °¿¬(TED Talks)À» ¿µ¾î·Î ¹ø¿ªÇÏ´Â ÇüÅ·ΠÁøÇàµÆ´Ù.
ÁÖÃÖ ÃøÀº ¹Ù½ºÅ©¾î¿Í ¿µ¾î·Î ¦ Áö¾îÁø 100¸¸°³ÀÇ ¿µÈ ÀÚ¸·°ú ÀϺΠ´Ù±¹¾î Å×µå °¿¬ ÀÚ¸·À» Á¦°ø[1]Çß´Ù. AI ¾Ë°í¸®ÁòÀÌ ÀÌ ÀÚ·áµé¸¸À¸·Î ÇнÀÀ» ÇÑ µÚ, º°°³ÀÇ Å×µå °¿¬À» ¹ø¿ªÇÏ°Ô ÇÏ´Â °í³À§µµ ¹æ½ÄÀÌ´Ù. »ï¼º¸®¼Ä¡ Æú¶õµå¿¬±¸¼Ò´Â »ç¶÷ÀÌ ¹ø¿ªÀ» ÇßÀ» ¶§¿Í ºñ±³ÇØ, 26.21Á¡ÀÇ °¡Àå ³ôÀº ¸ÅĪ·ü[2]À» ±â·ÏÇÏ¸ç ¼±µÎ¿¡ ¿Ã¶ú´Ù. À̹ø ±â¼úÀº ÀÚ·á°¡ ºÎÁ·ÇÑ »óȲ¿¡¼µµ AI¸¦ È°¿ëÇØ ´Ù±¹¾î ¹ø¿ªÀ» ½ÇÇàÇÏ´Â ¼Ö·ç¼Ç¿¡ À¯¿ëÇÏ°Ô ¾²ÀÏ ¼ö ÀÖ´Ù.
»ï¼º¸®¼Ä¡ ¿ìÅ©¶óÀ̳ª¿¬±¸¼Ò´Â ÀÚµ¿Â÷ °ü·Ã ºÐ¾ß¿¡¼ ¼¼°è 3´ë[3] AI ´ëȸ·Î ²ÅÈ÷´Â ‘KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago)’ÀÇ ÇÑ ºÐ¾ß¿¡¼ 1À§¸¦ ±â·Ï ÁßÀÌ´Ù. KITTI´Â µµ·Î»óÅÂ, ¹°Ã¼Å½Áö, º¸ÇàÀÚ ÃßÀû, À½Çâ µî ÀÚµ¿Â÷ °ü·Ã AI ±â¼úÀ» °Ü·ç´Â ´ëȸ´Ù.
¿ìÅ©¶óÀ̳ª¿¬±¸¼Ò´Â 9´ë ºÎ¹®, 17´ë ºÐ¾ß ´ëȸ Áß º¸ÇàÀÚ ÃßÀû ºÐ¾ß¿¡ Âü°¡Çß´Ù. ´ëȸ´Â 28°³ÀÇ ¼·Î ´Ù¸¥ ¿µ»ó¿¡¼ ÃßÃâÇÑ ¾à 3,400ÀåÀÇ ¿¬¼ÓµÈ »çÁø ¼Ó¿¡¼ ƯÁ¤ º¸ÇàÀÚÀÇ µ¿¼±À» ¾ó¸¶³ª Á¤È®È÷ ÃßÀûÇÏ´À³Ä¸¦ °Ü·ç´Â ¹æ½ÄÀ¸·Î ÁøÇàÇÑ´Ù.
¿ìÅ©¶óÀ̳ª¿¬±¸¼Ò´Â ‘¼Å¸Å°(SiRtaKi)’¶ó´Â ¹°Ã¼ ÃßÀûÀ» À§ÇÑ ÀÚü AI ¾Ë°í¸®ÁòÀ¸·Î Áö³ 8¿ù ´ëȸ¿¡ Âü°¡ÇØ ÇöÀç±îÁö 1À§¸¦ ÁöÅ°°í ÀÖ´Ù[4]. »ï¼º¸®¼Ä¡´Â À̹ø ´ëȸ¿¡¼ ¿ì¼ö¼ºÀ» ÀÎÁ¤¹ÞÀº ¼Å¸Å° ¼Ö·ç¼ÇÀ» ÀÚÀ²ÁÖÇà, Â÷¼¼´ë °¡Àü µî ºÐ¾ß¿¡ Àû¿ëÇÒ °èȹÀÌ´Ù.
¾Õ¼ »ï¼º¸®¼Ä¡´Â 7¿ù ±â°èÇнÀ(machine reading) ºÐ¾ßÀÇ ±Û·Î¹ú ´ëȸ Áß ÇϳªÀÎ ‘¸¶¸£ÄÚ(MSMARCO)’, ‘Æ®¸®ºñ¾Æ(TriviaQA)’ Å×½ºÆ®¿¡¼ ³ª¶õÈ÷ 1À§¿¡ ¿Ã¶ú´Ù. ÀÌÁß Æ®¸®ºñ¾ÆÀÇ À¥(web) ºÐ¾ß¿¡¼ ¿©ÀüÈ÷ 1À§ ÀÚ¸®¸¦ ÁöÅ°°í ÀÖ´Ù. 3¿ù¿¡´Â »ï¼º¸®¼Ä¡ º£ÀÌ¡¿¬±¸¼Ò°¡ ±¹Á¦ÆÐÅÏÀνÄÇùȸ(IAPR)ÀÇ ¹®ÀÚÀÎ½Ä ´ëȸ(‘ICDAR’)¿¡¼ 1À§¿¡ ¿À¸£±âµµ Çß´Ù. ICDARÀº ±¤Çй®ÀÚÆǵ¶(OCR) ºÐ¾ß¿¡¼ ¿µÇâ·ÂÀÌ °¡Àå Å« ´ëȸ´Ù.
»ï¼º¸®¼Ä¡ Á¶½Âȯ ºÎ¼ÒÀå(ºÎ»çÀå)Àº “»ï¼ºÀüÀÚ´Â ¼¼°è °¢Áö¿¡¼ ¼¼»óÀ» ¹Ù²Ü AI ±â¼ú °³¹ß¿¡ ¸ÅÁøÇÏ°í ÀÖ´Ù”¸ç “ÀÌ·¯ÇÑ ±â¼úµéÀ» ȸ»çÀÇ Çõ½Å Á¦Ç°°ú ¼ºñ½º¿¡ Àû¿ëÇØ »ç¿ëÀÚ°¡ Áß½ÉÀÌ µÇ´Â AI ¼¼»óÀ» ±¸ÇöÇسª°¥ °Í”À̶ó°í ¹àÇû´Ù.
À̽ÂÇÊ ±âÀÚ philph@techholic.co.kr
<ÀúÀÛ±ÇÀÚ © Å×ũȦ¸¯, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö>