상단여백
HOME 뉴스·정책
인공지능…사진 1장이면 미래 영상을
  • 이장혁 IT칼럼니스트
  • 승인 2016.12.01 08:30
  • 댓글 0




MIT 연구팀이 사진 1장을 이용해 1.5초짜리 동영상을 자동 생성하는 기술을 발표했다. 사진을 입력하면 골프장을 걷는 사람이나 해안에 넘실대는 물결, 선로를 달리는 열차 등이 움직이는 형태를 만들어준다.

이 기술을 발표한 건 MIT 산하 컴퓨터공학및인공지능연구소 CSAIL(Computer Science and Artificial Intelligence Lab) 연구팀. 플리커 등을 통해 소스를 모아 골프장이나 해변 등 영상 길이 1년 분량을 모아서 딥러닝을 통해 장면마다 움직임을 만드는 모델을 만든다.

사람이라면 어디에서 뭘 보고 있는지 어떻게 다리를 움직였는지 다양한 상식을 배우기 때문에 돌발적인 움직임이 아니라면 다음 행동을 예상할 수 있다. 하지만 이번에 개발한 움직임을 예측하는 모델은 중력과 땅, 물과 동물 같은 개념이 아니라 단순한 픽셀 연속 상태에서 전경과 배경을 잘라 움직이는 부분을 패턴으로 학습해간 것이다.

여기에 사용한 건 GAN(generative adversarial networks)으로 판별하는 측에 있는 네트워크 2개가 서로 겨루게 해 학습 효과를 강화하는 수법을 이용한다. 대량 데이터를 통해 학습을 해 동영상을 만들고 데이터세트에 있는 실제 동영상과 거짓 영상을 구별할 수 있게 훈련을 한다. 이렇게 2가지 네트워크를 통해 겨루게 하는 방법 자체는 이전부터 컴퓨터를 이용한 정지화면 생성에 이용된 바 있다. 이번 발표는 이런 수법을 동영상으로 확장한 것이라고 할 수 있다.





이렇게 장면마다 훈련을 한 뒤에는 알고 있던 영상 패턴에 가까운 걸 찾아 원본에 존재하지 않지만 그럴 듯한 짧은 동영상을 생성할 수 있게 된다. 이렇게 만든 영상은 인간의 눈으로 보면 이상한 왜곡이 있지만 어디로 움직이는지 어떻게 움직이는지에 대한 상식이 전혀 없는 컴퓨터가 대체적으로 정확하게 생성한다는 걸 알 수 있다.

물론 미래에 인공지능은 이런 점에선 그야말로 미래를 예견하는 초인적인 특수 능력을 갖출 것처럼 느껴진다. 하지만 실제로는 돌발적인 움직임을 읽을 수 있는 건 아니며 인간이라면 쉽게 해낼 수 있는 보통 이렇게 될 것이라는 예상을 보여주는 정도다. 미래를 예측하는 예지가 아니라는 것이다.

다만 이런 시도는 보통 이렇게 될 것이라는 예상을 할 수 있다는 건 반대로 돌발 사태가 일어나고 있을지 여부를 감지할 수 있다는 얘기가 될 수 있다. 연구팀에 따르면 감시카메라와 로봇, 자동운전 차량 등 컴퓨터 비전에 이런 기능을 부여해 비정상적 움직임을 감지하는 응용이 가능할 것이라고 한다. 또 움직임에 관한 지식을 컴퓨터가 확보하게 되면 사진 1장이나 한정적 정보를 통한 인식 능력도 높일 수 있다.

이번 연구는 머신러닝과 이미지 생성의 결합을 동영상, 그런니까 움직이는 쪽으로 방향을 확장한 연구라는 점에서 의미가 있다. 관련 내용은 이곳에서 확인할 수 있다.

https://www.youtube.com/watch?v=Pt1W_v-yQhw

이장혁 IT칼럼니스트  hymagic@naver.com

<저작권자 © 테크홀릭, 무단 전재 및 재배포 금지>

이장혁 IT칼럼니스트의 다른기사 보기
인기기사
추천기사
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
여백
여백
재미있는 테크월드 세상
여백
여백
여백
여백
여백
여백
여백
Back to Top