default_top_notch
default_setNet1_2
ad34

KAIST-구글딥마인드, 시각 개념 이해하는 인공지능 구현

기사승인 2023.11.30  08:12:10

공유
default_news_ad1

- 제37회 신경정보처리학회(NeurIPS)에서 발표 예정

‘노란 포도'나 `보라색 바나나'와 같이 본 적 없는 시각 개념을 이해하고 상상하는 인공지능 능력 구현이 가능해졌다. 

KAIST는 전산학부 안성진 교수 연구팀이 구글 딥마인드 및 미국 럿거스대학교와의 국제공동연구를 통해 시각적 지식을 체계적으로 조합해 새로운 개념을 이해하는 인공지능 새로운 모델과 프로그램을 수행하는 벤치마크를 개발했다고 30일 밝혔다.

인간은 `보라색 포도'와 `노란 바나나' 같은 개념을 학습하고, 이를 분리한 뒤 재조합해 `노란 포도'나 `보라색 바나나'와 같이 본 적 없는 개념을 상상하는 능력이 있다. 이런 능력은 체계적 일반화 혹은 조합적 일반화라고 불리며, 범용 인공지능을 구현하는 데 있어 핵심적인 요소로 여겨진다.

체계적 일반화 문제는 1988년 미국의 저명한 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 이 문제를 해결할 수 없다고 주장한 이후, 35년 동안 인공지능 딥러닝 분야에서 큰 도전 과제로 남아 있다. 이 문제는 언어뿐만 아니라 시각 정보에서도 발생하지만, 지금까지는 주로 언어의 체계적 일반화에만 초점이 맞춰져 있었고, 시각 정보에 관한 연구는 상대적으로 부족했다.

   
▲ 안성진 교수 연구팀은 장면을 구성하는 물체들을 몇 가지 특성으로 분해한 뒤, 해당 특성을 정해진 규칙 아래에서 재조합하여 새로운 이미지를 생성하는 방식을 이용했다.

안성진 교수가 이끄는 국제 공동 연구팀은 이러한 공백을 메우고자 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했다. 시각 정보는 언어와는 달리 명확한 `단어'나 `토큰'의 구조가 없어, 이 구조를 학습하고 체계적 일반화를 달성하는 것이 큰 도전이다.

연구를 주도한 안성진 교수는 “시각 정보의 체계적 일반화가 범용 인공지능을 달성하기 위해 필수적인 능력이며, 이 연구를 통해 인공지능의 추론능력과 상상능력 관련 분야의 발전을 가속할 것으로 기대한다”고 말했다.

또한, 딥마인드의 책임연구원으로 연구에 참여한 연구원이자 현재 스위스 로잔연방공과대학교(EPFL)의 찰라 걸셔(Caglar Gulcehre) 교수는 “체계적 일반화가 가능해지면 현재보다 훨씬 적은 데이터로 더 높은 성능을 낼 수 있게 될 것이다”라고 전했다.

이번 연구는 12월 10일부터 16일까지 미국 뉴올리언스에서 열리는 제37회 신경정보처리학회(NeurIPS)에서 발표될 예정이다.

장길수 ksjang@irobotnews.com

<저작권자 © 로봇신문사 모바일 무단전재 및 재배포금지>
default_news_ad4
ad49
default_side_ad1
ad42
ad62
ad63
ad65
ad44
ad86
ad90
ad105
ad110

인기기사

ad56
ad133
ad58

포토

1 2 3
set_P1
ad60
ad74
default_main_ad1
default_setNet1_1

섹션별 인기기사 및 최근기사

default_setNet2
ad36
default_bottom
#top
default_bottom_notch