default_top_notch
default_setNet1_2
ad34

MIT, 물질 생성 추론 인공지능 시스템 개발

기사승인 2017.11.19  22:31:43

공유
default_news_ad1

- 표적 물질 명칭, 수량, 장비 이름, 작동 조건, 서술 형용사 등 포함

   
 
MIT가 각종 물질을 생성하는 레시피를 추론할 수 있는 인공지능(AI) 시스템을 개발했다.

UC버클리와 공동으로 진행한 이번 프로젝트에서 연구팀은 수백만 개의 논문에서 추출한 재료 생성법을 포함하는 DB를 구축하고 표적 물질의 이름과 전구체 물질, 반응 조건, 제조 공정과 같은 각각의 기준을 입력하는 방식으로 시스템을 구현했다.

MIT 재료과학공학부 엘사 올리베티(Elsa Olivetti)는 "그동안 컴퓨터 기반 물질 과학자들은 무엇을 만들 것인가하는 부분에서 많은 진전을 이뤘다"며 "그러나 원하는 특성에 따라 어떤 재료를 설계해야 하는지에 대한 부분에서는 명확한 접근이 이뤄지지 않고 있다"고 말했다.

올리베티와 그의 동료들은 이를 위한 첫 단계로 연구 논문을 분석하고, 단락에 재료 레시피가 포함되어 있는지 추론하고, 레시피 내의 역할에 따라 해당 단락의 단어를 분류할 수있는 머신러닝 시스템을 개발했다. 여기에는 표적 물질의 명칭, 수량, 장비의 이름, 작동 조건, 서술 형용사 등이 포함돼 있다.

'화학(Chemistry)' 저널 최신호에 실린 관련 논문에서 이 머신러닝 시스템은 추출된 데이터를 분석해 재료의 종류(가령 혼합이 요구하는 다양한 온도 범위 등), 혹은 개별 재료의 특성(제조 조건이 다를 때 취하는 다양한 물리적 형태 등)에 따른 일반적인 특성을 추론할 수 있음을 보여준다. 올리베티는 이 논문의 수석 저자이며 다수의 연구자들이 참여하고 있다.

연구팀은 감독(supervised) 학습과 비감독(unsupervised) 학습을 혼용해 기계를 학습시켰다. 감독의 의미는 시스템에 공급되는 훈련 데이터가 먼저 사람에 의해 일정한 주석이 첨부되는 것으로 시스템은 원시 데이터와 주석 간의 상관관계를 찾으려고 시도한다. 비감독 학습은 훈련 데이터에 주석을 달지 않고 대신 시스템이 구조적 유사점에 따라 데이터를 함께 클러스터링하는 것을 의미한다.

연구팀은 초반에 물질-레시피 추출은 새로운 연구 분야이기 때문에 많은 데이터를 확보하지 못했다. 약 100개 정도의 논문에 불과했는데 이는 머신러닝 기준으로 보면 매우 작은 데이터 세트에 해당한다. 이를 보강하기 위해 워드2벡(Word2vec)이라는 구글 개발 알고리즘을 사용해 단어가 나오는 문맥과 유사한 문맥을 갖는 경향이 있는 단어를 그룹화하는 기술의 도움을 얻었다.

예를 들어 한 논문에 "우리는 사염화 티탄을 500℃로 가열했다"고 나와있고 다른 하나에는 "수산화나트륨이 500℃로 가열되었다"는 문장이 있다면 워드2벡은 사염화 티탄과 수산화나르륨을 함께 그룹으로 묶어주는 식이다. 워드2벡을 사용하면 연구자는 컴퓨터 학습 시스템이 주어진 단어에 첨부된 레이블이 클러스터된 다른 단어에도 적용될 수 있기 때문에 학습 데이터 세트를 크게 확장할 수 있다. 연구팀은 이후 약 64만 개의 논문을 연구할 수 있었다.

물론 시스템의 정확성을 테스트하려면 레이블이 지정되지 않은 데이터에 대한 성능을 평가해야 하지만 이는 포함되지 않았다. 이 실험에서 학습 시스템은 레시피가 포함된 단락을 99%의 정확도로 식별했으며 해당 단락 내 단어의 정확도는 86%인 것으로 나타났다.

연구진은 추가 작업으로 시스템 정확성 향상을 꾀할 계획이며 기존 문헌에서 거론되지 않는 물질에 대한 레시피도 자동적으로 고안할 수 있도록 할 예정이다. UC산타바바라의 람 세샤드리(Ram Seshadri) 교수는 "이것은 획기적인 작업"이라고 평가하고 "저자들은 AI를 통해 새로운 물질 준비에 사용된 전략을 포착하는 어렵고 야심찬 과제를 수행해냈다"고 말했다.
 

조인혜 ihcho@irobotnews.com

<저작권자 © 로봇신문사 모바일 무단전재 및 재배포금지>
default_news_ad4
ad49
default_side_ad1
ad42
ad62
ad63
ad65
ad44
ad86
ad90
ad105
ad110

인기기사

ad56
ad80
ad133
ad58

포토

1 2 3
set_P1
ad60
ad74
default_main_ad1
default_setNet1_1

섹션별 인기기사 및 최근기사

default_setNet2
ad36
default_bottom
#top
default_bottom_notch