default_top_notch
default_setNet1_2
ad34

바이브컴퍼니, 한국형 생성 AI 언어모델 '바이브 GeM' 공개

기사승인 2023.06.05  10:27:29

공유
default_news_ad1

- 보안, 할루시네이션 등 문제 개선

   
 

바이브컴퍼니(대표 김성언)가 자체 생성형 AI 언어모델인 '바이브GeM(VAIV Generative Model for language, VAIVGeM)'을 공개했다.

최근 정부가 약 3900억 원 규모의 예산을 투입해 초거대 AI 등 차세대 인공지능(AI) 산업을 적극 육성하겠다고 밝혔으며, 네이버도 초거대 AI 언어모델 하이퍼클로바X의 연내 공개 계획을 알리는 등 국내 주요 빅테크 기업에서도 산업 변화에 발빠르게 대응하는 가운데 바이브컴퍼니의 행보에 이목이 집중되고 있다.

바이브는 지난 2일 인공지능·빅데이터 연구소 주관의 기술 워크숍인 '바이브 테크데이(VAIV Tech-day)'를 통해 바이브GeM과, 뉴럴서치(Neural Search, 신경망 검색) 기술과 언어생성 기술을 결합한, '바이브 서치GPT(VAIV SearchGPT)'를 함께 공개했다.

이를 통해 그간 보안 문제나 할루시네이션(hallucination) 이슈 등 다양한 이유로 챗GPT 등 생성형 AI 기술을 도입하지 못했던 공공기관이나 기업들의 고민을 해결할 수 있을 것으로 보인다. 바이브의 기술은 최근 생성형 AI가 직면한 문제들을 보완한 것이 특징이다.

먼저, 안전성 문제를 해결했다. 업무의 효율을 높여주는 챗GPT의 등장은 전 산업군에 AI 수요를 불러왔지만 특히 공공기관이나 대부분의 기업에서는 데이터 유출 등 보안 문제로 당장의 도입은 꺼려하는 분위기다. 바이브 서치GPT는 머신러닝 과정에서 데이터가 외부에 공개되는 것을 원하지 않는 기업이나 기관에 최적화된 형태인 온프레미스(On-Premise, 사내구축형)로 제공되어, 보안 이슈에서 자유롭다는 장점이 있다. 

둘째로 생성 결과의 정확성과 신뢰성을 높였다. 바이브 서치GPT는 AI 언어모델이 잘못된 정보나 허위 정보를 생산하는 할루시네이션 문제를 크게 개선했다. 답변의 근거가 되는 원문 데이터의 출처를 함께 제시해 답변의 신뢰성을 높인 것이다.

셋째로 바이브GeM은 매개변수를 줄이고 미세조정으로 정확도를 높인 맞춤형 대규모 언어모델(LLM)로, 기존 LLM 대비 머신러닝에 소요되는 시간과 비용을 대폭 줄였다.

또한 코어 기술인 바이브GeM은 한국어의 고유한 특성을 잘 반영해 AI 학습을 진행한 한국어 특화 언어모델이라는 차별성도 있다. 바이브는 20년 이상 비정형 데이터를 수집하고 분석하는 꾸준한 연구 개발을 통해 다양한 빅데이터 분석 모델 개발 사업을 진행, 2020년과 2022년 과학기술정보통신부가 주관하는 인공지능 학습용 데이터 구축 지원 사업을 성공적으로 마무리하기도 했다. 또, 지난해 한국어 기계독해 성능 테스트인 '코쿼드 1.0(KorQuAD 1.0)'에서 국내 유수의 기업들을 제치고 1위를 차지하며 다시 한번 기술의 우수성을 입증하기도 했다.

바이브는 뉴럴서치 서비스 '바이브 서치(VAIV Search)'도 곧 선보일 계획이다. 바이브 서치는 사용자가 궁금한 질문을 문장 형태로 입력하면 정답이 있는 문서를 찾아줄 뿐만 아니라 바이브 서치GPT를 탑재해 답변을 단 몇 줄로 요약까지 해주는 검색 서비스다. 기존 키워드 기반의 검색 서비스와 달리, 사용자가 여러 문서를 찾지 않아도 한눈에 원하는 정답을 찾아준다는 특징이 있다.

이외에도 바이브GeM을 기반으로 시장의 수요에 맞는 ▲AI가 데이터의 수집, 분석부터 리포트까지 작성해주는 ‘바이브 리포트 코파일럿(VAIV ReportCopilot)’ ▲AI 대화 솔루션 ‘바이브 챗봇(VAIV Chatbot)’ ▲사용자가 원하는 뉴스를 선별해 요약해주는 ‘바이브 뉴스다이제스트(VAIV NewsDigest)’ 등 다양한 솔루션과도 결합해 제공할 계획이다.

바이브 인공지능·빅데이터 연구소 윤준태 부사장(CTO)은 “바이브의 생성형 AI 언어모델을 활용하면 다양한 산업 도메인에서 적은 비용으로 각 기업, 기관들이 특화된 언어모델을 자체 구축할 수 있다는 장점이 있다”며, “바이브GeM을 지속적으로 고도화해 법률, 금융 정보 같은 전문 분야 특화 모델도 선보일 계획”이라고 말했다.    

장길수 ksjang@irobotnews.com

<저작권자 © 로봇신문사 모바일 무단전재 및 재배포금지>
default_news_ad4
ad49
default_side_ad1
ad42
ad62
ad63
ad65
ad44
ad86
ad90
ad105
ad110

인기기사

ad56
ad80
ad133
ad58

포토

1 2 3
set_P1
ad60
ad74
default_main_ad1
default_setNet1_1

섹션별 인기기사 및 최근기사

default_setNet2
ad36
default_bottom
#top
default_bottom_notch