미국의 인공지능(AI) 연구 기업 오픈AI가 지난해 말 공개한 언어생성 AI인 ‘챗GPT(ChatGPT)’가 오픈 5일 만에 사용자 100만 명을 돌파하면서 ‘대화형 AI’에 대한 관심이 뜨겁다. 초거대 AI를 기반으로 한 챗봇은 기존 서비스와 비교가 안 될 만큼 수준이 높아 가까운 미래에 인간의 보조 역할을 할 것이라는 기대감이 크다. 챗봇이 거대 검색 플랫폼을 대체할 수 있을 것이라는 전망까지 나올 정도다.
특히 올 들어선 세계적으로 마치 인간과 같은 지능을 가진 AI에 대한 대중의 관심도가 높아졌다. 챗GPT의 기반이 된 GPT3 알고리즘은 1750억 개에 달하는 매개변수(파라미터)를 통해 학습데이터를 토대로 주어진 문장 다음에 이어질 가장 적합한 문장을 추측해 보여준다. 일례로 네이버가 개발한 초거대 AI 모델 ‘하이퍼클로바(HyperCLOVA)’의 매개변수는 2400억 개에 달한다. 앞서 구글도 챗봇 인공지능 람다(LaMDA)를 공개하는 등 전 세계 빅테크의 AI 기술 경쟁도 한층 뜨거워지는 모양새다.
글로벌 정보기술(IT)업계에서 구루(Guru)로 통하는 스콧 갤러웨이 뉴욕대학교 스턴비즈니스 스쿨 교수는 올해를 대표할 기술로 AI를 꼽았다. 그는 올해 1월 올린 ‘2023년 전망(Predictions)’ 글에서 “지난해 웹3와 마찬가지로 AI는 2023년 최고의 하이프(Hype·과장된 유행)를 충족하는 기술이 될 것”이라고 언급했다. 그는 “웹3와 달리 AI는 대부분 하이프에 부응할 것”이라면서 “우리는 이미 스테이블 디퓨전, 챗GPT 등을 포함한 이미지와 텍스트 생성 AI 프로그램의 엄청난 기능을 목격했고, 2023년 자본과 관심의 유입은 해당 범주의 성장을 가속화할 것”이라고 내다봤다.
네이버는 한 단계 진화한 초거대 AI를 검색·커머스·콘텐츠 등 주요 서비스에 붙여 시너지를 만들 수 있는 핵심 기술로 보고 있다. 우선 구글, 바이두 등 해외 빅테크 기업에 밀리지 않는 AI 기초체력(연구역량)을 쌓아야 실제 서비스 단계에서 이들과 경쟁이 가능하다는 게 네이버의 판단이다. 실제로 네이버는 인공지능 분야 세계적 학회에서 괄목할 만한 기초연구 성과를 거두고 있다. 네이버는 올해 통합 출범하는 네이버클라우드를 중심으로 그간 축적한 기술을 실제 서비스에 적용하기 위한 작업에 본격적으로 속도를 높인다는 구상이다.
네이버가 지난해 회사의 기술 조직 클로바·파파고가 지난해 글로벌 톱티어(Top-tier) 인공지능 학회에 발표한 정규 논문이 100건으로 전년(69건) 대비 큰 폭으로 늘었다. 네이버가 발표한 논문들은 작년 한 해에만 구글 스칼라(Google Scholar) 기준 8000회 이상의 피인용 수를 기록한 것으로 나타났다. 특히 실제 세계에서(Real World) 서비스에 적용할 가능성이 높은 연구가 세계 최고 권위 학회들에 채택됐다는 점이 고무적이다. 대표적으로 초거대 언어모델을 효율적으로 서비스에 적용하기 위한 방법 연구가 자연어처리 분야 최고 권위 국제학회 ‘EMNLP 2022’에 채택됐다.
네이버는 이 연구에서 초거대 AI의 서비스 적용 시 모델의 생성·이해 품질 감소를 최소화하며 사용하는 메모리를 줄이고 속도를 높이는 양자화 기반의 추가학습 기법을 제안했다. 업계 관계자는 “네이버의 이른바 알파튜닝 연구는 새로운 양자화 기반의 추가학습 기법으로 하이퍼클로바를 실제 서비스에 적용하는 핵심 기술”이라면서 “이를 활용해 향후 여러 서비스에 초대규모 AI를 도입할 계획”이라고 밝혔다. 초대규모 AI 기술을 서비스에 활용하는 비용을 절감할 수 있는 핵심적인 기술로 네이버 초대규모 AI 서비스의 경쟁력을 높일 수 있다는 설명이다.
AI와의 장기간 대화에서 이전에 나눴던 대화 정보를 AI가 기억하고 관리하는 기술에 대한 연구 논문도 ‘EMNLP 2022’에서 발표됐다. EMNLP는 특히 자연어처리(NLP) 분야에서 세계 최고의 권위를 인정받는 국제 학회다. 해당 기술은 독거 어르신을 위한 네이버의 AI 안부 전화 서비스인 ‘클로바 케어콜’에 적용되어 서비스 대상자에게 더욱 개인화된 공감 대화 경험을 제공하고 있다. 연구 성과가 지표로 확인되고 있는 만큼 실제 사업으로의 적용은 앞으로의 과제다.
네이버는 올해 클로바와 파파고, 웍스모바일, 웨일 등 각 조직의 기술 역량을 네이버클라우드로 결집할 계획이다. 네이버클라우드 AI 기술 조직을 중심으로 긴밀한 협업을 통해 회사의 클로바와 파파고의 경쟁력을 높이는 한편 클라우드 플랫폼 위에서 서비스 시너지와 연구 역량 강화에 속도를 낸다는 계획이다.
하정우 네이버클라우드 AI랩 소장은 “글로벌 학계에서 인정받은 네이버 기술 조직의 AI 연구 경쟁력은 통합된 조직에서 시너지를 발휘해 한 단계 도약할 것”이라면서 “실세계 문제를 해결하는 데 강점이 있는 네이버의 AI 기술 포트폴리오가 클라우드를 통해 더욱 적극적으로 글로벌 시장에 진출하고 전 세계 사용자들에게 가치를 제공할 수 있기를 기대한다”고 말했다.
카카오는 AI 연구 자회사 카카오브레인이 초거대 AI 개발 사업을 맡았다. 카카오브레인이 낙점한 분야는 디지털 헬스케어다. 초거대 AI 언어모델과 텍스트·이미지를 학습한 멀티모달 모델로 AI 기반 항체 신약 설계 플랫폼을 구축할 계획이다. 초거대 AI 기반 영상의료 서비스 개발도 추진하고 있다. 최소 2~3년 후 AI 시장의 게임체인저를 노린다는 게 카카오브레인의 그림이다. 카카오는 초거대 AI로 암·난치병 정복에 도전하면서 헬스케어 시장의 게임체인저가 되겠다는 꿈을 꾸고 있다. 초거대 언어 모델 및 초거대 멀티모달 모델을 활용하여 ‘질병 없는 세상’을 위해 AI 헬스케어를 연구 개발하고 있는 것이다.
카카오의 초거대 AI 개발은 사실상 카카오브레인이 주도하고 있다. 2017년 2월 설립된 카카오브레인은 세간에 김범수 카카오 창업자가 각별히 관심을 갖는 AI ‘비밀병기’ 정도로 알려졌다. 카카오브레인이 2021년 초거대 AI 개발에 뛰어들면서 사업이 모습을 드러내기 시작했다.
카카오브레인은 회사 리소스의 절반을 헬스케어 부문에 투입하는 것으로 알려졌다. 구글 딥마인드가 AI를 이용해 단백질 구조를 예측하는 ‘알파폴드’를 개발한 것이 자극이 됐다. 초거대 AI 언어 모델과 텍스트, 이미지를 학습한 멀티모달 모델로 보통 13년 정도 걸리는 신약 개발 과정을 1~2년으로 단축하고, 조 단위가 들어가는 비용을 수백억원 수준으로 절약한다는 목표다.
초거대 AI 사업은 본격적인 궤도에 오르고 있다. 카카오브레인은 신약 개발사 갤럭스와 손잡고 향후 5년간 AI 기반 항체 신약 설계 플랫폼을 구축한다. 2022년 7월 갤럭스에 50억원을 투자했다. 회사 내에 AI신약개발 연구팀을 꾸렸고, 올해 본격적으로 항암제를 재현한다는 계획이다. 카카오브레인은 고려대 안암병원과 초거대 AI 모델을 적용한 의료 서비스 개발을 위한 업무협약을 맺는 등 국내 대학과 협력체계를 구축하고 있다. 카카오 사내 기업인 카카오헬스케어와도 협업을 강화하고 있다.
최근 공개한 AI 아티스트 ‘칼로’도 유의미한 성과다. 칼로는 카카오브레인이 초거대 AI로 개발한 이미지 생성 모델 ‘민달리’와 ‘RQ-트랜스포머’를 발전시켜 만들었다. 1억2000만 장의 텍스트와 이미지를 세트로 학습시킨 결과 명령어를 입력하면 다양한 화풍과 스타일로 선명한 이미지를 생성한다. 카카오브레인의 초거대 AI 언어 모델인 ‘KoGPT’를 기반으로 미디어아트 그룹 슬릿스코프와 함께 시 쓰는 AI 모델 ‘시아’ 개발 및 시집 ‘시를 쓰는 이유’ 등을 출간하기도 했다.
카카오는 추후 ‘KoGPT’의 영어 및 일본어 모델을 준비해 오픈소스화할 예정이다. 베트남어, 말레이시아어 등 동남아어 버전으로 확장 개발해 더 많은 곳에서 AI 기술의 혜택을 누릴 수 있도록 지원할 방침이다. 올해에는 교육, 헬스케어 등 AI의 부가가치가 큰 영역으로 초거대 AI 연구 범위를 확대해나가며 다양한 사업모델 개발도 본격화한다. 궁극적으로는 이용자의 질문 의도와 맥락을 파악할 수 있는 초거대 AI 모델을 개발하는 것이 카카오의 목표다.
두 회사는 초거대 AI 개발 방법에서 차이가 크다. 우선 컴퓨팅 인프라부터 다르다. 네이버는 미국 엔비디아의 슈퍼컴퓨터를 도입했다. IT업계에선 슈퍼컴을 구축하고 운용하려면 최소 1000억원 이상의 투자가 필요한 것으로 알려져 있다. 반면 카카오브레인은 기존 서버에 구글 클라우드의 머신러닝 하드웨어 가속기 TPU(텐서 프로세싱 유닛)를 추가하는 방식을 선택했다.
AI 크기도 다르다. 하이퍼클로바는 2040억 개의 파라미터를 목표로 한다. 카카오브레인은 AI 효용이 큰 파라미터 수를 10억~300억 개 정도로 본다. AI 크기를 경쟁적으로 키우기보다 적정한 크기에서 다양한 시도를 하는 것이 비용을 절감하며 AI 성능을 개선하는 데 도움이 된다고 판단하고 있다. AI 학습 데이터에서도 원칙이 다르다. 네이버는 자사 플랫폼 서비스를 통해 쌓은 한국어 데이터를 활용한다. 반면 카카오는 사내 데이터 활용을 배제하기로 했다. 네이버는 초거대 AI 모델을 공개하지 않지만, 카카오는 세계 최대 오픈소스 커뮤니티 깃허브에 공개하는 것도 다른 점이다.
마이크로소프트(MS)가 AI 챗봇 ‘챗GPT’를 개발한 인공지능 연구소 오픈AI에 최대 100억달러(약 12조4800억원) 투자를 고려 중이라고 블룸버그통신이 올해 1월 보도했다. 이번 투자가 이뤄질 경우 MS의 스타트업 투자 중 사상 최대 규모가 된다. 오픈AI가 최근 평가받은 기업가치는 290억달러로 2021년(140억달러)에 비해 1년여 만에 2배 이상으로 늘어난 것으로 알려졌다. 블룸버그와 IT 전문 매체 더인포메이션 등에 따르면 MS는 자사 검색엔진 빙(BING)과 워드·엑셀 등 사무용 프로그램에 챗GPT를 탑재한 버전을 출시할 계획이 있다.
국내 업계에서는 챗GPT 기술이 실제로 적용된다면 빙이 고품질 대화형 검색으로 구글의 압도적인 검색 시장 우위를 뒤집을 수도 있다는 예측까지 나온다. 이와 같은 맥락에서 검색 플랫폼을 운영 중인 국내 양대 포털도 관심을 가질 수밖에 없는 이슈다.
구글의 경우는 테슬라 등과 같은 수직계열화보다는 다양한 방면의 AI 노하우를 실제 사업에 접목해 나가는 점에서 가장 앞서 있다는 평가다. 구글은 과거 인공지능 기대감이 사라졌던 ‘인공지능의 겨울’ 시기 캐나다 AI 연구진을 대거 영입한 바 있다. 이후 자연어처리, 사물인식 등 다양한 방면에서 노하우를 쌓아왔고 실제 사업영역에서 폭넓게 적용하고 있다. 업계에서는 구글이 자체 개발 AI를 검색과 여러 서비스에 적용할 준비와 기술 역량을 차곡차곡 쌓고 있는 것으로 본다.
구글 클라우드는 구글 검색(Search), 유튜브(YouTube)와 같은 구글 제품에 실제로 사용되는 업계 최고 수준의 AI 성능을 보유하고 있다. 이를 수익모델로도 구축한 상태다. 구글 클라우드 고객에게 맞춤형 머신러닝 하드웨어 가속기 ‘클라우드 TPU(Tensor Processing Unit)’를 통해 제공하는 식이다. LG AI연구원, 카카오브레인 등이 구글 클라우드 플랫폼(GCP)에서 클라우드 TPU v4 등 제품을 이용해 초거대 AI 개발을 이어가고 있다.
황순민 매일경제 디지털테크부 기자