지난 3월 9일 지상파 음악프로그램에서 다소 낯선 광경이 펼쳐졌다. MBC ‘쇼! 음악중심’에서 중견 아이돌 그룹인 르세라핌과 요즘 한창 주가를 올리고 있는 가수 비비를 제치고 1위에 오른 가수가 버추얼 아이돌 그룹인 ‘플레이브’였기 때문이다. 5인조 남자 아이돌 그룹인 플레이브는 2023년 3월 12일에 데뷔한 어엿한 데뷔 2년 차 가수로 상당한 팬덤을 지니고 있다. 지난 2월 두 번째 미니앨범 출시를 앞두고 열린 기자회견에서 실제 기자들의 엄청난 질문이 쏟아지기도 했다. 1998년 사이버 가수 아담이 등장해 반짝 인기를 끌고 난 이후 최근 AI 등 기술의 발달로 버추얼 아이돌이 다시 K-POP 시장 주류로 떠오르고 있다.
카메라나 특수 장비를 통해 실제 사람의 행동을 캐릭터화한 버추얼 휴먼의 시대가 도래하면서 플레이브 외에도 ‘이세계아이돌’ ‘스텔라이브’ 등의 버추얼 아이돌이 활발한 활동을 펼치고 있다.
‘실제 가수들과 같은 팬덤을 가질 수 있을까?’라는 의문을 제기하는 목소리도 있지만 요즘 젊은 층 사이에서는 아이돌보다 뜨거운 반응이 나오기도 한다. 대표적인 예가 버튜버 그룹 ‘이세계아이돌’이다. 2021년 12월 17일 데뷔한 ‘이세계아이돌’은 6인조 버추얼 아티스트로, 지난해 ‘키딩’이라는 곡을 통해 국내 차트 1위는 물론, 빌보드 코리아 3위, 빌보드 글로벌 200차트에서 167위를 기록하기도 했다. 현재 ‘키딩’ 뮤비의 조회 수만 해도 1518만 회(4월 17일 기준)라는 어마어마한 기록을 선보이고 있다. 참고로 요즘 Z세대들은 코인노래방에서 ‘이세계아이돌’을 포함한 각종 ‘버튜버’의 곡들을 즐겨 부르기도 한다. 특히 올해부터 기술 고도화와 함께 버추얼 아이돌·버튜버의 제작, 존재 형태가 다각화될 것으로 예상된다. AI 기술의 발달로 제작과 활용이 용이해지는 만큼 대중 접근성을 높여 버추얼 시장의 성장이 본격화될 것으로 전망이다.
김세희 유진투자증권 연구원은 “버추얼 아이돌을 포함한 버튜버는 화제성을 넘어 이미 산업적 가치는 증명되었다”라며 “일본의 경우 애니컬러(1.9조원),커버(1.4조원) 상장을 통해 시장성 또한 갖춰가고 있는 구간으로 콘텐츠를 폭발적으로 생산 가능하다는 점에서 버튜버의 주류화가 빠르게 일어날 가능성이 높아지고 있다”라고 말했다.
현재 활동하는 버추얼 아이돌이 처음은아니다. 크게 버추얼 휴먼은 두 종류로 나뉜다. 첫째, 실제 사람을 모델로 만든 케이스인데 SM엔터테인먼트의 여성 아이돌 그룹 ‘에스파(Aespa)’가 대표적이다. 에스파는 4명의 멤버들과 멤버들의 이미지를 반영한 아바타 4명으로 구성돼 있다. 다음은 원본이 없는 상태로 기획자와 개발자가 가상의 인물을 만들어 낸 버추얼 휴먼이다. 한국의 로지, 루이, 수아 등이 이 범주에 속한다. 이들은 SNS에서 인플루언서로 활동하면서 기업 광고나 드라마, 게임 등에 등장하기도 한다. 대표적으로 2021년에 등장한 로지(Rozy)는 1세대 버추얼 휴먼의 대표주자로 통신사 광고에서 인상 깊은 춤을 선보이는 등 큰 관심을 받으며 대중화에 기여했다는 평가를 받았다.
가상인간 1호 타이틀을 얻은 로지가 등장한 이후 SNS를 중심으로 활동하는 버추얼 인플루언서는 약 150여 명이 등장하기도 했다. 그러나 최근 로지는 매물설이 흘러나오고 있으며 1세대로 분류되는 버추얼 휴먼들은 반짝 인기를 끈 이후 부진을 면치 못하고 있다. 로지를 비롯해 버추얼 휴먼 초기에는 등장 자체로도 흥미를 끌었지만, 이제 시장에서 신선함을 잃은 상황이다. 가장 큰 이유는 기술적인 한계다. 사실적인 묘사에 중점을 둔 1세대 버추얼 휴먼은 표정과 동작 하나하나 수작업을 거칠 정도로 시간이 많이 소요되는 것이 일반적이었다. 짧게는 2~3일, 길게는 몇 주가 걸리기도 한다. 하루 촬영하고 이후 편집으로 끝내는 광고업계 생리와 달리 추가작업이 요구돼 점차 제작사의 외면을 받기 시작했다는 것이다.
최근 등장하는 2세대 버추얼 휴먼은 더 고도화된 기술과 향상된 상호작용 능력을 갖추고 등장하고 있다. 이들은 단순한 광고 모델을 넘어서, 자체 콘텐츠를 생성하고 팬들과 직접적으로 소통할 수 있는 능력을 갖추었다. 예를 들어, 버튜버 산업에서는 AI와 VR 기술을 활용하여, 실시간으로 반응하고 다양한 상황에서 자연스러운 대화를 이끌어낼 수도 있다.
기업의 CS(customer service)에 버추얼 휴먼을 활용하여 응대에 나서기도 한다. 기업의 CS센터에서도 버추얼 휴먼을 이용하는 것이 가능하다. 이는 인공지능 챗봇이 더 발전한 형태로, 고객에게 일관된 서비스 경험을 제공할 수 있을 것으로 기대된다. 고객 불만에 응대하는 걸 사람이 한다면 담당 직원 역량에 따라서 고객 경험이 달라질 수밖에 없다. 고객 응대에 서툰 직원을 만나면 고객은 불편함을 느끼게 되는 것이다. 이 때문에, 많은 기업이 AI 챗봇을 도입해 표준화된 고객 서비스를 제공하고 있다. 광고 모델을 버추얼 휴먼으로 구현해서 CS센터에 활용한다면 고객과의 최접점에서 표준화된 서비스를 제공하면서도, 기업이 해당 모델을 통해서 추구하는 브랜드를 일관적으로 구축할 수 있게 된다. 금융권에선 오프라인 지점 특색에 맞는 버추얼 휴먼을 제작하는 것을 검토 중인 곳도 있다.
개성을 갖춘 버추얼 휴먼이 본인의 캐릭터를 활용해 상대방과 감정의 교류까지 할 수 있다는 가능성을 보여주는 것은 일본의 버튜버 산업에서 엿볼 수 있다. 이들은 자신만의 독특한 캐릭터와 스토리라인을 가지고 있어 팬들과의 깊은 감정적 연결을 구축하기도 한다. 이러한 캐릭터들은 종종 자신의 쇼를 주최하거나, 유튜브 슈퍼챗과 같은 플랫폼을 통해 상당한 수익을 창출하는 등 실질적인 경제적 가치를 만들어내기도 한다. 김세희 연구원은 “2023년 일본 유튜브 슈퍼챗(후원) 순위 랭킹에서 버튜버의 비중이 빠르게 증가하고 있다”라며 “일본에서 지난 한 해 슈퍼챗으로만 1억원 이상 수익을 기록한 버튜버는 95명에 이르며 총 버튜버 시청시간은 11억 시간을 돌파했다”라고 설명했다.
버추얼 휴먼, AI를 기반으로 한 디지털 인물들이 민간 부문은 물론 공공분야까지 그 활용 범위를 넓혀가고 있다. 이들은 기업 홍보에서부터 엔터테인먼트, 심지어 정부 행사까지 다양한 영역에서 등장하고 있다.
SK텔레콤은 온마인드와의 협업을 통해 AI 휴먼 ‘나수아’를 전면에 내세워 에이닷(A.) 브랜드 광고를 선보였다. 나수아는 서울 잠실에서 열린 농구 홈 개막전에서 명예 치어리더로 활약하며 눈길을 끌었으며, AI 랩 포 스타트업스 홍보 영상에도 등장하기도 했다. 게임기업인 스마일게이트는 가상인간 ‘한유아’를 중심으로 방송과 엔터테인먼트 분야에서 활동 영역을 확장하고 있다.
공공 분야에서도 버추얼 휴먼의 활용도가 높아지고 있는 추세다. 최근 관세청과 한국AEO진흥협회 주최 행사에서는 AI 아나운서가 사회를 보며 공식적인 데뷔를 치르기도 했다. 관세청·한국AEO(수출입안전관리우수업체)진흥협회가 진행한 ‘2023 AEO 기업의 날 행사’에서 AI 아나운서가 개회식 사회를 맡았다. 국내 AI 서비스 업체 이스트소프트가 실존하는 박은보 아나운서를 본떠 만든 AI 가상인간이었다. AI 박은보는 1부 ‘AEO 기업의 날 선포’ 세션을 맡았다. 약 1시간 동안 행사에 참석한 업계 관계자 400여 명 앞에서 개회식 안내와 행사 설명, 축하 영상·축사 소개 등을 이어갔다. 기존 AI와 달리 자연스러운 말투와 표정, 시선 처리 등이 눈에 띄었다는 후문이다. 한편 중앙선거관리위원회는 ‘가상인간’이 국내 선거운동에 참여할 수 있음을 명시함으로써 공공분야에서의 활용 가능성을 열었다.
생성 AI를 활용해 아바타, 캐릭터에 생명력이 부여되면서 새로운 비즈니스 모델이 등장하고 있는 추세다. 최근 생성 AI를 통해 자신이 원하는 가상아바타, NPC(Non-Player Characters)들을 탄생시키고 이들이 플랫폼 안에서 상호작용하면서, 새로운 콘텐츠들이 탄생하는 동시에 이전에 없던 수익모델이 탄생하고 있는 것이다.
대표적으로 지난해 말에 애플에서 공개한 아바타 생성 AI ‘HUGS’는 동영상 속 인물을 몇 분 만에 ‘디지털 아바타’로 전환할 수 있는 도구다. 사용자는 다른 영상이나 가상환경에 해당 아바타를 배치할 수 있는 것이 특징이며, 애플은 향후 해당 기술을 아이폰, 아이패드, 비전프로에 적용해 온디바이스 AI 기능을 구현할 계획이다. KT는 지난해 가상인간이 등장하는 동영상 제작을 지원하는 ‘AI 휴먼 스튜디오’ 서비스를 출시하기도 했다. 이 서비스는 복잡한 촬영이나 편집 과정 없이 생성 AI 기술이 만든 AI 휴먼 모델·목소리를 선택하고, 텍스트를 입력해 누구나 쉽고 빠르게 동영상 콘텐츠를 제작하도록 돕는다.
KT가 제공하는 AI 휴먼 모델은 실존 인물이 아닌 이미지 생성 AI 기술을 통해 만들어낸 가상의 캐릭터다. 초상권과 저작권 제약 없이 자유롭게 콘텐츠 제작에 활용할 수 있다. 앵커·강사·쇼호스트·상담사·경찰관·소방관·승무원 스타일 등 의상을 제공한다. 손동작 등 AI 휴먼에 동작을 적용해 원하는 대로 편집 가능하다.
생성 AI 업체들의 동영상 생성모델 역시 버추얼 휴먼 활용도를 높일 것으로 예상된다. 대표적으로 오픈AI가 공개한 소라(Sora)는 텍스트 프롬프트 작성 시 고품질 비디오가 생성되는 모델을 출시했다. 또한 알리바바그룹은 텍스트 프롬프트가 아닌 사진 한 장(image)과 오디오 파일(Voice) 2가지만으로 사진 속 인물이 말하는 영상을 생성하는 에모(EMO)를 선보였다.
두 서비스는 현실세계 데이터인 프롬프트와 사진을 AI가 스스로 이해하면서 현실세계를 동영상으로 시뮬레이션할 수 있다는 것을 의미한다. 이를 통해 현실세계와 접목하거나 상호작용할 수 있는 여러 캐릭터나 영상을 생성해 활용할 수 있게 될 것이란 예측이 가능하다.
김 연구원은 이에 대해 “소라 또한 GPT-4와 마찬가지로 동영상 생성을 통해 스스로 학습 데이터를 생성하며 자가 발전할 수 있다는 뜻으로 AI가 시공간의 개념까지 학습하면서 인간과 유사하게 물리적인 세계를 이해할 수 있도록 만들고 있는 것”이라며 “이를 바탕으로 학습한 GPT-5는 메타버스 구축에 엄청난 기여를 할 것으로 예상된다”라고 설명했다.
[박지훈 기자]
[본 기사는 매경LUXMEN 제164호 (2024년 5월) 기사입니다]