2022년 11월 오픈AI가 내놓은 챗GPT가 전 세계를 집어삼켰다. 거대언어모델(LLM) 기반의 생성형 인공지능(AI)이 대중에게 신선한 충격을 가져다준 순간이자 AI 시대 개막을 알리는 신호탄이었다.
많은 이들이 감탄하던 순간 검색 시장의 왕좌의 자리에 있던 구글은 전례 없는 위기감을 느꼈다. 급하게 AI 서비스 개발 기간을 단축하며 챗봇 ‘바드’를 개발해 선보인 이유였다.
2023년 2월 구글이 처음 ‘바드’를 공개하던 때, 바드는 시연에서 “제임스 웹 우주망원경에 대해 설명해달라”는 질문에 대해 “최초로 태양계 밖에 있는 행성을 찍었다”라는 오답을 내놓았다. 구글의 기초적인 실수는 곧 대중들의 실망감을 자아냈고 주가도 급락했다.
그랬던 구글이 돌아왔다. 지난해 초 챗봇 ‘바드’의 이름을 ‘제미나이’로 바꾸고 리브랜딩을 시작하더니, 올해 7월 기준 4억 5000만 명 이상의 월 사용자를 확보하며 챗GPT를 추격하는 2위 자리로 올라선 것이다.
월 8억 명 이상이 사용하는 챗GPT와 격차는 여전히 크지만, 제미나이는 지난달 미국의 애플 앱스토어에서 다운로드 1위 자리를 차지하는 등 반향을 일으키기도 했다. 외신에서는 “구글은 생성형 AI 분야에서 오픈AI를 따라잡기 위해 노력해왔다. 이제는 드디어 구글이 이용자를 모으기 시작했다”라는 평가가 나왔다.
특히 구글은 인물의 일관성을 유지하면서 의상, 배경 교체 등 뛰어난 사진 편집 기능을 갖춘 AI 모델인 나노 바나나로 전 세계 이목을 집중시키면서 ‘지브리 열풍’을 일으켰던 챗GPT 수준의 파장을 일으키기도 했다.
특히 구글은 인물의 일관성을 유지하면서 의상, 배경 교체 등 뛰어난 사진 편집 기능을 갖춘 AI 모델인 나노 바나나로 전 세계 이목을 집중시키면서 ‘지브리 열풍’을 일으켰던 챗GPT 수준의 파장을 일으키기도 했다.
지난 2023년 오픈AI와 협력하는 마이크로소프트(MS)가 자사 검색 엔진 ‘빙’에 생성형 AI를 녹이면서 구글을 위협하자, 구글도 대응에 나섰다.
‘바드’로 큰 반향을 일으키지 못했던 구글은 조직 정비부터 진행했다. AI 모델을 연구하고 개발하던 계열사 ‘딥마인드’과 구글 사내의 연구 조직이었던 ‘브레인’을 2023년 4월 ‘구글 딥마인드’로 통합한 것이다. 지난해 노벨 물리학상을 수상한 데미스 허사비스 CEO가 이끄는 조직이다. 구글로서는 흩어져 있던 AI 조직을 하나로 결합해 오픈AI, MS의 기술력에 대응하고 모델 개발부터 서비스 적용까지의 시너지를 극대화하겠다는 움직임이었다.
이후 구글은 2023년 5월 자사의 연례 개발자 콘퍼런스인 ‘구글 I/O’를 통해 거대언어모델(LLM) ‘제미나이 1.0’을 선보인 후 지난해 말 제미나이 1.5를 공개했고, 지난해 12월에는 ‘AI 에이전트 시대’를 공표하며 다음 세대인 제미나이 2.0을 전격 발표했다.
모델 GPT-4o와 추론 특화 모델 o1으로 앞서 나가던 오픈AI를 본격적으로 추격하는 구글의 모델이었다. 세대가 바뀔 때마다 기록적인 성능 개선이 이뤄지면서 오픈AI, 앤스로픽 등 주요 AI 기업 모델과 성능 면에서 선두권을 다투는 수준까지 올라섰다. 현재 구글의 최신 모델은 제미나이 2.5 라인업이다.
10월 기준 제미나이 2.5는 AI 모델들이 순위를 겨루는 웹사이트 ‘LM 아레나’에서 앤스로픽과 오픈AI를 제치고 1위를 기록하고 있다.
이같이 구글의 모델이 빠르게 발전하게 된 배경에는 구글의 개발력을 뒷받침하는 자체 컴퓨팅 인프라도 역할을 했다. 구글은 머신러닝 처리를 위해 전용 반도체인 텐서처리장치(TPU)를 자체 개발했는데, 7세대 TPU인 아이언우드를 통해 AI 워크로드를 대규모로 처리함으로써 모델의 성능과 속도를 큰 스케일로 구현할 수 있게 된 것이다.
구글의 또 다른 경쟁력에는 오픈AI의 영상 생성 모델 ‘소라’에 대응하는 구글의 ‘비오(Veo)’가 있다. 지난 9월 차세대 영상 생성 AI 모델 ‘소라2’를 공개한 오픈AI는 텍스트를 영상으로 바꿔주는 텍스트-투-비디오 AI에서 최강자로 꼽히지만, 구글 또한 ‘비오’ 모델군을 지속적으로 업데이트하며 추격하고 있다.
구글의 AI에 대한 전력투구가 한층 더 본격화된 것은 올해 5월 있었던 구글의 I/O 2025였다. 검색 시장에서 독점적 지위를 차지하고 있는 구글은 검색 결과가 링크와 함께 나열되는 기존 검색이 아닌, AI가 검색 결과를 한 번에 요약해 제공하는 ‘AI 모드’를 발표한 것이다.
구글은 전체 매출의 약 60%를 검색 광고를 통해 번다. 구글에서 사용자들이 검색한 키워드에 맞게 결과 페이지에 광고가 노출되는 것이 대표적이다.
AI 모드를 도입할 경우 이 같은 검색 광고는 영향받을 수 밖에 없는 구조다.
그럼에도 구글은 탄탄한 매출 기반이 흔들릴 위험성까지 감수하면서도 AI 검색으로의 전환을 선언한 셈이다. 전통 검색이 오픈AI, 퍼플렉시티 등 AI 챗봇에 위협받는 상황에서 구글이 내린 결단은 AI 중심 전환이었다.
이외에도 올해 I/O에서 구글은 영상 생성 모델 ‘비오3’, 이미지 생성 모델 ‘이마젠 4’, 제미나이와 구글 앱(캘린더, 지도 등)과의 연동, 긴 문서를 팟캐스트로 요약해주는 노트북LM 앱 등 신규 기능과 서비스를 대거 발표하면서 더 이상 구글이 뒤처지지 않았음을 증명했다.
미국 실리콘밸리의 대표적인 벤처캐피털(VC)로 a16z가 반년 주기로 발간하는 ‘소비자용 생성형 AI 앱 톱100’의 최근 보고서를 보면, 구글의 추격을 숫자로 확인할 수 있다. 해당 보고서는 트래픽을 기반으로 웹과 모바일에서 상위 50개 서비스를 꼽았다.
해당 보고서에서는 역시 챗GPT가 웹과 앱에서 모두 1위를 기록했지만, 구글의 제미나이가 2위로 따라붙었다.
상반기에는 10위권에도 들지 못했던 제미나이가 챗GPT 바로 밑으로 순위가 상승한 것이다.
제미나이는 I/O에서 발표되었던 것처럼 올해 대거 기능을 추가하면서 단숨에 이용자를 확보했다.
카메라와 화면 공유 기능을 이용해, 스마트폰 카메라로 사물을 비추면 제미나이와 같은 사물을 보며 대화할 수도 있으며 이미지와 영상 생성도 제미나이 단일 앱에서 가능하다. 또한 심층적인 정보 탐색과 분석을 돕는 ‘딥 리서치’기능도 제미나이의 주요 기능이다.
지난달에는 구글의 새로운 이미지 모델이 이용자 몰이에 큰 영향을 미쳤다. 이미지 편집 영역에서 ‘나노 바나나’라는 뛰어난 성능의 AI 모델이 출처 미상으로 등장했는데, 이것이 곧 구글의 작품이었음이 밝혀진 것이다. 구글은 나노 바나나를 곧 ‘제미나이 2.5 플래시 이미지’라는 모델로 정식 출시하고 제미나이에 이를 탑재했다.
챗GPT가 ‘지브리풍’처럼 그림체를 바꿔주는 것에서 뛰어난 성능을 보여줬다면, 나노 바나나는 주어진 이미지의 일관성을 유지하면서 편집하는 데 강점을 가진다. 가령 인물 사진과 옷 사진 등 2장을 입력하고 해당 인물의 옷을 사진의 옷으로 바꿔달라고 하면, 인물의 얼굴과 표정 등을 그대로 유지하면서 자연스럽게 편집해주는 식이다. 또한 이용자 사이에서는 인물 사진으로 가상 피규어를 만드는 방식이 큰 인기를 얻기도 했다.
당시 구글 제미나이 앱의 총괄인 조시 우드워드는 제미나이 2.5 플래시 이미지를 앱에 적용한 이후 “4일만에 제미나이 앱 신규 이용자가 1300만 명 늘었다”라고 밝히기도 했다. 구글의 별도 AI 서비스인 ‘노트북LM’도 인기 제품이다. 논문이나 문서, 영상, 음성 등 이용자가 업로드하면 해당 내용을 기반으로 AI가 답해주고, 음성 팟캐스트나 마인드맵으로 제작해 이해하기 쉽게 돕는다. 예를 들어 수십페이지에 달하는 AI 분야 영문 논문을 업로드하면, 3~4분가량의 ‘음성 개요’를 들으면서 논문의 주요 요점 등을 라디오를 듣듯이 파악할 수 있다.
한편 오픈AI와 비교했을 때 구글의 강점은 구글이 가진 주요 서비스들과의 연동성과 시너지다. 브라우저 ‘크롬’을 갖고 있는 구글은 크롬에 제미나이를 녹여 이용자들이 브라우저를 활용해 웹을 탐색할 때 빠르게 제미나이를 호출할 수 있도록 했으며, 지메일·구글 캘린더 등의 자사 서비스를 제미나이에서 쉽게 호출하고 정보를 가져올 수 있도록 했다.
모델과 서비스를 넘어 경쟁의 다음 라운드는 실물 디바이스에서 펼쳐질 가능성도 높다. AI 서비스는 어느새 신기술을 넘어 대중적인 서비스로 자리잡았지만, 디바이스 영역에서는 아직 스마트폰의 시대가 이어지고 있다. 탑재된 카메라로 사물을 보고 설명해주는 ‘AI 핀’ 등 AI를 탑재한 새로운 형태의 디바이스들이 한때 등장하긴 했으나 대중화로 이어지진 못했다.
안드로이드 운영체제(OS)와 스마트폰까지 이미 가진 구글이 다음으로 내다보는 것은 스마트글라스다. 구글은 2010년대에 스마트글라스를 시장에 선보인 바 있으나, 선택받지 못하고 실패를 맛본 적이 있다.
다만 AI가 고도화되면서 스마트글라스가 제공할 수 있는 기능들이 대폭 늘어나고 있다. 스마트글라스에 탑재된 AI는 이용자의 질문이나 명령을 이해하고 답변하며, 카메라로 현실 세계를 바라보며 필요한 정보를 제공해줄 수 있다. 길을 걸을 때는 글라스 디스플레이에 방향과 지도를 띄워 사용자 위치에 맞게 길을 안내해준다.
구글은 올해 I/O에서 한국의 안경 기업인 젠틀몬스터와 깜짝 협업을 발표하면서, 스마트글라스 제품을 연내 공개할 것이라고 발표하기도 했다. 스마트글라스 시장을 이끌고 있는 메타가 레이밴과 협업했듯, 스마트글라스의 디자인을 위해 젠틀몬스터와 손잡으면서 대중적인 제품 개발에 나선 것이다.
스마트글라스는 아니지만 오픈AI도 소비자용 AI 디바이스 개발에 돌입했다. 아직 어떠한 형태가 될지, 어떤 기능이 탑재될지 등이 공개되지 않은 상황이다.
올해 샘 올트먼 오픈AI CEO는 애플의 전설적인 디자이너이자 스타트업 io를 이끌던 조니 아이브와 손을 잡고, io까지 인수하면서 차세대 디바이스 개발에 본격적으로 뛰어들었다. 챗GPT 전용 디바이스로 기능할 것으로 전망된다. 조니 아이브는 10월 오픈AI의 개발자 콘퍼런스 ‘오픈AI 데브데이’에서 올트먼 CEO와 대담을 진행하며 “우리를 행복하고 충만하게 하며, 더 평화롭고 덜 불안하고 (세상과) 덜 단절된 상태로 만들어주는 도구를 만들고 싶다”라고 언급하기도 했다.
[정호준 기자]
[본 기사는 매경LUXMEN 제182호 (2025년 11월) 기사입니다]