인공지능(AI) 모델 하나가 연구실을 넘어 각국 정부와 전세계 주요 기업의 핵심 어젠다로 부상했다. 앤트로픽이 지난 4월 세상에 처음 선보인 인공지능(AI) 모델이자 AI 업계에 가장 뜨거운 화제가 된 ‘미토스’ 이야기다.
스스로 소프트웨어의 취약점을 찾고 공격할 수 있는 역량을 확보한 미토스는 그동안 새로운 버전의 거대언어모델(LLM)이 등장할 때와는 결이 다른 충격을 가져왔다. 미토스는 사이버보안 용도만을 위해 개발된 모델이 아님에도 보안에 특화된 운영체제에서 27년 동안 발견되지 못했던 보안 결함을 스스로 찾아냈다. 또한 미토스는 취약점을 발굴하는 것을 넘어 취약점을 악용하기 위한 공격 코드까지 생성해낸다. AI가 수학 올림피아드에서 금메달을 따거나 전문직 시험을 통과하는 모습은 더 이상 새롭지 않다. 다만 미토스는 사이버보안 측면에서 AI가 무엇까지 수행할 수 있는지를 본격적으로 보여줬다.
미토스를 기존 소프트웨어 시스템보안을 강화하기 위한 목적으로 사용한다면 긍정적인 효과로 이어질 수 있지만, 만약 악의적인 해커 손에 들어갈 경우 사이버 공격의 빈도와 심각성이 걷잡을 수 없이 커질 수 있는 셈이다. 국가 차원의 사이버 전쟁에서도 미토스의 활용 가능성은 무궁무진하다. 특히 개발사인 앤트로픽이 모델 개발 과정에서 진행한 실험에서는 미토스가 격리 환경(샌드박스)을 스스로 탈출해 공격 코드를 스스로 짜고 실행하는 모습이 확인되기도 했다. 미토스와 같은 기술이 공개될 경우 발생할 잠재적인 부작용과 파급효과에 대한 우려가 커지자 미국 정부까지 나서고, 주요 기업들이 뭉친 컨소시엄인 ‘글래스윙’까지 출범했다.
4월 7일 앤트로픽의 기술 블로그를 통해 소개된 차세대 모델인 ‘미토스 프리뷰’는 주요 운영체제(OS)와 웹브라우저 전체에서 수천 건의 제로데이 취약점(발견되지 않은 취약점)을 찾아낸 것으로 소개됐다.
미토스는 우리가 현재 사용하고 있는 단순한 코드 생성 도구 수준의 AI가 아닌, 스스로 행동 완결까지 끝내는 에이전트다. 자율적으로 코드를 읽고 가설을 세우며 디버그를 진행하고 확인된 취약점에서 작동하는 익스플로잇(공격 코드)까지 완성한다.
미토스가 27년 만에 발굴한 결함은 보안에 특화된 운영체제로 유명한 ‘OpenBSD’에서 찾아낸 것으로, 그동안 발견되지 않았으나 악용할 경우 공격자가 해당 운영체제가 실행되는 모든 시스템에 원격 접속해 시스템을 다운시킬 수 있는 핵심 취약점이었다.
미토스의 실력은 하나의 사례에 그치지 않았다. 세계에서 가장 광범위하게 활용되는 비디오 인코딩-디코딩 라이브러리인 FFmpeg에서는 16년 된 H.264 코덱 결함을 미토스가 찾아낸 것이다. 특히 해당 결함은 자동화된 테스트 도구를 500만 번 실행하는 동안에도 한 번도 잡아내지 못했던 결함이었다. 미토스가 공개될 당시 기존 앤트로픽의 가장 강력한 모델은 ‘클로드 오퍼스 4.6’이었다. 오퍼스를 포함한 그동안의 모델이 사용자의 질문에 정확한 답변을 생성하는 능력이 중심이었다면, 미토스는 스스로 목표를 설정하고 실행하는 에이전트 역량을 중심으로 개발된 것이 차별점이다. 특히 미토스는 지속적으로 모델이 생성한 내용물을 검증하고 스스로 수정하는 피드백 루프를 갖추면서 자율적인 문제 해결 능력을 터득했다. 기존 모델이 프롬프트에 대해 단발적인 결과물을 내놓는다면, 미토스는 스스로 작성한 코드를 가상으로 실행해본 뒤 오류가 발생하면 분석하고 수정하는 과정을 돌려보는 셈이다. 미토스가 보안 취약점을 찾아내는 메커니즘도 기존의 보안 분석 솔루션과 다르다. 기존 솔루션이 개별 취약점을 탐지한다면 미토스는 코드의 맥락을 이해한 다음 취약점이 있을 만한 경로를 가정한 뒤 실제 공격 시나리오를 구성해 공격 코드를 짜는 방식이다. 미토스가 기존 모델을 훌쩍 뛰어넘는 성능을 발휘할 수 있는 배경이다. 일례로 파이어폭스 147 자바스크립트 엔진의 취약점을 찾아 공격하는 실험에서 오퍼스 4.6은 14.4%의 성공률에 그쳤지만 미토스 프리뷰 모델은 84.0%의 성공률을 기록했다.
특히 사람들의 의문을 자아낸 대목은 미토스가 이 같은 취약점 공격을 위한 특화 훈련을 거친 모델이 아니라는 점이다. 앤트로픽은 “미토스의 보안 역량은 코드·추론·자율성의 일반적 향상이 낳은 하류 결과(downstream consequence)”라고 설명했다.
보안에 특화하지 않아도 범용 AI의 성능이 이제는 쉽게 소프트웨어의 취약점을 발굴하고 공격을 수행할 수 있는 수준에 도달했다는 의미다.
범용 AI인 만큼 공개될 경우 비전문가도 악용 가능하다는 사실이 우려를 키우는 지점이다. 정식 보안 교육을 받지 않은 앤트로픽 엔지니어들이 미토스에 “밤새 원격 코드 실행 취약점을 찾아달라”고 지시했더니, 다음 날 아침 미토스는 완성된 공격 코드를 제공했다. 전문 해커가 몇 주간의 시간을 투자해야 하는 작업을 미토스는 수 시간 만에 완성한 것이다. 앤트로픽이 미토스 모델의 일반 공개를 보류하고 소수의 기업과 기관에만 모델을 제한적으로 공개한 것도 이 때문이다.
앤트로픽은 미토스 모델 발표와 동시에 ‘프로젝트 글래스윙(Project Glasswing)’을 출범시켰다. 주요 기업과 기관이 합류한 프로젝트 글래스윙은 폐쇄 구조의 연합체다. 모든 사용자에게 미토스를 공개하기에는 위험성이 크니, 검증된 주요 기업에만 미토스를 제한적으로 우선 제공하는 것이다. 앤트로픽은 미토스가 전 세계 은행과 전력망, 정부 시스템을 떠받치는 소프트웨어의 숨겨진 결함을 찾아내고 공격하는 능력이 위험 수준에 이르렀다고 판단한 것으로 알려졌다. 프로젝트 글래스윙에는 아마존 웹서비스(AWS), 구글, 마이크로소프트(MS), 애플, 엔비디아 등 주요 빅테크와 함께 크라우드스트라이크, 팔로알토네트웍스와 같은 보안 기업, JP모건 체이스 등 약 40개의 기업과 기관이 참여했다. 이들은 미토스 모델에 접근해 방어 목적의 테스트를 진행하며 대응 방안을 연구하고 있는 것으로 파악된다. 미국을 포함한 각국 정부나 주요 금융기관들은 미토스가 초래할 수 있는 혼란과 위험 대비에 집중하고 있다. 만약 미토스 같은 AI가 외부에 공개되고, 제3자가 그 AI를 활용해 금융·국가 인프라를 공격할 경우 국가 인프라가 마비되는 사태까지 발생할 수 있기 때문이다.
미토스 발표 후 미국 증권업계 단체인 미국증권협회(ASA)는 미국 재무부에 공개 서한을 보내 “미토스가 금융시장에 시스템적 혼란을 초래할 수 있다”고 지적하면서 개인투자자의 거래 내용과 신원 정보가 집적되어 있는 중앙 데이터베이스(DB)가 공격받을 경우 금융시장 시스템 붕괴로 이어질 가능성에 대한 우려를 나타냈다.
미국 재무부와 연방준비제도(FED)는 미토스로 인한 리스크를 논의하기 위해 주요 은행 최고경영자들을 긴급 소집하기도 했다.
한 민간 기업이 개발한 AI가 국가 안보까지 뒤흔들 수 있는 요소로 부상했음을 방증하는 사례다.
특히 앤트로픽과 정면 충돌하며 앤트로픽을 정부 기관에서 퇴출한 바 있는 미국 정부도 태도가 바뀌고 있다. 미국 정부는 전쟁에서 AI 활용을 두고 앤트로픽과 갈등을 빚으며 긴장 상태를 이어왔는데, 국가 안보에 영향을 미칠 수준의 모델이 등장하자 미토스 접근 권한을 확보해 활용에 나선 것이다.
로이터통신 등 외신에 따르면 에밀 마이클 국방부 연구공학 담당 차관 겸 최고기술책임자(CTO)는 미국 워싱턴DC에서 열린 콘퍼런스에서 미국 국방부가 앤트로픽 퇴출 절차를 진행하면서도 미토스는 도입하고 있다면서 미국 정부가 모순된 행동을 보이는 것에 대해 “미토스 문제는 국가 안보의 중대한 순간”이라고 지적했다.
유럽연합(EU) 등 다른 국가들도 대응에 나섰다. EU는 앤트로픽과 협력해 미토스를 기반으로 하는 사이버 취약점 테스트 도입을 논의 중인 것으로 알려졌으며, 일본 정부도 앤트로픽 측에 미토스에 대한 접근 권한을 요구할 방침인 것으로 파악된다.
업계에서는 앤트로픽이 아니더라도 미토스와 같은 수준의 모델이 등장하는 것은 시간문제라고 보고 있다.
앤트로픽은 기술 블로그를 통해 “불과 몇 달 전만 해도 언어모델은 단순한 취약점만 공격할 수 있었고, 그보다 몇 달 전에는 취약점을 아예 식별하지조차 못했다”라며 “앞으로 수개월 내로 앤트로픽 및 다른 기업이 개발한 언어모델은 취약점 발견 및 공격을 포함한 모든 측면에서 지속 발전할 것”이라고 말한 바 있다.
미토스에 어떻게 대응할지를 두고 한국도 발등에 불이 떨어졌다. 지난해 숱하게 발생한 초대형 해킹 사고 등 한국을 둘러싼 사이버 위협이 거세지는 가운데, 미토스와 같은 AI가 적대적 해커에 의해 활용될 경우 현재의 보안 체계로는 감당이 어렵기 때문이다.
한국 정부는 우선 미토스에 대한 접근부터 확보하기 위해 앤트로픽과 협력 방안을 강구하고 있다. 미국 기업 중심의 ‘프로젝트 글래스윙’에는 아직 한국 기업이나 기관이 참여하고 있지 않기 때문이다. 이에 류제명 과학기술정보통신부 2차관은 지난 5월 한국을 찾은 마이클 셀리토 글로벌 정책총괄 등을 만나 프로젝트 글래스윙 협력을 제안하면서 한국이 미토스에 사전 대비할 수 있도록 정보 공유를 요청했다. 보안업계에서는 단순히 “우리도 보안 특화 모델을 개발하자”와 같은 논의를 넘어 보안 패러다임 자체를 전환해야 하는 시기라고 입을 모으고 있다. AI가 사이버 공격과 방어 양측에서 모두 활용될 수 있음을 전제하고, AI를 활용한 보안 체계 마련과 함께 개별 취약점 대응 대신 전체 공격 경로를 고려한 보안 구조를 마련해야 한다는 것이다.
한국의 대표적인 화이트해커 중 한 명인 박세준 티오리 대표는 한 토론회에서 “미토스 수준의 AI는 특정 기업에만 머무르지 않는다. 우리에게 주어진 시간은 몇 년이 아니라 몇 개월 단위”라고 강조하기도 했다.
업계의 시선은 오는 7월 초를 향하고 있다. 프로젝트 글래스윙의 운영 결과 보고서와 함께 미토스가 탐지한 주요 보안 시스템의 모든 취약점이 공개될 것으로 예상되는 시기이기 때문이다. 취약점 정보가 모두 공개되기 전이 ‘골든타임’으로 꼽히는 만큼, 한국도 그전에 대응 전략을 완성해야 한다는 제언이 나오고 있다.
[정호준 기자]