일상생활 속의 AI노믹스 ④ 알파벳 | 구글이 그리는 인공지능의 미래, 알파벳 26자 키워드로 알아보는 AI 설명서

박지훈 기자
입력 : 2020.05.04 15:47:30 수정 : 2020.05.09 17:48:56

세계에서 가장 인공지능 분야에 앞서가는 기업은 어디일까? 열에 아홉은 구글이라고 답할 것이다. 분야와 방향에 따라 기술의 발전정도를 정확하게 측량하긴 어렵지만 적어도 사람들의 뇌리에 구글의 혁신은 강하게 남아있다. 2016년 3월 9일 바둑계 풍운아 이세돌 9단은 이날 인공지능 바둑기사 알파고에 패배했다. 전 세계에 충격적인 데뷔를 했던 알파고는 구글이 인수한 영국 회사 딥마인드의 작품이다.

▶출범 5년 만에 시총 1조달러 돌파 인공지능의 미래가치 알파벳에 스미다 구글의 인공지능에 대한 관심과 투자는 단적으로 2015년 알파벳을 중심으로 한 지주회사로 전환한 데서 짐작할 수 있다. 구글이 알파벳의 자회사가 된 것이다. 단순히 기업 지배구조만 바뀐 게 아니라 알파벳 산하 계열사를 ‘신사업(other bets)’과 구글 부문으로 나눴다. 구글 부문에선 AI를 검색 및 광고 서비스 개선에 곧바로 적용하고, 신사업 부문에선 AI를 활용해 미래 먹거리를 발굴하는 역할을 한다. 사실상 두 사업부문 모두 ‘AI 퍼스트’ 전략이 본격화된 것이다.

AI 기반 자율주행 전문기업 ‘웨이모(Waymo)’, 자율주행 드론(무인기) 사업을 하는 ‘윙(Wing)’, 머신러닝(기계학습)을 활용한 생명공학 계열사 ‘칼리코(Calico)’, 알파고로 유명한 ‘딥마인드(DeepMind)’, AI 기술로 온라인상의 괴롭힘, 악플을 감지하는 직소(Jigsaw) 등이 익히 알려진 신사업 분야들이다. 최근에는 알파벳의 자회사인 베릴리(Verily)가 4년간 1만 명에 달하는 개인의 건강 상태를 면밀하게 추적하여 데이터를 축적하는 ‘프로젝트 베이스라인(Project Baseline)’을 개시하며 헬스케어 분야에서도 존재감을 드러내고 있다.

알파벳은 이미 구글의 미래이자 AI의 상징적인 기업으로 자리 잡고 있다. 주식시장에서 바로 알파벳의 저력이 드러났다. 올해 초 코로나19 사태 이전 알파벳의 시가총액은 1조달러를 돌파했다. 감이 쉽게 오지 않을 수 있다. 미국 증시에서 1조달러를 돌파한 건 애플, 아마존, 마이크로소프트 이후 4번째다. 이러한 알파벳의 주가 상승은 검색엔진, 인터넷 산업을 넘어 향후 인공지능(AI) 업체로 전환이 가속화될 것이란 기대감 때문이다. 외신들은 지난 1월 구글 AI 딥마인드가 인간 방사선 전문가보다 더 유방암 진단에 뛰어난 정확성을 보였다는 내용을 보도하기도 했다.

알파벳 26자로 알아보는 AI + 지난 3월 구글은 옥스퍼드 인터넷 연구소(OII; Oxford Internet Institute)와 손을 잡고 대중에게 인공지능의 의미와 가치를 알리기 위해 온라인 가이드를 발표했다. 발간 배경이 꽤나 친절하다.

“인공지능이란 말이 식상해질 정도로 정보가 넘쳐나는 가운데 그중에서 사실만큼 거짓이 많고, 보통 사람들이 이해하기 쉬운 설명을 찾기가 쉽지 않다. 이번 ‘AI의 A to Z(The A-Z of AI)’라는 온라인 가이드가 발간된 배경이다.”

‘인공지능 A to Z’는 인공지능의 이해를 돕기 위한 안내서라고 할 수 있다. 일상생활에서 접하는 AI의 의미와, 작동 방식 나아가 인공지능이 무엇을 변화시키고 있는지 등에 대해 소개하는 가이드북이다. 평범한 사람들을 위한 설명서인 만큼 최대한 쉽고 간단하게 만들었다. 특히, 알파벳 A부터 Z까지 문자에 AI가 가진 특징이나 키워드를 매칭하고, 알기 쉬운 일러스트를 곁들여, 누구나 거부감 없이 쉽게 접근할 수 있도록 했다.

방식은 알파벳을 차용했다. A부터 Z까지 26개의 키 메시지를 통해 아이부터 어른까지 누구나 이해할 수 있도록, 눈높이를 최대한 낮추고 AI를 쉽게 설명하고 있다. 알파벳 순서대로 나열된 키 문자를 통해 AI의 기초부터 AI 제작, 사회와 AI, AI 활용으로 구분된 카테고리로 들어갈 수도 있다.

일례로 AI의 기초(AI Fundamentals)라는 카테고리는 인공지능(A; AI), 편향(B; Bias), 데이터세트(D; Dataset), 머신러닝(M; Machine Learning), 튜링 테스트(T; Turing Test)로 구성되어 있다. A파트에서는 ‘인공지능은 지능적인 인간 행동을 모방하도록 가르치는 모든 컴퓨터 시스템에 부여된 이름’이라고 인공지능의 정의를 알기 쉽게 알려준다.

B(Bias)파트인 편향은 불안전한 데이터가 AI를 편향적으로 만들 수 있고, 이러한 AI 시스템의 결과는 ‘실제 세계에서 발견되는 기존의 편향 또는 편견을 증폭시키는 데이터에 의해 영향을 받을 수 있다’고 설명하고 있다. D(Dataset)파트인 데이터세트는 AI에게 세상을 가르치는 데 사용되는 정보(The information used to teach AI about the world.)라고 정의하며, 데이터세트는 AI 교육에 사용되는 대규모 디지털 정보 모음이라고 설명하고 있다.

AI 제작(Making AI) 카테고리는 G(GANs), H(Human-in-the-loop), I(Image Recognition), K(Knowledge), L(Learning), N(Neural Networks), O(Open Source), Q(Quantum Computing), S(Speech Recognition), Z(Zeros & Ones)로 구성된다. GANs는 서로 경쟁하며 배우는 두 개의 AI 시스템이라는 설명을 붙였고, 휴먼 인 더 루프는 AI 시스템을 훈련, 테스트, 조정하여 더욱 안정적인 결과를 얻을 수 있는 사람이라고 소개한다. ‘A-Z of AI’의 내용을 소개하면 다음과 같다. 이를 통해 알파벳이 그리는 인공지능의 역할을 어렴풋이나마 짐작할 수 있을 것이다.

미국 샌프란시스코 모처에서 열린 구글 프레스데이에서 구글 인공지능 연구진이 안구사진만으로 빈혈을 진단해 낼 수 있는 방법을 소개하고 있다.

A 인공지능(Artificial Intelligence) AI의 핵심은 배우고 적응하는 컴퓨터 프로그래밍으로 지적인 인간의 행동을 모방하도록 가르치는 컴퓨터 시스템에 붙여진 이름이다. 보드게임을 하거나 언어를 번역하는 법을 가르치는 프로그램에서부터 인간다운 대화를 나누고 주식 시장을 분석하거나 건강상태를 진단하는 데 도움을 줄 수 있는 복잡한 시스템에 이르기까지 모든 것을 말한다.

B 편견(Bias) 불완전한 데이터는 AI를 편견으로 이끌 수 있다. AI 시스템의 결과는 현실 세계에서 발견되는 기존 편견의 영향을 받을 수 있다. 일반적으로, AI는 학습하기 위해 주어진 데이터가 완전히 포괄적이지 않을 때 편견을 형성한다. 따라서 특정 결과로 이어지기 시작한다. 데이터는 AI 시스템의 유일한 학습 수단이기 때문에 기존 정보 내에서 발견된 불균형이나 편견을 재현할 수 있다.

C 기후(Climate) AI는 지구 기후 문제에 대처하는 데 이용되고 있다. 전 세계 사람들은 지구가 직면하고 있는 전례 없는 위기를 해결하기 위해 AI를 활용한다. 기후 변화를 모니터링하려면 광범위하고 지속적으로 진화하는 데이터세트가 필수적이다. AI 시스템은 환경 정보를 수집·분석하고, 기후 조건의 실시간 변화를 추적하고, 비효율성을 줄여 인류가 지구에 긍정적인 영향을 미칠 수 있는 해결책을 더 빨리 찾을 수 있도록 도와준다.

D 데이터세트(Datasets) 정보는 AI에게 세계를 가르치기 위해 사용된다. 데이터세트는 AI 훈련을 위해 사용되는 대규모 디지털 정보 모음이라 할 수 있다. 데이터세트는 기압과 온도 등 날씨 데이터에서부터 사진과 음악처럼 AI 시스템이 주어진 임무를 수행하는 데 도움이 되는 다른 어떤 정보도 포함된다. 데이터세트는 컴퓨터용 교과서다. 아이가 예를 통해 배우듯이 기계도 마찬가지다. 데이터세트는 기계 학습 과정의 기초가 된다.

E 윤리(Ethics) AI의 구축 및 활용 방법을 규정하는 지침이다. 사회를 지배하는 윤리적 규범과 법률처럼 윤리적 지침은 AI가 발전하는 방식을 형성하는 데 도움을 준다. 따라서 행동 규범과 지침은 AI 사용의 문제점을 보완하는 데 도움을 줄 수 있다. AI는 다양한 윤리적인 문제를 수반한다. 게다가 일부 AI 시스템들은 계산이 너무 복잡해 인간이 어떻게 생산량에 도달했는지 확인하기가 쉽지 않을 수도 있다. 이처럼, 사회는 AI를 배정하는 것이 불편할 수 있다. 일부 기업들은 AI 프로젝트를 지도하는 윤리적 틀을 지속적으로 점검·개정하고 있으며, AI 윤리 탐구를 위해 지역사회는 발전하는 기술과 함께 새로운 대화를 열어 나가고 있다.

F 거짓(Fakes) AI를 이용해 만든 가짜 영상, 오디오, 비디오가 있다. AI는 초현실적인 ‘딥페이크’ 기술로 이미지와 음성, 음악, 비디오 등을 만드는 새로운 방법을 찾아냈다. 딥페이크는 실생활의 이미지나 오디오를 연구해 상세히 매핑한 후, 이를 조작해 당황스러울 정도로 진실된 픽션 작품을 만들어낸다. 이 기술은 할리우드 영화의 CG부터 음악 제작과 포르노에 이르기까지 모든 면에서 매우 다양한 응용 프로그램을 제작했다. 대부분 많은 사람들의 재미를 위해 제작되지만, 이를 부적절하게 사용하면 사회에 해로울 수 있는 잘못된 정보를 만들어낼 수 있다.

G 생산적 대립 신경망(GANs) 서로 경쟁하면서 배우는 두 개의 AI 시스템을 말한다. GAN(Generative riverical networks)은 한 시스템이 단독으로 작동하는 것보다 더 빨리 콘텐츠를 만들고 작업을 수행하도록 훈련된 AI 시스템 쌍이다. 피카소의 예술적 스타일에 영감을 받은 이미지를 만들어낸다고 상상해 보라. AI 디자인팀은 피카소의 모든 그림들을 모아 그의 작품을 독특하게 만드는 색깔과 특징, 개별 붓글씨를 찾기 위해 GAN을 훈련시킬 수 있다. 한 AI 시스템은 피카소의 작품을 모방하려고 시도하는 반면 다른 AI 시스템은 피카소의 시도를 판단한다. 그림을 모방하는 AI는 피카소 스타일의 수천 개 이미지를 만드는 데 지식을 적용하고, 다른 AI 시스템은 이 작품들이 피카소의 스타일과 얼마나 유사한지 판단하고 등급을 매긴다.

H 휴먼 인 더 루프(Human-in-the-loop) 휴먼 인 더 루프는 AI 시스템을 훈련, 테스트 또는 개선하여 보다 신뢰할 수 있는 결과를 도출하도록 돕는다. 해양 생물을 식별하기 위해 가르치는 시스템은 문어의 독특한 모양 때문에 다른 생물과 문어를 빨리 구별하는 법을 배울 수 있지만, 유사한 모양을 가진 물고기의 차이를 구별하는 데 어려움을 겪을 수 있다. 휴먼 인 더 루프는 시스템에 개입해 주의할 특징을 구분하고 보다 정확한 답을 유도하도록 시스템을 가르칠 수 있다.

I 이미지 인식(Image Recognition) AI가 우리 주변 세계의 물체를 인식하고 분류할 수 있게 하는 기술이다. ‘컴퓨터 미래’로 알려진 이미지 인식 시스템은 제공되는 다양한 기준 이미지를 연구함으로써 각각의 개인부터 유명한 랜드마크, 심지어 애완동물까지 모든 것을 AI가 인식하도록 가르칠 수 있다. 예를 들어, 이 시스템은 여행 후 자동으로 휴가 사진을 위한 새 앨범을 제안하는 것과 같은 일상적인 일에 도움을 줄 수 있다.

J 저널리즘(Journalism) 기자들은 뉴스 산업을 변화시키기 위해 AI를 이용하고 있다. 뉴스룸의 경우 실시간으로 데이터 볼륨을 처리할 수 있는 AI 시스템이 유용한 툴이다. 전 세계 기자들은 AI가 어떻게 뉴스 출처를 감시하고, 정보를 정리하며, 예상치 못한 연결고리를 찾는지 등을 탐구하고 있다.

K 지식(Knowledge) AI 시스템은 인간과 근본적으로 다른 방식으로 지식을 습득한다. AI가 획득하는 지식은 인간이 일생 동안 발전하는 복잡한 지식과는 매우 다르다. 인간은 주변의 모든 것을 문맥화하기 위해 자동적으로 지난 경험을 끌어냄으로써 세상을 이해한다. 그러나 AI 시스템에는 요구할 수 있는 배경 지식이나 본능이 없다. AI 시스템이 경험을 쌓을 수 있도록, 조직된 데이터 형태의 광범위한 정보를 상호 참조하고 분석하는 방법을 분명히 가르쳐야 한다. 그들이 배울 수 있는 것에는 AI 디자인팀이 제시한 매개변수에 따라 결정된다.

L 학습(Learning) 여러 방법들이 AI를 가르치기 위해 사용됐다. AI 설계팀이 기계학습 시스템을 훈련시키기 위해 사용하는 가장 일반적인 두 가지 기법은 지도 및 비지도 학습이다. 지도 학습은 AI가 새로운 데이터에서 유사한 패턴을 찾는 데 사용할 수 있는 참조 데이터를 받는다. AI는 시행착오라는 반복 과정을 통해 배운다. 비지도 학습은 AI가 개발자들에 의해 면밀히 관찰되지만, AI 스스로 데이터 자체에서 관계를 찾는 법을 배울 수 있다. 어떤 과일인지 말하지 않고도 다양한 과일들의 시스템 이미지를 보여줄 수 있고 그것들 사이의 유사점과 차이점을 찾도록 요구할 수 있다.

M 머신러닝(Machine Learning) AI가 데이터와 경험을 통해 스스로 배운다. 기계학습은 AI 시스템이 일련의 해답을 미리 프로그래밍하는 것이 아니라 자신만의 해결책을 제시할 수 있게 한다. 전통적인 프로그래밍에서, 당신이 컴퓨터에게 고양이를 그리는 법을 가르치고 싶다면, 그림 그리는 과정을 정밀하게 설명해야한다. 하지만 기계 학습을 이용해 당신은 AI 시스템에 수천 개의 고양이 스케치를 주입, 컴퓨터가 스스로 분석해 패턴을 찾도록 한다.

N 신경망(Neural Networks) AI는 인간의 뇌에서 영감을 얻었다. 신경망은 전통적인 AI와는 다른 종류의 학습을 가능하게 한다. 인간의 생각에서 영감을 받지만, 매우 다른 것이다. 신경망은 하나의 팀으로 작용하는 정보 처리집합체로 구성돼 있다. 이들 사이에 뉴런이 뇌 안에서 하는 방식과 유사한 정보를 전달한다. 이러한 네트워크는 기존의 프로그래밍이 처리할 수 있는 것보다 더 복잡하고 세부적인 문제를 해결할 수 있다.

O 오픈소스(Open Source) 오픈소스란 코드나 프로그램 등이 누구와도 자유롭게 공유 가능한 것을 의미한다. 이러한 관행은 소프트웨어 개발에서 흔히 볼 수 있다. 누구나 기존의 코드와 데이터, 연구 등을 다운로드하거나 연구하며 학습할 수 있다. 자신의 프로그램 문제에 적응하고, 원하는 방식으로 새로운 변형을 만들 수 있다. 오픈소스는 효과적인 시스템을 구축하기 위해 아이디어를 공유하고 개발하는 모든 것이다.

P 예측(Predictions) 컴퓨터 과학자들은 미래와 뚜렷한 관계가 없을 때에도 종종 AI 시스템의 출력을 예측이라고 언급한다. 예를 들어 AI가 권하는 책은 마음에 들 것이라는 예측이다. 예측 시스템은 이전의 취향을 바탕으로 당신이 좋아할 만한 영화나 비디오를 제안하거나, 이전의 기후 패턴을 조사해 일기 예보의 정확성을 높이는 것을 말한다. 예측 시스템은 오늘날 사회 어디에나 나타난다.

Q 양자컴퓨터(Quantum Computing) 양자컴퓨터는 기존 컴퓨터로 처리하기에 오랜 시간이 걸리는 문제를 해결하기 위해 AI를 사용할 수 있는 가능성을 가진 새로운 기계의 물결이다. 양자컴퓨터는 현재 AI 시스템에 전력을 공급하는 컴퓨터와 전혀 다른 방식으로 정보를 처리한다. 기존의 컴퓨터는 정보를 0 또는 1(이진법)의 연속으로 처리하는 반면, 양자컴퓨터는 0과 1을 동시에 사용할 수 있다.

R 로봇 공학(Robotics) 로봇 전문가들은 로봇으로 알려진 프로그램 가능한 기계를 만드는 데 전념하고 있다. 오늘날, AI는 로봇들이 새롭고 많은 일을 할 수 있게 해주고 있다. 엘리베이터에서 세탁기, 자동 진공 청소기, 공장 생산 라인의 거대한 기계 팔 등이 대표적이다. ‘로봇’이라는 용어는 디지털 활동을 자동화하는 데 이용하는 소프트웨어의 일부를 포함한다. 단순히 육체노동만을 ‘봇’이라고 부르는 것이 아니다. 역사적으로 로봇은 사람들의 작업 부하를 완화하기 위해 기본적인 활동을 수행하도록 설계됐다. AI의 도입으로 로봇은 이전에 자동화하기 어려웠던 작업을 즉각적으로 분석하고 탐색할 수 있게 됐다.

S 음성인식(Speech Recognition) 음성 인식 시스템은 인간이 말하고 있는 것을 인식하도록 훈련됐다. 이 시스템은 받아쓰기 소프트웨어부터 언어 번역 도구, 음성 작동 스마트 스피커에 이르기까지 모든 것의 중심 역할을 한다.

T 튜링 테스트(Turing Test) 튜링 테스트는 간단한 전제가 있다. 인간이 기계와 대화하고 있다는 사실을 깨닫지 못한 채, 5분 동안 대화를 나눌 수 있다면 컴퓨터는 테스트를 통과한 것이다. 1950년 컴퓨터 과학자 앨런 튜링(Alan Turing)이 발명한 이 실험은 기계가 인간의 사고를 흉내 내는 것이 가능한지 물음으로써 현재 우리가 AI라고 부르는 것의 기초를 닦았다.

U 사용(Uses) AI는 연구실을 벗어나 일상생활로 빠르게 진입하고 있다. 우리 집의 스마트 스피커에서 우주 탐험과 농업에 이르기까지 AI 시스템은 컴퓨팅의 힘을 이용해 인간의 능력을 증강시키고 있다.

V 가상 비서(Virtual Assistants) 가상 비서는 명령과 질문에 응답하는 AI의 보편적인 사용이다. 본질적으로 인간의 비서를 디지털로 받아들이는 것이다. 가장 잘 알려진 예는 사람들이 스마트폰과 스마트 스피커를 이용해 말하는 음성 비서들이다. 매일, 이 보조자들은 사람들이 온라인에서 정보를 검색하는 등 기본적인 질문에 답하는 것을 돕는다.

W 왓슨(Watson) 2011년 IBM은 두 사람에게 미국 퀴즈쇼 <제퍼디!> 게임에 도전하는 AI 시스템을 만들어 승리한 바 있다. 왓슨은 수백만 권의 책, 사전, 백과사전의 내용에 근거하여 그 답을 만들었다. 왓슨은 제퍼디의 독특한 구조를 배웠다. 왓슨은 이전에 나온 질문들을 찾아 1초 안에 새로운 질문에 대한 답을 찾을 수 있는 방법을 개발했다. 프로그래머들은 AI가 콘텐츠 내에서 키워드를 검색하는 것뿐만 아니라 키워드 주변의 문장을 분석하고 해독하도록 훈련시켰다. 그렇게 하면, 왓슨은 ‘차’가 단지 음료수일 뿐만 아니라 1940년대 옷의 한 종류라는 것을 알아내기 위해 서로 다른 문맥적 출처를 상호 참조할 수 있다. X 엑스레이(X-ray) 현재 많은 방사선 전문의들은 X선을 연구하며, 사람들의 질병을 더 빠르고 정확하게 진단하기 위해 AI로 작동되는 도구를 사용하고 있다. 생체검사에서 암세포를 찾거나 뇌 스캔으로 알츠하이머의 징후를 찾는 등 이미지에 대한 검토를 바탕으로 환자를 진단하는 의사라면, 누구나 AI를 이용해 일을 효율적으로 수행할 수 있다.

Y 당신(You) 기계에게 인간이 무엇을 의미하는지를 가르치는 것은 불가능하다. 전 세계의 모든 데이터를 AI 시스템에 제공할 수 있지만, 그것은 여전히 지구상의 모든 인간을 반영하지 못할 것이다. 인간은 기계가 사물을 이해하는 데 사용하는 2차원 데이터의 영역 밖에 있는 다차원적인 존재다. AI 시스템은 인간에 의해 훈련되며, AI를 만드는 개발자와 프로그래머로부터 이를 사용하는 개인에 이르기까지 지도받는다.

Z 이진법(Zeros & Ones) 0s와 1s(이진법)는 컴퓨터의 기본 언어다. 바이너리 코드로 알려진 이것은 AI 시스템이 정보를 처리하는 수단이다. 예를 들어 점자는 시각장애인들에게 정보를 전달하기 위해 상승된 범프와 역방향 범프의 패턴을 사용한다. 모스 코드는 일련의 길고 짧은 신호를 사용한다. 컴퓨터가 하는 모든 것은 정보를 전송하기 위해 함께 배열될 수 있는 0s와 1s로 변환된다.

[박지훈 기자]

[본 기사는 매경LUXMEN 제116호 (2020년 5월) 기사입니다]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Review Observation

2025년 08월
제 179호

정기구독 신청

최신호 기사

지난호 보기

일상생활 속의 AI노믹스 ④ 알파벳 | 구글이 그리는 인공지능의 미래, 알파벳 26자 키워드로 알아보는 AI 설명서

Review Observation

LUXMEN 인기기사

칼럼

Focus on Global South

포토 에세이