구독신청

[년 월 제 호] 프린트 이메일 전송 리스트
빅데이터와 AI의 파괴적인 힘 `대량살상수학무기` 빅브라더보다 무서운 빅데이터
기사입력 2017.11.10 16:51:47
  • 페이스북
  • 트위터
  • 카카오스토리
캐시 오닐은 하버드대에서 수학박사 학위를 받고 얻은 버나드칼리지 수학과 종신교수 자리를 던져 버렸다. 세 배의 연봉을 받고서 옮긴 곳은 월스트리트. 2007년 수학을 현실 세계에 활용한다는 아이디어에 매료되어 헤지펀드 디이(D.E.)쇼의 퀀트가 된 것이다. 하지만 선물거래팀을 이끌다 바로 이듬해 터진 글로벌 금융위기로 수학과 금융의 결탁이 부른 파괴적 힘에 환멸을 느끼게 됐다. 다시 월스트리트를 떠나 IT업계의 데이터과학자가 된 오닐은 빅데이터와 인공지능의 파괴적인 힘에 그럴듯한 이름을 붙였다. 바로 ‘대량살상수학무기(WMD)’다. 2016년 뉴욕타임스, 포춘에서 올해의 책으로 선정된 이 책은 빅데이터 시대의 그림자에 주목한다.



▶빅데이터 시대의 그늘

우선 각성의 순간부터 만나보자. 디이쇼에서 퀀트는 트레이더의 수하가 아니었다. 실제 거래 책임자였다. 퀀트들의 정보가 흘러나가는 것을 우려해 회사에서는 타사는 물론 사내 트레이더들과도 정보 공유를 금지시켰고, 직접 만든 알고리즘은 천문학적인 현금, 채권, 주식을 주무를 수 있었다. 그러던 2007년 7월 균열이 나타났다. 은행 간 금리가 급등한 것. 디이쇼는 하버드대 총장을 지낸 래리 서머스도 재직할 만큼 업계의 최상위층에 존재했지만, 리먼 브러더스가 지분을 20%나 가진 곳이었다. 금융위기가 심각해지자 회사는 소용돌이에 휩쓸렸다. 수학은 외부인들에게 진실을 가리는 장막에 불과했다. 수학의 목적은 단기이익의 최적화였고, 금융위기의 뇌관이 된 주택저당증권(MBS)의 위험 등급은 불투명하고 수학적으로 매우 복잡해 보이도록 설계됐다. 버블의 정점 시기, 비우량 주택대출을 기반으로 만들어진 신용부도스와프(CDS)와 합성 부채담보부증권(CDO)의 규모는 무려 60조달러에 달했다. 이런 시장을 만든 주범인 알고리즘은 막상 시장이 혼란해지자 이를 바로잡고 유가증권의 실질적 가치를 계산하는 데 무용지물이 됐다.

수학 모형은 본질적으로 과거와 기존 패턴이 반복될 것이라는 가정에 기반을 둔다. 다시 말해 수학은 쓰레기 같은 대출채권의 가치를 몇 배로 부풀릴 수는 있으나 그것을 해석할 능력은 없었다는 것이다. 해석은 순전히 인간의 몫이었다. 이 모든 일을 겪고 깨달은 건 사람들이 수학을 무언가를 정의하기 위해서가 아니라 단지 강렬한 인상을 주기 위해 이용한다는 것이었다.

금융위기 직후 딜링룸을 떠나 데이터과학자가 된 오닐은 수학 기법이 단지 금융시장의 동향을 분석하는 데 그치지 않고 인간을 분석하는 데 쓰이고 있음을 발견했다. 수학 기법을 바탕으로 소셜미디어, 온라인 쇼핑몰에서 수집된 방대한 데이터가 하루 24시간 쉬지 않고 가공되고 있었던 것이다. 중국에서는 사회적인 신용도를 평가하는 척도로 사생활이 고스란히 담긴 소셜네트워크 정보를 이용하는 알고리즘이 도입됐다. 이미 많은 국가에선 선거 결과에 영향을 주기 위한 의도로 만들어진 ‘가짜 뉴스’가 빅데이터의 도움을 받아 퍼져나가고 있다.

저자의 눈에 ‘빅데이터 경제’의 가장 큰 문제점은 태생부터 잘못된 수학 모형이 우리 사회 전반을 통제하고 있다는 것이다. 우선 수학 모형 프로그램은 실수가 있을 수밖에 없는 ‘인간의 선택’에 기반을 둔다. 이런 선택의 일부는 선한 의도를 가졌지만, 대다수 모형은 인간의 편견, 오해, 편향성을 코드화한다. 그리고 이 코드가 대학 진학, 대출, 형량 선고, 구직, 노동 환경 등 다시 우리 삶을 깊이 지배하는 시스템에 그대로 주입되고 있다는 것이다.



▶잘못된 수학모형과 효율성의 오류

WMD의 작동 방식과 가장 비슷한 사례는 인종차별이다. 인종차별주의자들은 경험이나 소문에 근거해 특정 피부색을 가진 사람이면 누구나 행실이 좋지 않게 행동할 것이라는 이분법적 예측을 하곤 한다. 심지어 자신의 왜곡된 모형을 수정할 생각이 없고, 신뢰성 있는 데이터를 수집할 노력도 하지 않는다. 그들의 모형은 하나의 신념으로 머릿속에 뿌리내린다. 무계획적인 데이터 수집에 의해 작동하고, 제도적 불공평에 의해 강화되며, 확증편향에 의해 오염된다. 이야말로 WMD와 완벽하게 동일한 모델이다.

그가 보기에 금융업과 빅데이터 업종에는 공통점이 있었다. 인간을 데이터의 흔적으로 대체한다는 것. 동전의 앞뒤처럼 닮은 두 업계를 비교하며 저자는 오닐이 데이터 알고리즘의 효율성이라는 이름을 통해 얼마나 많은 차별을 자행하는지 고발한다. 가치부가모형의 탈을 쓴 교사 평가 시스템을 통해 훌륭한 교사들이 무더기로 잘려나간 워싱턴 DC의 교육 개혁, 2류 잡지 유에스 뉴스의 대학 평가가 낳은 온갖 부정행위와 촌극, 저소득층의 범죄율을 오히려 높이는 범죄 통계 데이터, 타깃형 광고의 비윤리성 등을 말이다. 심지어 인터넷 광고는 극빈층이 취약한 지점을 공략해 지갑을 털었고, 신용평가점수는 취업과 대출과 연애에까지 영향을 미쳤으며, 취업 통계 시스템은 인종에 대한 편견을 강화시켰다. 심지어 선거 캠페인에서 빅데이터에 기반한 마이크로 타기팅은 가짜 뉴스를 믿게 만드는 효과를 만들어 냈다.

캐시 오닐은 수학 모형은 여러 면에서 신을 닮았고, 신처럼 불투명해서 이해하기 힘들다고 비유한다. “각 영역의 최고 사제들, 즉 수학자와 컴퓨터 과학자들을 제외하고는 그 누구에게도 내부의 작동 방식을 보여주지 않는다. 그리고 신의 평결처럼, 잘못되거나 유해한 결정을 내릴지라도 반박하거나 수정해 달라고 요구할 수 없다. 무엇보다 사회적 약자와 가난한 사람들을 차별하고 부자는 더욱더 부자로 만들어주는 경향이 있다.”

저자가 궁극적으로 염려하는 것은 빅데이터가 만들어 낼 민주주의의 손상이다. 가난한 이들은 신용 상태가 나쁘고, 범죄 발생률이 높은 동네에 거주한다. WMD로 무장한 세상은 이런 데이터를 입수해 비우량 담보대출과 약탈적 광고로 융탄 폭격을 퍼붓는다. 안타깝게도 이 문제를 해결할 도구는 일반인들에게 있지 않다. 저자는 수학 모형 개발자들에게 히포크라테스 선서가 필요하다고 말한다. 공정성과 공익을 위해 지금의 모델을 감시하고, 착한 모델의 설계에 나서야 한다는 것. 일례로 그는 아동학대 범죄 가정의 빅데이터를 통해 범죄 가능성이 있는 이들을 찍는 대신, 그 지역과 가정에 자원과 인력을 제공하도록 한 비영리단체 에커드의 사회복지 모델을 소개한다. 이 모델을 통해 플로리다 힐즈버러 카운티에서는 2년간 아동학대로 인한 사망자가 단 1명도 발생하지 않았다.

저자는 이렇게 말한다. “데이터가 사라지는 날은 오지 않을 것이다.
나는 21세기 초반의 WMD들이 참혹했던 석탄 광산처럼 기억되기를 바란다. 수학은 WMD보다 더 나은 대접을 받을 자격이 충분하다. 민주주의도 마찬가지다.”

[김슬기 매일경제 문화부 기자]

[본 기사는 매일경제 Luxmen 제86호 (2017년 11월) 기사입니다]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]


주춤한 은행주, 금리인상 타고 내년엔 오를까

‘환골탈태’ 아이폰 X…비싼 출고가에 사? 말아?

[구효서의 유념유상] 섣달에 부쳐

고수익 투자 VS 고위험 폭탄 ‘양날의 검’ P2P대출 3가지 투자 Tip

단종되기 전에 만들어야 할 ‘혜자’카드 7


경제용어사전 프린트 이메일 전송 리스트