빅데이터 혁명·전문가 진단| 빅데이터 다루는 인재부터 키워야… 데이터 유통 늘어야 생태계 활성화

김병수 문수인 박지훈 기자
입력 : 2019.12.27 15:07:08 수정 : 2019.12.29 23:12:58

전문가들이 평가하는 한국의 AI의 기술 수준은 미국과 중국을 100으로 놓으면 70 수준이다. 반면 빅데이터 산업 경쟁력은 이보다 더 떨어진 것으로 평가된다. 인공지능과 관련된 알고리즘은 공개가 많이 되어 있는데 빅데이터는 그렇지 않기 때문이다.

가장 필요한 부분은 정부의 정책적 노력이다. 정부도 개인정보 관련 규제완화와 함께 ‘데이터 바우처’ 제도를 활성하고, 공공 데이터도 전면 개방한다는 계획을 내놓았다.

고한석 서울디지털재단 이사장은 “정부가 적극적인 투자를 통해 선진국의 90%까지 기술수준을 올리겠다는 정책방향은 바람직해 보이지만 비즈니스로 연결되기 위해서는 그 이상의 노력이 필요하다”면서 “90%라는 숫자로만 보면 많이 올라왔다고 느낄 수 있어도 들여다보면 그렇지 않다. 90%와 97%는 작은 차이 같지만 들여다보면 상당히 크다. 특히 자율주행과 같은 기술은 인명이 달려있기 때문에 완벽한 기술력을 가져야 상용화가 가능하지만 마케팅이나 여타 비즈니스에서는 90%도 쓸 수 있는다”고 설명했다.

정부의 연구개발 투자 역시 빠질 수 없다. 정부가 먼저 연구개발과 플랫폼에 투자해 마중물을 만들어내면, 여러 기업들이 적극적으로 도입해 기술을 사용할 수 있다.

기업 단위에서의 활용에는 역시 인력과 임직원들의 인식 문제가 뒤따른다. 기업의 중간관리자 내지는 임원급의 데이터 리터러시다. 고한석 이사장은 “전반적인 경영전략을 제안하고 수립하는 부장·상무급 이상의 임원들이 빅데이터에 대한 이해도를 높여 프로젝트 도입 여부를 결정하고 얻을 수 있을 것이 무엇인지 확실히 알아야 한다”고 강조했다.

빅데이터와 인공지능(AI)은 모두 규모의 경제가 중요한 산업인 만큼, 우리보다 앞선 선진 국가들과의 협력이 중요하다는 목소리도 나온다. 차상균 서울대 빅데이터연구원장은 “유럽국가들은 지금 다양한 협력을 통해 머리를 맞대고 믿을 수 있는(Trustable) AI를 연구하고 있다. 구글의 자율주행 자동차 기술이 아무리 발전한다 한들 연구소나 일부 환경에서 사고 없이 시범운행을 했다고 과연 유럽이나 국내도로 환경에서 상용화 단계까지 나아갈 수 있는 것은 아니다”라고 강조했다.

▶기업 임원급의 데이터 이해도 중요

현장에선 데이터 활용 제약에 대한 제언이 많다. 빅데이터 분석 업체인 김성환 리비 대표는 최근 우리 사회에서 논의되고 있는 빅데이터 논의 관련해 “그림의 떡”이라고 했다.

그는 “빅데이터를 원천적으로 수집할 수 없는 저희 같은 분석 전문 업체에게 개인정보 보호를 활용할 수 있게 하느냐 마느냐 여부는 남의 일”이라면서 “오히려 대형 업체들의 독점 현상이 더 가속화될 수 있다”고 토로했다.

그는 “국회에 계류돼 있는 관련법이 통과되면 통신사나 금융사 등 데이터를 자체 수집할 수 있는 대형 업체들은 이를 합법적으로 제3자에게 팔 수 있는 길이 열린다”면서 “이렇게 되면 저희는 데이터를 사서 써야 하고 이러면 배보다 배꼽이 더 커지는 상황이 될 수 있다”고 했다. 실제 지금도 빅데이터 관련 수주 계약을 맺으면 수주 금액의 절반 이상이 데이터 구입비용으로 나간다는 것은 공공연한 비밀이다. 데이터를 가진 업체는 그냥 앉아서 돈을 벌 수 있는 구조가 지금도 정착돼 있는 것이다.

김 대표는 “물론 빅데이터 관련 법이 통과되면 사업 기회도 많아지겠지만, 솔직히 부담스러운 측면도 있다”고 했다. 관련 수혜를 보는 기업은 스타트업 중에서도 대형화된 곳만 해당이 되지, 많은 소규모의 스타트업들은 데이터 구입에 앞으로 더 신경을 써야 될지도 모르기 때문이다.

민기영 한국데이터산업진흥원 원장도 “중소기업과 스타트업의 생존을 가장 크게 위협하는 것이 자금력”이라면서 “사업에 반드시 필요하고 중요한 데이터지만 자금력이 열악한 중소기업은 데이터 구매·가공비용에 큰 부담을 느낄 수밖에 없다”고 말했다. 현재 한국데이터산업진흥원은 데이터 구매·가공비용 등과 관련한 컨설팅을 지원한다.

국회예산정책처도 관련 문제를 지적했다. 국회예산정책처는 최근 펴낸 보고서에서 “우리나라는 아직 빅데이터의 구축·유통·활용 등 가치사슬 전반에 쓸 만한 데이터가 부족하고, 유통이 폐쇄적”이라면서 “이 같은 문제를 해결하기 위해 빅데이터 플랫폼 및 센터의 데이터 생산·구축에 집중하고 구축된 각 플랫폼 및 센터 간 연계·고도화를 추진할 필요가 있다”고 밝혔다.

이와 관련해 과학기술정보통신부는 2019년 3월부터 공모절차를 진행하여 최근 빅데이터 플랫폼 10개소와 플랫폼별 빅데이터 센터 100개소를 선정해 놓고 있다. 2021년까지 총 1516억원을 투입해 데이터 유통 활성화를 도모할 예정이다.

▶부족한 국내 빅데이터 전문 인력 확보 나서야

빅데이터 인재를 육성할 시스템 미비도 아쉬운 대목이다.

기업들은 인력이 부족해 프로젝트를 진행하지 못한다고 하고 인재들은 국내에 빅데이터 관련 프로젝트가 부족해 해외기업들로 향하는 게 현실이다.

차상균 원장은 “학생들을 제대로 가르칠 수 있는 전문가를 데려오고 정식 교육과정을 하루바삐 만들어 세계 시장에서 활약할 수 있는 인재를 배출해내야 한다”면서 “해외기업이나 학교로 국내 인재들이 취업이나 공부를 하러 떠나는 것도 마냥 비판할 일은 아니다. 해외에서 공부하고 선진기업에 들어가 얻는 경험들이 장기적으로 한국의 자산이 될 수 있을 것”이라 조언했다.

빅데이터에는 인간의 통찰력이 함께 필요하다. 트리샤 왕 서든컴퍼스 대표는 “빅데이터는 현재와 과거에 편향돼 있기 때문에 심층데이터로 이를 보완해야 정확한 미래 예측이 가능하다”고 강조한다. 인류의 오랜 꿈이 미래에 대한 확신이고, 그 확신의 근저에는 오늘날 빅데이터가 있지만 빅데이터 숫자 이면의 함의를 찾아야 한다는 조언이다. 데이터에는 과거 데이터만 있기 때문에 시장을 정확히 이해하고 예측하려면 심층 분석인 딥데이터가 필요하다는 주장이다. 이를 위해선 데이터사이언티스트 외에 다양한 인문학 전문가들을 동원해야 한다고 강조했다.

개인정보 보호 역시 데이터 산업 활성화에 필수적인 요소다. 자칫 사고라도 나게 되면 데이터 산업의 기반 자체가 흔들릴 수 있기 때문이다. 따라서 데이터 확보 측면에서 비식별 개인정보에 대한 명확한 정의 및 사용, 처리기준에 대한 세부 가이드라인 개발이 필요하다는 주장이 나온다. 데이터 품질을 제고할 수 있는 평가 및 관리 체계를 구축해야 하며, 해외 데이터 선도국 사례를 참고해 정부 주도의 개인정보 보안 체계와 민간 기업의 자율에 맡기되 개인정보 유출 사고 발생 시 기업에 명확한 책임을 묻는 방식 간 실효성을 상호 비교해 볼 필요가 있다는 것이다. 데이터 사용 권리에 따르는 책임도 산업계가 분명히 져야 한다는 지적도 나온다. 가명 정보와 활용 목적의 범위를 명확히 하고 시민사회 일부서 우려하는 ‘무분별한 가명 정보 남용’에 대해 엄격한 처벌 조치도 명시해야 한다는 것이다.

권헌영 고려대 정보보호대학원 교수는 “데이터 3법 개정을 통해 데이터 경제 혁신의 토대를 만드는 것은 더 이상 거스를 수 없는 시대적 흐름이다”라며 “빅데이터 활용을 자유롭게 허용해 주되 사고가 발생하거나 사회적 위험이 가중되는 분야에 대해서는 정부가 조사권을 발동해 책임구조를 명확히 밝히고 후속 조치를 취하도록 법률안을 정밀하게 만들어야 한다”고 제언했다.

[김병수 문수인 박지훈 기자]

[본 기사는 매경LUXMEN 제112호 (2020년 1월) 기사입니다]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]