• [Part 3 | INTERVIEW] 이수지 디플리 대표 | 언어 없는 소리에서 새로운 시장을 만들다

    입력 : 2026.03.25 17:40:51

  • 사진설명
    ▶She is
    한국과학기술원(KAIST)전자과 출신. 서울대학교 뇌인지과학 석사. 현재 공공데이터 전략위원회 민간위원. 서울대학교 병원에서 뇌파 처리 분석 기술을 연구하던 중 음향 분석 기술의 가능성을 발견하고 2017년 디플리를 창업했다.

    Q 창업 초기에 육아를 도와주는 AI 솔루션을 만드셨다가, 산업현장에서 사용하는 음향 AI 솔루션 ‘리슨AI’를 개발하셨는데요. B2C에서 B2B로 사업모델을 전환하게 된 계기는 무엇일까요?

    A B2C는 모델링 실력뿐만 아니라 마케팅, 가격 전략 등 복합적인 능력이 요구되는데, 공학 전공자 중심의 기술팀인 저희에게는 B2B 모델이 더 적합하다고 판단했습니다. 기업 고객은 품질 개선이나 불량률 감소 등 ROI(투자 대비 효율)를 정량적으로 측정할 수 있어 AI 솔루션 도입에 더 명확한 수요와 투자 여력이 있었습니다.

    Q 사업 방향을 전환했지만 적용되는 음향 AI 기술은 동일한가요? 디플리만의 기술경쟁력은 무엇인가요.

    A 울음소리, 문이 열리고 닫히는 소리, 기계가 돌아가는 소리 등 세상의 다양한 비정형 소리를 AI로 분석하는 거죠. 비전 AI 분야에는 오픈 소스 모델도 많지만 음향 AI 분야는 아직 미개척 분야라 자체 모델을 개발해야 합니다. 각 상황에 맞게 축적된 데이터도 희소성이 있습니다. 공장 기계음과 현장의 잡음을 구분하는 신호처리 기술을 보유하고 있죠.

    Q 창업 초기에 페이스북, 구글 등에서 주관하는 스타트업 프로그램에 참여해 음향 데이터를 공급하기도 하셨는데요. 글로벌 IT 기업들에서 디플리의 데이터 패키지를 선택한 결정적인 이유는 무엇인가요.

    A 보통 언어 데이터셋은 많은데 비언어적 데이터, 즉 음향 데이터는 굉장히 희소합니다. 저희가 직접 현장 소리를 수집하거나, 배우를 고용해 녹음하고 데이터셋을 구축했습니다. 다른 곳에서 찾기 힘든 양질의 데이터셋이고 언어장벽이 없기 때문에 해외에서 수요도 많습니다. 자체 데이터와 음향 분석, 딥러닝 기술이 경쟁력이 됩니다.

    Q 현장에서 음향 데이터를 수집하기 위해 어떤 노력을 하셨나요?

    A 디플리의 리슨AI는 두 가지 라인업을 가지고 있습니다. 하나는 공장에서 기계음이나 부품의 결합음을 포착해 기기관리, 불량품 검수에 사용하는 산업용(Industrial) 제품이 있습니다. 이를 위해서 직접 공장 40여곳을 방문해 사업을 소개하고 소리 데이터를 수집했어요. 다른 하나는 안전관제용(Safety) 제품인데요. 도시의 소음, 다양한 기상 환경 속에서 비명이나 도와달라는 소리를 정확하게 인식해야 해요. 이를 위해 배우를 고용해 스튜디오, 공중 화장실, 공원 등 다양한 환경에서 비명 소리를 직접 녹음하며 데이터를 구축하기도 했습니다.

    Q 보통 안전 관제 분야에서는 CCTV를 활용해서 사고, 화재 등을 찾는데 음향 분석을 추가하면 어떤 점이 좋은가요?

    A 공장에서 비전 AI로 불량 검사를 할 때에도, 시각 데이터로는 한계가 있습니다. 안전관제 분야에서도 화재, 사고, 폭력 사건 데이터뿐만 아니라 도움 요청이나 비명 소리를 감지할 수 있으면 상황을 더 정확하게 판단할 수 있습니다.

    Q 싱가포르 정부기관에서 디플리의 음향 AI 기술을 도입한 이유는 무엇인가요?

    A 전 세계 7개국에서 선발된 12개 기업 중, 디플리는 아시아에서 유일하게 선정된 스타트업입니다. 싱가포르 공공안전 시스템에 응급 상황 소리를 실시간 감지하는 ‘리슨AI 세이프티’를 적용할 예정입니다. 한국은 세계적으로 공공안전이 뛰어난 나라이고 비전 AI를 활용한 안전관제 시스템 보급률도 높은 편입니다. 다만 시각지능의 한계를 멀티모달로 보완하기 위해 음향을 이용한 관제 시스템을 전체 관제 시스템에 통합하려는 시도인 거죠. 싱가포르는 동남아 사업의 중심이며, 현지 유통 파트너사들과 협력하고 있습니다.

    Q 국내 지자체에 AI 관제 시스템에도 도입될 수 있겠군요.

    A 올해 국내 지자체 5곳에서 ‘리슨AI 세이프티’를 도입할 예정입니다. 기상환경, 소음, 환경에 관계없이 필요한 소리를 정확하게 인식하는 기술력이 핵심이죠. CCTV나 안전관제 솔루션 전문 기업들과 파트너십을 맺고 소프트웨어를 공급하고 있습니다.

    Q 올해 북미 시장 확장 계획은 어떻게 진행되고 있습니다.

    A 동남아 지역에서 ‘리슨AI 세이프티’를 중심으로 고객사를 확보하고 있고, 북미 법인을 설립해 제조기업들에 납품할 계획입니다. 소음이 심한 공장 환경에서도 부품 간 연결음인 체결음을 판별하는 솔루션으로 검사시간을 최대 60%까지 단축하고, 품질 불량률도 최대 75%까지 개선됩니다. 생산공정은 24시간 연속 모니터링하면서 불량 검출 정확도를 99%까지 높일 수 있습니다.

    Q 스타트업 창업가들은 초기 팀원 구성, 인력 운영 등에 어려움을 많이 겪었다고 합니다. 대표님이 시행착오를 겪으며 얻은 노하우를 후배 창업가들에게 공유해준다면 어떤 조언을 하시겠어요?

    A 음향 AI 기술 자체에 가능성을 보고 창업에 뛰어들었기 때문에 시장을 찾아가는 과정이 어려웠습니다. 어떤 소비자들이 우리 제품을 가치 있게 사용하고 기술이 파급력을 가질 수 있을지 알아가는 과정에서 시행착오를 겪었어요. 여러 산업현장의 어려움을 찾아간 덕분에 현장에서 사용하는 기기 예지보전, 청각 검사 솔루션과 안전관제 AI 솔루션으로 전환에 성공할 수 있었습니다.

    Q 디플리만의 기업 문화나 인재 영입 전략이 있을까요?

    A 우선 올해 글로벌 시장 확장 단계에 있기 때문에 정해진 매뉴얼 없이도 유연하게 대응하며, 책임감 있게 문제를 해결해 나갈 수 있는 주도적인 인재를 찾고 있습니다. 디플리가 축적한 데이터와 독자 기술로 차별화된 음향 AI 솔루션을 만들었기 때문에, 음향 AI라는 특수분야에 전공 지식이나 스스로 공부하고 관심을 가진 인재를 영입하고자 합니다. 사내문화로는 ‘다정함’을 강조합니다. 문제를 해결하는 과정에서 화를 내는 건 쉬운 선택이지만, 팀원끼리 서로 다정하게 대하는 것이 어려운 문제를 함께 풀어나가는 진짜 원동력이 된다고 믿습니다.

    Q 음향 AI 기술과 디플리의 장기적인 비전은 무엇인가요?

    A 장기적으로는 로봇이 현실 세계에서 작동할 때 반드시 필요한 ‘귀’ 역할을 담당하는 AI를 구현하는 것입니다. 청각 기술에는 언어를 이해하는 것 뿐만 아니라, 다양한 소리를 구분하고 분석하는 것도 중요하죠. 음향 AI는 아직 연구할 주제가 많은 미개척 분야라고 봅니다.

    [박수빈 기자 · 사진 류준희 기자]

매일경제
맨위로