뉴스레터

[주간경향][I T]빅데이터는 ‘닳지 않는 자원’이다

최고관리자
2015-02-11 08:47 8,673

본문


ㆍ교통카드 사용 내역 분석해 유동인구 파악… 버스 노선 조정·상권분석 활용

 지난 정권의 자원외교를 둘러싼 논쟁이 지속되고 있다. 일부 사업에서는 수조원대의 손실을 봤다는 지적이 나온다. 뒤집어 생각해보면 ‘자원 빈국’인 대한민국의 슬픈 현실이기도 하다. 물리적인 자원 확보가 어렵다면 발상을 전환해볼 필요도 있다. 캐내고 또 캐내도, 가공하고 또 가공해도 닳지 않는 자원이 여기에 있다. 바로 ‘데이터’를 두고 하는 얘기다.

데이터의 사전적 의미는 ‘사실’, 또는 ‘자료’다. 기본적인 성질은 원유나 석탄 같은 물리적 자원과 크게 다를 바 없다. ‘가공’을 해줘야 쓰임새가 생긴다. 어떤 데이터든 의미를 부여하거나 활용을 해야 가치가 생긴다.








정보통신기술(ICT)이 발달하면서 데이터의 가치는 더욱 주목받고 있다. 우선 수집만 하면 무한정 생겨난다. 예컨대 도시 거주민들의 교통카드 사용 내역을 수집해 대중교통 이용 동선 등을 데이터화할 경우 하루에도 수천만건의 유동인구 관련 데이터가 쌓인다. 모바일 이동통신망이나 각종 근거리무선통신, 센서 등을 기반으로 데이터 수집 경로와 기술이 비약적으로 발달한 덕분에 수집되는 데이터의 양도 갈수록 거대해지고 있다. ‘빅데이터’란 바로 이렇게 수집된 거대한 데이터 덩어리를 뜻한다.

아무리 가공해도 없어지지 않는 게 데이터다. 예컨대 대중교통 이용 동선을 활용해 출퇴근시간 버스·지하철 노선을 조정하거나 주요 교차로 등의 신호를 조절하는 데 쓸 수 있다. 상업적으로는 해당 데이터를 통해 환승 등의 목적으로 사람이 몰리는 곳을 알아낸 뒤 상권분석 등에 활용해볼 수도 있다.

‘빅데이터 산업’으로도 불리는 데이터 가공산업은 이미 활성화 단계에 접어들었다. 정부는 국가 차원에서 수집한 주요 데이터들을 데이터베이스(DB)화한 뒤 무료로 개방 중이다.

‘서울 유동인구 DB’는 서울 주요 지점의 유동인구 실측정보와 각종 통계정보를 담고 있다. 홈플러스, 파리바게뜨, 국민은행 등은 이 정보를 지역 대리점 개설 시 상권 및 입지 분석에 활용하고 있다. 각 지방자치단체 등 공공부문에서는 이 정보를 보도 확장, 안전시설 확대 등 도시계획 수립에 활용하고 있다. 서울시는 점심시간에 정동 덕수궁길 보행인구가 시간당 5530명으로 다른 시간에 비해 보행인구가 집중되는 것을 감안해 덕수궁길 310m 구간을 차가 없는 ‘점심시간 보행전용거리’로 시범운영한 바 있다.

과학기술 분야의 ‘국가생물자원 통합 DB’는 여러 기관에 분산된 생물자원 정보와 미디어(이미지, 동영상, 음성) 콘텐츠 등을 통합·연계해 제공 중이다. 생물교육 관련 교육자재 제작에 활용되거나 다양한 책자 발간 등에 쓰이고 있다.






국립수산과학원이 제공 중인 인근 해역 수온 정보 사진

‘곤충 DB’ ‘고려청자 DB’ 등 무한정
엔씨소프트는 이 중 ‘곤충 DB 정보’를 가공해 아이패드 전용 모바일 애플리케이션 교육자료인 ‘숲에서 만난 곤충’ 등으로 개발했다. 이 앱은 ‘아시아 스마트폰 앱 콘테스트’에서 은상을 받았고, 미국의 저명 언론인 <워싱턴 포스트>에 의해 ‘최고 아동용 앱’으로 선정되기도 했다. 데이터를 가공하기에 따라서는 국제적으로도 충분히 통용될 만한 가치가 창출될 수 있다는 것이 확인된 사례다.

문화분야의 ‘고려청자 DB’는 고유의 고려청자 문양과 패턴 정보를 담고 있다. 이 데이터들은 건축용 마감재, 타일 시제품이나 세라믹 가구 등의 표면 디자인 정보로 활용 중이다. 과거의 전통문화유산이 산업적으로 활용 가능한 현대의 자원으로 재탄생한 셈이다.

데이터의 중요성을 알고 이를 산업에 적극적으로 활용하고 있는 나라가 영국이다. 정보통신정책연구원이 발간한 ‘영국 오픈데이터 정책의 특징 및 시사점’ 보고서를 보면 영국은 데이터 공개 및 투명성 확보를 중심으로 한 ‘오픈데이터 정책’을 유지 중이다. 영국은 데이터가 21세기의 새로운 원자재이자 사회와 경제의 성장을 자극할 수 있다고 보고 전담기구인 내각사무국 등을 설치해 데이터 개방 문제를 관리해오고 있다.






국립수목원이 제공 중인 생물정보 DB

영국, 공공데이터 공개에 독보적
그 결과 영국은 월드와이드웹(WWW) 재단의 2013년 각국 정부의 오픈데이터 지표에서 여러 나라를 제치고 1위를 기록했다. 같은 조사에서 우리나라가 12위를 기록한 것과 대조적이다.

정보통신정책연구원 한은영 부연구위원은 “영국은 데이터에 대한 수요와 공급 기능을 분리해 수행하는 효율적이고 강력한 추진체계를 갖추고 있다”며 “내각사무국이 관련 어젠다를 직접 선도하고, 데이터를 기반으로 한 혁신 및 성장 창출에 있어서는 실행기구 격인 기업혁신기술부(BIS)가 구체적 전략 수립 등 주요 역할을 맡는 형태”라고 밝혔다.

우리나라도 2013년에 ‘공공데이터의 제공 및 이용 활성화에 관한 법률’이 시행되면서 본격적으로 데이터 개방 및 활용 산업을 추진 중에 있다. 국무총리실 산하에 공공데이터전략위원회가 설립됐고, 미래창조과학부 등을 통해 데이터 개방이 단계적으로 진행되고 있다.

현재 국내 공공데이터의 경우 양적 개방 확대에 비해 산업 활용도가 저조하고, 데이터에 대한 접근성도 높지 않다는 게 문제점으로 꼽히고 있다. 이 때문에 미래부는 정부 및 정부 출연 연구기관 등 산하기관에서 보유하고 있는 공공데이터를 민간기업의 수요에 맞춰 적극 개방한다는 방침이다.

 
 미래부는 현재 보유 중인 548종의 공공데이터 가운데 336종을 개방했고, 2016년까지 404종으로 더 늘릴 계획이다. 우편정보 등 현재 수요가 있는 공공데이터의 경우 개인정보보호법, 저작권법 등 관련 법령의 규정에 의해 개방이 어려운 데이터를 제외하고는 연내 개방할 방침이다.

미래부 관계자는 “법령에 의해 전면개방이 제한된 공공데이터에 대해서도 데이터 개방에 따른 창업 및 일자리 창출효과가 높을 것으로 판단되는 경우 개인정보의 익명화 처리 등 기술적 조치 후 개방하는 방안을 검토하겠다”며 “기업과의 지속적인 소통을 통해 제공된 공공데이터의 이용 활성화를 위해 노력해 나갈 것”이라고 밝혔다.

 <송진식 경향신문 산업부 기자 truejs@kyunghyang.com