[설명환의 IT읽기] 빅데이터와 개인정보 사이

6월 24일은 ‘전자정부의 날’이다.

1967년 6월 24일은 인구통계용 컴퓨터로 첫 행정업무를 처리한 날을 기념해서 2016년 기념일에 지정됐다.

세계에서 가장 빠르게 구축한 초고속 정보통신망을 기반으로 주민, 부동산, 자동차, 인허가 등 국민 생활과 기업 활동에 필요한 행정 서비스를 온라인으로 구현했다.

전자정부가 발전하면서 빅데이터 저장과 보호뿐만 아니라 분석의 가치가 중요해졌다.

빅데이터(Big Data)란 디지털 환경에서 생성되는 모든 데이터를 의미한다.
수치 데이터뿐만 아니라 문자와 영상 데이터 등 대규모 데이터를 포함하는데 생성 주기가 짧은 반면, 규모는 방대하다는 특징이 있다. 과거에 비해 데이터의 양이 폭증했고, 종류도 다양해져서 위치정보와 SNS를 통해 사람들의 행동은 물론 생각과 의견까지 분석하고 예측할 수 있다.

흔히 빅데이터를 4차 산업혁명의 `석유`에 비유한다. 그만큼 활용가치가 높다는 의미다. 석유 없는 산업을 상상할 수 없는 것처럼 인공지능, 클라우드, 사물인터넷 등은 모두 데이터에서 시작한다.

은행, 증권 같은 금융거래, 학습, 자료 검색과 이메일 등 일상생활을 담아낸 데이터는 수집·저장·검색·분석을 통해 새로운 데이터로 재생산되고 있다. 도로와 건물 여기저기 설치된 CCTV 또한 빅데이터의 저장고다.

(사진설명: 트위터 사용자의 팔로워 연결 고리 빅데이터 분석. 출처= whyfiles.org)

빅데이터는 앞으로 10년 동안 더 급격한 변화가 진행될 전망이다.

리서치 기업 위키본(Wikibon)에 따르면 2017년 전 세계 빅데이터 애널리틱스(분석:Analytics) 시장은 전년도 대비 24.5 % 성장했고 2027년까지 연 11% 성장을 거듭해 전 세계적으로 1,030억 달러(약 103조 원) 규모에 이를 것으로 예상하고 있다. 장기적으로 사물인터넷(IoT), 이동성 등 엣지 컴퓨팅 용도에 빅데이터 애널리틱스가 활용되면서 시장 성장의 많은 부분을 이끌 것으로 보인다.

구글, 페이스북, 아마존, 알리바바의 공통점은 방대한 데이터 축적이다. 한국도 네이버, 카카오, KT를 필두로 빅데이터를 구축하고 있다.

하지만 데이터를 모으는 일이 간단치 않다. 정보와 프라이버시권이 충돌하는 경우가 많다. 한국은 관련 법규가 프라이버시 보호에 맞춰져 있어 특히 데이터 장벽이 높다.

현재 병원 빅데이터는 자기 병원 환자만의 빅데이터로 개인 정보 보호를 근거로 의료 정보는 병원 담을 넘을 수 없다.

(사진설명: 볼티모어 존스 홉킨스 병원의 초음파 검사 출처=medium.com)

앞으로 의료 서비스는 의사 개인 능력에서 승부 나지 않고 예측·진단·치료법·사후관리까지 제시하는 통합 관리 서비스로 진화할 것이다.

주요 대형병원은 데이터를 많이 확보하면 할수록 의료 서비스의 정확도가 높아지기 때문에 빅데이터 센터 설립과 인력 확보에 집중하고 있다.

빅데이터는 부인할 수 없는 대세다. 하지만, 빅데이터가 수반하는 리스크도 간과해선 안된다.

로컬에 머물렀던 데이터가 중앙에 집중하면 리스크는 증가한다.

페이스북의 개인정보 유출 파문(요약: 2016년 미국 대선에서 도널드 트럼프 후보 측이 페이스북 이용자의 성향을 분석해 정보전 도구로 이용한 사건)에서 보듯이 자신은 물론 친구들의 정보가 열람되고, 정치공작과 여론조작의 도구로 사용됐다는 것은 섬뜩한 일이다.

(사진설명: 마크 저커버그 페이스북 최고경영자가 미국 상원 청문회에 출석해 증언하고 있다. 출처=연합뉴스)

페이스북은 중동 민주화 바람에 기폭제가 되는 긍정적 역할도 했지만 월간 이용자 21억명에 어울리는 보안체제와 윤리기준은 제대로 갖추지 못했다. 실제로 페이스북은 이용자 정보를 매매하면서도 매입 처가 그 정보를 어떻게 활용하는지는 전혀 파악하지 못하고 있었다고 한다.

개인정보를 보호하지 못한 기업은 퇴출된다는 전제 아래 엄격한 기준과 잣대가 마련해야 한다. 개인정보 보호 없는 빅데이터는 ‘빅 브러더(big brother)’의 등장을 부르기 때문이다.

그렇다고 개인정보 유출을 염려해 무한한 비즈니스 이윤 창출이나 아카이브(archive)의 효율성을 놓칠 수도 없는 일이다.

사회적 합의를 통해 리스크를 줄여나가는 한편, 유연한 규제정책으로 빅데이터 생태계를 조성에 지혜를 모아야 한다.

* 설명환 칼럼니스트
설명환 칼럼니스트는 작가이자 커뮤니케이터다. 과학의 대중화를 목적으로 일반인과 학생들에게 공학을 보다 쉽고 재미있게 전달하는 글을 쓰고 있다. 현재 세계 5위권 메모리카드 전문 제조기업의 커뮤니케이션팀장으로 재직 중이며, 국가정보기간 언론사의 객원 논설위원으로 선임되어 과학, 산업, 사회 등 분야의 현상들을 분석하고 논평하고 있다. 이메일 pr1st@naver.com

About Kevin Choi

AVING News Reporter