금융위원회가 있는 정부서울청사 본관 전경, 출처 : 스카이메타뉴스

331만 명 사생활 데이터로 신용 평가

카카오뱅크 실증 데이터 분석 논문 통해 드러난 ‘대안 신용 평가’의 실체

금융위원회 가 포용적금융 명분으로 추진 중인 ‘대안 신용 평가’가 개인의 소비 패턴 및 사생활 정보를 광범위하게 수집·분석하고 있는 것으로 취재됐다.

한국금융연구원이 발표한 「대안 데이터를 활용한 신용 평가: 빅데이터와 머신러닝 활용 연구」(2024.12)를 검토해 본다.

이 보고서에서 연구진은 2020년 5월부터 10월까지 카카오뱅크 대출 신청자 3,311,744명의 방대한 데이터를 분석해 신용 평가 모델을 구축했다.

이 과정에서 활용된 ‘대안 데이터’에는 기존 금융 거래 정보 외에 다음과 같은 개인 사생활 정보가 포함되었다.

▲도서 구매 내역 (개인 취향 및 지적 성향) ▲택시 서비스 이용 정보 (이동 경로 및 시간대) ▲선물 구매 및 디지털 지갑 이용 패턴 (인간관계 및 소비 성향) ▲통신 소액결제 및 자동이체 정보 등이 그것이다.

해당 연구는 머신러닝 기법인 XGBoost 알고리즘을 적용한 결과, 기존 신용평가사(CB)의 표준신용점수(AUC 82~84%)보다 높은 87%의 예측력을 기록했다고 밝혔다.

이는 개인의 비금융적 일상 기록이 금융 기록보다 더 정밀하게 개인을 ‘등급화’할 수 있음을 증명한 것이다.

포용적금융 하에 사생활 정보 수집?

문제는 이러한 데이터 수집이 ‘금융 소외 계층 지원’이라는 금융위원회 의 포용적금융 명분 아래 정당화되고 있다는 점이다.

그러나 실제로는 개인의 일거수일투족이 데이터화되어 시스템에 기록되며, 평가 모델의 구체적인 변수는 ‘전략적 보안’을 이유로 대중에게 공개되지 않고 있다.

결국 ‘포용적금융’ 이라는 수사 뒤에서, 금융 시스템은 개인의 모든 생활 양식을 데이터화하여 감시망을 촘촘히 하고 있다는 지적이다.

특히 시스템이 정의한 ‘성실함’의 범주에서 벗어난 독립적 성향의 개인들은 오히려 보이지 않는 불이익을 받을 가능성도 배제할 수 없다.

본지 편집국장은 관련 취재를 위해 13일 금융위원회를 방문하고자 했으나 최용선 선생님이란 분에게 거절당했다.

본지는 대안신용평가와 관련해 금융위원회가 제시하는 포용적금융에 대해 질문하고자 수차례 전화를 시도했으나 금융위원회는 묵묵부답으로 대응했다.

스카이메타뉴스는 금융위의 헌법상 기본권 침해에도 불구하고 앞으로 이 ‘데이터 감시망’이 구체적으로 어떤 알고리즘을 통해 개인을 규격화하는지 후속 취재를 이어갈 예정이다.

By 김도균 기자(dsajax0411@naver.com)

스카이메타뉴스 편집국장 김도균입니다. 서울대학교 경제학과 (전) 한국산업은행 제1회 시험출신 행정사 (전)소비자경제신문 기자 (전)금융산업노조 한국산업은행지부 홍보국장