20252025-09-298분 읽기

내 개인 업무 자동화를 위한 프로그램 제작(4) - PDF 개인정보 마스킹 프로그램

조회 4추천 0

"AI는 쓰고 싶지만, 개인정보 유출은 어떡하죠?"

업무 자동화 시리즈가 이어지며 사내에서도 많은 관심을 받기 시작했습니다. 하지만 동시에 거대한 장벽에 부딪혔죠. 바로 **"보안"**이었습니다. 특히 고객이나 직원의 개인정보(PII)가 담긴 PDF 문서를 AI에게 제공하는 것에 대해 실무 부서의 우려가 상당했습니다.

이런 걱정이 단순히 '막연한 두려움'이 아니라 '기술적으로 통제 가능한 영역'임을 시연하기 위해, 2025년 9월 네 번째 프로젝트를 시작했습니다.

단순히 텍스트를 긁어오는 것만으로는 부족했습니다. 이미지로 된 PDF나 복잡한 레이아웃에서도 정확하게 정보를 추출해야 했죠.

작동 방식은 철저히 '보안 우선'으로 설계했습니다.

이 프로그램을 통해 실제 업무 환경에서 개인정보 유출 위험을 0%에 가깝게 통제할 수 있다는 것을 증명했습니다. 단순히 '마스킹 프로그램'을 만든 것이 아니라, 기술을 통해 조직 내에 **'AI 활용에 대한 신뢰'**를 심어준 계기가 되었습니다.

이제 우리 팀은 보안이라는 족쇄에서 벗어나, 민감한 문서 업무에서도 AI의 강력한 도움을 마음껏 받고 있습니다.

스캔본/표 구조 문서에서 발생하는 미탐 케이스를 줄이기 위해 OCR 후처리와 테이블 단위 보정 로직을 계속 손보고 있습니다.