다양한 사회문제를 해결하는 데 있어 비정형 데이터의 가치와 중요성은 챗GPT의 등장으로 더욱 높아지고 있으며 공공 영역에서도 활발히 연구를 진행하고 있다. 사회보장 분야에서는 AI를 활용한 초기상담으로 국민의 복지 욕구를 확인하고 있다. 정보체계 내에 축적되어 빅데이터를 이루고 있는 비정형 데이터
에 대해서 다각적인 분석과 활용 방안 마련이 필요한 시점이다.
이에 본 분석에서는 정보원이 보유한 국민의 도움요청 사연을 분석하여 시스템 개발이 필요한 사항을 제안하였으며, 자연어처리 형태소 사전을 개발 후 적용하여 텍스트 데이터 분석의 신뢰도를 제고하였다. 주요 내용으로는 첫째, 문자열을 계량화·구조화하여 단어 출현 수를 기반으로 주요 키워드를 도출하여 주요 욕구를 탐색하였다. 둘째, 단어 간 연관성을 바탕으로 군집화함으로써 비정형을 유형화하여 주요 토픽을 도출하였다. 셋째, 자살 관련 위기정보 키워드를 발굴하고, 실제로 작성한 요청내용과 현재 고정된 도움요청 주제 분류항목 간 비교 분석을 통해 복지 욕구와 지원 내용 간 매칭을 보다 개선하고, 도움요청 목적과 맞지 않는 사례가 무분별하게 입수되지 않도록 경로를 분리하여 도움요청 접수 건에 대한 복지서비스 지원 연계율을 높일 수 있도록 제안하였다.
본 분석 방법과 결과를 활용하여 정보원이 보유한 초기상담데이터 등도 분석하고 다양한 시사점 도출과 텍스트 형태의 데이터에 대한 향후 활용방안 마련에 도움이 되기를 기대한다.
보다 자세한 사항은 첨부파일을 확인하시기 바랍니다.