I. 서 론
1. 연구의 배경 및 목적
2. 연구의 범위 및 방법
II. 이론적 고찰
1. 공동주택 전용부 관리현황
2. 텍스트마이닝 기법 동향
3. 선행연구 검토
III. 데이터 분석방법
1. 자료수집 및 정제
2. 분석방법
IV. 분석결과
1. 빈도 및 TF-IDF분석
2. N-gram 분석
4. CONCOR 분석
V. 결 론
I. 서 론
1. 연구의 배경 및 목적
공동주택은 기본적으로 개인의 사유재산이지만, 단독주택과 다르게 관계 법규들로 법적 관리와 규제를 받는 사회적 공공재이기도 하다. 공동주택은 준공 후 「공동주택관리법」에 따라 3년 이내 하자발생에 대해 사업주체가 책임지고 보수하고 있고, 그 이후에는 관리자가 공동주택 공용부분의 유지보수 및 안전관리를 비롯해 전반적인 운영을 하고 있다. 이에 반해 공동주택 단위세대는 개인 소유물로 소유자가 필요에 의해 개별적으로 관리하고 있다. 시설물이 노후화됨에 따라 적절한 시기에 교체가 필요하나, 체계적인 관리가 되지 않고 있는 실정이다.
국내 주택의 64.0%를 차지하는 아파트는 약 1,227만호로, 이 중 준공 후 20년 이상 지난 아파트가 45.7%에 해당한다.1) 최근 안전에 큰 문제가 없더라도 층간소음, 배관, 주차 등 열악한 거주환경을 가진 30년 이상 경과한 노후주택은 안전진단을 하지 않고 바로 재건축 절차에 착수하도록 정부가 추진할 만큼, 거주환경은 거주자의 지속가능한 쾌적한 삶을 유지하는데 매우 중요한 문제이다.
본 연구에서는 공동주택 단위세대의 시설물 중 중점적인 유지관리가 필요한 요소를 도출하기 위해 공공임대주택의 단위세대 시설물 보수 요청에 관한 민원 내용을 분석하였다. 공사가 관리하는 공공임대주택은 단위세대의 시설물에 문제가 발생할 경우 거주자의 민원을 통해 공사가 시설물을 보수 처리하고 있다. 따라서 민원 내용에는 시설물 보수 요청에 따른 대상 시설물 종류와 위치, 보수 원인이 포함되어 있을 수 있어, 텍스트마이닝 기법을 활용하였다. 이를 통해 민원 빈도가 높은 시설물의 보수 발생 원인을 분석하고 공동주택 단위세대 시설물의 유지관리에 필요한 요소를 도출하여 선제적이고 체계적인 공동주택 유지관리에 필요한 기초자료를 마련하고자 한다.
2. 연구의 범위 및 방법
본 연구에서는 공동주택 단위세대 시설물의 유지관리요소를 도출하기 위해, 공공임대주택의 단위세대 시설물 보수 요청에 관한 민원 내용을 텍스트마이닝 기법을 활용하여 분석을 진행하였다. 분석 대상은 서울주택도시공사에 최근 5년(2019- 2023) 간 접수되어 처리된 공동주택 단위세대 시설물 보수에 관한 민원 673,589건이다.
분석에 앞서 민원 발생 빈도가 가장 높은 3가지 주요 공종인 위생기구, 난방설비, 수장에 대해 파이썬(Python)의 한국어 자연어 처리 패키지인 konlpy 중 OKT(Open Korean Text)를 사용하여 형태소 단위로 구분하고, 시설물 보수와 관련된 단어로 정제하였다.
주요 공종별 민원이 발생한 시설물의 위치, 원인의 연관관계를 분석하기 위해 먼저 중요한 키워드를 도출하고자 단어 빈도와 상대적 중요성을 평가하는 TF-IDF 분석을 실시하였다. 이를 통해 위생기구, 난방설비, 수장 공종의 핵심 키워드를 각각 30개를 도출하고, 핵심키워드간 동시출현 연관분석인 N-gram을 통해 민원 발생 원인별 시설물 종류 또는 발생 위치와 관련된 키워드를 매칭하였다. 매칭된 키워드간 유기적 관계를 분석하기 위해 UCINET 6을 활용하여 CONCOR 분석을 수행하여 시각화를 진행하였다. 즉, 민원 내용을 통해 시설물의 보수가 필요한 원인을 분석함으로써, 공동주택 단위세대 시설물의 유지관리에 필요한 요소를 도출하는데 본 연구의 목적이 있다.
II. 이론적 고찰
1. 공동주택 전용부 관리현황
공동주택의 단위세대는 준공 후 하자담보 책임기간이 지나면, 법적 관리와 규제의 대상이 아니기 때문에 거주자 또는 소유자가 개별적으로 관리하고 있다. 이에 반해 국가 또는 지방자치단체가 관리하는 공공임대주택은 단위세대도 공용부와 동일하게 교체가 필요한 시설물의 수선계획2)을 수립하여 관리하고 있다. 그러나 실제 거주하고 있는 세대 내부를 수선주기에 맞춰 시설물을 교체하는 것은 현실상 어려움이 있고, 그 외에도 보수가 필요한 상황은 발생하기 때문에 거주자들은 관리자에게 민원을 접수하여 시설물 보수를 요청하고 있다.
공공에서 관리하고 있는 임대주택 단위세대 시설물은 크게 건축, 기계・설비, 전기・통신, 3가지로 구분되어 시설물별 수선방법과 수선주기, 수선율 기준을 수립하고 있다. 공공임대주택을 관리하고 있는 주체별로 기준은 다소 상이할 수 있으나 건물 내부(마감재, 창・문, 주방기구, 신발장), 기계・설비(수전, 배관, 계량기, 렌지후드, 보일러, 온도조절기), 전기・통신(전등기구, 스위치, 콘센트, 배선, 인터폰, 홈네트워크, 분전반, TV공청설비)를 주로 관리하고 있다.
2. 텍스트마이닝 기법 동향
최근 다양한 분야에서 텍스트 데이터의 가치를 인식하여 수학, 통계학 등을 이용한 텍스트 분석 방법인 텍스트 마이닝(Text Mining)이 다양하게 활용되고 있다. 이는 구조화된 정형데이터를 정량적으로 분석하는 데이터 마이닝(Data Mining)과는 다르게, 구조화되지 않은 비정형 및 반정형 데이터에 대해 자연어 또는 문서 처리 기술을 적용하여 정량화하여 의미있는 정보를 추출하는 데이터 분석 기법이다.
이전부터 사회과학연구에서 커뮤니티 내의 관계망 등을 분석하기 위해 사용되었으나, 최근 빅데이터 분석의 발전으로 인터넷 전체의 텍스트를 대상으로 범위가 확장되었다. 학문상에서는 수많은 문서로부터 정보를 추출하여 데이터베이스화시키거나 규칙을 찾고, 핵심 키워드나 토픽을 추출할 경우 등에 특히 활용되고 있다. 방대한 양의 논문 분석을 통해 연구 동향을 찾거나, 인터넷상의 특정 이슈에 대한 정보를 수집하여 분석하는 등의 목적으로 신속하고 정확하게 정보를 얻을 수 있다는 점에서 텍스트 마이닝 기법은 주로 활용되고 있다.
가장 기본적인 형태소 분석은 데이터의 전반적인 이해를 위해 품사 태깅(POS tagging), 토큰화(tokenization)기법을 활용해 단어 출현 빈도 등을 구한다. 이를 기반으로 문서와 단어를 각각 벡터와 차원에 대응시켜 통계적 가중치를 구하는 벡터 공간 모델 기법을 통해 특정 문서상에서 상대적으로 중요한 단어를 구할 수 있다. 또한 문서 또는 문장 내에서 두 단어 또는 그 이상의 단어가 동시 출현하는 빈도를 구하여 유의미한 단어 쌍을 추출도 가능하다. 이러한 연관 분석을 바탕으로 단어들의 구조적 관계를 구해 텍스트의 의미를 도출하는 의미 연결망 분석도 가능하다. 이 밖에도 감성 사전을 바탕으로 텍스트에 내포된 감성 비율을 정량화하여 텍스트의 긍정, 부정, 중립으로 분류도 가능하다.
본 연구에서도 방대한 민원 내용을 분석하기 위해 텍스트 마이닝 기법을 활용하였다. 민원 내용에서 빈도가 높은 단어를 추출하고, 통계적 가중치를 구하여 핵심 키워드를 도출하여 민원이 발생하는 시설물의 종류, 발생원인, 위치를 파악하고자 하였다. 또한 핵심 키워드들이 동시 출현하는 빈도를 구하여 유의미한 단어 쌍을 추출하고, 단어들의 구조적 관계를 분석하여 민원이 많이 발생하는 대상물의 보수가 필요한 원인에 대해 분석하고자 하였다.
3. 선행연구 검토
공동주택 시설물의 유지관리에 대한 연구는 공용부의 장기수선계획을 중심으로 수행된 연구가 대부분이며, 실제 현황을 분석한 연구 사례도 부족하다. 특히 단위세대는 개인의 소유물이기 때문에 내부 시설물을 포함한 유지관리현황에 대한 연구는 전무한 실정이다. 다만 공동주택 단위세대 역시 유지관리가 필요하다는 인식에 거주자 설문 등을 통해 관리가 필요한 시설물 항목을 제안하는 연구 중심으로 수행되고 있다.
텍스트 마이닝 기법을 활용한 공동주택 시설물의 유지관리 분야 연구는 공동주택 하자 사례를 대상으로 최근 수행되고 있다. 분양 후 공동주택의 품질에 대한 입주자들의 관심이 높아지고 있고, 하자판정기준에 대한 입주자와 시공사의 이견 등으로 많은 시간과 비용이 소비되고 있다. 이에 텍스트 마이닝 기법을 활용하여 시공사가 하자보증 책임기간동안 관리하고 있는 하자사례 또는 하자청구소송 판례를 분석하여 저감방안을 모색하는 연구가 진행되고 있다.
Bang et al.(2022)는 공동주택의 보수하기 위해 분류된 1차 하자 외에도 이후 발생하는 재하자를 2차 하자라고 구분하고, 2차 하자발생의 원인을 감소하는 것이 공동주택의 품질 및 비용 측면에서 중요하다고 하였다. 그러나 2차 하자는 표면적으로 구분하기 힘든 하자이므로, 1,331,472건의 하자 내용을 텍스트 마이닝 기법을 활용하여 2차 하자를 유발하는 공종을 도출하였다. 동일한 날짜에 같은 현장, 부위, 위치를 설정하고 2차 하자 내용과 유발 공종의 하자 내용의 공종, 원인, 비슷한 현상 등을 코사인 유사도 분석을 통해 유지관리가 필요한 공종을 도출하여 2차 하자 발생을 저감하는 방안을 제시하였다.
그리고 공동주택 하자판결사례의 쟁점 도출을 위해 하자판결사례 61건과 건설사에서 관리하는 공동주택 보수 및 종료된 하자 데이터와 비교한 Bang el al.(2022) 연구에서도 텍스트 마이닝 기법을 활용하였다. 하자판결사례에서 텍스트마이닝을 통해 하자 구분, 하자 위치, 하자 부위, 하자 공종, 하자 유형, 하자 원인으로 구분하여 주요 쟁점 사항을 도출하였다. 그 결과 빈도수가 높은 공종의 쟁점 원인을 건설사에서 시행한 하자보수종결 데이터와 비교분석하여 주로 분쟁되는 하자 공종에서 관리가 필요한 요소를 도출하였다.
Lee(2018)에서는 공공임대주택의 단위세대 보수 이력을 텍스트 마이닝을 통해 유지보수항목들의 연관성 분석을 수행하였다. 노원구 소재 5개의 단지의 3개년 시설물 보수이력 18,192건에 대해 A prioir 연관성을 분석하여 1~3개 단어의 집합으로, 시설물의 보수 원인과 위치를 유추한 바 있다. 난방분배기의 작동 문제, 발코니 방수 불량, 상층 누수로 인한 도배를 도출하여 관리가 필요함을 제시하였다.
준공 후 30년이 경과한 공공임대주택 5개 단지의 14년간 처리완료된 단위세대 시설물의 보수요청에 관한 민원 사례 104,865건을 분석한 Kang(2023)에서는 텍스트 마이닝 기법을 사용하여 원인을 분석한 바 있다. 민원이 발생한 상위 5개 공종인 수장, 난방설비, 위생기구, 창/문, 전등설비에 대해 민원 내용을 분석하여 단어의 빈도수로 민원의 발생 원인을 도출하였다. 수장의 경우 노후로 인한 교체뿐 아니라 누수로 인한 교체가 큰 비중을 차지하는 것으로 나타났으며, 난방설비, 위생기구 공종에서도 유사한 경향을 보였다.
선행 연구들을 살펴볼 때, 공동주택 단위세대 시설물의 유지관리현황을 분석하기 위해서는 보수한 공종의 빈도뿐 아니라 발생 원인과 위치 파악이 필요함을 알 수 있다. 방대한 민원 또는 보수 이력을 분석하기 위해서는 텍스트 마이닝 기법 활용이 필수적이다. 본 연구에서는 텍스트 마이닝 기법을 활용하여 공공임대주택 단위세대의 시설물 보수 관련 민원 내용을 분석하여 시설물의 유지관리요소를 도출하고자 한다.
III. 데이터 분석방법
1. 자료수집 및 정제
서울주택도시공사가 관리하고 있는 공공임대주택 거주자들의 세대 내부 시설물 보수 요청에 관한 최근 5년(2019-2023)간 민원들을 수집하였다. 매년 약 15만 건 이상 접수되고 있었으며, 준공연도 경과시점이 증가할수록 민원 발생 건수도 증가하고 있다<Figure 1>. 전체 민원의 90% 이상이 단위세대에 해당하는 민원이였으며, 이러한 민원은 콜센터, 홈페이지, 관리사무소, 해당권역 센터에서 접수되어 해당지역 관리자들이 공사별로 ‘대공종’-‘중공종’-‘소공종’의 위계로 구분하여 처리하고 있다. 건축, 기계, 소방, 전기, 통신 등으로 구분하는 것이 대공종이고, 이를 수장, 도장, 가구 등으로 세분화한 것이 중공종, 소공종은 벽지, 장판, 보드 등 품목을 지정하는 수준에 해당한다.
가장 많은 보수요청을 받은 시설물 항목은 중공종 “위생기구”, “난방설비”, “수장”으로 나타났으며, 전체 민원 중 각각 13.3%, 13.0%, 11.6%를 차지하고 있었다<Figure 2>. 이 시설물은 서울주택도시공사에서 내부적으로 수선기준을 수립하여 관리하고 있으나, 보수 또는 교체에 대한 민원의 빈도가 큰 비중을 차지하는 것을 알 수 있다. 이는 현재 규정된 수선주기가 적절하지 않아서인지 시설물의 보수를 요청하는 원인이 무엇인지 분석해 볼 필요가 있다.
공사 시설물관리시스템에 기록된 된 민원 중 처리가 완료된 673,589건에 포함된 명사를 기반으로 키워드를 도출하였다, 여기서 단지명과 같은 고유명사, 시설물 보수와 관련되지 않은 무의미한 단어 등 분석에 불필요한 키워드들은 삭제하였고, 유사 단어들을 하나의 키워드로 통합하는 데이터 정제 과정을 거쳤다. 파이썬(Python)의 한국어 자연어 처리 패키지인 konlpy 중 OKT(Open Korean Text)를 사용하여 형태소 단위로 나눈 후 분석을 시행하였다.
먼저 민원 내용의 단어 빈도수를 체크하여 가장 빈번히 언급된 키워드를 워드클라우드(Wordcloud)로 시각화한 결과는 <Figure 3>와 같다. “교체”, “욕실”, “노후”, “보수”, “불량” 순으로 빈도가 높게 나타나는 것을 알 수 있으나, 혼재된 키워드의 빈도만으로는 민원의 발생 원인을 유추하기는 어렵다. 따라서 민원이 많이 발생한 “위생기구”, “난방설비”, “수장” 공종에 한정하여 민원 내용을 분석하여 발생 원인을 파악하고자 하였다.
2. 분석방법
본 연구에서는 주요 공종의 민원 발생 원인을 도출하기 위해 텍스트 마이닝 기법으로 가장 보편적으로 사용하는 빈도 및 TF-IDF 분석, N-gram 분석, CONCOR 분석을 수행하였다. Python 프로그램을 사용하여 분석을 진행했으며, 데이터 정제 후 다음과 같이 3단계의 과정으로 진행되었다.
1) 빈도 및 TF-IDF 분석
앞서 정제된 데이터에서 도출된 키워드를 대상으로 단순 빈도와 키워드별 상대적 중요성을 평가하는 TF-IDF 분석을 실시하여 주요 공종별 상위 30개의 핵심 키워드를 도출하였다.
빈도분석은 문서 내에서 가장 높은 빈도를 나타내는 키워드가 주요한 텍스트라고 판단하는 방법으로, 큰 의미없이 자주 반복되는 키워드가 주요한 키워드라고 판단될 수 있는 한계가 있다. 이를 보완하고자 문서 내에서 빈도는 낮으나 상대적으로 의미있는 키워드를 도출하는 TF-IDF(Term Frequency - Inverse Document Frequency) 분석을 수행하였다.
TF-IDF 분석은 특정 텍스트가 한 개의 문서 내에 출현한 빈도를 그 텍스트가 복수의 문서 내에서 출현한 빈도로 나누는 방식으로, 이를 통해 산출된 가중치 결과값을 통계적 수치로 도출하여 텍스트의 상대적 중요성을 계량화하는 방식이다. 이때 Python의 sklearn에서 제공하는 CountVectorize와 TfidfVectorize 클래스를 사용하였다.
2) N-gram 분석
빈도 및 TF-IDF 분석 결과 도출된 키워드를 대상으로 동시출현 연관분석인 N-gram 분석을 통해 발생 원인별 대상 시설물 또는 발생위치와 관련된 키워드를 도출하였다,
N-gram 분석방법은 통계학 기반의 언어모델의 한 종류로서, 문장 내 앞서 등장한 단어를 기반으로 이어서 등장할 적절한 단어를 예측하는 모델이다. N개의 연속된 단어 나열을 하나의 묶음인 토큰(token)으로 간주하여, 사용 빈도 정보를 도출한다. 본 연구에서는 발생 원인에 따른 위치 또는 대상 시설물을 분석하기 위해서 2개의 키워드가 동시 출현하는 2-gram을 선택하였다. 발생 원인으로 간주되는 키워드는 “노후”, “누수”, “불량”, “크랙”, “부식”, “탈락”, “파손”, “고장”, “훼손”, “오염”이며, 이와 동시에 출현하는 위치 또는 대상 시설물 키워드를 매칭하였다. Python의 sklearn에서 제공하는 CountVectorize을 사용하여 분석하였다.
3) CONCOR 분석
CONCOR(CONvergence of iteration CORrealtion) 분석은 키워드 간의 상관관계를 기반으로 구조적 등위성을 구분하고, 키워드 간의 유사한 군집을 형성하는 방법이다. 구조적 등위성이란 한 네트워크에서 다른 행위자들과 직접적인 관계는 없지만 동일한 관계 패턴을 가지는 경우를 말한다.
앞서 수행한 분석결과에서 도출된 핵심 키워드 20개 빈도값을 기준으로 키워드의 동시출현관계(keyword co-occurrence matrix)를 파악하였다. 핵심 키워드는 “위생기구”, “난방설비”, “수장” 공종에서 도출된 발생 원인, 발생 위치, 그리고 대상시설물 키워드 중에서 20개를 선택하였다. 다음으로 키워드 간 구조적 배열을 수치로 산출하여 1-mode Network matrix를 구성하고 UCINET 6을 활용하여 CONCOR 분석을 실시하였다. 그 결과를 NetDraw 프로그램으로 네트워크 그래프를 작성하여 시각화하였다.
IV. 분석결과
1. 빈도 및 TF-IDF분석
수집된 키워드는 9,273개로, 정제 후 시설물 수선 및 보수와 관련된 키워드를 중심으로 3가지 주요 공종별 단어 빈도수(TF)를 정리한 표는 <Table 1>과 같다.
Table 1.
Top 30 Major Keywords from Top 3 Types of Frequency of Complaints
중공종 중 민원발생 빈도가 큰 “위생기구”, “난방설비”, “수장”의 민원내용을 대상으로 공종별 키워드의 단순 빈도를 분석하고, 키워드별 상대적 중요성을 평가하는 TF-IDF 분석을 병행하여 실시하였다. 민원 내용에서 주요한 의미를 갖는 핵심 키워드를 추출하여 상위 30개를 <Table 1>에 정리하였다. 도출된 키워드들을 살펴볼 때, 시설물의 보수요청이 발생한 시설물, 위치, 원인들로 구성되어 있음을 알 수 있다.
3가지 공종 모두 수선 행위인 “교체”, “보수”, “수리”가 단순빈도값 및 TF-IDF값이 상위 5위 안에 나타났다. 발생 원인을 살펴보면, 공통적으로 “노후”, “불량”, “누수”가 3가지 공종에 공통적으로 나타났다. 따라서 “노후”는 빈도값 상위에 링크되어 있으나, 모든 공종에서 발생하는 원인이기 때문에 TF-IDF 순위는 떨어진다(위생기구:3(TF)▶6(TF-IDF), 난방설비:17(TF)▶21(TF-IDF), 수장:5(TF)▶12(TF-IDF)). 이에 반해 ”누수“는 빈도값(TF)에 비해 TF-IDF값의 순위가 높게 나타나, 타공종에 비해 주요 공종 3가지에서 주로 나타나는 발생 원인으로 보여진다(위생기구:13(TF)▶7(TF-IDF), 난방설비:6 (TF)▶6(TF-IDF), 수장:12(TF)▶7(TF-IDF)). 위생기구에는 ”크랙“이 주요한 발생 원인으로 나타났다. 그 외에 키워드들은 공종별 특징에 맞게 위생기구에는 수전, 변기, 세면대 등의 시설물과 욕실, 주방 키워드가 도출되어 있고, 난방설비는 보일러, 밸브, 배관 등, 수장에는 도배, 장판, 등의 키워드가 도출되었다.
단순빈도값(TF)과 TF-IDF값을 비교했을 때, 키워드 내 순위변화는 어느 정도 있었으나, 상위 30개의 키워드 선정상의 변화는 거의 없었다.
2. N-gram 분석
앞서 공종별로 도출된 키워드의 빈도분석을 토대로 발생 원인을 ”노후”, “누수”, “불량”, “크랙”, “탈락”, “노후”, “고장”, “부식”, “탈락”, “훼손”, “오염”으로 분류하였다. 위 단어와 나란히 등장하는 키워드 중 위치와 제품으로 구분하여 빈도가 높은 순으로 배치하였다<Table 2>. 보수, 수선, 교체 등과 같은 보수 행위에 대한 키워드는 삭제했으며, 두 개의 키워드의 출현순서는 고려하지 않았다.
먼저 위생기구를 살펴보면, 민원 발생 원인이 “노후”, “불량”, “누수”, “크랙”, “탈락” 순으로 나타났으며, 욕실과 주방, 그리고 발코니에 위치하고 있는 시설물들이 “노후”로 인해 보수 요청이 많은 것을 알 수 있다. 수전에서는 “노후”와 “누수”가, 환풍기는 “노후”와 “불량”이, 변기는 “크랙”, 타일은 “크랙”과 “탈락”이 보수 요청의 주요 원인임을 알 수 있다.
Table 2.
Categorizing the Frequency of Co-occurrence of Collected Keywords
난방설비는 불량, 누수가 주요 발생 원인으로 키워드가 도출되었으며, 안방과 주방을 중심으로 발생한 것을 알 수 있다. 난방설비의 경우, 보일러, 온도조절기 등 제품들로 구성되어 있기 떄문에 ”불량“이라는 키워드가 가장 빈도수가 크게 나타났다. 특히 누수는 발생 위치가 천장이 빈도수가 가장 높은 것으로 보아, 위층 누수로 인해 피해가 크며 배관과 밸브에서 누수가 많이 발생하는 것으로 유추할 수 있다.
마지막으로 수장은 “노후”, “누수”, “불량”이 주요 원인으로 도출되었으며, 그 외에도 “부식”, “탈락”, “훼손”, “오염” 순으로 원인에 대한 키워드가 도출되었다. 주로 실에서 많이 발생하는 것을 알 수 있으며, 난방설비의 경우와 마찬가지로 “누수”로 인한 보수 요청이 큰 비중을 차지하고 있었다. 누수의 발생 위치가 천장, 상층이라는 키워드가 도출되어 윗층의 누수로 아래층의 수장에 대한 보수 요청의 빈도가 크다는 것을 알 수 있다. 도배와 장판의 경우에는 타공종과 다르게 벽지의 “오염”, “훼손”이 원인으로 도출되었으나, 빈도는 다른 원인보다 크지 않았다.
4. CONCOR 분석
앞서 해석 결과로 주요 공종별 발생 원인, 발생 위치, 대상 시설물에 관한 핵심 키워드를 공종별로 20개를 도출하였다. 키워드간 연결 관계를 분석하기 위해 먼저 노드를 구성하는 단어들의 연결 관계를 분석하는 의미연결망(Semantic Network)을 도출하였다<Figure 4>. 다음으로 키워드 집합 내에서 연관성이 높은 단어들을 유사한 주제끼리 군집화하는 CONCOR 분석을 수행하여, 댄드로그램(dendrogram)을 통해 구조적 등위성의 존재여부를 판단하였다<Figure 5>. 누락되는 키워드 없이 모든 키워드가 군집에 속하면서 최대한의 의미 있는 주제를 도출하게 되는 집단 깊이(depth)를 2로 선택하여 <Figure 6>과 같이 4개의 군집으로 시각화하였다.
군집화 분석 결과를 바탕으로 군집 내 키워드의 연결 정도 및 중심성을 고려하여 군집별 주제를 분류하고 해석하였다. 네트워크에서 빈도수가 많을수록 노드(Node)의 크기는 커진다,
먼저 위생기구를 살펴보면, 욕실(군집1), 욕실 또는 주방에 설치된 시설물(군집2), 보수 발생 원인(군집3), 변기(군집4)로 분류되었다. 군집 1에 속하는 욕실은 가장 빈도수가 높은 위치에 대한 키워드이며, 모든 군집과 연결성이 높은 것을 알 수 있다. 강한 중심성을 띠는 군집 2는 수전, 환풍기, 배관, 싱크대, 샤워부스, 세면대, 욕조 시설물, 그리고 위치 키워드인 발코니, 주방, 원인 키워드인 누수로 구성되어 있다. 욕실, 주방에 설치된 시설물들로 구성된 군집 2는 누수가 주로 발생하는 것을 알 수 있으며, 군집1, 군집3과 강한 연결성을 가지고 있다.
군집 3은 위생기구의 민원 발생 원인으로 도출되었던 키워드인 불량, 부식, 탈락과 주로 이 원인으로 민원이 발생하는 거울과 타일이 함께 군집을 이루고 있는 것을 알 수 있다. 군집 4는 크랙이 변기를 대상으로 많이 발생하여 별도의 군집으로 구성된 것으로 보인다.
난방설비의 경우, 누수 위치(군집1), 보일러와 부속품(군집2), 욕실 시설물(군집3), 온도조절기(군집4)로 구분되어 있다. 군집 1은 난방설비와 누수가 빈도수가 높은 상위 키워드이며, 거실, 주방, 작은방, 천장, 바닥 등 보수를 요청한 위치에 대한 키워드로 구성되어 있다. 난방설비의 경우 누수로 인한 보수요청이 많으며, 이는 난방배관이 설치된 방을 중심으로 발생하고 있으며, 위층의 누수로 인한 피해가 있음을 유추할 수 있다. 군집 2는 빈도수가 높은 키워드인 보일러와 밸브, 난방분배기, 노후 키워드가 포함되어 있으므로, 보일러와 부속품들은 노후로 인해 보수요청이 발생함을 알 수 있다. 군집 3은 욕실, 점등, 감지기, 센서가, 군집 4는 온도조절기와 고장 키워드로 구성되어 있다. 온도조절기의 경우 빈도는 크지 않지만 고장이 주로 발생한다는 것을 알 수 있다.
다음으로 수장의 경우는 장판(군집1), 벽지(군집2), 누수(군집3), 기타 발생 원인(군집4)로 분류되었다. 장판, 작은방, 발코니가 상위 키워드로 도출된 군집 1은 작은방과 발코니 중심으로 불량으로 인한 장판 보수가 주로 발생하는 것을 유추해 볼 수 있다. 군집 2는 천장, 안방, 주방이 상위 키워드로 도출되었고, 방 중심으로 벽지와 석고보드 등의 보수가 주로 이루어지는 것을 알 수 있다. 군집 1과 군집 2는 강한 연결성을 띠고 있어, 도배와 장판은 상관관계가 높다는 것을 알 수 있다. 누수와 상층으로 구성된 군집 3을 보면, 상층으로부터 누수가 주로 발생한다는 것을 알 수 있다. 또한 군집 2와 높은 연결성을 가지는 것을 보아 도배 공종에 영향을 미치고 있음을 유추할 수 있다. 군집 4는 보수 원인인 훼손, 오염으로 구성되어 있으나, 빈도수는 매우 낮다.
Table 3.
Keywords by Cluster of CONCOR Analysis
종합적으로 볼 때, 위생기구 공종은 당연한 사실이지만, 주로 욕실에서 보수 요청이 있으며, 수전을 비롯한 욕실에 설치된 시설물에서 누수와 관련되어 민원이 발생하는 것을 알 수 있다. 난방설비의 경우, 방에 설치되어 있는 난방배관의 누수로 인해 보수요청이 있으며, 이는 윗층의 누수가 아래층에 피해를 주는 사례도 포함되어 있음을 알 수 있었다. 또한 보일러의 노후로 인한 민원도 비중이 크게 나타났다. 마지막으로 수장의 경우에는 도배와 장판에 대한 민원은 함께 발생하고 있으며, 거주세대 변경으로 인한 수장 교체뿐 아니라 윗층 누수로 인한 보수 요청도 빈도가 높게 나타나고 있음을 확인할 수 있었다.
V. 결 론
본 연구는 공공임대주택 단위세대의 시설물 보수 요청에 관한 민원을 텍스트 마이닝 기법을 통해 시설물의 보수가 필요한 원인을 분석함으로써, 공동주택 단위세대 시설물의 유지관리에 필요한 요소를 도출하고자 수행하였다. 서울주택도시공사에 최근 5년간 접수된 시설물 보수 요청 민원을 대상으로 3가지 주요 공종인 위생기구, 난방설비, 수장에 대해 Python을 이용하여 자연어를 처리한 후, 빈도와 TF-IDF 분석, N-gram과 네트워크 분석, CONCOR 분석을 진행하였다.
공동주택 단위세대 시설물의 보수를 요청하는 주요 원인은 일반적으로 노후라고 생각할 수 있으나, 민원 내용을 분석한 결과를 살펴보면 불량과 누수도 주요한 원인임을 알 수 있다. 민원 발생 빈도가 가장 높은 위생기구의 경우, 수전이 가장 보수 요청이 많은 시설물이었으며, 연관분석 결과에서도 수전의 보수 원인으로 노후, 불량, 누수가 복합적으로 나타났다. 따라서 해당 수전의 교체 시점을 파악한 후 수전의 교체 주기인 15년을 조정하거나3) 내구성을 고려한 제품으로 교체가 필요한 것으로 보인다.
난방설비의 경우 누수와 불량으로 인한 보수 요청이 많았으며, 난방 배관이 설치된 특히 위층의 누수로 인한 피해가 다수 있음을 알 수 있다. 난방 배관은 사람이 거주하고 있는 세대 내부를 수선 주기에 맞춰 교체하는 것이 현실상 어렵기 때문에 실제 잘 이루어지지 않고 있다. 이로 인해 배관의 노후화로 누수가 발생하여 난방설비뿐 아니라 수장까지 시설물의 보수가 많이 발생하고 있음을 알 수 있다. 특히 누수는 발생한 세대뿐 아니라 인접한 아래층 세대까지 영향을 미치기 때문에 사전 방지가 중요하며, 누수가 발생하더라도 초기에 빠른 발견이 필수적이다. 2015년 이전에 준공된 공동주택은 동파이프를 난방배관으로 사용했기 때문에 노후화로 인한 부식 진행이 빠르다. 또한 싱크대 아래에 설치된 난방분배기 밸브에서 특히 누수가 많이 발생하고 있어.4) 준공 후 10년이 경과한 시점부터 중점적으로 관리가 필요한 대상으로 판단된다.
일반적으로 수장은 거주 세대가 퇴거하고 새로운 세대가 입주하거나 훼손, 오염 등 노후화되었을 때 보수 요청이 발생한다고 생각하였으나, 누수에 의해 보수 요청이 발생하는 빈도가 높게 나타났다. 특히 윗층 누수로 인한 아래층 수장 요청이 발생하고 있어 난방설비로 인한 2차 민원이 발생하지 않도록 관리가 필수적이다.
본 연구는 공공임대주택의 단위세대 시설물의 보수 요청에 대한 민원 사례를 분석하여 공동주택 단위세대의 유지관리 중점요소를 도출하는데 목적이 있다. 그러나 본 연구는 민원을 신청한 사람이 작성한 민원 내용을 대상으로 분석하였기 때문에 시설물의 보수가 필요한 원인과 위치 파악에 한계가 있었다. 또한 시설물의 보수는 복합적으로 발생하기 때문에 관리자가 분류한 공종과 민원 내용이 상이한 것도 다수 발견되었다. 따라서 정보 도출에 한계가 있는 데이터를 기반으로 분석이 이루어졌기 때문에 인사이트 도출에 어려움이 있었다. 시설물 보수 요청에 대한 민원 접수시 시설물의 유지관리에 필요한 정보를 등록하여 관리한다면, 공동주택 시설물의 체계적인 유지관리의 데이터로 활용할 수 있을 것으로 판단된다.
본 연구에서는 민원이 많이 발생한 3가지 주요 공종에 대해서 보수 원인과 대상을 살펴보았지만, 그 외 공종들도 추후 분석울 진행하여 보수 원인을 파악할 필요가 있다. 더 나아가 수선 또는 교체주기에 따라 유지관리한 시설물의 이력도 고려하여 분석할 필요가 있어 추후 연구로 진행하고자 한다.








