텍스트 마이닝 기법과 ARIMA 모델을 이용한 배달의 민족 앱 리뷰 분석

추상적인

모바일 애플리케이션 시장의 급속한 성장과 함께 다운로드 및 리뷰도 빠르게 성장하고 있습니다.

개발자는 사용자 리뷰 분석을 통해 서비스의 문제점을 찾고 사용자 만족도를 향상시키기를 희망하지만 매일 생성되는 수많은 리뷰를 감당하기는 어렵습니다.

본 연구에서는 수많은 리뷰 중 중요한 서비스 이슈를 탐지하기 위해 텍스트 마이닝 기법과 시계열 이상 탐지 모델인 ARIMA(Autoregressive Integrated Moving Average)를 이용하여 빠르게 성장하고 있는 배달 애플리케이션 “배달의 민족”의 리뷰를 분석하였다.

이를 위해 “배달의 사람들” 어플리케이션에 대한 71,435건의 리뷰를 크롤링하여 수집한 후 토픽 모델링 기법을 적용하여 5개의 토픽을 도출하였다.

또한 시계열 기반 이상치 탐지를 위해 ARIMA 모델을 이용하여 댓글 수가 급증한 이상치 날짜 12개를 탐지하고, 주제별 감성 분석 결과를 바탕으로 문제 요인을 분석하였다.

소개하다

모바일 애플리케이션에 대한 사용자 리뷰는 애플리케이션의 즉각적인 사용자 경험의 재구성에 대한 사용자의 직접적인 피드백으로, 서비스 품질 향상 및 누락된 기능 보완을 위한 유용한 정보를 제공합니다.

사용자 리뷰에서 감지된 불편함은 개발자가 앱을 유지 관리하고 앱 업데이트 일정을 계획하는 데 유용한 기반을 제공합니다.

개발자가 적시에 식별하고 조치를 취할 수 있도록 사용자 리뷰에서 필요한 정보를 얻는 프로세스는 서비스 운영에 매우 중요합니다.

사용자 리뷰를 통해 질문에 답변하는 것도 중요하지만 사용자 리뷰는 빠르고 정확하게 답변하기 어렵습니다.

  • 양이 매우 많습니다.

    Facebook은 Google Play 스토어에서 하루에 10,000개 이상의 리뷰를 받습니다.

    매일 엄청난 수로 발생하는 모든 리뷰를 추적하려면 많은 시간이 걸립니다.

  • 많은 리뷰에는 반복적인 단어와 한국어가 아닌 단어와 같은 노이즈 단어가 많이 포함되어 있습니다.

  • 대부분의 앱에 대한 사용자 리뷰는 주제별로 분류되지 않으므로 중재자는 각 주제에 대한 리뷰를 분석해야 합니다.

이러한 한계를 극복하기 위한 다양한 연구가 진행되고 있지만, 토픽 모델링을 통해 앱 만족도와 불만족 요인을 도출하고, 앱 리뷰에서 주제별로 가장 유익한 리뷰를 선정함으로써 많은 문제별 리뷰가 생성된다.

상황은 사소합니다.

그러므로, 본 연구에서는 모든 리뷰의 주제를 토픽 모델링으로 분류한 후, 급증하는 리뷰 날짜의 리뷰를 별도로 추출하여 분류된 주제와 감성 분석 결과를 바탕으로 인사이트를 추출하고자 한다.

연구의 의의

– 기존 사용자 리뷰 데이터를 이용한 대부분의 연구가 주제 분류에 치중하고 있으나, 본 연구는 리뷰를 통해 서비스 이슈를 빠르게 발견하기 위해 주제를 분류하기 위해 시계열 이상값을 탐지하는 ARIMA 모델을 추가하였으며, 해당 연구라는 점에서 학술적 의의가 있다.

– 모바일 애플리케이션 시장의 급속한 성장과 관련 애플리케이션 서비스 리뷰의 증가로 리뷰를 생성하는 주제를 과거 데이터를 기반으로 자동 분류하여 이상 리뷰 감지를 통한 콘텐츠 식별 시간 및 애플리케이션 서비스 운영 비용을 절약할 수 있습니다.

절약에 기여한다는 점에서 실질적인 의미가 있습니다.