Data Labs

통계 및 품질 개선을 위한 팁과 기법입니다.

데이터랩스 블로그

더욱 다양한 통계 소식, 기법은 데이터랩스 커뮤니티 블로그를 확인하세요.

Blog Post

새로운 방식의 도입: 범주형 설문 조사 데이터 분석의 대안으로서의 CART 사용
  • 2020-05-22 10:32:35


Minitab 블로그에 게시된 글입니다.

 

새로운 방식의 도입: 범주형 설문 조사 데이터 분석의 대안으로서의 CART 사용

 

고객이나 환자의 행동을 이해하는 것은 때로 매우 어려운 일이 될 수 있습니다. 연구원들은 종종 Minitab Statistical Software의 회귀 분석 기능을 사용하여 설문 조사의 데이터를 이용하고 분석합니다. 하지만 결과 변수가 정량적이 아닌 범주형일 경우 로지스틱 회귀의 결과를 해석하는 일은 그리 쉽거나 간단하지 않을 수 있습니다.

 

CART란 무엇인가

 

CART는 예측 변수 또는 입력 설정에 따라 대상이나 결과 변수를 분할하는 예/아니요 규칙 집합을 생성하여 구동하는 의사 결정 트리 알고리즘입니다. 결과 모델은 입력 설정을 기반으로 대상이나 결과 변수가 분할되는 방식을 나타내는 의사 결정 트리로 표시됩니다. Minitab의 CART 알고리즘은 모형의 예측 기능을 극대화하기 위해 분할 또는 최종 그룹화라고도 하는 최적의 개수의 최종 노드를 자동으로 찾아냅니다. 이 알고리즘이 제공하는 최고의 장점은 무엇일까요? 분석이 완료된 후 제공되는 CART의 결과는 데이터 과학자가 아니더라도 직관적인 시각적 해석을 통해 데이터에서 가치있는 심층 정보를 발견할 수 있다는 점입니다.

 


(Minitab은 기본적으로 상세 CART 트리를 표시합니다. 위의 요약 보기를 확인하려면 Minitab에서 마우스 오른쪽 버튼으로 트리를 클릭하고 노드 분할 보기를 선택하시기 바랍니다.)

 

CART를 이용한 (Walk-in Clinic) 데이터 활용

 

이제 CART가 무엇인지 알아보았으므로 CART의 구동 방식을 살펴보겠습니다. 한 Walk-in Clinic 체인에서는 환자들을 대상으로 향후 해당 클리닉을 다시 방문할 의사가 있는지에 대한 설문 조사 데이터(매우 그렇다, 다소 그렇다, 그렇지 않다)를 수집했습니다. 직원은 환자의 나이, 집에서 클리닉까지의 거리 및 취업 여부를 기록했습니다. 이 클리닉의 관리자는 환자들이 클리닉 서비스를 다시 이용할 가능성에 영향을 미치는 요소를 알아내는 데 특별히 목적을 두었습니다.

 

데이터의 하위 집합은 클리닉 근방에 있는 환자가 제공한 응답을 나타내는 막대형 차트와 함께 오른쪽에 표시됩니다.

 

CART는 범주 결과의 가능성을 예측하는 데 사용될 수 있는데 여기에서는 환자가 해당 클리닉을 다시 방문할 가능성을 보여줍니다. Minitab CART 엔진은 분류를 위해 이항 결과(두 그룹) 또는 다항 결과(3개 이상의 그룹)를 처리할 수 있는 직관적인 인터페이스를 제공합니다. 관리자가 Minitab에 데이터를 입력한 후 통계 > 예측 분석 > CART® 분류를 선택하면 다음과 같은 정보가 표시됩니다.

 

 

그룹이 3개 이상이므로 다항 반응을 선택한 다음 ‘재방문 가능성’을 응답으로 선택하거나 예측하려는 대상을 선택합니다. 계량형 예측 변수 및 범주형 예측 변수을 간단히 입력하거나 예측에 사용할 입력 사항을 상자 안에 입력합니다.

 

일반적으로 0.70 이상의 ROC 값은 대부분의 애플리케이션에 유용한 것으로 간주되므로 관리자는 환자가 향후 클리닉에 재방문할 가능성을 정확하게 예측할 수 있는 모형을 찾게된 것에 만족했습니다.

 

 

최종결과

 

위의 상대 변수 중요도 그래프를 빠르게 평가한 결과, 환자의 나이가 클리닉을 재방문할 가능성에 대한 최고의 예측 변수이며, 그 다음이 거리이고 마지막으로 고용 상태임으로 확인할 수 있습니다.

 

 

Minitab Statistical Software의 트리 기반 기계 학습 알고리즘에는 광범위한 애플리케이션을 제공하며 조직의 비즈니스 문제에 대한 해결책을 찾는 데 도움이 될 수 있습니다.

아직 이 제품을 구입하지 않으셨다면 오늘 Minitab 30일 무료 평가판을 시작해 보세요! 

 

Minitab 블로그에 게시된 글입니다.

 

 


Minitab, LLC 소개

Minitab은 종합적인 업계 최고의 데이터 분석 및 프로세스 개선 솔루션을 제공하여 여러 기업과 기관들이 추세를 파악하고, 문제를 해결하며, 데이터를 통해 귀중한 통찰력을 얻을 수 있도록 도와드립니다. Minitab은 고유한 통합적 소프트웨어 및 솔루션 제공을 통해 더 나은 의사결정을 내리고 우수한 비즈니스 성과를 도출하도록 지원합니다. 사용 편의성이 탁월한 Minitab의 소프트웨어를 통해 데이터에서 간편하게 심층적인 통찰력을 얻을 수 있습니다. 고도로 숙련된 데이터 분석 전문가들로 구성된 Minitab 팀은 전 과정에 걸쳐 사용자들이 분석을 100% 활용할 수 있도록 상담을 제공하고, 더 빠르고 정확하며 현명한 결정을 내릴 수 있도록 도와드립니다.

Minitab은 50여 년간 고객의 비용 절감, 품질 개선, 만족도와 효율성 향상을 지원해왔습니다. 현재 전 세계 수천 개의 기업 및 기관들이 Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler®와 Quality Trainer®를 통해 프로세스의 결함을 수정하고 있습니다.