래피드마이너 데이터 초간편 분석 8편모델 적용(Apply Model)~!!이번 시간에는 7편에서 만든의사결정나무 모델을 테스트 데이터에 적용시켜 보도록 하겠습니다.지난 시간에 'Anny'라는 샘플 데이터를트리의 맨 위 분기부터 타고 내려오며 어느 label로 분류되는지 알아보았습니다.그러나 모든 고객을 이렇게 직접 수행하는 것은 매우 비효율적입니다!!래피드 마이너에서 제공하는'Apply Model' 오퍼레이터는해당 작업을 자동으로 수행해줍니다.'Apply Model'에 대해 알아봅시다~!!먼저, 지난 시간에 만들었던 '02-build decision tree' 프로세스를카피한 뒤 프로세스 폴더에 붙여 넣어 줍니다.그리고 'Insert copy of entry'를 선택하고 Ok 버튼을 눌러줍니다.프로세스가 만들어졌으니 rename을 클릭해프로세스의 이름을 '03-apply the model'으로 변경하고 해당 프로세스를 불러옵니다.모델 적용을 하기 위해서는 우리가 예측하고자 하는 데이터즉, label 값이 없는 데이터를 원래 데이터에서 분리시켜 주어야 합니다.데이터에 두 개의 'Filter Examples' 오퍼레이터를걸어 해당 작업을 수행해보겠습니다.'Filter Examples' 오퍼레이터를 프로세스 패널로 드래그 앤 드롭합니다.데이터에 두 개의 오퍼레이터를 연결해야 하지만래피드마이너에서는 하나의 출력포트는 다른 하나의 포트에만 연결할 수 있게 되어있습니다.'Filter Examples (2)' 오퍼레이터와 연결하게 되면위의 'Filter Examples' 오퍼레이터와는 연결이 자동으로 끊기게 됩니다.이러한 상황에서는??'Multiply' 오퍼레이터를 사용하면 됩니다.'Multiply' 오퍼레이터는하나의 출력포트에 두 개 이상의 포트를 연결시켜 줍니다.오퍼레이터 패널에서 'multiply'를 검색해서 가져와도 되지만다른 매우 간편한 방법이 있습니다.데이터의 출력포트를 다시 위에 있는 'Filter Examples'와 연결시켜 줍니다.포트를 연결하게 되면 다음과 같이 파란색 작은 아이콘이 나타납니다.해당 아이콘을 클릭하게 되면 자동으로 'Multiply' 오퍼레이터가 적용됩니다.연결선이 복잡하게 연결 되어있으므로 연결선을 다시 연결시켜줍니다.'Filter Examples (2)' 의 파라미터 패널에서 Add Filters를 클릭하고'Churn' 값이 missing 인 값만 가져오도록 설정해줍니다.결과포트에 연결시켜주고 프로세스를 실행합니다.실행결과, 96개의 데이터가 있으며'Churn' 칼럼의 값이 모두 missing으로 잘 분리된 것을 확인할 수 있습니다.이제 모델을 적용시켜 볼까요?'Apply Model' 오퍼레이터를 파라미터 패널로 드래그 앤 드롭합니다.'Decision Tree'의 mod 포트를 'Apply Model'의 mod 포트로 연결해주고'Filter Examples (2)의 exa 포트를 'Apply Model'의 unl 포트로 연결시켜 줍니다.여기서 unl은 라벨이 없는 데이터(unlabeled)를 의미합니다.프로세스의 첫 번째 결과 포트는 mod와 연결되어 있기 때문에 의사결정나무 모델을 출력해주고두 번째 결과 포트는 lab와 연결 되었기 때문에 테스트 셋의 예측된 label을 제공해줍니다.실행결과, 3가지의 새로운 special attribute가 생긴 것을 볼 수 있습니다.missing 이었던 label 값들이 모두 예측된 것을 볼 수 있습니다.1번 고객은 79.8%의 신뢰도로 이탈할 고객('Churn')으로 예측하였고7번 고객은 97.8%의 신뢰도로 충성스러운 고객('Loyal')으로 예측한 것을 확인할 수 있습니다.이제까지 모델 적용에 대해 알아보았습니다~!!다음시간에는 모델의 성능을 평가하는 방법에 대해 알아보겠습니다!래피드마이너에 대해 더 궁금하시면?!!문의주세요~!!