의사결정트리
-
Python - sklearn, jupyter로 Decision Tree 학습하기Programming & Machine Learning/Python X 머신러닝 2017. 7. 31. 21:17
02DecisionTree_practice In [2]: R을 공부하며 Decision Tree를 정리했었는데, 파이썬에서 비슷한 내용을 정리해보고자 한다. 소스코드는 scikit-learn의 공식 튜토리얼 문서자료와 [Python Machine Learning]을 참고하였다. In [3]: 파이썬에서 sklearn 모듈을 사용해서 의사결정 트리를 학습하는 과정은 R에 비하면 약간 덜 직관적이고, 조금 더 객체지향스러운 프로그래밍의 느낌이다. DecisionTreeClassifier라는 일종의 모델 helper를 사용하여 학습이 진행된다. X,Y 데이터셋을 fit이라는 함수에 입력하는 간단한 절차를 거치면, 놀랍게도(?) 학습이 완료된다. In [4]: from sklearn import tree X =..
-
R을 이용한 머신러닝 - 5 (의사결정 트리)Programming & Machine Learning/R X 머신러닝 2017. 7. 14. 01:24
R을 이용한 의사결정 트리 1.1 개념의사결정 트리는 분류 문제이기도 하고, 예측 문제이기도 한데, 주로 사용되는 분야는 지도 분류 학습이다. 분기의 기준이 범주형이냐, 연속형이냐에 따라 결과가 분류나 회귀 모두가 가능하다. terminal node의 값이 범주형이라면 분류, 연속형이라면 예측이라는 것이다. 어찌되었든 의사결정 트리의 메인 아이디어는 데이터를 스무고개처럼 분석하여 최종적 판단에 이르는 패턴을 찾아내는 것이다. 다음의 그림은 의사결정트리를 나타내는 대표적인 예시인 타이타닉호 생존 결정 트리이다. 결정트리에서 중요한 내용으로는 다음과 같은 크게 3가지가 있다. 1. 노드 분기 방법 2. 모델 학습 과정 3. 가지치기 1.2 노드 분기 방법의사결정트리는 한 분기때마다 변수 영역을 두개로 구분하..