Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 경사하강법
- 사후 가지치기
- gradientdescent
- 중선형회귀
- 캘리포니아주택가격예측
- 부스팅
- LinearRegression
- C4.5
- 회귀분석
- Adaboost
- 선형모형
- 의사결정나무
- 부스팅기법
- MultipleLinearRegression
- 실제데이터활용
- AdaBoostRegressor
- AdaBoostClassifier
- LeastSquare
- 사전 가지치기
- 최소제곱법
- 체인지업후기
- cost complexity pruning
- pre pruning
- boosting
- post pruning
- 선형회귀
- KNearestNeighbors
- 아다부스트
- 군집화기법
- 정보이득
Archives
- Today
- Total
목록사후 가지치기 (1)
데이터 분석을 향한 발자취 남기기

지난 시간에 의사결정 나무를 어떻게 생성하는지에 대해서 알아보았다. 의사결정 나무의 가장 큰 특징은 쉽게 과적합된다는 점이다. 이를 해결하기 위해 나무가 더이상 성장되지 않도록 막는 가지치기 방법을 사용한다. 0. Decision Tree의 과적합 위험성1. 가지치기 (pruning)2. Cost complexity pruning3. Minimal cost complexity pruning0. Decision Tree의 과적합 위험성과적합이란 모델이 훈련 데이터를 지나치게 학습해 훈련 데이터에 대해서는 매우 좋은 성능을 보이지만, 이에 반해 테스트 데이터에 대한 예측 성능이 떨어지는 경우라 볼 수 있다. 이를 확인해보기 위해 캘리포니아 지역의 주택 가격을 예측하는 의사결정 나무를 생성해보고자 한다. 데..
손으로 직접 해보는 모델정리/단일 모델
2023. 6. 12. 21:49