Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 부스팅기법
- 군집화기법
- Adaboost
- MultipleLinearRegression
- AdaBoostClassifier
- 실제데이터활용
- 선형모형
- 사후 가지치기
- 선형회귀
- post pruning
- boosting
- gradientdescent
- 부스팅
- 체인지업후기
- cost complexity pruning
- 캘리포니아주택가격예측
- pre pruning
- LinearRegression
- AdaBoostRegressor
- 의사결정나무
- 회귀분석
- 사전 가지치기
- 아다부스트
- 경사하강법
- LeastSquare
- KNearestNeighbors
- 중선형회귀
- 최소제곱법
- C4.5
- 정보이득
Archives
- Today
- Total
목록실제데이터활용 (1)
데이터 분석을 향한 발자취 남기기

이전에 공부한 경사하강법을 이용해 선형회귀를 구현해보고자 한다. 그에 앞서, 사용한 데이터를 정리하고자 한다. 그후, 경사하강법을 통해 예측값들을 생성하고 이를 사이킷런의 선형회귀 모듈과 비교하고자 한다. 0. 캘리포니아 주택 가격 데이터1. 경사하강법 적용2. 예측결과 비교 0. 캘리포니아 주택 가격 데이터 모델 적용에 앞서, 데이터를 분석하고자 한다. 데이터는 사이킷런으로부터 쉽게 접근할 수 있으며, 모든 변수들이 연속형 변수로 구성되어있다. 데이터 분석의 목적은 캘리포니아 지역의 주택 가격을 예측하는 모델을 생성하는 것이다. 데이터는 아래와 같이 구성되어있으며 총 20,640개이다. - 상관관계상관관계 분석을 통해, 주택의 가격(MedHouseVal)은 소득(MedInc)과 강한 양의 상관관계를 ..
손으로 직접 해보는 모델정리/단일 모델
2023. 3. 8. 21:54