검색어 입력폼

[데이터마이닝] 데이터마이닝(Boston Housing Data)

등록일 2003.12.17 한글파일한글 (hwp) | 57페이지 | 가격 1,000원

소개글

기말레포트로 A+받은겁니다.
데이터 및 분석과정이 상세하게 나와있습니다.
데이터와 변수설명 포함되어있음

목차

Ⅰ. 서론

Ⅱ. 본론
- Diagram
- Insight 노드
- 산점도
- Data Partition
⊙ 방법1
STEP1. Filter Outliers
STEP2. Variable Selection
STEP3. Regression
STEP4. 첫 번째 방법에 의해 세워진 모형 평가
⊙ 방법2
STEP1. Replacement
STEP2. Variable Selection
STEP3. Regression
STEP4. 두 번째 방법에 의해 세워진 모형 평가
⊙ 방법3
STEP1. Transform Variables
STEP2. Variable Selection
STEP3. Regression
STEP4. 세 번째 방법에 의해 세워진 모형 평가

Ⅲ. 결론
데이터, 변수설명포함

본문내용

Ⅱ. 본론

서론에서 각 변수들의 성격을 대략적으로 살펴보았다. 또한 14개의 변수 중에서 목표변수(target)를 MEDV로 정하였다. 이는 주어진 Boston Housing Data에서의 목적이 보스턴 외곽지역의 집 값과 다른 변수와의 관계를 알아보고자 하는 것이므로, 각각의 변수들이 집 값을 결정짓는데 얼마만큼의 영향을 미치는지를 알아보아야 할 것이다. 이 과정에서 우리는 실제 집 값을 결정하는데 많은 영향을 미치는 변수를 알 수 있을 테고, 또한 집 값에 전혀 영향을 미치지 않는 변수도 알 수 있을 것이다.
이러한 각 변수들이 집 값의 영향을 미치는 정도를 알아보기 위해 Regression(선형회귀분석)을 이용하였다. 이 분석방법에는 세 가지 방법을 사용하였으며, 각각의 분석방법 중에서 결정계수가 높은 것, 혹은 추정된 회귀식에서 모든 변수 중 입력변수의 수(입력변수의 수가 작을수록 회귀식은 간단해 질 것이다) 등을 고려하여 최종적인 모형을 결정하게 될 것이다.
우선 세 가지 방법을 수행하는데 있어 기본적인 분포의 모양을 알아보고 Data Partition을 실시하였다. 세부적인 것은 아래에서 자세히 다루도록 하겠다.

참고 자료

데이터마이닝-방법론 및 활용- 최용석외 4인
다운로드 맨위로