검색어 입력폼

[데이터마이닝] 데이터마이닝:파워포인트

등록일 2003.12.17 파워포인트파일MS 파워포인트 (ppt) | 22페이지 | 가격 1,000원

목차

서 론
조사목적
변수설명
조사방법
본 론
추정방법선택
step 1 DATA PARTITION
step 2 FILTER OUTLIER
step 3 VARIABLE SELECTION
step 4 REGRESSION
step 5 추정된모형의 평가
결 론

본문내용

이상치
이상치(Outliers)란 관찰치들 중 어떤 변수의 값이 특별히 크거나 작은 자료를 말한다.
이상치 판단기준
평균으로부터 양쪽으로 6σ를 벗어나는 데이터를 이상치로 판단하였다. 6σ는 약 0.999997 임으로 이 정도면 거의 대부분의 자료를 포함한다고 볼 수 있겠다. CRIM의 6σ의 범위는 -48.94 ∼ 55.864 이다. 여기에서 3개의 관측치가 이 범위를 벗어나므로 이 관측치들을 이상치로 판단하였다. 실제로 분포의 모양을 보아도 이 3개의 데이터는 한쪽으로 떨어져 있으며 대부분의 CRIME 변수의 값은 0에서 5사이에서 80%정도 차지하고 있는 것을 볼 수 있다.
이상치 대체
이상치제거 후에 최대값인 41.5292로 대체

참고 자료

데이터마이닝-방법론 및 활용- 강현철외4인
다운로드 맨위로