검색어 입력폼
평가점수A

[인터넷, 검색엔진] 검색엔진 순위계산법과 검색결과 나열원리

저작시기 2005.07 |등록일 2005.07.05 한글파일한컴오피스 (hwp) | 10페이지 | 가격 2,000원

소개글

인터넷의 이해 시간에 조사한 리포트인데...
우수 리포트로 뽑힌 자료입니다...
학점도 물론 A뿔 받았구요...

목차

1. 들어가기
2. 검색엔진의 발전 과정
3. 검색엔진의 구성 요소
4. 페이지랭크의 정의와 계산방법(구글의 검색엔진 순위 계산법)
5. 네이버에서의 검색 결과 나열 원리
6. 야후에서의 검색결과 나열 원리
7. 검색엔진 상위랭킹 사이트의 비결
8. 맺음말

본문내용

4. 페이지랭크의 정의와 계산방법(구글의 검색엔진 순위 계산법)

먼저 페이지 랭크에 대해 간략히 설명하자면, 구글이 자사의 검색엔진에서 웹페이지의 배열 순위를 측정하기 위해 사용하는 방식으로, A라고 하는 웹페이지가 B라고 하는 웹페이지에 링크가 되어 있으면 그 링크를 일종의 투표로 간주하여 점수를 매기고 이 점수에 따라 검색결과의 순위를 책정하는 방식입니다. 그러나 단순히 투표수에만 의지하지 않고 투표하는 페이지 자체도 구글이 평가를 하고 있습니다.

1) 페이지 랭크(PageRank)의 정의

어떤 웹 페이지를 u라고 하고 u 페이지가 가리키는 페이지들의 집합을 Fu, u 페이지를 가리키는 페이지의 집합을 Bu라 하자. Nu = |Fu|라 하고, 이것은 u 페이지로부터 나가는 링크의 갯수, 즉 Fu의 갯수다. 그리고 노멀라이제이션에 사용되는 팩터를 c라고 하자.(노멀라이제이션은 전체 웹 페이지의 랭크 총합을 일정하게 하기 위해서다.) 일단, 단순 랭킹 R을 정의하는 것에서 출발해 보자. 단순 랭킹 R은 페이지랭크(PageRank)를 약간 단순화시킨 버전이다.
위 식은 전 섹션에서 얘기한 직관을 공식화한 것이다. 어떤 페이지가 가리키는 페이지들의 랭크에 균일하게 기여하기 위해, 링크가 나가는 페이지의 랭크를 그 페이지의 포워드 링크 갯수로 나누고 있다는 점에 주의하자. 그리고 c는 1보다 작아야 하는데, c < 1인 이유는 포워드 링크가 없는 페이지도 많이 있기 때문에 그런 페이지들의 가중치는 시스템 속에서 사라질 수 있기 때문이다.(섹션 2.7을 참조하라.) 위 등식은 재귀적(recursive)인 식이지만 초기 랭크 집합을 주고 수렴할 때까지 연산을 함으로써 계산할 수 있다.
그림 2 단순화된 페이지랭크의 계산
그림 3 정상상태를 이루고 있는 페이지들
다운로드 맨위로