검색어 입력폼

Language in Information Representation and Retrieval

등록일 2004.07.21 한글파일한컴오피스 (hwp) | 5페이지 | 가격 1,000원

목차

1 Natural Language (자연어)
2 Controlled Vocabulary (통제어휘)
3 자연어 VS 통제어
4 Digital Age에서 IRR언어

본문내용

1 Natural Language (자연어)
1) 정의
① 자연어란 사람이 말하고 쓰는 언어이다.
② IRR에서 자연어를 사용할 때는 용어들 간 연관관계, 구문론, 의미론이나 용어를 정의하 는데 노력을 기울일 필요가 없음.
③ 사람이 정보를 표현하거나 질의를 만들 때 통제어휘의 도움을 받지 않음
2) IRR에서 자연어가 쓰이는 세 가지 방법
① 문헌의 제목, 주제문 또는 다른 중요한 요소들에서 용어를 추출(ex. KWIC)
② 문헌의 다른 부분(any part of the document)에서 용어를 추출(ex. 용어추출색인)
③ 이용자가 질의를 표현하기 위해 사용한 질문으로부터 직접 구나 단어를 추출
(->5장 참조)
3) 내용어(significant words)와 기능어(function words)
① 자연어는 기본적으로 내용어와 기능어로 구성됨
② 내용어 : 주요 개념이나 의미를 담고 있는 단어
기능어 : 관사, 전치사, 접속사 등(an, a, the, and, for, of, to, this, that, her, their...)
4) 불용어 리스트 (stop word list = stop list)
① 자동화된 IR 시스템에서는 불용어가 색인되는 것을 막기 위해 불용어 리스트가 구성, 저장되어 있음

참고 자료

없음
다운로드 맨위로