검색어 입력폼

HTML parser

저작시기 2006.01 |등록일 2006.12.20 파일확장자압축파일 (zip) | 가격 1,000원

소개글

"a href", "img src"에서 사용되는 URL 목록을 추출하는 프로그램 작성
추출된 목록을 output file에 출력한다.
분석해야 할 html page의 이름과 output file의 이름을 run time parameter로 받을 수 있도록 한다.

컴파일 실행환경

VC++ compiler / Visual Studio 6.0

본문내용

#include "htmlParser.h"

void FileReader(FILE *input, FILE *output)
{
char line[MAXSTRING];
char *tracer, *temp;

while (!feof(input)) {
fgets(line, MAXSTRING, input);
for (tracer = line; *tracer; tracer++)
{
if (*tracer == `<`)
{
if (MakeSmallLetter(*(tracer+1)) == `a` ) {
if (*(tracer+2) == ` ` || *(tracer+2) == `\n`) {
tracer += 2;
temp = GetLinkAddress(tracer, input);
if (temp != NULL) {
WriteInFile(temp, output);
}
}
else
{
tracer += 2;
}
}

압축파일내 파일목록

HTMLparser.dsp
HTMLparser.dsw
htmlParser.h
HTMLparser.ncb
HTMLparser.opt
HTMLparser.plg
input1.htm
input1.txt
input2.txt
input3.txt
input4.txt
input5.txt
input6.txt
main.c
output1.txt
output2.txt
output3.txt
output4.txt
output5.txt
output6.txt
output7.txt
parser.c
Debug/HTMLparser.exe
Debug/HTMLparser.ilk
Debug/HTMLparser.pch
Debug/HTMLparser.pdb
Debug/main.obj
Debug/parser.obj
Debug/vc60.idb
Debug/vc60.pdb
다운로드 맨위로