반응형

프로그래밍 기술/웹 검색 엔진 만들기 66

1. 5 라이브러리

1.5 라이브러리 1. 5 라이브러리 .NET 프레임워크 기반의 라이브러리는 .NET 어셈블리라고 부릅니다. .NET 어셈블리는 .NET 프레임워크 응용 프로그램을 구성하는 기본 컴포넌트입니다. 컴포넌트 기반의 프로그래밍은 모듈의 재사용성을 높여줍니다. .NET 응용 프로그램을 제작할 때 미리 작성된 라이브러리를 사용할 수 있는데 이 때 사용하는 라이브러리도 .NET 어셈블리이며 실행 파일도 .NET 어셈블리입니다. .NET 어셈블리는 EXE 파일 혹은 DLL 파일 형태로 만들 수 있으며 하나 이상의 모듈을 포함할 수도 있습니다. .NET 어셈블리는 자기 기술적인 메타 데이터를 갖고 있고 레지스트리 항목에 종속되지 않는 구성 요소로 디자인되어 있기 때문에 병행(Side by Side) 실행이 가능합니다...

1.3 시나리오 / 1.4 요구 기술

1.3 시나리오 / 1.4 요구 기술 1.3 요구 기술 먼저 이 책에서 작성할 맞춤형 검색 엔진 만들기 솔루션의 전반적인 시나리오를 소개할게요. 시나리오는 가상으로 만들었으며 별도의 설명은 하지 않겠습니다. EH-WSE (EH Web Search Engine) 언제나 휴일 컴퓨터 I. 개요I.1 배경지식I.2 프로젝트 소개 II. 동작 환경 및 요구 기술II.1 동작 환경II.2 요구기술III. 개발 공정 I. 개요 I.1 배경지식 웹 검색 엔진이란 원하는 웹 사이트를 검색하기 위한 S/W를 말합니다. 웹 검색 엔진은 대부분 인터넷 상에 게시되어 있는 웹 페이지들을 수집하는 웹 로봇과 웹 페이지를 분석하는 분석기, 분석한 결과로 쉽게 검색할 수 있게 역 파일을 만드는 색인기 및 질의 결과에 랭킹을 부여하..

1. 2 개요

1. 2 개요 이 책은 웹 검색 엔진을 구성하는 다양한 엔진과 모듈을 제작하는 방법을 다루고 있습니다. 따라서 하나의 프로젝트가 아닌 여러 개의 프로젝트로 나누어 작업을 진행해야 합니다. 그리고 이 책에서는 단순히 웹 검색 엔진을 구현하는 것만을 다루는 것이 아니라 개발 전체 공정에 관해서도 다루고 있습니다. 웹 검색 엔진을 만드는 전체 공정은 시나리오에서 출발하여 요구 분석 및 정의 단계, 아키텍쳐링 단계, 설계 단계, 구현 단계로 나누어 진행할 것입니다. 이를 위해 구현에 필요한 개발 도구만 사용하는 것이 아니라 CASE 도구를 사용하여 다양한 다이어그램을 작성도 해야 합니다. CASE 도구로는 Rational 사의 Rose, 볼랜드 사의 Together, 오픈 프로젝트인 Star UML 등이 있습니..

1. 1 검색 엔진

1. 1 검색 엔진 여러분도 잘 아시는 것처럼 검색 엔진은 사용자가 원하는 정보를 검색해 주는 도구나 서비스를 말합니다. 특히 웹 검색 엔진은 웹 상에 게시되어 있는 수 많은 웹 페이지의 내용에서 원하는 정보를 검색해 주는 엔진입니다. 이러한 검색 엔진은 방대한 자료에서 빠르고 정확하게 원하는 정보를 검색하는 것이 중요합니다. 만약 자료의 양이 많지 않다면 굳이 고사양의 검색 엔진은 필요하지 않을 것입니다. 따라서 검색 엔진은 방대한 자료를 수집하는 작업이 필요합니다. 그리고 수집한 자료를 분석하는 작업, 분석한 결과를 검색하기 쉽게 가공하는 작업, 검색 작업과 검색한 결과를 선별 및 순위를 정하는 등의 작업이 필요합니다. 웹 검색 엔진의 구성을 살펴보면 게시한 웹 페이지를 수집하는 웹 로봇과 수집한 웹..

1. 검색 엔진 소개 및 개요

1. 검색 엔진 소개 및 개요 최근 인터넷의 발달로 다양한 정보를 웹을 통해 얻습니다. 특히 개인 블로그 및 커뮤니티 사이트, 소셜 사이트의 증가로 정보 공급자와 정보 사용자의 경계가 사라져가고 있습니다. 이처럼 다양한 형태의 방대한 자료가 웹 상에 만들어지고 있어 효과적인 검색을 위한 검색 엔진들을 연구하고 만들어지고 있습니다. 특히 검색 엔진은 기존의 포털 사이트에서 제공하는 서비스였지만 소셜 사이트 및 다양한 정보 서비스를 위해 필요한 곳이 많아집니다. 이 책에서는 기존 웹 검색 엔진을 만드는 전체 공정을 순서대로 하나 하나 설명하고 궁극적으로 서비스 목적에 맞는 검색 엔진을 만들 수 있게 할 것입니다. [그림 1.1] 정보의 바다

0. 들어가기에 앞서

0. 들어가기에 앞서 2000년 무렵에 케이블 인터넷과 ADSL기술을 도입하면서 초고속 인터넷을 보급하던 때만 하더라도 웹 사이트에 글을 포스팅하는 것은 업체나 기관에서 할 일이라 생각했지요. 그런데 지금은 SNS의 등장을 비롯하여 많은 곳에서 All IP 시대로 가기 위한 준비를 하면서 웹 사이트를 방문하는 지식 소비자와 웹 사이트를 구축하고 지식 포워딩하는 지식 공급자가 뚜렷하게 나눌 수 없는 프로슈머 형태를 지니고 있습니다. 시멘틱 검색 엔진이라는 것이 세상에 모습을 드러낼 때만 해도 포털 사이트에서만 사용할 기술처럼 생각했습니다. 그리고 새로 포스팅하는 자료의 양이 지금에 비해 적어 높은 수준의 기술을 요구하지 않았었죠. 하지만 지금은 일반 사용자들도 자신의 블로그나 SNS에 일상과 자신의 취미 ..

반응형