반응형

웹 검색 엔진 만들기 46

4. 2 PostedUrl (수집한 사이트)클래스 구현

4. 2 PostedUrl (수집한 사이트)클래스 구현 수집한 웹 페이지 정보를 표현할 PostedUrl 클래스를 추가하세요. 웹 로봇에 의해 수집한 웹 페이지는 DBM ForAll을 통해 수집한 정보를 DBMS에 저장 요청을 합니다. 이 때 사용할 형식이 PostedUrl입니다. StorePostedUrl 시퀀스 다이어그램을 보면 PostedUrl 형식에는 수집한 페이지 주소와 요청한 페이지 주소, 페이지의 내용, Seed 사이트에서의 상대적 깊이, 수집한 DateTime과 페이지 제목이 필요하다는 것을 알 수 있습니다. 이와 같은 멤버를 갖는 PostedUrl 클래스를 작성합시다. 클래스의 노출 수준을 public으로 지정하고 Serializable 특성을 지정합니다.[Serializable]publ..

4. 1 Candidate(수집 후보 사이트) 클래스 구현

4. 1 Candidate(수집 후보 사이트) 클래스 구현 Candidate 클래스를 추가하세요. Candidate 클래스는 수집할 대상 사이트를 표현할 클래스입니다. 먼저 클래스의 노출 수준을 public으로 설정합니다. 라이브러리에 정의한 형식을 다른 곳에서 사용하려면 노출 수준을 public으로 설정해야 합니다. 그리고 서비스에서 직렬화하여 사용할 수도 있으니 Serializable 특성을 지정합시다. [Serializable] public class Candidate{} Candidate 클래스에는 멤버 속성으로 사이트 주소와 Seed 사이트 주소에서의 상대적 깊이를 설정하고 가져오기 가능한 멤버가 필요합니다. 노출 수준을 public으로 지정하여 멤버 속성 Url과 Depth를 추가합니다. 가져..

3.4.2 WSEManager 응용 프로토 타이핑

3.4.2 WSEManager 응용 프로토 타이핑 WSEManager는 관리자가 EH WSE를 구성하고 있는 각 엔진들의 상태를 제어하거나 엔진들에 의해 만들어지는 결과물을 모니터링 할 수 있는 윈도우즈 응용 프로그램입니다. WSEManager에서는 관리자가 Seed 사이트를 추가할 수 있어야 합니다. 그리고 웹 사이트 수집 주기를 설정하고 웹 사이트 수집을 가동하거나 멈출 수 있어야 합니다. 또한 현재까지 수집한 웹 페이지에서 발견한 형태소 목록을 확인할 수 있고 각 형태소를 선택하면 이를 포함하는 웹 페이지 목록을 확인할 수 있게 합시다. 그리고 정상적으로 검색 서비스를 할 수 있는지 확인할 수 있게 합시다. 먼저 WSEManager는 EH 응용처럼 검색할 수 있어야 합니다. 이 부분은 EH 응용 프..

3. 4 프로토 타이핑

3. 4 프로토 타이핑 프로젝트를 수행하다보면 이해 관계자의 요구 사항을 잘못 파악하거나 요구 사항이 바뀔 수 있습니다. 개발 초기에 이를 발견하였다면 큰 비용이 들지 않겠지만 개발 후기에 이를 발견하여 수정하려면 많은 비용이 들 수 있습니다. 이와 같은 부담을 줄이기 위해 이해 관계자의 요구 사항을 제대로 파악했는지 개발 초기에 확인해야 합니다. 그리고 이해 관계자의 요구 사항 중에 바뀔 확률이 높은 부분을 초기 단계에 확인하여 반영하여 전체 개발 비용을 줄일 수 있습니다. 이를 위해 사용자와 상호 작용에 관한 부분을 만들어 확인하는 작업을 프로토 타이핑이라고 합니다. 프로토 타이핑에서는 실제 엔진은 구현하지 않지만 사용자와 상호 작용하는 GUI 부분을 작성하여 이해 관계자의 요구 분석을 제대로 수행했..

2. 요구 분석 및 정의

2. 요구 분석 및 정의 요구 분석 및 정의 단계에서는 시스템에서 제공해야 할 비지니스와 이해관계자의 요구 사항을 정확히 이해하는 작업이 필요합니다. 이를 위해 이해관계자의 요구 사항을 수집하고 이해해야 합니다. 그리고 수집한 요구사항을 바탕으로 시스템에서 제공해야 할 기능을 개괄적으로 파악하고 결정해야 합니다. 이 책에서는 어떠한 이해관계자가 있는지에 관한 조사와 이를 통해 요구 사항을 수집하는 부분은 간단히 요구 리스트를 보여주는 것으로 끝낼 것입니다. 대신 요구 리스트를 바탕으로 시스템에서 제공해야 할 기능을 파악하고 결정하기 위해서 Usecase 다이어그램을 작성하고 요구 사항과 Usecase 매핑 테이블을 작성하기로 할게요. 2.1 요구 리스트 번호 액터 이름 설명 1 End User 검색 서비..

0. 들어가기에 앞서

0. 들어가기에 앞서 2000년 무렵에 케이블 인터넷과 ADSL기술을 도입하면서 초고속 인터넷을 보급하던 때만 하더라도 웹 사이트에 글을 포스팅하는 것은 업체나 기관에서 할 일이라 생각했지요. 그런데 지금은 SNS의 등장을 비롯하여 많은 곳에서 All IP 시대로 가기 위한 준비를 하면서 웹 사이트를 방문하는 지식 소비자와 웹 사이트를 구축하고 지식 포워딩하는 지식 공급자가 뚜렷하게 나눌 수 없는 프로슈머 형태를 지니고 있습니다. 시멘틱 검색 엔진이라는 것이 세상에 모습을 드러낼 때만 해도 포털 사이트에서만 사용할 기술처럼 생각했습니다. 그리고 새로 포스팅하는 자료의 양이 지금에 비해 적어 높은 수준의 기술을 요구하지 않았었죠. 하지만 지금은 일반 사용자들도 자신의 블로그나 SNS에 일상과 자신의 취미 ..

반응형