Sunny's Study/Studying Research

Page Ranking Based on Number of Visits of Links of Web Page

AhnSunnyYoung 2022. 12. 20. 01:17

Abstract

검색 엔진은 일반적으로 사용자 쿼리에 대한 응답으로 많은 페이지를 반환합니다. 사용자가 결과 목록을 탐색할 수 있도록 검색 결과에 순위 지정 방법이 적용됩니다. 문헌에서 제안된 순위 알고리듬의 대부분은 사용자 사용 동향을 고려하지 않은 링크 또는 콘텐츠 지향입니다. 본 논문에서는 검색 엔진을 위해 링크 방문 기반 페이지 순위(VOL)라는 페이지 순위 메커니즘이 고안되고 있으며, 이는 구글의 기본 순위 알고리듬에서 작동합니다. PageRank는 웹 페이지의 인바운드 링크 방문 횟수를 고려합니다. 이 개념은 검색 공간을 대규모로 줄이는 사용자 검색 동작을 기준으로 결과 목록의 맨 위에 가장 중요한 페이지를 표시하는 데 매우 유용합니다. 이 논문은 또한 웹 페이지의 링크 방문 횟수를 찾는 방법과 PageRank 알고리듬과 VOL 간의 비교를 제시합니다

 

Introduction

검색 엔진은 일반적으로 사월드 와이드 웹은 수십억 개의 웹 페이지와 페이지 내에서 이용할 수 있는 엄청난 양의 정보로 구성되어 있습니다. 월드 와이드 웹에서 필요한 정보를 검색하기 위해 검색 엔진은 각 아키텍처를 기반으로 작업 수를 수행합니다. 이러한 프로세스는 복잡하고 시간이 많이 소요될 수 있습니다. 모든 검색 엔진 프로세스는 정보의 크롤링, 인덱싱, 검색 및 정렬/순위 지정에서 시작됩니다. 크롤러는 웹 사이트의 모든 웹 페이지를 방문하여 다운로드하고 웹 사이트에서 필요한 정보를 검색합니다. 크롤러가 제공한 정보는 검색 엔진이 액세스하기 위해 어떤 순서로 저장되어야 합니다. 정보는 검색하는 데 필요한 시간을 줄이기 위해 색인화됩니다. 

웹 검색 엔진은 사용자가 정보를 쿼리할 수 있도록 허용하는 데 필요한 사용자 인터페이스를 나타냅니다. 사용자가 검색 엔진에 쿼리를 보낼 때 사용자와 정보 저장소 간의 연결이며, 주어진 쿼리와 관련된 웹 페이지가 엄청나게 많습니다. 그러나 실제로 사용자에게 필요한 웹 페이지 수는 매우 적습니다. 여전히 이 숫자는 매우 큽니다(백만 단위). 검색 엔진은 표시할 결과를 정렬하기 위해 순위 알고리즘을 사용합니다. 그래야 사용자가 가장 중요하고 유용한 결과를 먼저 얻을 수 있습니다. 다양한 순위 알고리즘이 개발되어 있으며, PageRank, HITS, SALSA, RANDOMZE HITS, SUBSPACE HITS, SIMRANK 등이 있습니다. 본 논문에서는 PageRank와 PageRank의 개선안에만 초점을 맞출 것입니다.자 쿼리에 대한 응답으로 많은 페이지를 반환합니다. 사용자가 결과 목록을 탐색할 수 있도록 검색 결과에 순위 지정 방법이 적용됩니다. 문헌에서 제안된 순위 알고리듬의 대부분은 사용자 사용 동향을 고려하지 않은 링크 또는 콘텐츠 지향입니다. 본 논문에서는 검색 엔진을 위해 링크 방문 기반 페이지 순위(VOL)라는 페이지 순위 메커니즘이 고안되고 있으며, 이는 구글의 기본 순위 알고리듬에서 작동합니다. PageRank는 웹 페이지의 인바운드 링크 방문 횟수를 고려합니다. 이 개념은 검색 공간을 대규모로 줄이는 사용자 검색 동작을 기준으로 결과 목록의 맨 위에 가장 중요한 페이지를 표시하는 데 매우 유용합니다. 이 논문은 또한 웹 페이지의 링크 방문 횟수를 찾는 방법과 PageRank 알고리듬과 VOL 간의 비교를 제시합니다