1. 그랩
크롤링은 Googlebot이 새 웹페이지를 발견하고 업데이트하여 Google 색인에 웹페이지를 추가하는 프로세스입니다.
우리는 웹사이트의 많은 페이지를 가져오기(또는 "크롤링")하기 위해 많은 컴퓨터를 사용합니다. 획득 작업을 수행하는 프로그램을 Googlebot(로봇 또는 정보 수집 소프트웨어라고도 함)이라고 합니다. Googlebot은 알고리즘을 사용하여 크롤링합니다. 컴퓨터 프로그램은 크롤링할 웹사이트, 크롤링 빈도, 각 사이트에서 가져올 페이지 수를 결정합니다.
Google의 크롤링 프로세스는 이전 크롤링 프로세스 중에 형성되고 웹마스터가 제공한 Sitemap 데이터를 통해 지속적으로 확장되는 웹페이지 URL 목록을 기반으로 합니다. Googlebot은 각 웹사이트를 방문할 때 각 페이지의 링크를 감지하고 이를 크롤링할 페이지 목록에 추가합니다. 새로운 사이트, 기존 사이트의 변경 사항, 작동하지 않는 링크가 기록되어 Google 색인을 업데이트하는 데 사용됩니다.
Google은 사이트를 더 자주 크롤링하는 데 대한 비용 지불을 허용하지 않습니다. 우리는 검색 사업과 영리 목적의 AdWords 서비스를 구분합니다.
2. 인덱싱
Googlebot은 크롤링하는 각 웹페이지를 처리하여 찾은 모든 단어와 각 페이지에서 해당 단어의 위치를 큰 색인 목록으로 컴파일합니다. 또한 TITLE 태그나 ALT 속성과 같은 주요 콘텐츠 태그 및 속성의 정보를 처리합니다. Googlebot은 다양한 유형의 콘텐츠를 처리할 수 있지만 전부는 아닙니다. 예를 들어 특정 리치 미디어 파일이나 동적 웹페이지의 콘텐츠를 처리할 수 없습니다.
3. 결과 제공
사용자가 검색어를 입력하면 Google 컴퓨터는 색인에서 일치하는 페이지를 검색하고 사용자 검색과 가장 관련성이 있다고 판단되는 결과를 반환합니다. 관련성은 200개 이상의 요소에 의해 결정되며, 그 중 하나는 특정 웹페이지의 PageRank입니다. PageRank는 페이지가 다른 페이지에서 들어오는 링크에 얼마나 중요한지를 측정한 것입니다. 간단히 말해서, 귀하 사이트의 페이지를 가리키는 다른 사이트의 개별 링크가 귀하 사이트의 PageRank를 구성합니다. 모든 링크의 가치가 동일하지는 않습니다. Google은 검색결과에 부정적인 영향을 미칠 수 있는 링크 스팸 및 기타 행위를 지적하여 사용자 환경을 지속적으로 개선하기 위해 최선을 다하고 있습니다. 귀하가 제공하는 콘텐츠의 품질을 기준으로 할당된 링크가 최고의 링크입니다.
귀하의 사이트가 검색결과 페이지에서 높은 순위를 차지하려면 Google이 귀하의 사이트를 올바르게 크롤링하고 색인을 생성하는지 확인하는 것이 중요합니다. 웹마스터 가이드라인에는 일반적인 문제를 방지하고 사이트 순위를 높이는 데 도움이 되는 몇 가지 모범 사례가 요약되어 있습니다.
Google의 관련 검색, 맞춤법 제안 및 Google 제안 기능은 관련 용어, 일반적인 철자 오류 및 일반적인 검색어를 표시하여 사용자가 검색 시간을 절약할 수 있도록 설계되었습니다. google.com 검색결과와 마찬가지로 이러한 기능에 사용되는 키워드는 웹 크롤러 및 검색 알고리즘에 의해 자동으로 생성됩니다. 이러한 제안은 사용자 시간을 절약해 줄 것이라고 생각되는 경우에만 표시됩니다. 특정 키워드에 대해 사이트 순위가 더 높은 것은 해당 콘텐츠가 사용자의 검색어와 더 관련성이 높다고 Google이 알고리즘을 통해 판단했기 때문입니다.