메인
Google 검색 엔진 작동 방식

Google 검색 엔진 작동 방식

검색 엔진을 사용하여 정보를 구성하고 월드 와이드 웹에서 정보를 찾을 수 있습니다. 검색 엔진은 웹을 통해 검색하려는 고유 정보를 설명하는 단어 나 구로 구성된 검색어를 제출하는 데 도움이되는 컴퓨터 프로그램입니다. 그런 다음 검색 엔진은 쿼리를 일치 시키려고 시도한 데이터베이스를 찾습니다. 쿼리와 일치하는 프레젠테이션이 포함 된 URL 목록을 대조하고 반환합니다. 이 목록은 맨 위에 나타나는 더 나은 성냥에 따라 정렬되거나 순위가 매겨집니다. 일반 검색 엔진은 다양한 주제의 정보가 들어있는 데이터베이스에서 정보를 검색합니다..

검색 작동 원리

검색 엔진은 수집기, 웹을 가로 지르고 웹 문서에 대한 정보를 수집하는 프로그램을 사용하여 정보를 얻습니다. 많은 사람들이 검색 엔진을 사용하기 쉽지 않을 수 있습니다. 검색 엔진을 단순화 할 수있는 URL 목록이 줄어들 기 때문입니다. 이 검색 범위를 좁히기 위해 웹 크롤러라는 기술을 사용합니다. 웹 크롤러 (웹 스파이더 또는 웹 로봇이라고도 함)는 체계적이고 자동화 된 방법으로 월드 와이드 웹을 탐색하는 프로그램 또는 자동화 된 스크립트입니다. 웹 크롤러의 덜 자주 사용되는 이름은 개미, 자동 인덱서, 봇 및 웜입니다..

이 과정을 웹 크롤링 또는 스파이더 링이라고합니다. 많은 사이트, 특히 검색 엔진은 최신 정보를 제공하는 수단으로 스파이더 링을 사용합니다. 웹 크롤러는 주로 다운로드 한 페이지의 색인을 생성하여 빠른 검색을 제공하는 검색 엔진에서 나중에 처리 할 수 있도록 모든 방문 페이지의 복사본을 만드는 데 사용됩니다. 크롤러는 링크 검사 또는 HTML 코드 확인과 같은 웹 사이트의 유지 관리 작업을 자동화하는 데 사용할 수도 있습니다. 또한 크롤러를 사용하여 전자 메일 주소 (주로 스팸)를 수집하는 등 웹 페이지에서 특정 유형의 정보를 얻을 수 있습니다. 최근 서버 측 스크립팅 언어에서 생성되는 페이지 수가 증가함에 따라 어려움이 발생합니다 HTTP GET 매개 변수의 끝없는 조합이 존재하기 때문에 작은 선택 만이 실제로 고유 한 결과를 반환합니다.

요약하면, 웹 페이지의 순위는 많은 요인에 달려 있습니다. 웹 사이트의 가장 일치하는 키워드, 가장 자주 방문한 인기 사이트. 전송 된 검색어는 웹 페이지의 메타 태그에 저장된 키워드를 검색하여 처리됩니다. 가능한 일치하는 것이 무엇이든, 그것은 대조되고 다시 사용자에게 반환됩니다. Google 검색 엔진 작동 방법 더 작은 엔진 인 InfoSeek부터 시작해 보겠습니다. 그들은 귀하의 웹 페이지에 대해 약 200 단어 정도만 색인을 생성하기 때문에 귀하의 사이트에 메타 태그가 있는지 확인하고 가장 중요한 것들이 먼저 나열되어 있는지 확인하는 것이 중요합니다. 메타 태그에 입력 한 정보는 사이트 설명을 표시하는 데 사용되며 대부분의 메타 태그에는 약 200 자의 텍스트가 포함될 수 있습니다. 그러나 키워드 메타 태그는 최대 1,000 자까지 입력 할 수 있습니다..

이러한 간단한 규칙은 모든 검색 엔진에서 유의해야합니다. 정보가 더 중요할수록 메타 태그의 시작 부분이나 사이트 내용의 시작 부분에 가까워 야합니다. 많은 검색 엔진은 메타 태그를 건드릴 필요가 없으므로 메타 태그에있는 것과 동일한 정보를 몸에 지니는 것이 중요합니다 (목록 및 키워드 목록을 분명히 입력 할 수는 없지만 귀하의 사이트 콘텐츠).

AltaVista 검색 엔진은 귀하의 전체 사이트를 확인하기 위해 거미 인 Scooter를 보냅니다. 스쿠터는 거미가 귀하의 사이트를 완전히 색인화하는 데 3 개월이 걸릴 수 있습니까? 평균 거미는 6-8 주만 걸립니다. 스쿠터는 일반적으로 매주 귀하의 사이트에서 2 ~ 10 페이지 사이에 어딘가에 거미가됩니다. 즉, 웹 사이트의 지속 시간이 길수록 검색 엔진이 다윈의 이데올로기 이론을 구현하는 방법의 예와 같이 색인을 생성하는 것이 좋습니다..

Excite는 검색 강국 이었지만 이전에는 AOL 및 Netscape 검색 제공 업체로 지정되지 않았으므로 과거보다 덜 중요합니다. 키워드 관련성을 결정하기 위해 사용하는 알고리즘은 매우 복잡합니다. 즉, 페이지를 인덱싱 한 다음 가장 관련성이 높은 문장 만 선택하여 요약하려고 시도합니다. 2 주에 한 번 정도 페이지를 검토 할 것으로 기대하십시오. 그러나 메타 태그를 사용하면 단어와 관련성이있는 경우 설명 태그를 사용하더라도 순위에 대해서는 의미가 없습니다. 함유량.

라이코스로 넘어 갑시다. Lycos는 Open Directory Project (ODP)를 주류 결과 페이지에 완전히 통합했으며, AllTheWeb의 검색 결과도 사용합니다. Lycos는 자매 사이트 인 HotBot에도 클릭 연결을 실행합니다. 라이코스 (Lycos)는 제출 페이지가 한 가지를 말하고 완전히 다른 방식으로 사이트의 색인을 생성하기 때문에 이해하기 어려운 검색 엔진 중 하나입니다. 일반적으로, ODP 및 AllTheWeb에서 색인을 생성하는 한 귀하의 사이트는 Lycos에서 색인이 생성됩니다..

WebCrawler는 Excite에서 소유하고 있지만 여전히 자체 검색 엔진과 인덱서를 가지고 있습니다. WebCrawler를 사용하여 목록에 올리면 나열된 가장 쉬운 검색 엔진이 아니므로 WebCrawler에 등록되어 있어야합니다. 히트 앤 미스 표준과 산발적 인 색인 생성 방법을 함께 사용하면 제출 프로세스가 힘들지는 않지만 불가능하지는 않습니다.

가장 큰 선수는 물론 색인 순위의 핵심으로 페이지 순위 시스템을 사용하는 Google입니다. 한때 순위를 높이기 위해이 페이지 순위 시스템을 조작하는 것은 거의 불가능했지만 사람들은 나머지 인터넷 사이트에서 생성 할 수있는 링크가 많을수록 더 우수한 Google 순위를 얻게되었습니다. Google은 상황에 맞는 순위를 사용하는 것으로 생각하지 않습니다. Yahoo, Looksmart 및 ODP에서는 상황에 맞는 정보가 사용되지만 Google은 자체 데이터베이스를 다시 색인 할 때 해당 사이트를 정기적으로 거미로 사용합니다.

MSN은 또 다른 중요한 검색 엔진입니다. 현재 검색 엔진의 거룩한 삼위 일체는 Google, Yahoo !, MSN입니다. 이 세 가지 검색 엔진은 결합하여 검색 엔진에서 얻을 수있는 트래픽의 대부분을 제공합니다. MSN은 일반적으로 사이트 색인을 생성하는 첫 번째 검색 엔진이 될 것이고 거의 대부분의 페이지를 가장 빠른 속도로 나열 할 것입니다.

검색 엔진에서 색인을 생성 할시기를 정확히 말할 수있는 사람은 없지만 적어도 매주 확인하는 것이 가장 좋습니다. 어떤 일을 하든지 2 개월마다 사이트를 다시 제출하지 마십시오. 이렇게하면 색인이 생성되지 않을 수도 있습니다..