Kaip bet voras pradėti savo keliones visame internete? Įprastinė pradinė taškai sąrašai aktyviai naudojamas serverių ir labai populiarus puslapiai. Voras prasidės populiarus svetainę, indeksavimo žodžius apie savo puslapius ir po kiekvieno nuorodą rastos svetainėje. Šiuo būdu spidering sistema greitai pradeda keliauti, išskleidimas visoje plačiausiai naudojamų dalių internete.
"Google" pradėjo kaip akademinės paieškos. Straipsnyje, kuriame aprašoma, kaip sistema buvo pastatyta, Sergejus Brinas Lawrence Page duoti, kaip greitai jų vorai gali dirbti pavyzdį. Jie pastatė savo pradinę sistemą naudoti kelis vorai, dažniausiai trijų vienu metu. Kiekvienas voras gali išlaikyti apie 300 jungtis į interneto puslapius atvirų metu. Į savo piko efektyvumą, naudojant keturis vorus, jų sistema gali nuskaityti daugiau nei 100 puslapių per sekundę, generuoti apie 600 kilobaitų duomenų per sekundę.
Laikydami viskas veikia greitai reiškė kurti sistemą maitinti reikalingą informaciją vorai. Ankstyvoji "Google" sistema turėjo serverį skirta teikti URL vorai. Užuot priklausomai nuo interneto paslaugų teikėjo domeno vardų serverio (DNS), kuri paverčia serverio vardą į adresą "Google" turėjo savo DNS, siekiant išlaikyti vėlavimus iki minimumo.
Kai "Google voras pažvelgė į HTML puslapį, ji susipažino su dviem dalykais:
Žodžiai atsiranda žodžiai pavadinimą, subtitrai, meta žymeles ir kiti pozicijos santykinę svarbą buvo pastebėti ypatingo svarstymo metu vėlesnio Vartotojų paieška. Google voras buvo pastatytas indeksuoti kiekvieną reikšmingą žodį puslapyje, paliekant straipsnius " a, " " " ir ". " Kitos vorai imtis skirtingų požiūrių.
Šie skirtingi požiūriai paprastai bando padaryti voras veikti greičiau, leidžia vartotojams ieškoti efektyviau, arba abu. Pavyzdžiui, kai vorai bus sekti ž