Žinios Discovery
/ Knowledge Discovery >> Žinios Discovery >> Technika >> kompiuteris >> Internetas >> interneto pagrindai >>

Kaip interneto paieškos sistemose Work

, ji turi būti nustatyta. Norėdami rasti informaciją apie milijonų tinklalapių, kad egzistuoja šimtai, paieškos sistema dirba specialius programinės įrangos robotus, vadinamus vorai, siekiant sukurti sąrašus žodžiais rasti interneto svetainėse. Kai voras stato savo sąrašus, procesas vadinamas Web nuskaitymo. (Yra keletas trūkumų raginama dalyvauti interneto World Wide Web - didelis rinkinys voragyvis orientuotas pavadinimų įrankiai yra vienas iš jų). Siekiant sukurti ir išlaikyti naudingą sąrašą žodžių, Search Engine vorai turi pažvelgti į daug puslapių.

Kaip bet voras pradėti savo keliones visame internete? Įprastinė pradinė taškai sąrašai aktyviai naudojamas serverių ir labai populiarus puslapiai. Voras prasidės populiarus svetainę, indeksavimo žodžius apie savo puslapius ir po kiekvieno nuorodą rastos svetainėje. Šiuo būdu spidering sistema greitai pradeda keliauti, išskleidimas visoje plačiausiai naudojamų dalių internete.

"Google" pradėjo kaip akademinės paieškos. Straipsnyje, kuriame aprašoma, kaip sistema buvo pastatyta, Sergejus Brinas Lawrence Page duoti, kaip greitai jų vorai gali dirbti pavyzdį. Jie pastatė savo pradinę sistemą naudoti kelis vorai, dažniausiai trijų vienu metu. Kiekvienas voras gali išlaikyti apie 300 jungtis į interneto puslapius atvirų metu. Į savo piko efektyvumą, naudojant keturis vorus, jų sistema gali nuskaityti daugiau nei 100 puslapių per sekundę, generuoti apie 600 kilobaitų duomenų per sekundę.

Laikydami viskas veikia greitai reiškė kurti sistemą maitinti reikalingą informaciją vorai. Ankstyvoji "Google" sistema turėjo serverį skirta teikti URL vorai. Užuot priklausomai nuo interneto paslaugų teikėjo domeno vardų serverio (DNS), kuri paverčia serverio vardą į adresą "Google" turėjo savo DNS, siekiant išlaikyti vėlavimus iki minimumo.

Kai "Google voras pažvelgė į HTML puslapį, ji susipažino su dviem dalykais:

  • Per puslapyje
  • kur buvo rasta žodžiai

    Žodžiai atsiranda žodžiai pavadinimą, subtitrai, meta žymeles ir kiti pozicijos santykinę svarbą buvo pastebėti ypatingo svarstymo metu vėlesnio Vartotojų paieška. Google voras buvo pastatytas indeksuoti kiekvieną reikšmingą žodį puslapyje, paliekant straipsnius " a, " " " ir ". " Kitos vorai imtis skirtingų požiūrių.

    Šie skirtingi požiūriai paprastai bando padaryti voras veikti greičiau, leidžia vartotojams ieškoti efektyviau, arba abu. Pavyzdžiui, kai vorai bus sekti ž

    Page [1] [2] [3] [4] [5] [6]