"Google" inžinieriai naudojamas penkerių metų istoriniu didelis duomenų - ir mes tai didelis. Jie paliesti į jų duomenų bazę iš dažniausiai naudojamų nefiltruotas paieškose 50 mln sukurti visuotinės gripo paplitimo tyrimą. Pradinė algoritmas prognozės priemonė išimtinai rėmėsi regioninių gripu susijusių Paieškos užklausa duomenis (regioninis remiantis IP adresą), įskaitant pamatinių temomis, pavyzdžiui, bendrųjų gripo simptomus, peršalimo ir antivirusinių vaistų.
algoritmas palygina nekilnojamojo Game Paieškos užklausa duomenys - žodis ar frazė, kurį naudojote kaip paieškos terminas, pavyzdžiui, " gerklės " - Lyginant su pradiniu, siekiant nustatyti lygius regioninio gripo paplitimo, pradedant tarp penkių klasifikacijų nuo minimal iki intensyvus. Teoriškai, GFT galėtų teikti einamosios dienos ataskaitas (beveik realiu laiku) gripo paplitimo ir prognozuoti gripo protrūkių savaites iki CDC rengia ataskaitą.
Pasak GFT išradėjų, nors GFT realaus laiko ataskaitas yra skirtas turi būti naudojamas kaip papildomos informacijos prie klinikinės ir virusologinių duomenų tradicinės priežiūros (CDC ir jos tinklų). GFT sparčiai aptikimo skirtas padėti ankstyvam ne tik gripo epidemijos, tačiau taip pat virusinės deformacijų nustatymo ir dėl pandemijos potencialą
GFT. Modelis atnaujinimų, tikslumas ir Big Duomenų gaudyklė
Prieš kiekvieną Naujųjų metų gripo sezoną, "Google" gripo tendencijose modelis atnaujinamas su 45 naudingiausių užklausų gripo susijusių nuo metų iki (šiuos specialius paieškos terminai yra pasirinktas naudojant logistinę regresiją, tačiau tikslios užklausų ir kaip jie skaičiuojami nuo kitų yra laikomi TOP SECRET).
Be to, GFT postas sezono vertinimai vertinami pagal tradicinius naudojamų CDC pamatyti, kaip gerai du rungtynes duomenų stebėjimo ataskaitas. Remiantis prognozavimo įrankio gebėjimas tiksliai įvertinti, kai tų metų gripo sezonas prasideda, kai sezonas bus didžiausia, ir kaip sunkus bus, modelis gali būti atnaujintas. Kai jis pirmą kartą pradėjo 2008 metais, GFT turėjo vidutinę koreliaciją 97 proc su CDC duomenis [Šaltinis: Ginsbergas].
2009 m, už JAV versijos Google "gripo tendencijose modelis gavo savo pirmąjį atnaujinimą įtraukti Paieškos užklausa duomenys H1N1 protrūkį. Tai buvo, nes GFT modelis buvo visiškai neįvertino H1N1 k