Componenti

Google conta oltre 1 trilione di URL Web unici

Week 6

Week 6
Anonim

In a scoperta che probabilmente avrebbe mandato il personaggio del Dr. Evil dei film "Austin Powers" in arresto cardiaco, Google ha recentemente rilevato oltre un trilione di URL unici sul Web.

Questo traguardo ha intimidito gli ingegneri di ricerca di Google, che stanno vedendo il Web in crescita di diversi miliardi di pagine individuali ogni giorno, i funzionari della compagnia hanno scritto in un post sul blog Venerdì.

Oltre a annunciare questo risultato, Google ha colto l'opportunità per promuovere la portata e l'ampiezza del suo indice.

"Noi non indicizziamo ognuna di quelle migliaia di miliardi di pagine - molte di esse sono simili l'una all'altra, o rappresentano contenuti generati automaticamente … che non è molto utile per gli utenti di ricerca, ma siamo orgogliosi di avere l'indice più completo di qualsiasi motore di ricerca, e il nostro obiettivo è sempre stato quello di indicizzare tutti i dati del mondo ", ha scritto Jesse A lpert e Nissan Hajaj, ingegneri del software nel team di Google sulla rete di ricerca sul Web.

Era da un po 'che Google aveva rilasciato dichiarazioni pubbliche sulla dimensione del suo indice, un argomento che generava regolarmente polemiche e controprova tra i principali player dei motori di ricerca. fa.

Quei giorni di invidia delle dimensioni dell'indice si sono conclusi quando è diventato chiaro che la maggior parte delle persone scansiona raramente più di due pagine di risultati Web. In altre parole, ciò che conta è fornire 10 o 20 collegamenti Web veramente rilevanti, o, ancora meglio, una risposta fattuale diretta, perché poche persone otterranno 5.000 risultati per trovare le informazioni desiderate.

Sarà interessante vedere se questo annuncio di Google, pubblicato sul suo blog ufficiale principale, scatenerà una serie di reazioni da parte di concorrenti come Yahoo, Microsoft e Ask.com.

Nel frattempo, Google ha anche rivelato informazioni interessanti su come e con quale frequenza analizza questi

"Oggi Google scarica continuamente il Web, raccoglie informazioni aggiornate sulle pagine e rielaborazione dell'intero grafico del collegamento Web più volte al giorno. Questo grafico di un trilione di URL è simile a una mappa composta da un trilione di intersezioni Più volte al giorno, facciamo l'equivalente computazionale di esplorare a fondo ogni incrocio di ogni strada negli Stati Uniti, a parte una mappa di circa 50.000 volte più grande degli Stati Uniti, con 50.000 volte più strade e intersezioni. ctions ", hanno scritto i funzionari.