androide

Ricercatore di Google mira ai dati strutturati del Web

Your body language may shape who you are | Amy Cuddy

Your body language may shape who you are | Amy Cuddy
Anonim

I motori di ricerca di Internet hanno incentrato principalmente sulla scansione del testo nelle pagine Web, ma Google ha approfondito la ricerca su come analizzare e organizzare i dati strutturati, ha detto venerdì uno scienziato dell'azienda.

"Ci sono molti dati strutturati sul Web e siamo "Non fare un buon lavoro di presentarlo ai nostri utenti", ha detto Alon Halevy durante una conferenza al New England Database Day al Massachusetts Institute of Technology,

Halevy si riferiva in parte alle cosiddette fonti del "deep web", ad esempio i database che si trovano dietro i siti Web basati su moduli come Cars.com o Realtor.com. Google ha inviato le query a vari moduli per un po 'di tempo, recuperando le pagine Web risultanti e includendole nel suo indice di ricerca se le informazioni sembrano utili.

[Ulteriori letture: I migliori servizi di streaming TV]

Ma anche l'azienda vuole analizzare i dati trovati in tabelle strutturate su molti siti Web, ha detto Halevy, offrendo come esempio una tabella su una pagina Web che elenca i presidenti degli Stati Uniti.

E ci sono risme di quelle tabelle - L'indice di Google è arrivato 14 miliardi di loro, secondo Halevy. "Si è reso conto molto rapidamente che oltre il 98% di questi non è così interessante", ma anche dopo un filtraggio significativo rimangono circa 154 milioni di tabelle che vale l'indicizzazione, ha detto.

Uno degli obiettivi finali di Google è fornire risultati che organizzino "aspetti" "di una query di ricerca, in particolare di tipo esplorativo come" Viaggio in Vietnam ", al contrario di una query per un fatto specifico come" la popolazione del Vietnam ", ha detto Halevy. La precedente query produrrebbe, ad esempio, informazioni su requisiti di visto, pacchetti meteo e tour.

L'idea ha eco del servizio di ricerca offerto da Kosmix, ma Google vuole andare oltre, secondo Halevy. "Kosmix ti darà un 'aspetto', ma è collegato a una fonte di informazioni", ha detto.

La ricerca di "viaggi in Vietnam" su Kosmix offre un insieme organizzato di risultati, tra cui recensioni di ristoranti del New York Times, immagini da Yahoo e Flickr, informazioni commerciali da Shopping.com e risultati Web generali di Google.

"Nel nostro caso, tutti gli aspetti potrebbero essere solo risultati di ricerca Web, ma li organizzeremmo in modo diverso", ha detto Halevy.