Componenti

Benvenuti nel Web 3.0: Ricerche semantiche

Keynote (Google I/O '18)

Keynote (Google I/O '18)
Anonim

L'onnipresente modalità di keyword della tecnica di ricerca su Internet sta per essere sostituita da una nuova generazione di tecnologie di ricerca semantica, secondo gli analisti della società di ricerca Ovum.

Mentre la ricerca di parole chiave rimane il metodo più popolare, di solito non è accurata, con gli utenti a volte si ottengono fino a 30.000 risultati in una ricerca e quindi si deve passare a un elenco di risultati generici relativi alle parole chiave per trovare documenti pertinenti.

"Questo è il punto in cui una nuova generazione di cosiddette tecnologie semantiche entra nel frame. algoritmi di ranking come il PageRank di Google per predire la pertinenza, la ricerca semantica si immerge nel significato del linguaggio per produrre risultati di ricerca altamente pertinenti ", secondo un rapporto pubblicato dagli analisti di Ovum Mike Davis e Madan Sheina.

Notevole semanti c Gli operatori web individuati dagli analisti includono Expert System, Powerset, Yedda, Trovix e Hakia. Secondo gli autori, la consapevolezza della ricerca semantica aumentò quando Microsoft raccolse due società di ricerca semantica Powerset e Zoomix.

Nel caso di Expert System, la sua applicazione, chiamata Cogito, è progettata attorno ai principi della comprensione umana per consentire ai contenuti di essere compreso nel modo in cui l'autore lo intendeva. Questo è qualcosa che la ricerca per parola chiave ignora.

"Una ricerca su Google per la parola 'giaguaro' potrebbe aumentare il contenuto intorno all'animale e alla macchina. La ricerca semantica non guarderebbe solo la parola chiave, ma anche altre parole attorno ad essa come 'giungla' "o" saloon "per separare i due significati," hanno detto gli autori.

Analisi più approfondita

Oltre alla ricerca semantica, ci sono altre forme, tra cui euristica e ontologia, linguistica e text mining e statistica. Tuttavia, Expert System sostiene che questi approcci sono insufficienti, affrontando solo gli aspetti morfologici e grammaticali dell'analisi.

Altri motori di ricerca spesso colpiscono un muro di mattoni quando si tratta di analisi approfondite. Ad esempio, quando un motore di ricerca guidato euristicamente vede due aggettivi in ​​una frase, di solito li lava e segna la frase come neutrale perché non ha alcuna comprensione di dove puntano i due aggettivi separati.

In confronto, la ricerca semantica sembra a entrambe le frasi logiche - come le parole in una frase si relazionano tra loro - e l'analisi semantica - comprendere il contesto delle parole chiave.

Quando un termine è ambiguo, nel senso che può avere diversi significati, ad esempio, abbaia, è necessaria un'analisi semantica sulle altre parole che lo circondano per dargli il suo vero significato e contesto.

Un database lessicale

Gli ingegneri di Expert Systems dicono che Cogito può fare il miglio in più perché ha una rete semantica - un database lessicale che fornisce una rappresentazione della conoscenza delle definizioni di parole e delle loro relazioni. Ha versato il dizionario di Webster in un database in memoria - comprendente 350.000 parole e 2,8 milioni di relazioni.

"La rete semantica di Expert System si concentra anche su parole comuni. Questo è diverso dalla maggior parte degli approcci ontologici che riguardano il significato involucro e il contesto intorno specializzato contenuto, come i termini scientifici, e salta le parole comuni che comprendono il 90% di tutto il contenuto ", hanno detto gli autori Ovum.

Tuttavia, la ricerca semantica è ancora piena di" molta pubblicità teorica ma poca sostanza reale o prova che funziona meglio delle attuali tecnologie di ricerca.

"Le reti semantiche sono difficili da costruire e non tutte sono uguali. È improbabile che le tecnologie semantiche saranno mai in grado di fornire una precisione del 100% nelle loro analisi e risultati. Inoltre ci sono ancora punti interrogativi su problemi di prestazioni potenzialmente appiccicosi con ricerche semantiche che consumano più cicli di elaborazione. "