Aggiornamenti Google per il riconoscimento del linguaggio naturale

Pubblicato il

Nel bollettino che Google rilascia periodicamente sul blog Inside Search, contenente le novità che vengono introdotte per migliorare il proprio motore di ricerca, questo mese troviamo interessanti evoluzioni sul fronte del riconoscimento del linguaggio naturale.

Riconoscimento del linguaggio naturale nel motore di ricerca Google
Google: nuovi aggiornamenti per il riconoscimento del linguaggio naturale

Sistema di riconoscimento delle domande

Sono ben ottantasei le novità introdotte nel motore di ricerca Google tra giugno e luglio 2012. Miglioramenti alle funzionalità già esistenti e l’aggiunta di nuove caratteristiche che vanno a rifinire e perfezionare sempre di più uno degli strumenti più usati nel web. Molte di queste novità hanno come obbiettivo il miglioramento dei sistemi di riconoscimento delle domande poste attraverso l’uso del linguaggio naturale.

Ad esempio se l’utente cerca:

«Cosa vuol dire […]»

Prima dei normali risultati della ricerca, si può notare la definizione del termine fornito. Solitamente la fonte di queste definizioni è presa da Wikipedia o Wiktionary.

Anche il riconoscimento delle conversioni di valuta è stato aggiornato per capire quando un utente sta cercando una conversione. Mentre fino a qualche tempo fa la frase doveva essere molto schematica, ad esempio:

«120 usd in eur»

Ovvero un numero seguito dalla valuta di origine, dal termine «in» ed infine dalla valuta di destinazione, adesso si può formulare la domanda più naturalmente scrivendo:

«Quanti dollari sono 120 euro?»

Lo stesso vale anche per il convertitore di unità di misura anche se in questo caso i test svolti in lingua italiana non sono ancora soddisfacenti.

Come per il convertitore delle unità di misura anche il riconoscimento della domanda per le previsioni del tempo necessita qualche perfezionamento. Se non si cerca esattamente la frase «che tempo fa a [nome della città]», ad esempio scrivendo «ad» al posto di «a», il sistema non è più in grado di identificare la domanda. In ogni caso, anche se le funzionalità non sono perfette, si tratta di ulteriori passi in avanti per rendere il motore di ricerca sempre più intuitivo e facile da usare.

Google, previsioni meteo con ricerca naturale

L’interpretazione dei sinonimi da parte di Google

Allo scopo di fornire dei risultati adeguati alle richieste degli utenti è stata rivista anche la gestione dei sinonimi in modo da gestire con maggiore efficienza i risultati delle ricerche. Già da tempo Google ha nei propri database un ricco elenco di sinonimi utilizzati per aumentare i risultati pertinenti, ma in alcuni casi questi potevano essere usati in maniera impropria e quindi sfalsare le possibili risposte. Grazie agli ultimi aggiornamenti Google cercherà invece di interpretare più correttamente i sinonimi così da aumentare la precisione delle pagine con i risultati delle ricerche.

L’identificazione dei sinonimi presenti in una pagina con lo stesso significato del termine usato nella «query» richiesta dall’utente verrà usata per dare un peso maggiore nel posizionamento dei risultati. Questa modifica si basa sull’osservazione che a volte dei sinonimi potrebbero esprimere un concetto diverso da quello richiesto. Ad esempio in base al contesto in cui si trovano potrebbero subire delle variazioni. L’efficienza del sistema dipenderà dalla capacità di Google di saper determinare e distinguere questi casi particolari.

Infine, sempre per quanto riguarda i sinonimi, anche la generazione dei titoletti visualizzati nei risultati delle ricerche potrebbe essere influenzata da una migliore comprensione e classificazione dei sinonimi.

Il web semantico e la ricerca semantica si avvicinano?

Il concetto di «web semantico» viene sfruttato, a volte anche in maniera impropria, per descrivere quei sistemi in grado di riconoscere e comprendere più facilmente il linguaggio usato dall’uomo. Al momento queste innovazioni sono solo dei timidi tentativi, tuttavia servono anch’essi per avvicinare l’uso del linguaggio naturale agli strumenti informatici rendendo le interfaccie più semplici da usare.