Fabio Donatantonio

Resta connesso

Software Developer / Adjunct Professor

La ricerca in rete: l’operatore + (più)

Il comando + sembra ormai andarsi a sovrapporre al comando AND perché impone che tutti i termini con il + davanti compaiano nei risultati di una query.
In realtà tanto Google che gli altri motori dichiarano a proposito del segno + che esso impone di cercare in una query anche termini molto comuni che in genere sono ignorati in fase di elaborazione anche con un comando AND, perché rallentano la ricerca e non sono considerati reali portatori di informazione: si tratta delle stopwords; fra queste rientrano, ad esempio i numeri, le congiunzioni gli articoli certi verbi come gli ausiliari essere e avere coniugati o anche avverbi e preposizioni.

L’uso del segno + può effettivamente cambiare e di parecchio il numero dei risultati che il motore può visualizzare.
Se ad esempio inserisco come parole chiave “Calvino” e “romanzo”, su Google si ottengono circa 477.000 pagine di risposta:

Google - Comando + più

Se però si inserisce Calvino +il romanzo i risultati scendono vertiginosamente a 599:

Google - Operatore + più

La sequenza “calvino+nel romanzo porta addirittura a 20 le pagine trovate.

Google - Operatore + più

Anche in questo caso si deve fare attenzione.
Innanzitutto la sequenza delle parole inserite nella casella di ricerca non necessariamente restituirà risultati che mantengano lo stesso ordine.
Quindi la preposizione articolata potrà trovarsi tanto davanti a Calvino quanto davanti a romanzo.

Al motore infatti è stato chiesto di cercare tutte le pagine in cui compaiono contemporaneamente sia “Calvino” che “romanzo” e inoltre  che in queste stesse compia obbligatoriamente la preposizione articolata “nel”, di solito non considerata in quanto stopword.
Si potrebbe obiettare che fra i risultati che contemplano “calvino” e “romanzo” sicuramente sarebbe comparsa anche qualche pagina in cui appariva “nel”, ma si sarebbe trattato di un risultato più o meno aleatorio, in quanto sarebbe dipeso da fattori legati prima di tutto ai due termini principali (ranking, ecc) e sarebbero apparse magari molto in avanti nella ricerca.

Utilizzando “+nel” invece si impone che questa preposizione articolata venga considerata allo stesso modo di “calvino” e “romanzo” e i risultati saranno visualizzati a partire da questo vincolo, prima di altre eventuali stopword e quindi assai meno casualmente.

Torna al menu articoli -> La ricerca in rete: Introduzione

 

Fabio Donatantonio

Fabio Donatantonio. Analista e sviluppatore full-stack di applicazioni web in linguaggio PHP. Professore a Contratto per le cattedre di Fondamenti di Informatica e Archivistica Digitale presso Università degli Studi eCampus. Dal 2008 curatore del sito www.donatantonio.net, da sempre appassionato di programmazione, mare, sigari e... musica.

Leave a reply

Your email address will not be published. Required fields are marked *

 

Didattica

Università degli Studi eCampus
Data Evento
30/03/2017
11:30
Esame Archivistica Digitale e Informatica per le Scienze Umane - Lettere - Novedrate(CO)
31/03/2017
11:30
Esame Archivistica Digitale e Informatica per le Scienze Umane - Lettere - Roma
Risorse
Guida HTML/CSS per principianti (link)
Introduzione agli ipertesti (link)
Esercizi guidati in Java (link)
Intelligenza artificiale (link)
Libri
Fondamenti di Informatica (2011) (link)
Informatica per le Scienze Umane (2011) (link)
Fondamenti di Informatica (2014) (link)
Pagina Docente
uniecampus.it - Scheda Docente (link)
Contatti
fabio.donatantonio[at]uniecampus.it

JWhisper, sviluppato presso il Dipartimento di Informatica Applicata dell'Università degli Studi di Salerno:

Stay Connected

Twitter

Le mie foto

Foto di Fabio Donatantonio
×