Fabio Donatantonio

Resta connesso

Software Developer / Adjunct Professor

La ricerca in rete: i comandi AND e OR

Come abbiamo detto in fase di introduzione il comando AND è un operatore logico booleano e può essere sostituito semplicemente dalla sua assenza.
I due comandi quindi si equivalgono.

parola1 AND parola2  <——-> parola1 parola2

Il comando AND comunque non è univocamente usato nei vari motori di ricerca.
Ad esempio la ricerca «Dante Bonagiunta» su Google restituisce (Giugno 2015) 43.900 risultati

Google AND

mentre la ricerca «Dante AND Bonagiunta» ne restituisce 18.800, perché inserisce anche pagine inglesi in cui and fa parte addirittura del titolo o del corpo del testo.

Google AND

Bing curiosamente ne restituisce 10100 se manca AND e 9950 se c’è AND.
Conviene in buona sostanza utilizzare la sintassi dichiarata dai motori ed ormai prevalente e spaziare le parole sottintendendo l’operatore AND.
In generale rimane sempre una buona prassi quella di studiare la sintassi dei differenti motori perché essa può anche subire variazioni.

Il comando OR (in maiuscolo come tutti gli operatori booleani) indica l’alternativa fra uno o più termini di ricerca ed ha valore disgiuntivo, come aut in latino, per cui x1 OR x2 OR … xn restituisce uno solo fra gli x(1,2,,n…z) termini.
Tuttavia alcuni motori restituiscono anche pagine con più d’uno dei termini cercati, pur avendo specificato l’uso di OR come disgiuntivo.

È chiaro che la ricerca con OR restituisce molti più risultati che non la ricerca con AND.
La prima infatti restituisce un insieme unione fra gli insiemi rappresentati dalle parole chiave, la seconda restituisce invece un insieme intersezione fra gli stessi insiemi.
A titolo di esempio per le parole chiave Alighieri, Guinnizzelli e Cavalcanti, per Bing e Google  si hanno questi risultati (non si valuti qui la pertinenza):

Motore Risultati AND Risultati OR
Bing ~ 132,000 ~ 6,690,000
Google ~ 102.000 ~ 15.700.000


AND E OR INSIEME.

Ricordiamo che il comando AND ha sostanzialmente un’azione di restringimento del campo di ricerca. Più termini collegati fra loro dall’operatore logico equivalgono in termini matematici, come abbiamo accennato sopra, a un insieme intersezione fra più insiemi parzialmente differenti e individua dunque quella sola porzione dell’insieme che è comune a tutti.
Il comando OR invece ha un effetto differente ma non esattamente opposto. Esso in effetti allarga il campo dei risultati possibili in quanto, posta una lista di elementi separati, accetta come risultato uno solo di ma li elenca comunque uno a uno tutti in forma disgiuntiva.
È intuitivo che il numero dei risultati con OR sia maggiore che con AND.
Lo si verifica chiaramente digitando i due seguenti comandi:
Alighieri OR bonagiunta OR Davanzati restituisce ad esempio oltre 16.000.000 di pagine:

Google OR

Alighieri bonagiunta Davanzati restituisce -solo- 2.570 risultati:

Google AND

I due comandi possono anche essere utilizzati insieme, tenendo conto delle loro caratteristiche.
Bisogna ricordare che OR agisce sia sul termine immediatamente precedente sia su quello immediatamente seguente.
Possiamo allora utilizzare le parentesi per ottenere dei raggruppamenti (AND) disgiuntivi (OR) dei vari termini secondo i criteri che ci interessano per tentare di trovare risultati non troppo restrittivi dovuti a AND, né troppo vasti causati da OR.
Riprendiamo la stessa query utilizzata precedentemente a solo scopo dimostrativo e vediamo gli effetti dell’applicazione contemporanea dei due comandi:

(Alighieri bonagiunta) OR Davanzati restituisce 360.000 risultati

Google - AND e OR insieme

Alighieri OR (bonagiunta Davanzati) restituisce 356.000 risultati

Google - AND e OR insieme

Si tenga sempre presente che OR è un comando che esclude la compresenza dei due termini su cui agisce (ricordarsi AUT latino).

NOTE SUL COMANDO AND.
Una ricerca basata su una sola parola chiave restituirà quasi sempre risultati scarsamente o del tutto improduttivi nell’insieme.
La prima ragione è nell’elevato numero di pagine che potrebbero contenere quella sola parola, specie se nota.
Al momento, una ricerca su “dante” restituisce 61.800.000 pagine su Google e 1.920.000 in Bing e si capisce bene che non è stata un granché utile.
Raffiniamo la ricerca utilizzando più parole chiave spaziate fra loro (equivalente ad AND logico) per ottenere tutte le pagine che contengano contemporaneamente le parole richieste.

È ovvio che in tal caso la ricerca si fa più selettiva.
Già solo cercare “Dante Alighieri” fa scendere il numero di pagine a 5.640.000 su Google mentre, curiosamente, le fa salire a 2.490.000 su Bing; si tratta comunque di un numero ancora troppo elevato.
Inserendo questa serie di parole:
dante alighieri beatrice portinari vita nova morte gentile cortese cortesia
le pagine scendono a 4.610 su Google e 130.000 su Bing.

Google - Restringere ricerca
Google a questo proposito permette di utilizzare fino a un massimo di 32 parole chiave.
Significa che esso è in grado di effettuare una ricerca con AND logico intersecando fino a 32 insiemi contemporaneamente.
È il solo motore a dichiarare questo valore.
Va comunque precisato che la ricerca con AND non restituisce la pagine contenenti le parole nello stesso ordine in cui sono state inserite. Per questo si veda più avanti l’operatore “”.
Queste osservazioni fanno comprendere l’importanza di scegliere con cura le parole chiave da utilizzare per la propria ricerca.
Più si è precisi nel definire cosa si cerca e più le parole chiave saranno mirate e le query saranno ben organizzate, più facile sarà ottenere risultati validi e in minor tempo.

A tal proposito un buon suggerimento è quello di valutare l’ordine delle parole mettendo ai primi posti quelle ritenute più importanti.
Questo perché spesso nelle pagine web i metadati inseriti manualmente nelle intestazioni sono pochi e di solito quelli ritenuti più importanti.

Se nella ricerca precedente le parole “dante” e “alighieri” venissero poste in fondo alla serie di parole chiave, i risultati diminuirebbero (seppur di poco), perché in genere nei metadati si tende a dare rilievo prima all’autore e poi alle sue opere.

I termini di ricerca inseriti compariranno in neretto nel titolo del link se fanno parte anche del titolo della pagina cui si riferiscono.
Google infatti ricerca le parole sia nel titolo sia nel corpo della pagina.

Google - In grassetto termini ricercati
La presenza nel titolo di determinate parole chiave dovrebbe teoricamente garantire una maggior possibilità di reperimento di pagine pertinenti con i propri desiderata.
I motori verificano anche se le parole del titolo ricorrono nel corpo; in caso affermativo aumenterebbe la probabilità di pertinenza del risultato. D’altronde, su diversi motori è possibile anche raffinare la ricerca per parole chiave, come vedremo,  specificando le sezioni della pagina web in cui queste devono trovarsi: titoli, URL, corpo del testo eccetera.

Torna al menu articoli -> La ricerca in rete: Introduzione

 

Fabio Donatantonio

Fabio Donatantonio. Analista e sviluppatore full-stack di applicazioni web in linguaggio PHP. Professore a Contratto per le cattedre di Fondamenti di Informatica e Archivistica Digitale presso Università degli Studi eCampus. Dal 2008 curatore del sito www.donatantonio.net, da sempre appassionato di programmazione, mare, sigari e... musica.

Leave a reply

Your email address will not be published. Required fields are marked *

 

Didattica

Università degli Studi eCampus
Data Evento
30/03/2017
11:30
Esame Archivistica Digitale e Informatica per le Scienze Umane - Lettere - Novedrate(CO)
31/03/2017
11:30
Esame Archivistica Digitale e Informatica per le Scienze Umane - Lettere - Roma
Risorse
Guida HTML/CSS per principianti (link)
Introduzione agli ipertesti (link)
Esercizi guidati in Java (link)
Intelligenza artificiale (link)
Libri
Fondamenti di Informatica (2011) (link)
Informatica per le Scienze Umane (2011) (link)
Fondamenti di Informatica (2014) (link)
Pagina Docente
uniecampus.it - Scheda Docente (link)
Contatti
fabio.donatantonio[at]uniecampus.it

JWhisper, sviluppato presso il Dipartimento di Informatica Applicata dell'Università degli Studi di Salerno:

Stay Connected

Twitter

Le mie foto

Foto di Fabio Donatantonio
×