Avvelenare i ragni... si direbbe quasi che oggi su Ingonline si parli di spietata e crudele "economia domestica". Invece si tratta dell'ennesimo articolo che tratta di internet e informatica! Mi rendo conto di ritrovarmi a scrivere sempre articoli che trattano di computer. Purtroppo è il settore che maggiormente mi interessa. Cosa c'entrano i Ragni con Internet? Con il termine ragno (o spider o crawler o bot e mille altri sostantivi coniati per la bisogna) si indicano dei computer programmati appositamente per scansionare tutti i siti internet che gli capitano a tiro reperendo informazioni di vario tipo che poi vengono classificate e memorizzate in un database. Quando un ragno visita un sito internet, in particolare, segue tutti i link che vi trova, potendo così andare a raggiungere anche altri siti internet (e così via fino quasi all'infinito). Cosa cercano i Ragni nei siti internet? Da questo punto di vista mi viene quasi da fare una distinzione tra Ragni buoni e ragni cattivi. Ci sono ragni che visitano i siti internet allo scopo di riempire i database dei motori di ricerca. Ci sono altri ragni che hanno invece la cattiva creanza di andare di sito in sito a reperire indirizzi di posta elettronica, che saranno poi raccolti da aziende che, in maniera scorretta, pubblicizzeranno i loro prodotti e/o servizi inviando email indesiderate (spam) a tutti coloro che hanno incautamente lasciato il proprio indirizzo di posta elettronica al pubblico demanio. Da quando esiste lo spam gli sviluppatori di siti web devono fare i conti con questi fastidiosissimi ragni che, oltre a quanto detto sopra, tendono a sovraccaricare i server che ospitano i siti web e che, a volte, hanno l'ulteriore pessima abitudine di compilare automaticamente i moduli che trovano nei vari siti (ad esempio il classico libro degli ospiti) allo scopo di inserire commenti in cui pubblicizzano siti internet per lo più a contenuto erotico. Nel corso degli anni sono state sviluppate le tecniche più disparate per difendersi dallo spam. Classificherei queste tecniche distinguendo tra passive e attive. A volte, infatti, ci si limita a camuffare alcuni contenuti ai ragni (cosiddetto cloaking) quali ad esempio gli indirizzi di posta elettronica, inserendoli come immagini piuttosto che come testo, perchè un essere umano è in grado, contrariamente ad un Ragno, di leggere l'indirizzo email . Un altra tecnica passiva può consistere nel prendere in giro un ragno, che è strutturalmente stupido, indicando un indirizzo email "postmaster.eliminaquesto @ ingonline.biz" e raccomandando di eliminare la stringa "eliminaquesto". Per quanto riguarda invece la compilazione automatica dei moduli, analogamente, si richiede al visitatore di compiere un'operazione che richiede la capacità di riconoscere immagini, oppure di ragionare autonomamente, come questo esempio, in cui si chiede di fare un semplice calcolo. L'altro fronte su cui si lavora, quello attivo, si propone invece di danneggiare i Ragni, sottoponendogli tantissimi indirizzi email fasulli, come ad esempio Spam poison. |