Sono ormai molti i portali indicizzati su Caasa, tramite CaasaBot o tramite feed: in virtù di questo fatto le ricerche effettuate su Caasa sono sempre più complete ed è difficile che ci siano degli immobili in vendita o in affitto, senza che risultino presenti anche su Caasa. Gli stessi annunci vengono però postati su diversi portali ed è in qualche modo auspicabile che le ricerche effettuate su Caasa identifichino le duplicazioni, rendendo la ricerca più rapida ed efficiente agli utenti. E' online da oggi una versione aggiornata (e sensibilmente migliorata) del nostro algoritmo di identificazione dei duplicati, che dovrebbe garantire un'eccellente capacità di identificare le duplicazioni: utilizza in modo coordinato l'estrazione delle keyword, i valori numerici più significativi (prezzo e superficie) , la localizzazione,  la similitudine tra le descrizioni (calcolando la distanza di Levenshtein) e le informazioni sul venditore. Insomma, un lavoro non banale che spero possa rendere le ricerche su Caasa ancora più precise, affidabili e funzionali.