La ricerca di template semantici identifica architetture di pubblicazione automatizzata da abbattere

Da fine aprile 2026 i forum SEO si riempiono della stessa anomalia: intere sezioni di siti spariscono dall’indice senza notifica, finite nei bucket “Excluded” o “Crawled, currently not indexed”.

Google sostiene di non vedere nulla di insolito. Mentre la comunità cerca una spiegazione, la domanda di automazione dei contenuti continua a crescere, e i numeri di ricerca dipingono un mercato che investe proprio nella tecnologia che ha prodotto i contenuti ora silenziati.

Basta consultare i 10 trend SEO del 2026 secondo Ahrefs per avere un quadro: “ai writing” raccoglie 19.000 ricerche al mese, in aumento del 15% anno su anno; “ai content detector” tocca 14.000 ricerche (+11%); “ai content creation” sale a 5.100 (+16%). Cresce chi produce contenuti con l’AI e, parallelamente, chi cerca strumenti per riconoscerli. Il paradosso è la fotografia di una resa dei conti: più l’indice si restringe, più l’industria pompa AI slop.

Il template unico che condanna interi cluster

Il 19 giugno 2026, i ricercatori di Google hanno pubblicato un nuovo paper su come rilevare lo spam AI. La novità non sta nell’ennesimo classificatore, ma nel metodo: il sistema non valuta pagine isolate, cerca il riutilizzo di massa di uno stesso template narrativo semantico. Se una percentuale elevata di account in un cluster infrastrutturale condivide pattern testuali o visivi generati da AI, l’intero cluster viene spento. Non si colpiscono singoli URL, si abbattono architetture di pubblicazione automatizzata.

La scelta di un approccio strutturale nasce da una difficoltà conclamata: la quantità di spam generato da AI è diventata una sfida esponenziale, capace di travolgere i filtri qualità classici. Detto in altri termini, produrre contenuti mediocri su larga scala non è più solo un rischio di ranking: è un segnale di cluster che porta alla deindicizzazione totale.

I settori nel mirino (e la previsione di Illyes)

Le segnalazioni di deindicizzazione raccolte da Search Engine Journal tra aprile e giugno 2026 riguardano quasi esclusivamente editori, siti programmatici, ecommerce, affiliati e siti di servizio locale. In molti casi, il crollo è arrivato dopo il core update di marzo 2026, lo stesso aggiornamento per cui Amsive ha misurato un netto spostamento di visibilità lontano dagli aggregatori. Un singolo proprietario ha visto l’intero sito finire fuori dall’indice.

Gary Illyes aveva già ricordato che un’incidenza elevata di URL “Crawled, currently not indexed” è spia di problemi di qualità generali. Oggi quel segnale si somma al rilevamento dei template semantici, creando una doppia pressione difficile da aggirare con semplici ottimizzazioni tecniche.

Per chi domani mattina deve decidere come investire il budget contenuti, la direzione è univoca: smettere di finanziare pipeline di generazione massiva e verificare se i propri domini sono percepiti come parte di un cluster omogeneo. Ogni nuovo URL deve dimostrare E-E-A-T – esperienza, competenza, autorevolezza e affidabilità – fin dal primo crawl. Il tempo dei volumi drogate dall’automazione è scaduto.