Come funziona davvero un algoritmo per analizzare informative e dati grezzi

Come funziona davvero un algoritmo

All’interno dell’alleanza dell’Interpol contro le cosche calabresi, l’Italia sta sviluppando un sistema informatico per analizzare informative e dati grezzi sulle infiltrazioni mafiose e anticipare le mosse future.

Gli affari sporchi della ‘ndrangheta non conoscono confini. Lo mette nero su bianco una delle ultime relazioni della Direzione investigativa antimafia (Dia). “Anche all’estero – scrivono gli inquirenti – le cosche sono in grado di sfruttare tutte le opportunità offerte dai differenti sistemi normativi”. Lo fanno “privilegiando l’insediamento in Stati meno attivi sul piano della cooperazione giudiziaria” con l’Italia, prosegue il rapporto, e dove è più semplice reinvestire “capitali illeciti”.

Ed è proprio su questa inarrestabile espansione che vuole far luce un sistema informatico attualmente in via di sviluppo da parte delle forze dell’ordine italiane: un complesso database governato da numerosi algoritmi in grado di estrarre e mettere a sistema informazioni provenienti da molteplici fonti in modo da individuare ricorrenze, unire i puntini, collegare tracce.

Come funziona il programma

Ancora in fase di sviluppo, l’infrastruttura è frutto del Centro di ricerca per l’analisi delle informazioni multimediali della polizia di Stato (Craim), del Consiglio nazionale delle ricerche (Cnr) e di Leonardo.

Obiettivo: monitorare le infiltrazioni dell’unica mafia presente nei cinque continenti e capace di insinuarsi all’interno del tessuto economico, della filiera logistica, nelle operazioni di import-export o in quelle aeroportuali.

Sono i metodi tipici dell’analista, che si basa anche sulla statistica per scoprire correlazioni e autocorrelazioni che ci permettano di intuire cosa potrebbe succedere domani

Non una tecnologia che governa l’indagine, ma uno strumento in grado di accelerare il ragionamento e l’analisi di chi la conduce, automatizzando la ricerca di indizi e collegamenti tra le informazioni che giornalmente vengono prodotte.

Come si analizzano i dati

Il problema principale riguarda l’estrazione dei dati ma l’evoluzione dei motori di ricerca, sempre più precisi ed elastici, sono ormai in grado di capire non solo quello che l’utente richiede, ma anche quello che effettivamente intendeva chiedere.

È il caso di Bert (Bidirectional encoder representations from transformers), componente sviluppato da Google nel 2019 e progressivamente inserito “sotto il cofano” del più utilizzato motore di ricerca al mondo, che da qualche anno ha permesso un enorme salto in avanti di questa tecnologia. In breve, Bert è la ragione per la quale se l’utente cerca la parola “moon” (luna), i risultati forniranno anche contenuti che includono l’aggettivo “lunar” (lunare), anziché – per esempio – il nome del batterista degli Who (Keith Moon).

Addestrare una rete a conoscere un fenomeno che di per sé è molto complesso significa prima di tutto capire il fenomeno, poi bisogna farlo capire alla rete

A quel punto sono sufficienti l’intuito e l’esperienza investigativa per far emergere da un ammasso di dati informi una traccia che può essere seguita per attivare tempestivamente un servizio di osservazione.

Approfondimento & Fonte WIRED.IT

Per contribuire a diffondere la “cultura dell’Anticorruzione” Resquon ha ideato e prodotto il Think Tank Anticorruzione