I numeri primi hanno incuriosito i pensatori curiosi per secoli. Da un lato, i numeri primi sembrano essere distribuiti casualmente tra i numeri naturali senza altra legge che quella del caso. Ma d’altra parte, la distribuzione globale dei numeri primi rivela una regolarità straordinariamente regolare. Questa combinazione di casualità e regolarità ha motivato i ricercatori a cercare modelli nella distribuzione dei numeri primi che potrebbero eventualmente far luce sulla loro natura ultima.
In un recente studio, Bartolo Luque e Lucas Lacasa dell’Universidad Politécnica de Madrid in Spagna hanno scoperto un nuovo modello nei numeri primi che è sorprendentemente passato inosservato fino ad ora.
Hanno scoperto che la distribuzione della cifra iniziale nella sequenza dei numeri primi può essere descritta da una generalizzazione della legge di Benford. Inoltre, questo stesso modello appare anche in un’altra sequenza numerica, quella delle cifre iniziali degli zeri zeta di Riemann non banali, che è noto per essere correlata alla distribuzione dei numeri primi. Oltre a fornire informazioni sulla natura dei numeri primi, la scoperta potrebbe anche avere applicazioni in aree come il rilevamento delle frodi e l’analisi del mercato azionario.
“I matematici hanno studiato i numeri primi per secoli”, ha affermato Lacasa. “Nuove intuizioni e concetti provenienti dalla scienza non lineare, come i processi moltiplicativi, ci aiutano a guardare i numeri primi da una prospettiva diversa. Secondo questo focus, diventa significativo che ancora oggi sia possibile scoprire inosservati accenni di regolarità statistica in tali sequenze, senza essere un esperto di teoria dei numeri. Tuttavia, il problema più significativo in questo lavoro non è svelare questo modello nei numeri primi e negli zeri di Riemann, ma comprendere la ragione e le implicazioni di tale struttura inaspettata, non solo per questioni teoriche sui numeri ma, cosa interessante, anche per altre discipline. Ad esempio, questi risultati approfondiscono la nostra comprensione delle correlazioni nei sistemi composti da molti elementi”.
La legge di Benford (BL), dal nome del fisico Frank Benford nel 1938, descrive la distribuzione delle cifre iniziali dei numeri in un’ampia varietà di set di dati e sequenze matematiche. In modo un po’ inaspettato, le cifre iniziali non sono distribuite casualmente o uniformemente, ma invece la loro distribuzione è logaritmica.
Cioè, 1 come prima cifra appare circa il 30% delle volte e le cifre successive appaiono con frequenza sempre più bassa, con 9 che appare meno spesso. È stato dimostrato che la legge di Benford descrive insiemi di dati disparati, dalle costanti fisiche alla lunghezza dei fiumi del mondo.
Dalla fine degli anni ’70, i ricercatori sapevano che i numeri primi stessi, se presi in insiemi di dati molto grandi, non sono distribuiti secondo la legge di Benford. Invece, la distribuzione della prima cifra dei numeri primi sembra essere approssimativamente uniforme. Tuttavia, come sottolineano Luque e Lacasa, insiemi di dati più piccoli ovvero (intervalli), di numeri primi mostrano una chiara distorsione nella distribuzione della prima cifra.
I ricercatori hanno notato un altro schema: più grande è il set di dati dei numeri primi che hanno analizzato, più la distribuzione della prima cifra si avvicina all’uniformità. Alla luce di ciò, i ricercatori si sono chiesti se esistesse un modello alla base della tendenza verso l’uniformità quando l’intervallo primo aumenta all’infinito.
L’insieme dei numeri primi e l’insieme dei numeri interi è infinito
L’insieme di tutti i numeri primi – come l’insieme di tutti i numeri interi – è infinito. Da un punto di vista statistico, una difficoltà in questo tipo di analisi è decidere come scegliere a “caso” in un insieme infinito di dati. Quindi deve essere scelto un intervallo finito, anche se non è possibile farlo in modo del tutto casuale o in un modo che soddisfi le leggi della probabilità. Per superare questo punto, i ricercatori hanno deciso di scegliere diversi intervalli della forma [1, 10 d ]; per esempio, 1-100.000 per d = 5, ecc.
In questi insiemi, tutte le prime cifre sono ugualmente probabili a priori. Quindi, se uno schema emerge nella prima cifra dei numeri primi in un insieme, rivelerebbe qualcosa sulla distribuzione dei numeri primi in prima cifra, anche se solo all’interno di quell’insieme.
Osservando più insiemi all’aumentare di d, Luque e Lacasa hanno potuto studiare come cambia la distribuzione della prima cifra dei numeri primi all’aumentare dell’insieme di dati. Hanno scoperto che i numeri primi seguono una legge di Benford generalizzata (GBL) dipendente dalle dimensioni. Un GBL descrive la distribuzione della prima cifra dei numeri in serie generati dalle distribuzioni della legge di potenza, come [1, 10 d ].
All’aumentare di d, la distribuzione della prima cifra dei numeri primi diventa più uniforme, seguendo una tendenza descritta da GBL. Come ha spiegato Lacasa, sia BL che GBL si applicano a molti processi in natura.
“Immagina di avere $ 1.000 sul tuo conto bancario, con un tasso di interesse dell’1% al mese”, ha affermato Lacasa. “Il primo mese, i tuoi soldi diventeranno $ 1.000 * 1,01 = $ 1.010. Il mese successivo, $ 1,010 * 1,01 e così via. Dopo n mesi, avrai $ 1.000*(1.01)^n. Nota che avrai bisogno di molti mesi per passare da $ 1.000 a $ 2.000, mentre per passare da $ 8.000 a $ 9.000 sarà molto più facile. Quando analizzi i tuoi dati contabili, ti accorgerai che la prima cifra 1 è più rappresentata di 8 o 9, proprio come detta la legge di Benford. Questo è un esempio molto semplice di un processo moltiplicativo in cui 0,01 è la costante moltiplicativa”.
I fisici hanno dimostrato che molti processi in natura possono essere modellati come processi moltiplicativi stocastici, dove il valore precedentemente costante di 0,01 è ora una variabile casuale e i dati equivalenti al denaro del nostro ultimo esempio sono un’altra variabile casuale con una distribuzione sottostante 1/ X. Si mostra che i processi stocastici con tali distribuzioni seguono BL.
Ora, molti altri fenomeni si adattano meglio a un processo stocastico con una probabilità sottostante più generale x^[-alpha], dove alfa è diverso da uno. La distribuzione della prima cifra correlata a questa distribuzione della legge di potenza generale è la cosiddetta legge di Benford generalizzata (che converge a BL per alfa = 1).
Significativamente, Luque e Lacasa hanno mostrato nel loro studio che GBL può essere spiegato dal teorema dei numeri primi; in particolare, la forma della densità locale media delle sequenze è responsabile del pattern. I ricercatori hanno anche sviluppato un quadro matematico che fornisce le condizioni affinché qualsiasi distribuzione sia conforme a un GBL. Le condizioni si basano su ricerche precedenti, che hanno dimostrato che il comportamento di Benford potrebbe verificarsi quando una distribuzione segue BL per particolari valori dei suoi parametri, come nel caso dei numeri primi.
Luque e Lacasa hanno anche studiato la sequenza degli zeri zeta non banali di Riemann, che sono legati alla distribuzione dei numeri primi, e la cui distribuzione degli zeri è considerata uno dei più importanti problemi matematici irrisolti. Sebbene la distribuzione degli zeri non segua BL.
I ricercatori suggeriscono che questo lavoro potrebbe avere diverse applicazioni, come identificare altre sequenze che non sono distribuite da Benford, ma potrebbero essere GBL. Inoltre, molte applicazioni che sono state sviluppate per la legge di Benford potrebbero eventualmente essere generalizzate al contesto più ampio della legge di Benford generalizzata.
Una di queste applicazioni è il rilevamento delle frodi: mentre i dati generati naturalmente obbediscono alla legge di Benford, i dati indovinati casualmente (fraudolenti) non lo fanno, in generale.
“BL è un caso specifico di GBL“, ha spiegato Lacasa. “Molti processi in natura possono essere adattati a un GBL con alfa = 1, cioè un BL. La struttura nascosta quantificata dalla legge di Benford si perde quando i numeri vengono modificati artificialmente: questo è un principio per l’individuazione delle frodi in contabilità, dove i meccanismi combinatori associati agli insiemi contabili sono tali da applicare BL. Lo stesso principio vale per i processi che seguono GBL con un alfa generico, dove BL fallisce. Infine, per i processi la cui densità sottostante non è x^(-alpha) ma 1/logN, un GBL dipendente dalle dimensioni sarebbe il segno distintivo corretto”.