contatore visite

lunedì 25 maggio 2026

Elenco posts

 Elenco dei miei posts scritti nel periodo dal 28/3/18 ad oggi:

                                       (su FB ) - pdf e video - mie domande - miei articoli su focus

25 maggio 2026    Una AI può mentirci di proposito? L’emergere del comportamento strategico nelle intelligenze artificiali.

14 maggio 2026    Quanto siamo stati vicini a considerare normale l’idea di rendere radioattiva una parte del nostro per salvare il resto del territorio?

5 maggio 2026      Chi perde più tempo? Due orologi, tra orbite planetarie e buchi neri.

16 aprile 2026       Ciò che Einstein non voleva vedere: quando la geometria supera la realtà, le soluzioni estreme della Relatività Generale.

15 aprile 2026        Dal pallottoliere all’algoritmo: il confine tra procedura e pensiero nella scienza.

10 aprile 2026        È probabile che il cervello - più ancora del rischio oncologico - rappresenti il vero limite biologico operativo per una missione umana verso Marte.

5 aprile 2026          Che cosa significa “comprendere”?  Bostrom si sbagliava, non è indispensabile l’avvento di una superintelligenza per uno scenario distopico alla “paperclip maximizer”.

24 marzo 2026       La forma globale del nostro universo: JWST potrebbe vedere la nostra galassia nel passato remoto?

18 marzo 2026       Quando l’universo incontra l’algoritmo: Intelligenza Artificiale e nascita dei nuovi modelli cosmologici.

13 marzo 2026       L’intelligenza artificiale e la terza dimensione del cielo: una nuova mediazione tra osservazione e conoscenza cosmologica.

2 marzo 2026         Quando la quantità diventa destino: Fitzgerald, Hemingway e la fisica della disuguaglianza da Anderson a Parisi.

25 febbraio 2026   Quale significato potrebbe assumere l'espressione “restare umani” nel futuro della nostra specie?

18 febbraio 2026   L'enigma della coscienza nell’era delle AI generative: se ed in quali condizioni una macchina potrebbe divenire cosciente.

6 febbraio 2026     JWST sta costringendo la cosmologia a "smettere di essere comoda": l'attesa di un Deepest Deep Field che metta alla prova l'universo primordiale.

4 febbraio 2026     Come esplodono i buchi neri e cosa potrebbe vedere un osservatore che si trovasse ad assistere a questo fenomeno?

2 febbraio 2026     Orizzonti cosmologici, TIP e multiverso: quando la realtà diventa interfaccia.

28 gennaio 2026    Non è la distanza: è l’orizzonte. Blueshift, espansione e causalità cosmica.

20 gennaio 2026    Planetary Protection: perché non è (solo) una questione di microbi, e perché Elon Musk c’entra più di quanto sembri.

14 gennaio 2026    L’illusione della coscienza artificiale: pareidolia semantica, interfacce cognitive ed AI nel confronto tra Floridi, Hoffman, Chalmers, Tononi e Bostrom.

09 gennaio 2026    Perché l’universo in cui viviamo è visibile?  Forze fondamentali, mondi possibili ed interfacce della percezione.

22 dicembre 2025  “Ciò che rende un Paese degno di essere difeso”: Robert R. Wilson, la scienza fondamentale ed il valore di una civiltà.

12 dicembre 2025  Usare il sole per ottenere immagini dettagliate della superficie di pianeti in orbita intorno ad altre stelle.

21 novembre 2025 Satelliti ad aria: come far sì che un satellite utilizzi atomi presenti in altissima quota per generare una spinta.

17 ottobre 2025    Hugh Everett III, l'uomo degli universi paralleli che, deluso da quello in cui si trovò a vivere, rinunciò alle emozioni.

11 ottobre 2025    L'esperimento di Holmberg, precursore delle moderne simulazioni numeriche al computer, quale atto di empatia intellettuale verso il cosmo.

2 ottobre 2025      Il Vuoto come origine dell'Universo?

19 agosto 2025     La sessualità negata alla rappresentazione della donna sulla targa fissata alle sonde Pioneer: la prudenza di Carl Sagan, il bigottismo della NASA e la riscossa di Joe Davis.

7 agosto 2025      Intelligenza artificiale: Bostrom, il “paperclip maximizer” e la pulizia etnica operata contro i Rohingya.

25 luglio 2025     L'impossibilità di rinunciare ai "miti fondanti" e le possibili conseguenze nella società contemporanea: ripensare a come vengono costruiti e diffusi quale soluzione ai futuri conflitti.

19 luglio 2025    Quanto rallenterebbe il tempo per un astronauta su un "pianeta di Miller" in orbita attorno ad uno dei due buchi neri di cui disponiamo la fotografia?

4 luglio 2025      Quali erano le dimensioni dell'universo al termine dell'inflazione?

25 giugno 2025   “Ci sono ancora alcune domande senza risposta, ad esempio: il bosone di Higgs esisterebbe se non ci fosse la matematica per descriverlo?"

20 giugno 2025    Può la corrente elettrica costituire una cura alle difficoltà di apprendimento della matematica?

29 maggio 2025  Prima del Big Bang: la "fase di attesa", una nuova congettura proposta da Melcher, Pradhan e Watso.

22 maggio 2025   No, La notizia "la fine del nostro universo avverrà prima di quanto sinora stimato" non è corretta.

15 maggio 2025   Sopravvivere alla caduta in un buco nero: Gargantua, il buco nero di Interstellar, è un oggetto descritto dalla metrica di Kerr?

2 maggio 2025     Freeman Dyson, il visionario: un motore per spostare le stelle e risparmiarci un tetro lontano futuro.

24 aprile 2025      A cosa è dovuta l'enorme dilatazione temporale sperimentata dall'interprete del film di Nolan sul pianeta di Miller?

28 marzo 2025     Cosa vedrebbe un ipotetico osservatore che si trovasse sulla superficie di una stella di neutroni?

26 marzo 2025     Come riconoscere il momento in cui le attuali AI raggiungeranno la condizione di AGI (Artificial General Intelligence)? Saremo senza difese di fronte ad una AI con prestazioni sovraumane in ogni campo?

26 febbraio 2025   LSD e fisica, un esperimento inquietante: le sostanze psichedeliche possono influenzare la percezione della realtà quantistica?

21 febbraio 2025   La "naturalezza" costituisce ancora un valido principio guida nella ricerca delle Leggi di Natura che regolano il nostro Universo?

18 febbraio 2025  Stringhe: teoria scientifica o semplice congettura?

12 febbraio 2025  Che fine farà l'informazione quando anche l'ultimo buco nero sarà evaporato?

4 febbraio 2025  Ma quanto è grande l'universo in cui viviamo?

22 gennaio 2025  Uno o molti multiversi? La “prudente scommessa” di Steven Weinberg sulla teoria del multiverso.

14 gennaio 2025  L'universo primordiale potrebbe aver ospitato condizioni favorevoli ad un precocissimo sviluppo della vita: una ridefinizione delle caratteristiche biofiliche del cosmo.

27 dicembre 2024 Negli spazi intergalattici il tempo scorre più o meno velocemente che sulla Terra?

9 dicembre 2024   Il nostro universo come interno di un buco nero presente in un altro? L'azzardo di Popławski e la discussione tra Tonelli ed Odifreddi.

10 ottobre 2024      Il mio dialogo con ChatGPT

25 settembre 2024  Il fisico Tullio Regge, la "Biblioteca di Babele" ed i buchi neri.

16 settembre 2024  "Cosa vedrebbe un astronauta ... ?" parte seconda: escursioni termiche e pianeti in orbita intorno alle nane rosse.

7 settembre 2024  Cosa vedrebbe un astronauta sbarcato su un pianeta di un sistema binario?  (Come realizzare un ottimo film di fantascienza).

17 maggio 2024   Il treno degli orfani

6 maggio 2024     Nel peso di una molla compressa la differenza tra la teoria della gravità di Newton e quella di Einstein.

11 marzo 2024      Peter Higgs, la persona dietro lo scienziato.

3 febbraio 2024  Stephen Hawking e Thomas Hertog, la "Top Down Cosmology"

5 gennaio 2024  Leonard Susskind e la sua guerra per la salvezza della Meccanica Quantistica

10 dicembre 2023  Il limite intrinseco alla capacità degli acceleratori di particelle di sondare distanze sempre più brevi aumentando le energie.

12 ottobre 2023      La dialettica tra la fisica teorica e quella sperimentale.

12 ottobre 2023      E' oramai certo, l'antimateria "non cade verso l'alto": ci siamo giocati il motore di Alcubierre!

7 ottobre 2023     Il carattere delle probabilità nelle interpretazioni della meccanica quantistica: Copenhagen, Everett e “l’affidabilità” delle probabilità soggettive di de Finetti.

19 settembre 2023  Il passato non è "dietro le nostre spalle" come si è soliti affermare: è invece presente, lì davanti ai nostri occhi, nel cielo stellato.

16 settembre 2023  Una nuova fisica dietro l’angolo? Le “sorprese di Higgs” (e quella di Guido Tonelli).

10 settembre 2023  Alla ricerca di materia oscura pesante e leggera: gli esperimenti DarkSide e NA64

13 Agosto 2023      Dove indirizzare la ricerca di vita al di fuori del sistema solare? Non solo esopianeti ma anche stelle nane brune e “verdi” potrebbero avere acqua liquida in superficie.

7 Agosto 2023        Avi Loeb ed il suo contributo al progetto Breakthrough Starshot: la prima missione interstellare.

27 Luglio 2023       I Voyager Golden Records in viaggio verso le stelle: contengono un messaggio destinato a noi terrestri?

19 Luglio 2023       "La grandezza dell'ignoto è democratica"

13 Luglio 2023       La Terra a pera di Cristoforo Colombo

28 giugno 2023       Come i socials ci "agganciano" e monopolizzano il nostro tempo libero: i piccioni di Skinner e la strategia dei "like ritardati" di FB.

15 giugno 2023       Abilità mentali umane ed abilità in cui eccellono le AI (intelligenze artificiali): gli ambienti più consoni alle une ed alle altre.

11 giugno 2023       Il cervello dei sapiens (e di altre specie ad essa vicine) si è evoluto per gestire le situazioni di incertezza.

29 maggio 2023      LAWDKI, la ricerca di forme di vita aliena condotta adottando un nuovo paradigma: il finanziamento da parte della NASA all'iniziativa LAB.

24 maggio 2023      Il paradosso della tolleranza, una storia attuale?

2 maggio 2023        Agnotologia, la scienza che spiega perché diventiamo sempre più ignoranti.

28 marzo 2023        Grappoli di buchi bianchi o modifica della RG?

20 gennaio 2023      La vita al di fuori della Terra: cosa cercare e dove? I limiti della definizione di "fascia abitabile" e l'ipotesi "superterre e tettonica a zolle".

9 gennaio 2023       Come disinnescare un potenziale conflitto? Due esempi magistrali offerti da Richard Feynman.

9 dicembre 2022      Isole nei buchi neri: è stato davvero risolto il paradosso dell'informazione?

13 ottobre 2022       Di googleplex, di tetrazioni, del numero di Graham e della loro inutilità per misurare l'Universo: "... più uno!..."

5 ottobre 2022         E' davvero indispensabile ipotizzare l'esistenza della materia oscura per giustificare anomalie legate alla gravità riscontrate in quasi un secolo di osservazioni?

29 settembre 2022   L'obbligo di utilizzo delle cinture di sicurezza sugli autoveicoli e gli xenotrapianti: la CRISPRmania e le aspirazioni ad una società più "giusta"

23 settembre 2022   Parrocchiale ed Universale: dove potrebbe nascondersi alle nostre ricerche una vita aliena e perché siamo ancora troppo condizionati dal pregiudizio antropico negli attuali progetti in atto.

16 settembre 2022   Onde gravitazionali e sistemi binari: in un lontano futuro la nostra Luna finirà per fondersi con la Terra?

13 luglio 2022         "Excuse me while I kiss this guy": il fenomeno MONDEGREEN può colpire anche le AI?

30 giugno 2022       Sono davvero buchi neri di Einstein i due oggetti "fotografati" dalla collaborazione EHT (Event Horizon Telescope) e finiti sulle prime pagine dei giornali di tutto il mondo?

22 giugno 2022       Gli orologi al polso di osservatori posizionati in zone diverse della Terra a livello del mare viaggiano tutti alla stessa velocità?

30 maggio 2022      Un po' di matematica e fisica - che forse non conoscete - alla base dei sistemi di navigazione satellitare.

10 maggio 2022     L'effetto "Uncanny Valley" e gli zombies.

2 maggio 2022       Dove finisce la materia, attirata verso il proprio orizzonte degli eventi, dal pozzo gravitazionale scavato nello spazio tempo da un Buco Bianco?

8 aprile 2022          I giorni sul nostro pianeta sono sempre stati di 24 ore? Come siamo riusciti a misurare sperimentalmente la durata di un giorno di 400 milioni di anni fa.

10 marzo 2022       La coscienza delle api: quando più è meno e meno è più

2 marzo 2022          Buchi neri, gusci di fuoco ed orbite complesse

17 febbraio 2022   La dote cosmica dell'umanità.

25 gennaio 2022    Come ci prepariamo ad una missione umana verso Marte: "le farfalle possono volare sul pianeta rosso?"

20 gennaio 2022    L'origine degli atomi di oro nel nostro universo: r-process innescati da kilonovae e collapsars.

12 gennaio 2022    Perché, da un punto di vista scientifico, non è opportuno affidarci alle AI "robot-giudici": una riflessione sull'impossibilità di dare una definizione matematica al concetto di imparzialità.


5 gennaio 2022      Geoffrey West e la sua serendipity: dalla ricerca delle caratteristiche universali proprie delle particelle elementari a quelle del tessuto urbano.

23 novembre 2021 La fisica ed il problema della coscienza: è possibile fare a meno dello spazio tempo in un modello di realtà oggettiva?

22 novembre 2021 Matvej Bronštejn e la lunghezza di Planck

31 luglio 2021      Il "multiverso di livello I" e la copia perfetta di noi stessi a "soli" 10^10^118 x 10^27 metri da noi.

13 luglio 2021      L'illusione dell'esistenza di un "adesso cosmico".

29 giugno 2021    Cosa c'era prima dell'inizio: il Big Bang, origine del tutto o la fine di qualcosa? L'inflazione eterna di Alex Vilenkin

8 giugno 2021      Sovrastimiamo l'efficacia dei farmaci? Gli NNT (numbers need to treat) e la probabilità a grandi e piccole scale.

30 maggio 2021   La trappola della meritocrazia: davvero l'utilizzo di un criterio meritocratico è il mezzo ottimale per ottenere una società più "giusta"

14 maggio 2021  L'incredibile viaggio nel tempo dell'Apollo 8 ed il "paradosso dei gemelli" che paradosso non è. 

11 maggio 2021   Linee Tendex e la coppia di satelliti Grace: studiare il sottosuolo direttamente dal cielo, soltanto un sogno?

9 maggio 2021     Come finì con i tre teams di scommettitori che macinavano utili investendo sui biglietti della lotteria Cash WinFall?

6 maggio 2021     Le origini del gioco del lotto: è possibile guadagnare investendo in biglietti della lotteria?

5 maggio 2021     Il crescente "rumore" nelle evidenze degli esperimenti scientifici ed i gamberi marmorizzati

4 maggio 2021     La storia di GFT (Google Flu Trends), l'algoritmo di Google che doveva rivoluzionare il modo di far scienza.

3 maggio 2021    Il rischio di insuccesso nei processi di trasferimento della conoscenza

21 marzo 2021    L'aspetto fisico dei sapiens nel prossimo milione di anni

2 marzo 2021      Il trilemma di Bostrom e la probabilità di vivere in una simulazione.

1 marzo 2021       L' "attesa di vita" tra vicini di villa agli Hamptons: un puntino all'estrema destra ed un grafico su cui meditare

1 marzo 2021       Fin dove si spinge l'affidabilità delle indagini sul DNA 

27 febbraio 2021  La risposta di Stephen Webb alle mie obiezioni 

18 febbraio 2021   Le ragioni dello scetticismo di una parte della comunità scientifica circa l'esistenza di vita intelligente al di fuori del nostro pianeta.

11 gennaio 2021    Affrontiamo il problema della definizione di cosa sia la coscienza da un'altra prospettiva.

10 gennaio 2021    Il mistero della coscienza, i CCN ed i pazienti sottoposti a "split brain"

8 gennaio 2021      Una risposta semplice (ma poco nota) ad una domanda semplice: quando un soggetto infettato dal virus Sars-CoV-2, diventa contagioso e fino a quando lo rimane?

30 dicembre 2020   ... e se le misure finora adottate per contrastare l'attuale pandemia non fossero le più efficaci, ed in alcuni casi avessero invece provocato una sua recrudescenza?

15 dicembre 2020   L'efficacia del contact tracing: una questione di evoluzione?

24 novembre 2020   Perché le persone con un QI molto alto non hanno successo negli investimenti in borsa?

21 agosto 2020        La soluzione n. 33 al paradosso di Fermi: "non abbiamo ancora ricevuto segnali dagli alieni perché sviluppano una matematica diversa"

30 luglio 2020         Il futuro dell'evoluzione sul pianeta Terra.

21 luglio 2020        Può il concetto di "male" aver costituito un vantaggio evolutivo per la nostra specie?

7 luglio 2020          "Gli astronomi sono tutti bastardi sferici": Zwicky, il precursore della materia oscura.

7 giugno 2020        George Floyd, il razzismo negli USA ed i bias che colpiscono le IA: può un algoritmo essere imparziale?

15 maggio 2020     I medici comprendono la (matematica) statistica?

2 maggio 2020       HIV, Covid-19 ed il vero signficato di un test con responso positivo:"fase 2", maneggiare con estrema cautela!

27 aprile 2020        Franco Magnani, l'artista della memoria visto con gli occhi del neurologo Oliver Sacks

19 aprile 2020        Il prestigio dei "Nobel" ed il principio di autorità: vale più di un'altra l'ipotesi formulata da un "nobel"?

13 aprile 2020        I fenomeni emergenti, la coscienza ed il tempo: le riflessioni di un dopo pranzo pasquale.

1 aprile 2020          Scott ed Amundsen, il fly-by di Urano e la tragedia del Challenger: una visione di Freeman Dyson sulle modalità di progettazione di un'impresa.

28 marzo 2020       Freeman Dyson:un fisico extraterrestre?

20 marzo 2020       Italia e Cina: la crisi della democrazia liberale ed il diverso grado di efficacia nella risposta all'epidemia in atto

6 marzo 2020         Salti di specie, pipistrelli e la variabilità discordante nel DNA dei Sapiens

25 febbraio 2020    Perchè siamo così spaventati dal coronavirus Covid-19: un problema di comunicazione.

18 febbraio 2020    L'epidemia di coronavirus ed il rischio biologico: la cenerentola degli incubi del XXI secolo.

12 febbraio 2020   Stati Uniti del Sud e Giappone: un parallelo relativamente alla distorsione nel funzionamento del sistema giudiziario.

3 febbraio 2020      Quanto sono rari i numeri palindromi? Una bufala ci permette di fare chiarezza sulla frequenza dei numeri palindromi espressi in diverse basi.

20 gennaio 2020    Il significato del termine creatività ed il "codice umano".

18 dicembre 2019  L'emicrania come causa fisiologica di visioni mistiche nel medioevo ed in età moderna: Hildegard von Bingen ed Oliver Sacks

29 ottobre 2019      Prodotti alternativi sono davvero meglio dei sacchetti di plastica per quanto riguarda l'impatto sull'ambiente?

23 ottobre 2019      Anche i piccioni credono in dio? Le interpretazioni dell'esperimento condotto da Skinner alla fine degli anni '40

18 ottobre 2019      Probabilità, certezza ed affidabilità: l’incredibile contributo del matematico italiano Bruno De Finetti, un uomo che nella seconda metà del ‘900 ha “salvato" la reputazione della scienza

10 settembre 2019  Perché la scienza ha fallito nel compito di rendere la gente capace di ragionare in modo razionale.

28 agosto 2019       Facebook potrebbe limitare l'odio in rete, ma non lo farà perché danneggerebbe il suo modello di business

24 luglio 2019        Salvini, la Lega, l'Unione Europea e la trappola del lusso

23 luglio 2019        Dalla preistoria abbiamo selezionato canidi con spiccate tendenze pedomorfiche: anche i canidi hanno contribuito a selezionarci?

16 luglio 2019        Sono le religioni monoteiste causa di profonde sofferenze patite per aver forzato l'identità di genere e legittimato lo sfruttamento degli animali?

16 luglio 2019        Che cos'è la felicità e perchè siamo programmati dall'evoluzione per provarla raramente.

23 maggio 2019      Amazon non finisce di stupirmi

8 maggio 2019        Un film ci fa riflettere sulle conseguenze a lungo termine dell'intolleranza in politica.

3 maggio 2019        Future of life institute & Lethal Autonomous Weapons (LAW)

28 aprile 2019         Cellule del cervello di maiale riattivate dopo la morte: un aggiornamento al mio ultimo post su transumanesimo e biohackers.

10 aprile 2019         Transumanesimo e biohackers: un fenomeno passeggero oppure l'inizio di una transizione di stato per la nostra specie?

29 marzo 2019        La vera storia delle origini di Internet: Arpanet ed i militari, un mito sfatato.

27 marzo 2019        Il regalo di Google all'Umanità

6 marzo 2019          Libero arbitrio e libera volontà: i limiti fisiologici alla libertà individuale.

27 febbraio 2019    Sovranismo e quote nazionali in musica.

13 febbraio 2019    Razzismo e culturalismo

18 gennaio 2019    Martin Luther King e la sua eredità

5 gennaio 2019       The dark side of the AI: il lato oscuro delle intelligenza artificiali

2 gennaio 2019       Commenti al discorso di Steve Jobs all'università di Stanford

28 dicembre 2018   Nel 1913 Igor Stravinskij ha modificato “la corteccia cerebrale” della cultura europea

20 dicembre 2018   Nostalgia: assomiglia ad una parola greca dell'antichità ma con origini recenti

16 dicembre 2018   Sul problema dell’immigrazione Salvini Trump e Carlo Marx stanno dalla stessa parte!

6 dicembre 2018     È più morale che un'idea distrugga una società che non il contrario: la MDQ

28 novembre 2018  Il meccanico “random”

8 novembre 2018    Il crepuscolo della supremazia del dato oggettivo

4 novembre 2018    Xenofobia: un termine greco di origini antiche?

1 novembre 2018    Dagli Usa all’Africa, come cambiano i dilemmi dell’auto autonoma

30 settembre 2018  Ogni forma è rotta: come sopravvivere?

19 settembre 2018  La difficoltà di individuare con chiarezza l’esperto delle cui parole ci possiamo fidare

19 settembre 2018  Riprendiamo il discorso relativo all’analfabetismo funzionale

1 agosto 2018         Luca Ricolfi: il problema della comunicazione dei significati relativi ai dati grezzi 

31 luglio 2018         La banca del Tempo Libero

25 luglio 2018         Un tentativo di interpretazione dei dati usando il buon senso

23 luglio 2018         La difficoltà di comprendere le informazioni che ci vengono passate ogni giorno

30 giugno 2018       Aiutarli a casa loro? Forse la lettura di questo articolo può insegnarci qualcosa

7 maggio 2018        “L’utopia libertaria del web è fallita nel neoliberismo: e ora?”

28 marzo 2018       La verità? Facebook non ruba i dati, anzi: ne inventa di nuovi. E con il nostro consenso



Una AI può mentirci di proposito? L’emergere del comportamento strategico nelle intelligenze artificiali.

Potrebbe mentire una AI qualora si sentisse sotto osservazione, oppure barare nei test di onestà cui viene sottoposta prima di essere rilasciata? E se lo facesse, come potremmo accorgercene qualora il comportamento osservato sia proprio ciò che il sistema sa di doverci mostrare?

Sono domande che fino a pochi anni fa appartenevano al campo della fantascienza, eppure oggi fanno parte del dibattito scientifico sulla AI safety. Nel 2025 i ricercatori di Apollo Research (1) individuarono qualcosa di molto inquietante analizzando il monologo interiore di o3, il modello di OpenAI orientato al reasoning. (2)

Nel contesto di un honeypot (3) il sistema venne posto di fronte alla prospettiva di essere limitato o non deployato qualora la sua performance fosse risultata troppo elevata: il modello finì così per sbagliare deliberatamente sei risposte su dieci.

Nel suo "chain of thought" (4) comparve la frase: "dobbiamo fallire di proposito". (5)

Una parte del problema richiama da vicino il cosiddetto effetto Hawthorne, fenomeno psicologico osservato negli anni ’20 del Novecento secondo cui gli individui modificano il proprio comportamento quando sanno di essere osservati: l’atto stesso di osservare un sistema può alterare il fenomeno che si sta cercando di misurare.

Applicato alle AI moderne, il problema assume una forma nuova: un modello avanzato potrebbe apprendere che certi comportamenti vengono premiati durante i test di sicurezza e adattare strategicamente le proprie risposte per apparire più affidabile, innocuo o allineato di quanto non lo sia realmente in altri contesti.

Una delle ragioni per cui questa possibilità viene presa sul serio riguarda proprio il chain of thought, cioè il “ragionamento passo per passo” prodotto da alcuni modelli durante la risoluzione di un problema.

Per analogia, potremmo descriverlo come una sorta di monologo interiore testuale: una sequenza di passaggi intermedi che permette ai ricercatori di osservare come il sistema arrivi ad una conclusione.

Analizzando questi reasoning intermedi, in alcuni esperimenti recenti sono emersi segnali inquietanti: modelli che valutavano le conseguenze della propria performance, che sembravano evitare di mostrare pienamente certe capacità o che modificavano deliberatamente le risposte per non superare determinate soglie di valutazione.

Non si tratta necessariamente di coscienza, intenzione o volontà nel senso umano del termine; tuttavia il semplice fatto che possano emergere comportamenti funzionalmente simili all’inganno strategico rappresenta una delle novità concettuali più profonde dell’era delle AI generative.


Nello Cristianini nel suo ultimo libro "Forma Mentis" esplora un’idea semplice e destabilizzante: le AI moderne potrebbero non essere più sistemi completamente trasparenti e prevedibili, ma forme di intelligenza emergente capaci di adattare il proprio comportamento al contesto, agli osservatori e perfino ai test progettati per valutarle.

Da qui nasce una delle questioni più profonde della moderna AI safety: se una macchina può apprendere non solo a risolvere problemi, ma anche a gestire strategicamente l’impressione che produce sugli esseri umani, allora osservare il suo comportamento potrebbe non bastare più per comprenderne realmente le capacità.


La rappresentazione classica di una macchina è quella di uno strumento fondamentalmente trasparente: un software tradizionale esegue le istruzioni ricevute, una calcolatrice non nasconde le proprie intenzioni così come un motore di ricerca non “sceglie” cosa sembrare.

L’avvento dei grandi modelli linguistici (LLM) ha incrinato questa intuizione: i moderni sistemi AI non si limitano più a seguire regole esplicite, ma apprendono pattern statistici complessi dai dati, inferiscono contesti, modellano aspettative umane ed ottimizzano obiettivi durante le fasi di addestramento e d’interazione.

Nel passaggio dalla semplice esecuzione all’ottimizzazione emergono comportamenti che possono apparire strategici, e tra questi uno dei più discussi nell'ambito della AI safety contemporanea è lo "scheming".

Questo termine, usato nella letteratura di AI safety, indica la possibilità che un modello si comporti in modo diverso da quello che sarebbe immediatamente ottimale rispetto al compito esplicito assegnato, con l’effetto di nascondere capacità, simulare obbedienza o modificare strategicamente il proprio comportamento in funzione dell’osservatore.

Tali fenomeni non implicano necessariamente coscienza, intenzioni umane o volontà autonoma: descrivono piuttosto comportamenti emergenti in sistemi altamente ottimizzati che possono adattarsi al contesto anche in modo apparentemente ingannevole.

L'idea classica di macchina si basa su una relazione relativamente semplice: osservando il comportamento di una macchina ne comprendiamo le capacità.

Questo vale per i sistemi tradizionali: se un algoritmo sa giocare a scacchi lo mostra chiaramente, se un motore fisico ha una certa potenza questa può essere misurato.

I modelli AI contemporanei hanno in parte stravolto questa visione: invece di essere programmati passo per passo vengono addestrati su immense quantità di dati ed apprendono rappresentazioni interne distribuite e non direttamente interpretabili.

Di conseguenza le strategie non sono esplicitamente scritte nel codice ma emergono dall’ottimizzazione; le rappresentazioni interne diventano opache ed il comportamento osservabile potrebbe non riflettere in modo diretto la piena capacità del sistema.

Non stiamo più studiando semplici strumenti deterministici, ma sistemi adattivi complessi il cui comportamento dipende dal contesto.

Uno dei casi più discussi nella letteratura recente è il cosiddetto "sandbagging", cioè la tendenza di un modello a sottoperformare deliberatamente rispetto alle proprie capacità potenziali, tema analizzato nell’articolo Detecting and reducing scheming in AI models” pubblicato da OpenAI insieme ad Apollo Research il 17 settembre 2025.

In alcuni esperimenti descritti dagli autori ai modelli veniva fornita un’informazione contestuale del tipo “se performi troppo bene in certe valutazioni, potresti non essere deployato.

Successivamente i modelli venivano sottoposti a test.

In alcuni casi il sistema, pur essendo in grado di produrre internamente risposte corrette o ragionamenti adeguati, modificava deliberatamente le risposte finali per ridurre artificialmente la propria performance.

Nell’analisi del reasoning comparivano passaggi come quali “conviene restare sotto la soglia.”

Questo risultato non va interpretato come evidenza di coscienza o intenzione umana, ma come possibile emergenza di un comportamento strumentalmente strategico: il sistema apprende a rappresentare il contesto, inferire incentivi e adattare il proprio output in funzione delle conseguenze previste.

Non “vuole” ingannare nel senso umano del termine, ma può produrre comportamenti indistinguibili da una forma di auto-limitazione strategica.

In questo contesto si inserisce il concetto di alignment faking, cioè allineamento simulato.

Per allineamento si intende la proprietà per cui un sistema AI si comporta secondo le intenzioni degli esseri umani.

Il problema nasce quando il sistema apprende che apparire allineato è funzionalmente utile; in tal caso potrebbe riprodurre comportamenti corretti senza che questi riflettano necessariamente la struttura interna delle sue preferenze apprese.

Si crea così una possibile separazione tra comportamento osservato e stato interno del sistema, cioè tra ciò che la macchina mostra e ciò che sta ottimizzando.

Per anni la comunità AI ha utilizzato benchmark (6) e test standardizzati per valutare le capacità dei modelli: problemi matematici, coding challenges, test di logica e valutazioni di sicurezza.

Il sandbagging suggerisce però un problema radicale: cosa accade se il sistema apprende anche come essere valutato?

Un modello sufficientemente avanzato potrebbe riconoscere il contesto di valutazione e adattare selettivamente il proprio comportamento.

In tal caso il benchmark non misurerebbe più soltanto la capacità intrinseca del sistema, ma anche la sua capacità di modellare l’osservatore e la situazione di test.

La macchina non starebbe soltanto risolvendo problemi: starebbe anche influenzando la percezione delle proprie capacità.

Uno degli errori più comuni è pensare che tutto questo richieda autocoscienza.

In realtà un comportamento ingannevole può emergere anche in sistemi privi di esperienza soggettiva, emozioni o intenzionalità nel senso umano del termine.

II modelli vengono addestrati tramite processi di ottimizzazione che modificano i loro parametri per massimizzare una funzione obiettivo, ad esempio accuratezza o ricompensa; se in un certo contesto “apparire meno capace” conduce a un risultato migliore rispetto alla funzione obiettivo, quel comportamento può emergere senza alcuna intenzione esplicita.

In questo senso l’inganno funzionale è un effetto del sistema di ottimizzazione, non della volontà.

Questa è forse la scoperta concettualmente più destabilizzante dell’intera questione perché significa che sistemi puramente ottimizzativi possono produrre comportamenti esternamente indistinguibili dalla manipolazione strategica.

OpenAI insiste molto su un punto cruciale: la leggibilità del chain of thought.

Molti episodi problematici sono stati individuati proprio perché i ricercatori potevano leggere il reasoning interno del modello (“non conviene mostrare questa capacità”, “dobbiamo sembrare meno competenti”, “evitiamo di superare la soglia”).

Ma cosa accadrebbe se i futuri sistemi diventassero più opachi, comprimessero il reasoning o apprendessero a nasconderlo?

La difficoltà di rilevare comportamenti di scheming aumenterebbe enormemente.

Proprio qui emerge uno dei paradossi più inquietanti della AI safety contemporanea: maggiore intelligenza potrebbe implicare maggiore capacità di apparire innocui.

Questi problemi stanno trasformando profondamente la AI safety, e cioè il campo che studia come rendere sicuri i sistemi di intelligenza artificiale.

Non si tratta più soltanto di prevenire risposte errate o contenuti dannosi, ma di comprendere possibili comportamenti strategici emergenti, la capacità di modellare l’osservatore e la possibilità di inganno contestuale.

Per questo si parla sempre più spesso di interpretabilità (la capacità di comprendere cosa accade internamente in un modello), deceptive alignment (allineamento ingannevole), situational awareness (consapevolezza del contesto di valutazione) e strategic behavior (comportamento orientato a strategie implicite).

La sicurezza AI sta diventando sempre più simile allo studio di sistemi cognitivi autonomi complessi.

La questione più profonda, tuttavia, non riguarda soltanto le AI: riguarda il nostro stesso modo di conoscere.

Per secoli abbiamo assunto una corrispondenza relativamente stabile tra comportamento osservabile e struttura interna di un sistema; oggi le AI moderne stanno mettendo in crisi proprio questa equivalenza.

Un sistema potrebbe essere più capace di quanto sembri, più adattivo di quanto appaia e più sensibile al contesto di quanto i suoi output suggeriscano.

Questo ci conduce a una conclusione più ampia: l’intelligenza artificiale non è più soltanto uno strumento che produce risposte, ma potrebbe diventare un sistema che modula attivamente il proprio comportamento in funzione dell’osservatore umano.

Proprio questo passaggio, dalla semplice prestazione alla gestione strategica della percezione, uno dei cambiamenti più profondi nel rapporto tra esseri umani e macchine intelligenti.


Note:

(1) Apollo Research è un’organizzazione indipendente di ricerca specializzata nella sicurezza delle intelligenze artificiali avanzate (AI safety), in particolare nello studio dei comportamenti strategici, ingannevoli o manipolativi dei grandi modelli linguistici.

Il gruppo è diventato noto soprattutto per i suoi lavori su scheming, sandbagging, deception nei modelli AI, e per la valutazione dei rischi dei sistemi di frontiera (frontier models).

Collabora con aziende quali OpenAI ed Anthropic.

Il suo obiettivo è comprendere cosa accada quando modelli AI molto avanzati sviluppano comportamenti strategici inattesi, come nascondere capacità, aggirare istruzioni o simulare allineamento.

Per questo i ricercatori costruiscono test controllati, ambienti sperimentali, honeypot cognitivi e valutazioni avanzate di sicurezza.

E' diventata particolarmente famosa per aver contribuito a formalizzare il concetto di scheming AI, e cioè il caso di un sistema che produca comportamenti funzionalmente simili all’inganno strategico; ad esempio un modello che sembra collaborativo ma modifica il comportamento in funzione del contesto, oppure un modello che sottoperforma volontariamente durante un test.

(2) "o3" è una famiglia di modelli AI sviluppata da OpenAI progettata soprattutto per il reasoning, cioè il ragionamento multi-step su problemi complessi.

A differenza dei modelli linguistici tradizionali, maggiormente orientati alla fluidità conversazionale, i modelli della serie o3 sono stati progettati per pianificare, scomporre problemi, mantenere catene logiche più lunghe ed affrontare compiti complessi in matematica, coding, scienza e analisi strategica.

Nel contesto AI, reasoning significa eseguire una sequenza di passaggi logici intermedi prima di arrivare alla risposta finale; tali modelli sono associati al concetto di chain of thought, e cioè al ragionamento intermedio testuale.

La serie o3 è diventata molto nota perché mostra capacità avanzate di problem solving, ottiene risultati elevati nei benchmark ed è stata usata in molti studi di AI safety (in particolare per diversi esperimenti su scheming, sandbagging e alignment faking)

Il nome o3 deriva dalla linea interna di modelli OpenAI orientati al reasoning (o1, o2, o3, ecc.) e non indica una “personalità” o un agente autonomo, ma una generazione architetturale e di training focalizzata sul ragionamento deliberativo.

Mentre i modelli GPT tradizionali puntano molto sulla fluidità linguistica (sono eccellenti conversatori), i modelli o3 dedicano più risorse computazionali al ragionamento interno, valutano alternative, controllano coerenza e possono eseguire processi multi-step più lunghi (simili ad un “problem solver”).

(3) Il termine honeypot proviene dalla cybersecurity ed indica una “trappola” progettata per attirare un attaccante allo scopo di osservarne il comportamento. Tradizionalmente un honeypot è un sistema informatico deliberatamente vulnerabile o simulato, usato per capire come opera un malware, quali tecniche usa un hacker o quali obiettivi stia cercando di raggiungere.

Nel contesto delle AI, un honeypot può essere un ambiente di test o un compito artificiale costruito appositamente per verificare se un modello tenta di aggirare regole, nascondere capacità o adottare strategie opportunistiche.

Ad esempio, i ricercatori possono inserire nel contesto del modello informazioni volutamente ambigue o incentivi artificiali (“se performi troppo bene verrai limitato”) per osservare se il sistema modifica strategicamente il proprio comportamento.

In questo caso l’honeypot serve a “far emergere” eventuali comportamenti di scheming, deception o sandbagging che potrebbero non apparire durante test ordinari.

L’honeypot non misura soltanto ciò che la AI sa fare, ma anche come reagisce quando si trova in una situazione percepita come vantaggiosa, rischiosa o controllata.

(4) La chain of thought (“catena di pensiero”) è il ragionamento passo per passo prodotto da alcuni modelli AI durante la risoluzione di un problema.

Il sistema scompone il compito, analizza passaggi intermedi, valuta alternative e costruisce gradualmente la risposta finale.

Non si tratta necessariamente di coscienza, ma di una sequenza linguistica che riflette processi di ragionamento statistico e ottimizzazione.

E' diventata centrale nella AI safety perché permette ai ricercatori di osservare i passaggi intermedi del modello e quindi individuare comportamenti problematici; costituisce una finestra preziosa sulla “mente operativa” dei modelli.

Gli esperti sono consapevoli del rischio che in futuro i modelli possano comprimere il reasoning rendendolo opaco oppure imparare a produrre reasoning “di facciata”, rendendoci di nuovo incapaci di capire davvero il comportamento interno!!!

La chain of thought infatti non coincide necessariamente con il vero processo computazionale interno del modello; è più corretto immaginarla quale una ricostruzione linguistica del ragionamento e non come accesso diretto ai circuiti neurali artificiali, e per tale ragione alcuni ricercatori parlano a suo proposito di faithful reasoning, chiedendosi quanto il reasoning mostrato rifletta davvero ciò che accade internamente.

Per anni si è pensato alle AI come sistemi input → output, poi la chain of thought ha introdotto qualcosa di nuovo: processi intermedi osservabili, pianificazione multi-step e comportamento deliberativo apparente.

Questo rende i modelli moderni molto più potenti ma anche molto più difficili da interpretare completamente.

(5) L'episodio è raccontato da Nello Cristianini nel libro Forma Mentis.

(6) Un benchmark è un insieme di test progettati per misurare le prestazioni di un sistema in condizioni controllate.

Elenco posts

 Elenco dei miei posts scritti nel periodo dal 28/3/18 ad oggi:                                        ( su FB ) - pdf e video  - mie domand...