Paul Jensen, un biologo dei sistemi microbici presso l’Università del Michigan ad Ann Arbor, voleva vedere se gli strumenti di intelligenza artificiale (AI), come i modelli linguistici di grandi dimensioni, potessero sintetizzare la ricerca su diversi microrganismi. Così ha individuato tutti i documenti rilevanti su una specie batterica studiata nel suo laboratorio, un organismo che causa la carie Streptococco sobrinus – ma scoprì che li aveva già letti tutti, qualche dozzina in totale.
Molti microbiologi si troveranno in una posizione simile, o addirittura peggiore. In uno studio pubblicato la settimana scorsa sul server di pubblicazione preliminare bioRxiv1Jensen ha scoperto che solo 10 specie batteriche rappresentano la metà di tutte le pubblicazioni, mentre quasi tre quarti di tutti i batteri nominati non hanno un solo articolo a loro dedicato.
“Abbiamo imparato molto su un piccolo numero di specie”, afferma Jensen. Ma “per molti batteri non c’è nulla che possa essere letto da un modello linguistico o da un’intelligenza artificiale”. I microbi importanti per la salute umana e terrestre sono particolarmente poco studiati, dicono i ricercatori.
Microbo modello
Come altri scienziati della vita, i microbiologi studiano organismi modello, nella speranza che le intuizioni raccolte da ricercatori di laboratorio ben educati come Escherichia coli sarà rilevante per altri organismi.
In molti casi lo sono: le basi della biologia molecolare sono costituite da esperimenti in Escherichia coli. Ma man mano che gli scienziati ampliano il catalogo della vita microbica con ogni tampone di pelle, cacca o campione di terreno che sequenziano, aumenta la possibilità di scoprire informazioni nuove e insolite.
Per quantificare la parzialità della microbiologia verso un piccolo numero di organismi modello, Jensen ha consultato un database di 43.409 specie batteriche uniche e ha contato il numero di articoli indicizzati da PubMed – un archivio di letteratura biomedica gestito dal governo statunitense – che menziona ciascuna specie nel titolo o nell’abstract.
Non sorprende che Escherichia coli risulta primo con oltre 312.000 pubblicazioni, pari al 21% del totale. Il resto della top 10 era costituito principalmente da agenti patogeni umani, come Stafilococco aureoun’infezione opportunistica, Mycobacterium tuberculosis E Helicobacter pyloriun microbo dello stomaco che può causare ulcere e persino il cancro (vedi “Batteri più studiati”).
Ma il 74% delle specie batteriche non è stato menzionato nel titolo o nell’abstract di alcun articolo indicizzato (“Microbi ignorati”). E anche il divario tra i batteri conosciuti e quelli studiati è cresciuto negli ultimi 25 anni, in parte grazie agli studi sul microbioma che sequenziano i microbi in massa.
Organismi poco studiati
Nicola Segata, scienziato del microbioma presso l’Università di Trento in Italia, è costernato dalle conclusioni dello studio, ma non sorpreso. Con una o due eccezioni, i microbi abbondanti nei microbiomi umani sani non rientrano nell’elenco dei 50 batteri meglio studiati. E molti organismi importanti per la salute umana che Segata e altri hanno scoperto non sono stati nemmeno nominati, e ancor meno studiati. “Queste specie hanno ancora molta strada da fare prima di essere studiate al livello che meritano”, aggiunge.
Anche i microbi presenti in diversi ecosistemi, come negli oceani e nel suolo, sono decisamente poco studiati, osserva Brett Baker, ecologo microbico dell’Università del Texas ad Austin. “Nessuno degli organismi dominanti in natura è presente in questa lista”, afferma. “Questo è un problema.”