Elementi e materiali
Gli elementi della tavola periodica e i materiali che fanno il mondo.
In sintesi
- È un database pubblico di proprietà computazionali di oltre 140 000 materiali inorganici, calcolate con DFT e mantenute dall’iniziativa Materials Genome americana.
- Il convex hull delle energie di formazione è la superficie che connette le fasi più stabili per ogni composizione.
- Si costruisce un modello surrogato (tipicamente un processo gaussiano) che stima la proprietà target in tutto lo spazio dei parametri con una misura di incertezza.
- Perché S, σ e κe sono fisicamente interdipendenti attraverso la densità elettronica: aumentare σ riduce generalmente S (relazione di Wiedemann-Franz tra σ e κe).
Identificare un nuovo materiale con le proprietà desiderate tra le decine di migliaia di composti in un database computazionale richiede una strategia sistematica. La materials informatics e lo screening ad alto throughput combinano database, calcoli automatizzati e machine learning per ridurre uno spazio di 105–106 candidati a una manciata di proposte da sintetizzare in laboratorio.
Questo articolo descrive i principali database, la logica a imbuto del workflow tipico e i risultati concreti ottenuti nella scoperta di materiali termoelettrici, catalizzatori e materiali per batterie.
I grandi database computazionali
La materials informatics si poggia su banche dati di proprietà calcolate con DFT per decine o centinaia di migliaia di strutture. I più usati internazionalmente sono:
- Materials Project (materialsproject.org): oltre 140 000 materiali inorganici con energia di formazione, band gap, proprietà elastiche, dati di solubilità.
- AFLOWLIB (aflowlib.org): più di 3⋅106 composti calcolati con il framework automatizzato AFLOW; include proprietà strutturali, termodinamiche ed elettroniche.
- OQMD (Open Quantum Materials Database): oltre 800 000 strutture, focalizzato su energie di formazione e hull convex.
- NIST JARVIS: include proprietà meccaniche, ottiche e topologiche calcolate con funzionali diversi (DFT, DFT+U, van der Waals).
- Polymer Genome: database specifico per polimeri con proprietà dielettriche e di trasporto.
Questi database sono pubblici e continuamente aggiornati: sono la materia prima indispensabile per qualunque studio di ML su larga scala.
La logica a imbuto: filtrare prima di calcolare
Lo screening non calcola tutto per tutti: usa filtri a costo crescente. Il primo livello è spesso la stabilità termodinamica: un composto viene mantenuto solo se la sua energia di formazione è al di sotto della superficie di hull convex, cioè se non decompone spontaneamente in fasi più stabili. Questo filtro elimina immediatamente la maggioranza dei candidati ipotetici. Il secondo livello può riguardare la proprietà target (ad esempio, band gap in un certo intervallo per un fotovoltaico, o bassa conduttività termica reticolare per un termoelettrico). Solo i pochi che superano tutti i filtri vengono sintetizzati.
Termoelettrici: il figure-of-merit ZT
Un esempio paradigmatico di screening ad alto throughput è la ricerca di materiali termoelettrici efficienti. Un termoelettrico converte il calore in elettricità e la sua prestazione si riassume nel figure-of-merit adimensionale:
ZT = S2σκe + κl T (figure-of-merit termoelettrico)
dove S è il coefficiente di Seebeck, σ la conduttività elettrica, κe e κl le conduttività termiche elettronica e reticolare, T la temperatura assoluta. Un buon termoelettrico deve avere contemporaneamente alto S, alta σ e bassa κl: proprietà intrinsecamente antagoniste. Ottenere ZT > 1 è già notevole; ZT > 2 è considerato eccellente.
Lo screening automatizzato dell’AFLOWLIB ha analizzato il fattore di potenza (S2σ) di oltre 79 000 composti half-Heusler, identificando quelli con nanograni come i più promettenti. Successivamente, modelli ML addestrati su database di conduttività termica hanno permesso di filtrare anche κl, portando a una selezione ancora più mirata. Un punto interessante emerso da questi studi ML è che le stesse caratteristiche di legame chimico (natura ionica/covalente) che controllano S2σ influenzano anche κl: il ML ha rivelato una connessione nascosta tra due proprietà altrimenti considerate indipendenti.
Catalisi: la relazione di Sabatier e i volcano plot
Nello screening di catalizzatori per la reazione di evoluzione dell’idrogeno (HER), il criterion chiave è l’energia di adsorbimento dell’idrogeno ΔGH: né troppo forte (il prodotto non si stacca), né troppo debole (il reagente non si attiva). Il calcolo DFT di ΔGH per centinaia di superfici metalliche, combinato con ML su descrittori composizionali, ha prodotto “volcano plot” che identificano rapidamente i metalli di transizione ottimali. Questo approccio ha guidato la scoperta di catalizzatori bimetallici con prestazioni vicine al platino a costo molto inferiore.
Batterie: materiali catodici e anodici
Per i catodi delle batterie agli ioni di litio, i requisiti sono alto potenziale di ossidoriduzione, alta capacità specifica e stabilità durante il ciclaggio. Un dataset di 40 000 strutture tavorite calcolate con DFT è stato utilizzato per identificare candidati con voltaggio e capacità ottimali, riducendo da migliaia a poche decine le strutture da sintetizzare. L’ottimizzazione bayesiana completa questi workflow quando lo spazio dei parametri di sintesi (temperatura, composizione del drogaggio) è continuo: un surrogate model viene aggiornato iterativamente con pochi esperimenti ad alto costo, convergendo rapidamente verso l’ottimo.
Sfide aperte: trasferibilità e validazione sperimentale
Il limite più ricorrente dei workflow ad alto throughput è la trasferibilità dei modelli: un ML addestrato su una classe di materiali (es. half-Heusler) funziona male su un’altra (es. perovskiti ossidici). Algoritmi come “guided patchwork kriging” cercano di costruire modelli più generali combinando modelli locali. L’altro problema è la validazione: anche un materiale con ZT predetto di 2.5 può non funzionare nella pratica per ragioni di sintesi, interfacce, o instabilità chimica a alta temperatura. La sintesi sperimentale rimane l’ultimo giudice.
Riepilogo: database principali e proprietà coperte
| Database | N. strutture | Proprietà chiave |
|---|---|---|
| Materials Project | >140 000 | Ef, band gap, elasticità, magnetismo |
| AFLOWLIB | >3⋅106 | Struttura, termodinamica, elettronica |
| OQMD | >800 000 | Ef, hull convex, stabilità |
| NIST JARVIS | >55 000 | Meccanica, ottica, topologia |
| Polymer Genome | >13 000 | Dielettrico, gap, Tg |
Dalla teoria alla conformità. Se questo argomento riguarda un prodotto che produci, importi o vendi, può tradursi in un obbligo normativo concreto: vedi il nostro servizio di classificazione ed etichettatura CLP e richiedi una verifica del tuo caso.
Domande frequenti
Che cos’è il Materials Project?
È un database pubblico di proprietà computazionali di oltre 140 000 materiali inorganici, calcolate con DFT e mantenute dall’iniziativa Materials Genome americana. Ogni struttura ha energia di formazione, band gap, proprietà elastiche e più. Accessibile via API Python (pymatgen), è la fonte dati più usata nei lavori di ML per i materiali.
Cos’è il convex hull e perché è usato come primo filtro?
Il convex hull delle energie di formazione è la superficie che connette le fasi più stabili per ogni composizione. Un composto “sopra l’hull” è termodinamicamente instabile: decomporrebbe spontaneamente. Lo screening usa la distanza dall’hull (energia sopra l’hull, in meV/atomo) come primo filtro: solo i composti sotto o vicino all’hull sono candidati realistici per la sintesi.
Come funziona l’ottimizzazione bayesiana nella scoperta di materiali?
Si costruisce un modello surrogato (tipicamente un processo gaussiano) che stima la proprietà target in tutto lo spazio dei parametri con una misura di incertezza. In ogni iterazione si sceglie il candidato che massimizza una funzione di acquisizione (che bilancia exploitation dell’ottimo corrente e exploration delle regioni incerte). Si esegue il calcolo reale sul candidato, si aggiorna il surrogato e si ripete. In questo modo si trovano ottimi con molte meno valutazioni rispetto a un grid search.
Perché il figure-of-merit ZT è difficile da ottimizzare?
Perché S, σ e κe sono fisicamente interdipendenti attraverso la densità elettronica: aumentare σ riduce generalmente S (relazione di Wiedemann-Franz tra σ e κe). L’unica proprietà ottimizzabile quasi indipendentemente è la conduttività termica reticolare κl, che dipende dai fononi. Per questo molte strategie puntano a ridurre κl tramite nanodifetti, atomi “rattler” e nanostrutturazione.
Quanti materiali vengono sintetizzati dopo uno screening?
Tipicamente meno dell’1% dei candidati iniziali. Uno screening che parte da 10 000 strutture porta di solito a 10–50 candidati prioritari per la sintesi. Non tutti vengono sintetizzati: si tengono quelli con il miglior rapporto promesse/costo sintetico. La percentuale di successo nella sintesi varia: in alcuni campi (es. perovskiti alogenuri) può essere alta (>50%); in altri (leghe refrattarie complesse) è spesso inferiore al 20%.
Vuoi una verifica sul tuo caso?
Raccontaci cosa produci, importi o vendi: ti diciamo con chiarezza cosa serve per essere in regola, senza tecnicismi inutili e senza blocchi di vendita o spedizione.
Avvertenza. Questo articolo ha finalità informative e divulgative e riflette la normativa vigente alla data di pubblicazione; le scadenze indicate possono essere modificate da provvedimenti successivi. Non sostituisce la verifica tecnica del singolo prodotto e del caso specifico. A cura della Redazione di ChimicaConforme.