Wygenerowane modele nanodiamentów w kształcie: a) płyty, b) supersfery, c) pręta. Źródło: https://doi.org/10.1038/s41598-025-24143-z

Uczenie maszynowe przewiduje kształt nanokryształów diamentu

 

27-02-2026

Artykuł naukowców z Narodowego Centrum Badań Jądrowych oraz Instytutu Wysokich Ciśnień PAN na ten temat ukazał się w czasopiśmie Nature Scientific Reports. Badacze wykorzystali algorytmy uczenia maszynowego do określania kształtu i struktury powierzchni nanodiamentów na podstawie danych dyfrakcyjnych, osiągając skuteczność sięgającą 99%.

Uczenie maszynowe (ML) stało się powszechną metodą przetwarzania informacji w różnych dziedzinach nauki. Metody ML potrafią odkryć niewidoczne innymi metodami zależności, które dają nowe spojrzenie na wiele problemów badawczych. Poznanie właściwości materiałów nanokrystalicznych na podstawie badań dyfrakcyjnych wymaga zastosowania specjalistycznego oprogramowania. Ze względu na specyfikę budowy nanoziaren, precyzyjne informacje dotyczące ich wielkości, kształtu i struktury atomowej, zawarte w danych dyfrakcyjnych, nie są łatwo dostępne. Skomplikowane procedury obliczeniowe i modele wykorzystujące dynamikę molekularną mogą dostarczać tych informacji, jednak ze względu na złożoność i czasochłonność, nie są przyjmowane jako standardowa metoda do charakteryzacji nanomateriałów.

Przełom w tej dziedzinie przyniosło upowszechnienie wykorzystania sztucznej inteligencji, a zwłaszcza metod uczenia maszynowego. Algorytmy ML zrewolucjonizowały obszar przetwarzania informacji i analizy statystycznej. Dane pochodzące z eksperymentów, jak również sprawdzone modele komputerowe mogą być podstawą do uczenia klasyfikatorów, które pozwalają na uwidocznienie nieznanych wcześniej związków pomiędzy właściwościami materiałów. Wczesne badania pokazały, że techniki ML, takie jak sieci neuronowe mogą być z powodzeniem zastosowane w celu określenia rozmiarów i kształtu nanokryształów. W nowej pracy opublikowanej w Nature Scientific Reports, naukowcy z Narodowego Centrum Badań Jądrowych (NCBJ) i Instytutu Wysokich Ciśnień PAN przyjrzeli się bliżej temu zagadnieniu i przedstawili wyniki dla kilku różnych algorytmów uczenia maszynowego.

Podstawę do wytrenowania trzech algorytmów: Lasu Losowego (Random Forest, RF), Sieci Neuronowej (Neural Network, NN) oraz algorytmu dokonującego regularyzacji wyników końcowych, opartego na ulepszonej technice gradientowej (eXtreme Gradient Boosting, XGB) stanowiły dane pochodzące symulacji z wykorzystaniem metody Dynamiki Molekularnej. Niemożność użycia w tym celu rzeczywistych danych eksperymentalnych wynika z braku dostępności zbiorów danych nanomateriałów o precyzyjnie zadanym kształcie i wielkości. Wcześniejsze badania wykazały jednak, że dynamika molekularna poprawnie odwzorowuje rzeczywistą strukturę nanoziaren. Przedmiotem badań zostały nanokryształy diamentu – ze względu na prostotę ich struktury oraz jej duże podobieństwo do wielu powszechnie używanych nanomateriałów, takich jak CdSe, ZnO, SiC, czy GaN. Praca stanowiła dodatkowo weryfikację badań eksperymentalnych, jakie przeprowadzono wcześniej na rzeczywistych nanodiamentach.

Modele nanodiamentów podzielono na trzy kategorie w zależności od kształtu – jednowymiarowe pręty (rods), dwuwymiarowe płyty (plates) i trójwymiarowe supersfery/superelipsoidy. Na ich podstawie dokonano symulacji dynamiki molekularnej, aby uzyskać strukturę krystaliczną bliską tej występującej w rzeczywistym świecie. Dla uzyskanych struktur obliczono odpowiadające im widma rentgenowskie. W szczególności, do dalszych analiz wykorzystywano funkcje struktury S(Q), która zawiera w sobie informacje o strukturze krystalicznej. – W trakcie przygotowywania danych okazało się, że nie ma potrzeby badania wszystkich wartości tej funkcji, ponieważ dane dyfrakcyjne w dużym stopniu powielają informacje. Dokładne przewidywania można otrzymać po przeanalizowaniu niemal każdego dowolnie wybranego przedziału wartości. Jest to istotne z punktu widzenia danych eksperymentalnych, które mogą różnić się znacząco od teorii i wymagać ograniczania wartości funkcji struktury – wyjaśnia dr Kazimierz Skrobas z Zakładu Syntezy i Charakteryzacji Materiałów NCBJ, pierwszy autor publikacji.

Wytrenowane przy pomocy symulowanych danych algorytmy uczenia maszynowego zastosowano do identyfikacji rzeczywistych nanoziaren o różnej wielkości. – Wszystkie algorytmy były w stanie z wysoką skutecznością (96-99%) rozpoznać kształt ziaren, choć skuteczność ta zależała od branych pod uwagę wierzchołków dyfrakcyjnych w widmie rentgenowskim. Te wyniki pozwoliły nam na pogłębione badania powierzchni nanodiamentów o kształcie płyt – dodaje dr Kazimierz Skrobas. Algorytmy wykorzystano do charakteryzacji topografii powierzchni pod względem występowania atomów z jednym bądź trzema „wolnymi wiązaniami” (ang. „dangling bonds”). Metody uczenia maszynowego były w stanie poprawnie określić rodzaj powierzchni w przypadku, gdy dane dyfrakcyjne nie zawierały wierzchołka 111. Jego obecność powodowała błędy i nieprawidłowe przewidywania, co mogło być spowodowane niewystarczająco precyzyjnymi danymi eksperymentalnymi.

Praca grupy badawczej pokazała, że algorytmy uczenia maszynowego, takie jak Las Losowy, sztuczna Sieć Neuronowa, czy algorytm XGB mogą z powodzeniem zostać wykorzystane do charakteryzacji nanoziaren. Sposób działania tych metod sprawia, że przy odpowiednich danych referencyjnych do wytrenowania modelu, działają bardziej efektywnie, niż konwencjonalne narzędzia analityczne. Zgodność wyników uzyskanych przez różne algorytmy dodatkowo potwierdza poprawność ich działania. Co więcej, badania udowodniły, że dane dyfrakcyjne cechują się wysokim stopniem powielenia informacji, co pozwala ograniczyć zakres wykorzystanych wartości i potencjalnie usunąć obszary narażone na błędy i niższą precyzję bez utraty jakości przewidywania.

Pełne wyniki badań są dostępne w publikacji:

Skrobas, K., Stefańska-Skrobas, K., Stelmakh, S. et al. Application of machine learning for nanodiamonds shape and surface classification based on X-ray pattern analysis. Sci Rep 15, 40304 (2025). https://doi.org/10.1038/s41598-025-24143-z