Поиск по сайту Поиск

Разработка новых полупроводников с помощью нейросетей

Поиск и исследование новых химических соединений с большим числом неизвестных свойств во многом опирается на вычислительные методы. Применение подобных открытий способно помочь в решении многих задач, в первую очередь — возрастающих экологических проблем и разработки новых лекарств. В этой статье мы расскажем, как машинное обучение используется при создании новых полупроводниковых материалов.

Отправной точкой современной физической электрохимии можно считать 1986 год, когда инженеры IBM обнаружили низкотемпературную сверхпроводимость у некоторых керамических соединений. Стало понятно, что синтетические материалы при определённых условиях ведут себя необычно: меняют температуру плавления, проявляют сверхпроводимость, электронные свойства полупроводников и изоляторов. Однако, существование таких материалов (особенно, в практическом диапазоне температур и давлений) — большая редкость, поскольку основано на удачном сочетании многих тысяч физико-химических параметров.

Традиционно для поиска новых частиц используются два метода: теория функционала плотности (Density Functional Theory, DFT) и предсказание кристаллической структуры (Crystal Structure Prediction, CSP). Первый применяется для расчёта электронного строения молекул, а второй — для прогнозирования параметров кристаллической решётки вещества.

Не так давно появился новый класс методов, основанный на алгоритмах машинного обучения. Модели создаются с помощью данных экспериментальных наблюдений DFT, таких, как OQMD, Materials Project и AFLOWlib, и могут быть нацелены на прогнозирование химических пространств для материалов с благоприятными свойствами. 

Несмотря на эффективность этих разработок, у них есть довольно существенный недостаток: они часто предсказывают химический состав соединения, не давая никакой информации о его кристаллической структуре. А знание расположения атомов в кристаллической решётке — необходимое условие для дальнейших вычислений и расчётов. Поэтому важно найти методы, позволяющие получить эту информацию.

Чтобы решить эту проблему, группа исследователей объединила две модели машинного обучения: первая прогнозирует свойства материалов на основе их химического состава, а вторая — термодинамическую стабильность (энтальпию) и ширину запрещённой зоны с помощью метода минимальных скачков (Minima Hopping Method, MHM). Последняя использует в качестве входных данных химический состав соединения из первой модели и оптимизирует потенциальную энергию. 

Этот подход применяется для прогнозирования класса тройных соединений с составом X4Y2Z, которые термодинамически стабильны и имеют запрещённые зоны от 0,3 до 1,8 эВ. 

Методы

Модели машинного обучения

Нейросети состоят из трёх компонент: обучающая выборка, её тензорное представление и алгоритм обучения. Энергия запрещённой зоны определяется с помощью иерархической модели, основанной на деревьях решений; а энтальпия – с помощью алгоритма «случайный лес». Обучающие данные взяты из открытых наборов OQMD, Materials Project и AFLOWlib.

Определение структуры

Для исследования структуры элементов используется метод минимальных скачков (MHM), который прогнозирует потенциальную энергию с помощью информации о химическом составе. Для преодоления энергетических барьеров применяется метод классической молекулярной динамики (МД), а вслед за ним — оптимизация локальной энергии. Выравнивание начальных скоростей МД происходит по принципу Бэлла-Эванса-Поляни.

Формирование энтальпии и электронной структуры

Обучающие данные генерируются из экспериментов DFT, расчёты которых выполнены с использованием пакета VASP*. Допустимые значения ширины запрещённой зоны основаны на функционале Perdew-Burke-Ernzerhof (PBE), который может выдавать неточные значения, но хорошо воспроизводит общую корреляцию в отношении химического состава различных материалов. Поэтому ошибка в этом случае является систематической и соответствует постоянному сдвигу значений запрещённой зоны. 


*Пакет VASP использует графические карты и успешно протестирован на облачных серверах с GPU NVIDIA Tesla V100 от REG.RU.


Для анализа химической связи используется заселённость перекрывания кристаллических орбиталей (Crystal Orbital Overlap Population, COOP), которая характеризует связывание и антисвязывание электронной плотности состояний. 

Результаты

Поиск новых полупроводников

Первоначально авторы исследования пытались найти новые полупроводниковые материалы, полагаясь на то, что все прогнозируемые моделями ML соединения являются стабильными. Одно из них — Ba2As2S5. Используемый принцип поиска состоял в следующем:

  1. Необходимо оценить все композиции Ba-As-S менее чем с 12 атомами на один элемент, чтобы обнаружить другие потенциально стабильные материалы.
  2. Если обнаруживается другая область стабильных соединений, то система Ba-As-S оценивается с помощью модели, определяющей ширину запрещённой зоны. В данном случае модель спрогнозировала ширину примерно 1 эВ.

Прогнозы исследователей указывают на то, что система Ba-As-S содержит многообещающие, но ещё не обнаруженные полупроводниковые материалы.

Далее авторы приступили к уточнению списка материалов-кандидатов. Ba2As2S5 — уже известное соединение, которого, однако, не было в обучающей выборке. Но с другой стороны, не существует экспериментальных доказательств наличия тройного соединения вблизи диаграммы состояний Ba- и As-. Поэтому составляется первый список кандидатов, в котором перечисляются композиции, соответствующие обычным степеням окисления Ba2+, As3– и S2–. Наименьшими возможными формульными единицами в этом списке будут Ba4As2S и Ba5As2S2 (7 и 9 атомов).

После этой первоначальной оценки исследуются новые комбинации. При этом заменяются компоненты в X4Y2Z и X5Y2Z2, где X = {Mg, Ca, Sr, Ba}, Y = {P, As, Sb, Bi} и Z = {O, S, Se , Te}, то есть 64 композиции. Для каждого соединения оценивается минимальная ширина запрещённой зоны и выбираются кандидаты с наименьшей энергией.

Чтобы оценить энтальпию, можно положиться на фазовую стабильность DFT и построить треугольники Гиббса для каждой из систем X-Y-Z. Треугольники для Ba-As-S можно увидеть на рисунке:


( а ) стабильность и ( b ) ширина запрещенной зоны различных комбинаций системы Ba-As-S, спрогнозированные с помощью моделей ML; ( с ) предполагаемые состояния, полученные в результате моделирования. Синие и оранжевые кружки — термодинамически стабильные и нестабильные фазы соответственно.

В результате исследований авторы обнаружили, что либо X4Y2Z, либо X5Y2Z2, а в некоторых случаях даже обе композиции прогнозируются как термодинамически стабильные. Исключениями являются Ba-Bi-S, Ba-Bi-Se, Ba-Sb-S, Ca-Bi-S, Ca-Bi-Se, Ca-Sb-S, Sr-Bi-S, Sr-Bi-Se, Sr-Sb-S и все магнийсодержащие соединения, Mg-Y-Z. Следовательно, фазы, в которых элементы Y и Z находятся на расстоянии двух и более периодов, имеют тенденцию к нестабильности. При этом соединения X4Y2Z более стабильны, чем X5Y2Z2, поэтому в дальнейшем мы сосредоточимся на фазовых характеристиках только для них.

Энергетические свойства

Диапазон полученных значений ширины запрещённой зоны представляет особый интерес для фотоэлектрических и термоэлектрических явлений в полупроводниках. 

Чтобы оценить, насколько хорошо в соединениях X4Y2Z проявляются фотоэлектрические свойства, авторы вычислили их спектры поглощения и сравнили с солнечным спектром. На рисунке ниже показана мнимая часть частотно-зависимой диэлектрической функции, рассчитываемой на сетке 6×6×6 точек.


Спектры поглощений соединений X4Y2Z. Мнимая часть диэлектрической функции показана относительно энергии солнечного спектрального излучения

Как и ожидалось, у соединений с наилучшими характеристиками поглощения оказались самые низкие значения энергии запрещённых зон. Наиболее подходящие кандидаты — X4Y2Te и X4Sb2Se с краевым значением поглощения в диапазоне 1,2-2,0 эВ и высоким пиковым значением около 1,8-3,0 эВ. Следовательно, эти материалы хорошо подходят для фотоэлектрических применений.

Перспективными кандидатами с термоэлектрическими свойствами являются Zintl-фазы. Из-за своей химической и структурной сложности Zintl-соединения обладают низкой теплопроводностью и высокими значениями мощности. На рисунке ниже можно увидеть локальные экстремумы в зонах валентности и проводимости для соединения Ba2As2S, которые вместе с вышеперечисленными свойствами делают такие материалы подходящими для термоэлектрических источников энергии.


Электронная структура Ba2As2S. Окраска полос соответствует атомным проекциям, справа показана заселённость перекрывания кристаллических орбиталей.

Электронная структура Ba2As2S имеет симметрию I-42d и может быть отрегулирована путём химического замещения. Это и приводит к тому, что значения энергии запрещённой зоны становятся подходящими для широкого спектра энергетических применений.

Заключение

Химикам часто приходится анализировать базы данных и отбирать из них наиболее перспективные и стабильные химические структуры. Алгоритмы машинного обучения могут помочь визуализировать химические пространства и автоматизировать этот процесс. В результате их работы исследователи увидят распределение новых, неизученных соединений относительно существующих и исследуют их перспективные свойства. Так, например, фармацевты смогут быстрее находить и создавать медикаменты, а специалисты по хемоинформатике — моделировать материалы с новыми свойствами.

Google преодолевает барьер между человеческим и машинным переводом

Google преодолевает барьер между человеческим и машинным переводом

Нейронный машинный перевод (НМП) позволяет преодолеть многие недостатки традиционных систем перевода по фразам. Но в то же время нейронные модели...
Read More
6 трендовых доменов, которые можно зарегистрировать прямо сейчас

6 трендовых доменов, которые можно зарегистрировать прямо сейчас

Мы врываемся в этот прохладный июль с горячей подборкой актуальных и свободных доменов. Изучайте и регистрируйте понравившиеся! (далее…)
Read More
Свёртка в Deep Learning простыми словами

Свёртка в Deep Learning простыми словами

У многих слово «свёртка» ассоциируется со сложными и непонятными формулами. А ведь это одно из самых важных понятий в Deep...
Read More
Стэнфордский курс: лекция 1. Введение

Стэнфордский курс: лекция 1. Введение

Представляем курс «Свёрточные нейронные сети для визуального распознавания» (Convolutional Neural Networks for Visual Recognition) от инженерной школы Стэнфордского университета (Stanford...
Read More
ИИ скажет, что люди подумают о ваших фото

ИИ скажет, что люди подумают о ваших фото

Новый искусственный интеллект Photofeeler-D3 предсказывает первые впечатления людей от фото или видео. Теперь не придётся долго мучиться с выбором самой...
Read More
Да, это жёстко: история и перспективы HDD

Да, это жёстко: история и перспективы HDD

В этом материале вы узнаете краткую историю жёстких дисков, их устройство, преимущества и недостатки, а также ближайшие перспективы развития подобных...
Read More
Истина где-то рядом — ищем аномалии с Python. Часть 1: теория

Истина где-то рядом — ищем аномалии с Python. Часть 1: теория

Все мы время от времени наблюдаем аномалии в реальном мире. Это и необычная жара, и животные-альбиносы, и гетерохромия. Аномальные отклонения...
Read More
Хостинг для лендинга: как заставить сайт летать?

Хостинг для лендинга: как заставить сайт летать?

Классная посадочная страница должна приковывать взгляд и быть такой же эффектной, как синхронное приземление ступеней Falcon 9. Но даже самому...
Read More
Разработка новых полупроводников с помощью нейросетей

Разработка новых полупроводников с помощью нейросетей

Поиск и исследование новых химических соединений с большим числом неизвестных свойств во многом опирается на вычислительные методы. Применение подобных открытий...
Read More
На что способны антивирусы для сайтов

На что способны антивирусы для сайтов

Да-да. Вирусы — проблема не только пользователей персональных компьютеров и смартфонов, но и владельцев сайтов. Через заражённый ресурс злоумышленник может рассылать...
Read More