Специалисты Центра НТИ «Цифровое материаловедение: новые материалы и вещества» МГТУ им. Н. Э. Баумана работают над созданием базы данных материалов и веществ, которая при помощи алгоритмов ИИ (искусственный интеллект), помогает предсказывать свойства и приближает к внедрению машинного обучения в разработку перспективных полимерных материалов, сообщается в пресс-релизе вуза.
«Построение регрессионных моделей свойств полимеров по их химической структуре с помощью машинного обучения способно значительно ускорить открытие и разработку новых полимерных материалов. Для построения таких предсказательных моделей необходимо закодировать структуру вещества в машинно-читаемом виде. Руководствуясь подходами обработки текста, мы использовали энкодер Mol2Vec, воспринимающий SMILES-кодировку структуры в качестве текста, а отдельные функциональные группы — как слова и предложения (т.н. Mol2Vec, molecule-to-vector). Подобный подход ранее не применялся для исследования полимерных структур и позволил отобразить полимерные структуры в виде смысловых векторов», — говорит младший научный сотрудник Центра НТИ «Цифровое материаловедение: новые материалы и вещества» МГТУ им. Н. Э. Баумана Иван Злобин.
В своем исследовании ученые рассмотрели несколько стратегий использования предварительно обученных представлений Mol2Vec для задачи предсказания различных физических свойств полимеров с различной химической структурой на небольшом (~200 записей) наборе данных.
По словам эксперта, получающиеся представления сохраняют большой процент информации о химической структуре полимера при небольшой размерности эмбеддинга.
«При использовании подхода Mol2Vec удается надежно векторно отобразить химическое разнообразие полимеров, что очень положительно влияет на качество предсказательных моделей, обученных на небольших базах данных», — добавил Иван Злобин.
ИИ позволяет создавать материалы быстро, но пока не точно. Для точности 90% программе достаточно небольшого объема данных по полимерам и композитам. Повышение точности возможно после сбора большего разнообразия результатов синтеза и испытаний.
Евгений Александров, д.х.н., заведующий лабораторией молекулярного моделирования Центра НТИ «Цифровое материаловедение: новые материалы и вещества» МГТУ им. Н.Э. БауманаИзображение: пресс-служба МГТУ им. Н.Э. Баумана
Уточнить прогнозы также можно с помощью моделирования на молекулярном уровне. Это позволит прогнозировать свойства материалов, а также состав и технологии, которые использованы в готовом изделии. Такое мнение высказал Евгений Александров, д.х.н., заведующий лабораторией молекулярного моделирования Центра НТИ «Цифровое материаловедение: новые материалы и вещества» МГТУ им. Н. Э. Баумана, выступая на форуме AMTEXPO-2024.
«Разработка одного материала занимает порядка года. При этом стоит задача оптимизации комплекса свойств. Мы планируем ускорить этот процесс через прогнозирование свойств методами машинного обучения и моделирования методами молекулярного моделирования. Созданная нами модель машинного обучения позволяет получать прогноз свойств за доли секунды. Этот результат быстрый, но не точный. Молекулярное обучение дольше, но при правильно подобранных параметрах точнее», — пояснил Евгений Александров.
Прогнозировать свойства полимерных материалов научились в МГТУ им. Н. Э. Баумана
Эксперт отметил, что для композитов молекулярное моделирование в меньшей степени применимо из-за сложности системы. Однако результаты на уровне точности 90% удалось достичь с использованием методов машинного обучения для решения прямой задачи (прогноз свойств) и обратной задачи (прогноз состава и технологии).
Статья о подходах обработки естественного языка (NLP) для кодирования структуры полимерных материалов опубликована в журнале первого квартиля.