Определение эффективности алгоритмов библиотеки машинного обучения PyCaret для видовой идентификации микроорганизмов на основании данных времяпролетной масс-спектрометрии
Хамитова Мария Дмитриевна /
Детушев Константин Владимирович /
Богун Александр Геннадьевич /

Работа посвящена оценке возможности применения технологий машинного обучения для анализа данных, полученных при масс-спектрометрии бактериальных культур. В работе использовали масс-листы микроорганизмов видов Escherichia coli и Staphylococcus aureus, полученные с помощью MALDI-TOF масс-спектрометрии. Полученные данные обрабатывали с применением библиотеки PyCaret и выбранного в ходе исследования алгоритма Light Gradient Boosting Machine. Показано, что при анализе данных, полученных при идентификации штаммов бактерий E. coli и S. aureus из библиотеки PyCaret, алгоритм Light Gradient Boosting Machine позволяет получать результаты со степенью достоверности около 98%.
Ключевые слова: машинное обучение, масс-спектрометрия, MALDI-TOF, PyCaret
Для цитирования: Хамитова М.Д., Детушев К.В., Богун А.Г. Определение эффективности алгоритмов библиотеки машинного обучения PyCaret для видовой идентификации микроорганизмов на основании данных времяпролетной масс-спектрометрии. Бактериология. 2022; 7(2): 34–38. DOI: 10.20953/2500-1027-2022-2-34-38
For citation: Khamitova M.D., Detushev K.V., Bogun A.G. Determining the effectiveness of the algorithms of the PyCaret machine learning library for species identification of microorganisms based on time-of-flight mass spectrometry data. Bacteriology. 2022; 7(2): 34–38. (In Russian). DOI: 10.20953/2500-1027-2022-2-34-38