Используемые методы можно применить к данным о вспышках многочисленных болезней сельскохозяйственных культур для получения методик, помогающих фермерам принимать оптимальные решения по борьбе.
Болезни сельскохозяйственных культур поражают растения не точечно, а массово, что в свою очередь может потенциально угрожать глобальной продовольственной безопасности, поэтому крайне важно иметь надежные данные, оперативно доступные в рамках программ фитомониторинга и контроля вспышек. Однако во многих случаях собирается только информация о вспышках заболевания, а данные по окружающим здоровым культурам отсутствуют. Поэтому использование таких данных для разработки моделей, позволяющих прогнозировать риск/отсутствие риска заболевания, является проблематичным, поскольку отсутствует информация, касающаяся состояния культур здоровых, но находящихся в своеобразной «группе риска».
Биоинформатиком Института Джеймса Хаттона доктором Питером Скелси было разработано принципиально новое перспективное приложение FindOUT, впервые использующее «алгоритмы обнаружения аномалий» посредством машинного обучения. Приложение было специально создано для прогнозирования риска заболевания сельскохозяйственных культур, что значительно повышает точность прогнозов. Мобильное приложение позволяет пользователям настраивать его под свои потребности, проводить тестирование растений для обнаружения аномалий и прогнозирования болезней сельскохозяйственных культур на основе имеющихся собственных данных.
В новом исследовании, опубликованном в журнале Phytopathology под редакцией американского Фитопатологического общества, доктор Скелси описывает новый подход к прогнозированию заболеваний, основанный на данных, состоящих только из вспышек заболеваний.
Новый подход включал два этапа:
Было проведено сравнение пяти различных математических алгоритмов обнаружения аномалий в зависимости от их точности при прогнозировании вспышек: ковариация, одноклассовое k-среднее, гауссовская модель смеси, оценщик плотности ядра и метод опорных векторов.
Доктор Скелси использовал в качестве доказательства концепции тематическое исследование данных обследования фитофтороза картофеля со всей Великобритании; результаты показали, что гауссовская модель смеси имела самую высокую точность прогноза — 97,0%, за которой следовали одноклассовые k-средние значения — 96,9%.
«Существует дополнительная ценность в объединении математических алгоритмов в единый «ансамбль», чтобы обеспечить более точный и надежный инструмент прогнозирования, который может быть адаптирован для получения предупреждений о заболеваниях сельхозкультур для каждого конкретного региона», — отметил ученый — «Используемые методы могут быть легко применены к данным о вспышках разных болезней сельскохозяйственных культур, чтобы получить инструменты, помогающие фермерам и землеустроителям принимать наилучшие решения в борьбе с болезнями и их профилактикой».
Эта работа вызвала большой интерес, и доктор Скелси получил дополнительное финансирование для дальнейшей разработки и усовершенствования мобильного приложения в коммерческое/лицензионное приложение.
Подготовлено по материалам James Hutton Institute.