Оглавление:

Как обнаружить болезни растений с помощью машинного обучения: 6 шагов
Как обнаружить болезни растений с помощью машинного обучения: 6 шагов

Видео: Как обнаружить болезни растений с помощью машинного обучения: 6 шагов

Видео: Как обнаружить болезни растений с помощью машинного обучения: 6 шагов
Видео: Машинное обучение и нейросети / Интервью с техническим директором Яндекс.Дзен 2024, Июль
Anonim
Как обнаружить болезни растений с помощью машинного обучения
Как обнаружить болезни растений с помощью машинного обучения

Процесс обнаружения и распознавания больных растений всегда был ручным и утомительным процессом, требующим от людей визуального осмотра тела растения, что часто может приводить к неправильному диагнозу. Также было предсказано, что по мере того, как глобальные погодные условия начнут меняться из-за изменения климата, болезни сельскохозяйственных культур, вероятно, станут более серьезными и широко распространенными. Следовательно, важно разработать системы, которые быстро и легко анализируют посевы и выявляют конкретное заболевание, чтобы ограничить дальнейшее повреждение посевов.

В этом руководстве мы рассмотрим концепцию машинного обучения, известную как «трансферное обучение», для классификации изображений больных рисовых растений. Тот же метод можно использовать для решения любой другой задачи классификации изображений.

Шаг 1: Типы болезней риса

Типы болезней риса
Типы болезней риса

Рис - одна из самых популярных продовольственных культур, выращиваемых в основном в Азии, Африке и Южной Америке, но она подвержена целому ряду вредителей и болезней. По физическим характеристикам, таким как обесцвечивание листьев, можно определить несколько заболеваний, которые могут повлиять на урожай риса. Например, в случае коричневой пятнистости, грибкового заболевания, поражающего защитную оболочку листьев, листья покрываются несколькими небольшими овальными коричневыми пятнами с серыми центрами, тогда как в случае Leaf-Blast листья покрываются с более крупными коричневыми поражениями. Точно так же листья, пораженные вредителем Rice Hispa, можно определить по длинным следам, которые появляются на поверхности листа.

Шаг 2. Как прежние методы выявляли заболевания?

Как предшествующие методы выявляли болезни?
Как предшествующие методы выявляли болезни?

Предыдущие методы автоматической классификации изображений больных растений, такие как классификаторы на основе правил, используемые в [1], полагаются на фиксированный набор правил для сегментации листа на пораженные и незатронутые области. Некоторые правила извлечения признаков включают наблюдение за изменением среднего значения и стандартного отклонения между цветом затронутых и незатронутых областей. Правила для извлечения элементов формы включают индивидуальное размещение нескольких примитивных форм поверх пораженной области и определение формы, которая покрывает максимальную площадь пораженной области. После извлечения признаков из изображений используется набор фиксированных правил для классификации изображений в зависимости от болезни, которая могла поразить растение. Главный недостаток такого классификатора заключается в том, что он потребует нескольких фиксированных правил для каждого заболевания, что, в свою очередь, может сделать его восприимчивым к зашумленным данным. На изображениях выше показано, как можно использовать дерево решений на основе правил для сегментации изображения на две области.

1. Сантану Пхадикар и др., «Классификация болезней риса с использованием методов отбора признаков и генерации правил», Компьютеры и электроника в сельском хозяйстве, том. 90, январь 2013 г.

Шаг 3. Передача обучения

Трансферное обучение
Трансферное обучение

Методика классификации изображений, описанная в этой инструкции, использует базовую структуру CNN, которая состоит из нескольких сверточных слоев, слоя объединения и последнего полностью связанного слоя. Сверточные слои действуют как набор фильтров, извлекающих высокоуровневые характеристики изображения. Максимальное объединение - один из распространенных методов, используемых в объединении слоев для уменьшения пространственного размера извлеченных функций, тем самым уменьшая вычислительную мощность, необходимую для вычисления весов для каждого слоя. Наконец, извлеченные данные проходят через полностью связанный слой вместе с функцией активации softmax, которая определяет класс изображения.

Но обучение пользовательских CNN с нуля может не дать желаемых результатов и может потребовать очень длительного обучения.

Чтобы изучить особенности обучающих изображений, мы используем метод под названием Transfer Learning, в котором «верхние» слои предварительно обученной модели удаляются и заменяются слоями, которые могут изучить особенности, характерные для набора обучающих данных. Трансферное обучение сокращает время обучения по сравнению с моделями, использующими случайно инициализированные веса. В нашем методе используются шесть различных предварительно обученных моделей, а именно AlexNet, GoogLeNet, ResNet-50, Inception-v3, ShuffleNet и MobileNet-v2.

На изображении показана архитектура GoogLeNet, где синий используется для сверточных слоев, красный - для объединения слоев, желтый - для слоев softmax и зеленый - для слоев concat. Вы можете узнать больше о внутренней работе CNN здесь.

Набор данных о болезнях риса состоит из изображений листьев как здоровых, так и больных растений риса. Изображения можно разделить на четыре разных класса, а именно: коричневые пятна, рисовые пятна, листовые пятна и здоровые. Набор данных состоит из 2092 различных изображений, каждый класс содержит 523 изображения. Каждое изображение состоит из одного здорового или больного листа, помещенного на белом фоне.

Мы разделяем набор данных изображения на наборы изображений для обучения, проверки и тестирования. Чтобы предотвратить переобучение, мы увеличиваем обучающие изображения, масштабируя и переворачивая обучающие изображения, чтобы увеличить общее количество обучающих выборок.

Код и зависимости имеют открытый исходный код и могут быть найдены здесь: Код GitHub

Для различных приложений классификации изображений мы можем просто изменить набор данных обучающих изображений.

Шаг 4: Обучение модели

Обучение модели
Обучение модели
Обучение модели
Обучение модели
Обучение модели
Обучение модели

В зависимости от объема памяти, требуемого каждой моделью, предварительно обученные модели делятся на большие и меньшие модели. Меньшие модели потребляют менее 15 МБ и, следовательно, лучше подходят для мобильных приложений.

Среди более крупных моделей у Inception-v3 было самое продолжительное время обучения - примерно 140 минут, тогда как у AlexNet было самое короткое время обучения - примерно 18 минут. Среди более мелких моделей, ориентированных на мобильные устройства, MobileNet-v2 имеет самое продолжительное время обучения - примерно 73 минуты, тогда как ShuffleNet - самое короткое время обучения - примерно 38 минут.

Шаг 5: Тестирование модели

Тестирование модели
Тестирование модели
Тестирование модели
Тестирование модели
Тестирование модели
Тестирование модели

Среди более крупных моделей Inception-v3 имел самую высокую точность тестирования примерно 72,1%, тогда как AlexNet имел самую низкую точность тестирования примерно 48,5%. Среди более мелких мобильных моделей MobileNet-v2 имел самую высокую точность тестирования 62,5%, тогда как ShuffleNet имела самую низкую точность тестирования 58,1%.

MobileNet-v2 показал хорошие результаты при классификации изображений коричневых пятен, взорванных листьев и здоровых листьев, в то же время допустив несколько ошибок в классификации Rice Hispa с точностью всего 46,15%.

Inception-v3 показал те же результаты классификации, что и MobileNet-v2.

Шаг 6: Дополнительные тесты

Дополнительные тесты
Дополнительные тесты
Дополнительные тесты
Дополнительные тесты

На изображении выше показано, как модель MobileNet-v2 ошибочно классифицирует изображение листа травы на белом фоне как Rice Hispa.

Мы также проверили точность MobileNet-v2 на кадрированных изображениях Rice Hispa, где белый фон был минимизирован таким образом, чтобы лист занимал максимальную площадь в пределах изображения. Для обрезанных изображений Rice Hispa мы наблюдали точность примерно 80,81%, то есть для обрезанных изображений Rice Hispa мы наблюдали значительное повышение точности классификации по сравнению с необрезанными тестовыми образцами. Следовательно, мы предлагаем, чтобы реальные реализации обнаружения болезней риса с использованием сверточных нейронных сетей должны были обрезать тестовые изображения, чтобы удалить фоновый шум и повысить точность.

Рекомендуемые: