Архивы по рубрикам: Программное обеспечение прогноза урожайности

Входные параметры моделей урожайности

Данные о сельскохозяйственном угодье:

Географические коррдинаты

Тип возделываемой культуры

Тип почвы (опционально)

 

Погодные условия:

Средняя температура (° C) за временной интервал

Максимальная температура (° C)

Минимальная температура (° C)

Атмосферное давление на уровне моря (гПа)

Средняя относительная влажность (%)

Общее количество осадков и / или таяние снега (мм)

Средняя видимость (Km)

Средняя скорость ветра (км / ч)

Максимальная скорость ветра (км / ч)

Максимальная скорость ветра (км / ч)

Индикатор осадков в виде дождя (в среднем в месяц, в течение всех дней, когда шел дождь)

Индикатор осадков в виде снега (в среднем в месяц, общее количество снега в день)

Индикатор осадков в виде ливней и гроз (среднемесячно, общее количество дней с грозами)

Индикатор осадков в виде тумана (среднемесячно, общее количество дней с туманом)

 

Данные о состоянии посевов, полученные с беспилотника или со спутника

Например, данные MODIS, который рассчитывает мультиспектральные вегетационные индексы (NDVI & EVI) каждые 16 дней с разрешением 250м.

Почва и растения:

 

Засоренность посевов (по видам сорной растительности)

Количество вредителей (особей на растение (единицу площади или по коэффициенту заселения (процент заселения вредителем площади на исследуемой территории или ином регионе, деленный на среднюю численность вредителя в данном регионе)

Большинство современных нейросетевых моделей не учитывает тип почвы, её агрофизические характеристики и показатели почвенного плодородия.

Данные о почвенном плодородии, содержащиеся в паспортах плодородия полей, могут дать больше информации о фактическом состоянии почвы, уровне её деградации и потенциональном продуктивности.

 


Прогнозирование урожайности методами машинного обучения. Примеры и перспективы

Вместо того, чтобы совершенствовать уже существующие модели прогноза урожайности, добавлять в них дополнительные переменные или усложнять способ расчета, мы предлагаем использовать методы машинного обучения, преимущественно основанные на данных дистанционного зондирования земли в мультиспектральном диапазоне и информации погодных условиях.

Машинное обучение (Machine Learning) — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Машинное обучение находится на стыке математической статистики, методов оптимизации и классических математических дисциплин, но имеет также и собственную специфику.

Нейронные сети (Neural Networks)— это один из типов модели обучения, который эмулирует принцип работы синапсов в человеческом  мозге и соединяет в себе большое количество относительно простых элементов, а обучение сводится к построению оптимальной структуры связей и настройке параметров связей.

Примеры использования

Поэтапная регрессия была использована в для прогнозирования производства риса в Китае.

Подробнее: Huang J, Wang X, Li X, Tian H, Pan Z (2013) Remotely Sensed Rice Yield Prediction Using Multi-Temporal NDVI Data Derived from NOAA’s-AVHRR. PLoS ONE 8(8): e70816. 

Иерархическая кластеризация, байесовские нейронные сети и рекурсивное разбиение  нашли применение в вопросах прогнозирования урожайности ячменя, канолы (сорт рапса) и яровой пшеницы.

Подробнее: Michael D. Johnson, William W. Hsieh, Alex J. Cannon, Andrew Davidson, & Frédéric Bédard (2016). Crop yield forecasting on the Canadian Prairies by remotely sensed vegetation indices and machine learning methods. Agricultural and Forest Meteorology, 218–219: 74–84.

Нейронную сеть работающую по перетасованному комплексному алгоритму оптимизации эволюции, разработали в Университете Аризоны (SCE-UA) для прогнозирования урожайности кукурузы и сои в США.

Источник: Li, A., Liang, S., Wang, A., & Qin, J. (2007). Estimating crop yield from multi-temporal satellite data using multivariate regression and neural network techniques. Photogrammetric Engineering & Remote Sensing, 73(10), 1149-1157.

Алгоритм случайного леса с успехом применяется  для классификации пикселей в спутниковых изображениях в разных категориях землепользования. Например, неконтролируемое линейное смешение использовалось на гиперспектральных данных для различения почвы и растительности в пределах одного пикселя.

Источник: Barrett Lowe and Arun Kulkarni (2015). MULTISPECTRAL IMAGE ANALYSIS USING RANDOM FOREST. International Journal on Soft Computing (IJSC) Vol.6, No. 1, February 2015. DOI: 10.5121/ijsc.2015.6101 1.

Zhe Zhu, Curtis E.Woodcock (2014). Continuous change detection and classification of land cover using all available Landsat data. Remote Sensing of Environment 144: 152–171. 

Многослойные нейронные сети (персептроны) и радиальные базисные функции были использованы в 13 для прогнозирования площади посевов и урожайности кукурузных полей в Индии.

Bin Luo, Chenghai Yang, Jocelyn Chanussot, and Liangpei Zhang (2013). Crop Yield Estimation Based on Unsupervised Linear Unmixing of Multidate Hyperspectral Imagery. IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING, VOL. 51, NO. 1. 

«Обучающиеся алгоритмы — как семена, почва — это данные, а обученные программы — это наша жатва. Эксперт по машинному обучению похож на крестьянина, сеющего, поливающего и удобряющего землю. Он присмат­ривает за здоровьем растущего урожая, но в целом не вмешивается»

Педро Домингос , автор книги «Верховный алгоритм: как машинное обучение изменит наш мир»

Программное обеспечение прогноза урожайности. Шаг 1: выбор модели

При разработке программных средств прогноза урожайности используются следующие виды моделей:

  1. эмпирические (физико-статистические модели или балансовые, мате-
    матико-статистические);
  2. теоретические (комплексные динамические имитационные модели);
  3. нейронные сети различной архитектуры.

Балансовые модели (1950-1970 гг)

Самые первые модели продуктивности агробиоценозов были физико-статистическими или балансовыми. Они связывали продуктивность земель с обобщенными агроклиматическими и почвенными показателями и позволяли приближенно прогнозировать возможную продуктивность сельскохозяйственных посевов на больших территориях. При этом величина урожая могла определяться только одной из групп параметров:

  1. приходящей фотосинтетически активной радиации (ФАР) и коэффициенту
    её использования посевами;
  2. тепловым ресурсам (так называемые гидротермические или биоклиматические показатели продуктивности);
  3. водному балансу (влагообеспеченности) посевов;
  4. фотосинтетическому потенциалу растений;
  5. потенциальным возможностям культуры и сорта (исходя из того факта, что различные сорта по-разному реагируют на нормы высева, дозы и соотношения основных элементов питания, вносимых с удобрениями и т.д.)
  6. эффективному плодородию почвы на основе учета запаса питательных веществ
    почвы, других ее агрохимических показателей, коэффициентов использования
    питательных веществ из почвы и удобрений, потребности растений в питательных веществах, обеспечивающих получение запрограммированного урожая и его качества.

Примеры балансовых моделей продуктивности агроценозов:

  1. структурная формула урожая (Савицкий, 1973),
  2. балансовый метод программирования урожайности (Шатилов, 1975);
  3. расчет «эффективного плодородия» почвы (Белорусский НИИ почвоведения и агрохимии, 1980)

Плюсы и минусы балансовых моделей:

Балансовые модели позволяют проследить только общие закономерности влияния различных факторов на урожайность агроценоза.

Использование только обобщенных (усредненных) показателей в балансовых моделях дает точность расчетов недостаточную для принятия управленческих решений на основе смоделированных данных.

Математико-статистические модели (1970-1980 гг)

На втором историческом этапе разработки методов прогнозирования и программирования урожая широкое распространение получили математико-статистические модели.

В целях их разработки использовались данные научных учреждений и сортоучастков, закладывались длительные полевые эксперименты.
Применение простых и комплексных статистических моделей для целей
прогнозирования и оптимизации урожая* целесообразно в тех случаях, когда
конечный урожай определяется суммарным значением факторов, заранее рассчитанных на получение планируемого урожая, а распределение управляемых факторов во времени осуществляется на неформальной основе. В силу случайного характера погодных условий расчет возможного урожая ведется по средним многолетним данным с одновременным определением вероятности получения запланированного урожая.

Примеры математико-статистических моделей:

  1. Weather and grain yields in the Soviet Union. Desai P. // International Food Policy
    Research Institute. Res. Rep. 1986. N. 54.
  2. Типовые программы и методические рекомендации для проведения исследований по прогнозированию и оптимизации факторов среды для получения запланированных урожаев и питательной ценности кормовых культур. Образцов А. С, Ковалев В.М., Головатый В.Г. и др.  М., 1982.

Плюсы и минусы статистических моделей:

Математико-статистические модели — это результат длительных полевых опытов в общей системе агроэкосистемных исследований в совокупности с краткосрочными опытами, сплошными агрохимическими обследованиями и компьютерным моделированием. Входные данные, полученные для их разработки, представляют большую ценность и в настоящем, в том числе для обучения нейронных сетей (ссылка, материал обновляется)

Модели, полученные с использованием данных одного полевого опыта, как правило, имеют локальное применение — они правомерны в погодных и почвенных условиях, близких к условиям проведения эксперимента.

Динамическое имитационное моделирование (1970 — 2000 гг)

Метод имитационного моделирования является одним из мощных инструментов исследования поведения сложных систем, особенно в тех случаях, когда непосредственное экспериментирование на объекте в.реальном масштабе времени сопряжено со значительными материальными затратами либо невозможно вообще.

Как правило, имитационные модели продуктивности представляют собой динамическую балансовую структуру блочного типа. Балансовый характер моделей заключается в том, что по каждой из включенных в модель субстанций производится полный расчет всех составляющих баланса:

  1. блок погоды (исходные метеоданные);
  2. блок водного режима почва/растение;
  3. блок теплового режима почвы;
  4. блок роста и развития растений ( в т.ч. вычисление биомассы наземной части и корней, площадь листовой поверхности и поглощающей поверхности корня);
  5. блок микроклимата (распределение температуры и влажности воздуха, ветра, радиации по высоте растительного покрова, профиль поглощаемой интегральной радиации и ФАР);
  6. блок питания (модели динамики минеральных и органических веществ в почве, поглощение питательных веществ корнями растений).

Примеры динамических имитационных моделей

ELCROS (Elementary crop simulator) —  США, 1958 год;

BACROS (Basic crop simulator) — США, 1974 год;

SPAM (Soil-plant-atmosphere model) — США, 1978 год.

Модель WOFOST используется в Системе мониторинга развития культур ЕС
(CGMS — Crop Growth Monitoring System) в рамках проекта MARS.  WOFOST принадлежит семейству моделей, разработанных Вагенингенской школой, включающему модели SUCROS, ARID CROP, MACROS и ORYZA1, которые отражают развитие различных культур при лимитирующих факторах. Модель WOFOST позволяет рассчитывать урожайность следующих культур: пшеница, кукуруза, ячмень, рис, сахарная свекла, картофель, горох, соя, подсолнечник.
WOFOST  использует ежедневные погодные данные с сеткой 50×50 км. Эти данные интерполируются исходя из данных сети метеостанций, используя специальную разработанную процедуру.

Одним из первых примеров использования космических методов для решения
задач оценки состояния сельскохозяйственных культур и прогноза
урожая служит эксперимент LACIE (Large Area Grop Inventory Experiment) no оценке урожая на больших площадях, выполнявшийся в середине 70-х годов в рамках программ спутника «LANDSAT» на территории США. Основная задача эксперимента — разработка методики дистанционной оценки площадей, состояния посевов и прогноза урожая пшеницы для крупных регионов. Для оценки урожайности применялись эмпирические связи «погода-урожай», полученные по данным агрометеорологических наблюдений. Спутниковая информация использовалась только для оценки площадей под посевами. Для Канады и США погрешность составляла, соответственно, 15 и 20%.

Одной из самых перспективных на сегодняшней день имитационных моделей блочного типа является модель EPIC (Erosion-Productivity Impact Calculator), разработанная Техасской сельскохозяйственнойнаучно-исследовательской лабораторией, США. Модель позволяет рассчитывать урожайность различных сельскохозяйственных культур (пшеница, овес, травы, кукуруза и др.).

Модель EPIC состоит из следующих десяти блоков:
1. Погода. Производится обработка измеренных ежедневных погодных данных
и (или) их генерирование вероятностными методами из среднемесячных
измерений.
2. Гидрология. Учитывая ежедневное количество осадков, рассчитывается
просачивание, боковой сток и таяние снега, производится оценка эва-
потранспирации четырьмя методами.
3. Эрозия. Моделируется эрозия почвы, вызванная ветром и водой.
4. Цикл питания: Моделируется удобрение азотом и фосфором, их преобразования
и чувствительность к ним культуры. Учитывается применение
как минеральных удобрений, так и органических.
5. Пестициды. Моделируется движение пестицидов с водой.
6. Температура почвы. Температура почвы зависит от погоды, содержания
воды в почве и объемной плотности почвы. Расчет производится ежедневно
для каждого слоя почвы.
7. Обработка земли. Моделируется воздействие землеобрабатывающего
оборудования на гидрологию почвы и цикл питания.
8. Рост культуры. Используется единая модель урожайности для всех культур.
Развитие растения происходит, пока не будет накоплена сумма потенциальных
температур. При неблагоприятных условиях развитие прекращается
и возобновляется, когда условия станут благоприятными, т.е.
гибель растения не наступает.
9. Управление культурой и почвой. Отражает проводимые сельскохозяйственные операции.
10.Экономика. Имеется простой пакет бухгалтерского учета для вычисления
затрат на посев и предполагаемой выручки.

Модель EPIC имеет следующие входные параметры: температура воздуха
(максимальная и минимальная), количество осадков, солнечная радиация, относительная влажность воздуха, скорость ветра, характеристики почвы (содержание питательных веществ, твердых веществ, песка, ила и др.) и характеристики поля (длина, ширина, направление, угол наклона). Также входными параметрами являются агрономические сельскохозяйственные операции (день посадки и уборки культуры, внесения питательных веществ и другие мероприятия).

Выходные параметры EPIC: биомасса (общая: корни и побеги), листовой индекс и др. Урожайность не является выходным параметром, но ее можно рассчитать по формуле: наземная биомасса х индекс урожайности, где индекс урожайности фактически отражает процент веса полезной части растения от
его общего веса (для пшеницы — зерна в колосе).

Самая известная имитационная модель, разработанная для российских почвенно-климатических условий была разработана в 1979 году в ФГБНУ «Агрофизический научно-исследовательский институт» и называлась «СИМОНА», позже переименована в AGROTOOL.

Модель AGROTOOL имеет суточный временной шаг, за исключением блока фотосинтеза, в котором реализован часовой шаг. В качестве входных погодных данных модели в целом используется следующий набор суточных метеопараметров (реальных или смоделированных): минимальная и максимальная температура воздуха, минимальная относительная влажность воздуха, осадки, скорость ветра и длительность солнечного сияния. Кроме того, для прогона модели необходимо задать начальное условие — дату сева и влагозапас в метровом слое почвы (до сева или в день сева).

Плюсы и минусы динамических имитационных моделей

Динамические имитационные модели дают наиболее полное представление о о вкладе различных факторов в урожайность агроценоза при условии его однородности.

Для сельскохозяйственных угодий, характеризующееся высоким значением коэффициента вариации, например, для черноземной зоны, где коэффициенты вариации почвенных условий составляют 30% и более, применение факторных моделей ограничено.

Одна из самых больших трудностей в имитационном моделировании заключается в получении адекватных метеоданных. Минимальный набор суточных метеопараметров для рассматриваемой территории может быть или слишком дорогим (что делает работу по прогнозу урожайности нерентабельным), либо эти данные могут отсутствовать совсем. Во втором случае, реальные метеопараметры заменяют смоделированными, что вносит значительную методическую погрешность в работу.

И последний минус использования современных имитационных моделей, заключается в том, что  большинство из них, либо невозможно использовать совместно с полученными с беспилотника, данными дистанционного зондирования земли (ДЗЗ), либо невозможно модифицировать для использования с данными ДЗЗ без участия разработчиков.

Методы машинного обучения и нейронных сетей (с 2000 гг по настоящее время)… статья обновляется…

 

По материалам: Брыксин В. М. Разработка математической модели и программных средств оценки урожайности зерновых культур в условиях Западной Сибири : дис. – Алтайский государственный университет, 2009.