【问题标题】:Predicting cucumber harvest预测黄瓜收成
【发布时间】:2019-12-17 21:38:54
【问题描述】:

我正在尝试预测温室中黄瓜的收成。我测量了有关湿度、温度、人造光、阳光和二氧化碳的数据。每天收获的黄瓜数量以公斤为单位。
由于黄瓜需要大约 14 天的生长时间,因此前 14 天的测量数据会影响特定日期的实际收获黄瓜数量。我已经创建了一个数据集,将前 14 天的平均测量数据与给定日期的每个收获结果相关联,并用它训练了一个预测模型。这已经给了我有希望的结果。
现在我想改进系统。而不是平均前 14 天的数据并假设每天的影响为 1/14,我想找出对收获结果的实际影响(经验法则说数据是在收获前 1 天测量的)对收获的黄瓜的实际数量有 50% 的影响;我的目标是验证或改进该规则)。
知道如何实现吗?

【问题讨论】:

    标签: machine-learning neural-network prediction


    【解决方案1】:

    根据你的情况,我想到了两种方法:

    1) 实现此目的的一种方法是同时对不同的收获进行多次分析。例如,连续三天收获三次:

    收获 1:2019 年 12 月 17 日

    收获 2:2019 年 12 月 18 日

    收获 3:2019 年 12 月 19 日

    您在 12 月 16 日记录的条件将对应于收获 1 的最后一天、收获 2 的第 12 天和收获 3 的第 11 天。如果您的理论是正确的,那么前一天对收获的影响最大产量,12/16 的条件对 Harvest 1 的影响应该比其他条件更明显。

    我不确定您是否想要一般的实验大纲或程序统计/编码方法。如果您正在寻找开始的方向,请查看多元统计分析。

    2) 另一条路线完全可以如下:

    由于您已经对单个集合进行了实验,您可能知道哪些条件有利于增长。如果你这样做了,并且如果你的神经网络可以让你的神经网络将某一天的所有条件减少到一个单一的“健康”数字(良好的生长条件给出更高的健康数字,糟糕的条件给出更低的健康数字),你可以填充一个矩阵有 14 次收获以及他们根据您的一个可变“健康”维度看到的相应条件。从那里您可以执行回归以确定每天的重量与其对生长的影响。

    【讨论】:

      【解决方案2】:

      您是否尝试根据前 14 天最好地预测某一天的黄瓜产量?或者您想确定前 14 天中的哪一天对某一天的黄瓜产量贡献最大?

      我假设通过陈述“现在我想改进系统”,您希望实现前者。

      既然如此,为什么要对前 14 天的数据记录进行平均,而不是分别输入 14 天每一天的实际数据?这样,您可以尝试输入最后 14 天,然后是最后 7 天,甚至可能只是最后 2 天等。您也没有假设每天对收益的贡献量,但简单地说每天都在做出贡献(首先)。假设您每天有 5 个记录,并且您输入了所有 14 天的信息,您的神经网络将有 5 * 14 = 70 个输入神经元(第一层)。

      您甚至可以使用循环神经网络来找到前几天之间之间的关系——也许会提高准确性。但是,首先使用神经网络通常需要您拥有大量的训练数据。您可能会发现线性回归产生更好的结果 - 它也更容易用于推理。

      【讨论】:

        【解决方案3】:

        要获得更准确的预测,您还需要了解更多信息:

        1. 水果负荷
        2. 理想情况下 - 起始重量

        果实的成熟期不仅取决于它的温度,还取决于它的下沉强度——植物上的黄瓜越多,它们生长的越慢,最小的果实就会流产,从而导致之后的产量模式波动。由于大量的个体植物具有不同的波动模式,你会看到它的平均产量较低,没有明显的波动,但如果你开始观察每株植物,你会看到个体波动

        根据我们在华沙生命科学大学 2014-2017 年的研究,黄瓜果实呈指数生长模式,在完全平衡的植株上,从开花到果实的生长期为 14 天,果实鲜重每天的收益是% fresh weight gain from final fruit weight (220g)

        那我该怎么办-

        1. 我不会根据鲜重,而是根据干重进行预测
        2. 我会使用果实数量和每株植物的平均果实年龄或 m2 作为起点来计算其汇/能量需求
        3. 然后从 LAI 计算光同化系数
        4. 然后根据蒸腾作用和 CO2 浓度和光总和计算同化池
        5. 我会在现有器官上分配同化池
        6. 我会重新计算每个器官的状态
        7. 对于每一天 - 一遍又一遍地重复

        你可以做什么 - 从给定的图表中,你可以得到一个近似值,即每天从能量果实中提取的部分,并在此基础上建立一个模型。

        我的判断是,如果不知道植物注册,您将无法获得 75% 的正确预测,因为即使在我们使用完整植物注册和物联网传感器的情况下,我们也可以获得约 95% 的准确度

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2010-11-01
          • 2021-04-17
          • 2016-10-14
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多