关于数据集

🌾 合成小麦产量数据集(智利阿劳卡尼亚)

该数据集是人工合成生成的,用于模拟智利阿劳卡尼亚大区(智利主要农业区之一)的小麦产量。
该数据集基于一个复杂的产量函数,该函数整合了当地气候模式、土壤条件、管理措施和压力因素(病虫害和营养缺乏)。
它旨在用于预测模型、机器学习和精准农业的研究和实验。


⚙️ 数据生成

  • 生成了50,000 条记录n_datos(可通过 配置)。
  • 每一行代表阿劳卡尼亚大区的一个小麦生长季节,具有特定的环境和管理条件。
  • 收益率(Rendimiento_kg_ha通过非线性函数计算得出,其中包括:
    • 降雨和营养物质的饱和效应。
    • 采用高斯响应(特定季节的最佳值)建模的温度。
    • 土壤 pH 值惩罚(最佳值为 6.8)。
    • 因害虫和营养缺乏而受到处罚。
    • 产量的提高取决于耕作类型。
    • 相互作用项(例如,温度×氮、降雨量×日照时数)。
    • 随机噪声(6%)与产量成比例。

📑 变量

气候(阿劳卡尼亚地区)

  • 季节"winter""spring",遵循智利南部的主要小麦周期。
  • Rainfall_mm:总降雨量(毫米),以阿劳卡尼亚的平均值校准。
  • Sunlight_hours:每个季节的累计日照小时数。
  • Temp_meanTemp_maxTemp_min:温度(°C)。

土壤与管理

  • N_kg_haP_kg_haK_kg_ha:营养施用率。
  • pH:土壤pH值(范围5.8 – 8.5)。
  • 耕作"conventional""no-tillage"
  • 害虫"yes""no"(春季发生概率较高)。
  • 缺乏"yes""no"(约10%)。

派生特征

  • GDD生长度日数,累积生长温度单位。
  • Thermal_range:最高温度和最低温度之间的差异。
  • 总肥力:N + P + K。
  • Climate_category"optimal""stressed"(基于降雨量和温度阈值)。
  • pH_category"acidic",,"optimal""alkaline"

目标变量

  • Yield_kg_ha:模拟小麦产量(kg/ha)。
    • 值范围在200 至 10,000 公斤/公顷之间。
    • 根据气候、土壤、管理和压力条件进行调整。

✅ 用例

该数据集可用于:

  • 训练机器学习回归模型
  • 特征工程和变量选择研究。
  • 精准农业场景的模拟。
  • 展示数据科学管道
资源下载
下载价格9.9
VIP免费
分享海报
显示验证码
没有账号?注册  忘记密码?