关于数据集
🌾 合成小麦产量数据集(智利阿劳卡尼亚)
该数据集是人工合成生成的,用于模拟智利阿劳卡尼亚大区(智利主要农业区之一)的小麦产量。
该数据集基于一个复杂的产量函数,该函数整合了当地气候模式、土壤条件、管理措施和压力因素(病虫害和营养缺乏)。
它旨在用于预测模型、机器学习和精准农业的研究和实验。
⚙️ 数据生成
- 生成了50,000 条记录
n_datos
(可通过 配置)。 - 每一行代表阿劳卡尼亚大区的一个小麦生长季节,具有特定的环境和管理条件。
- 收益率(
Rendimiento_kg_ha
)通过非线性函数计算得出,其中包括:- 降雨和营养物质的饱和效应。
- 采用高斯响应(特定季节的最佳值)建模的温度。
- 土壤 pH 值惩罚(最佳值为 6.8)。
- 因害虫和营养缺乏而受到处罚。
- 产量的提高取决于耕作类型。
- 相互作用项(例如,温度×氮、降雨量×日照时数)。
- 随机噪声(6%)与产量成比例。
📑 变量
气候(阿劳卡尼亚地区)
- 季节:
"winter"
或"spring"
,遵循智利南部的主要小麦周期。 - Rainfall_mm:总降雨量(毫米),以阿劳卡尼亚的平均值校准。
- Sunlight_hours:每个季节的累计日照小时数。
- Temp_mean、Temp_max、Temp_min:温度(°C)。
土壤与管理
- N_kg_ha、P_kg_ha、K_kg_ha:营养施用率。
- pH:土壤pH值(范围5.8 – 8.5)。
- 耕作:
"conventional"
或"no-tillage"
。 - 害虫:
"yes"
/"no"
(春季发生概率较高)。 - 缺乏:
"yes"
/"no"
(约10%)。
派生特征
- GDD:生长度日数,累积生长温度单位。
- Thermal_range:最高温度和最低温度之间的差异。
- 总肥力:N + P + K。
- Climate_category:
"optimal"
或"stressed"
(基于降雨量和温度阈值)。 - pH_category:
"acidic"
,,"optimal"
或"alkaline"
。
目标变量
- Yield_kg_ha:模拟小麦产量(kg/ha)。
- 值范围在200 至 10,000 公斤/公顷之间。
- 根据气候、土壤、管理和压力条件进行调整。
✅ 用例
该数据集可用于:
- 训练机器学习回归模型。
- 特征工程和变量选择研究。
- 精准农业场景的模拟。
- 展示数据科学管道。

资源下载
下载价格9.9 元
VIP免费
立即购买