背景描述
美国国家健康与营养调查(NHANES)由美国疾病控制与预防中心(CDC)主导,旨在评估美国非机构化人群的健康状况和环境暴露水平。数据包含从体检到实验室测试的多种健康指标,覆盖多个年代的抽样群体。近年来,由于NHANES数据存在多种不一致性,研究者开发了一套整合数据的工具,通过合并614个文件,统一处理NHANES III(1988-1994)与持续调查(1999-2018)数据,涵盖135,310名参与者及5,078个变量。
数据说明
| 类型 | 变量数量 | 说明 |
|---|---|---|
| 人口学信息 | 281 | 年龄、性别、种族等 |
| 饮食摄入 | 324 | 每日膳食记录,包括食物类型和营养成分 |
| 生理功能 | 1,040 | 身高、体重、血压、血糖等健康指标 |
| 职业信息 | 61 | 职业类型及工作状况 |
| 问卷数据 | 1,444 | 包括体力活动、疾病病史、糖尿病、早期童年健康、血压与胆固醇等 |
| 药物信息 29 | 药物使用情况 | |
| 死亡信息 | 15 | 来自国家死亡指数(NDI)的死亡率信息 |
| 调查权重 | 857 | 设计权重用于校正抽样偏差 |
| 环境暴露生物标志物 | 598 | 环境化学物质暴露的生物标志物测量 |
| 化学测量评论 | 505 | 表示化学物质测量是否低于或高于检测下限 |
此外,研究者整理的数据包含以下文件:
- 清理与未清理数据模块:涵盖10个模块,每个模块提供未清理(原始数据)和清理版本的数据。
- 变量字典:包括变量名称、描述、单位、类别、CAS编号、化学家族、测量次数等详细信息。
- 不一致性文档:记录所有变量的不一致性和处理方法。
数据来源
美国国家健康与营养调查(National Health and Nutrition Examination Survey,NHANES)
问题描述
- 慢性病研究:分析人口学特征与慢性疾病的关系,如高血压、糖尿病等。
- 营养与健康:探索饮食摄入与健康状态的因果关系。
- 环境健康研究:评估化学物质暴露对健康的长期影响。
- 数据可视化与建模:使用R工具对数据进行快速分析,构建统计和预测模型。
资源下载
下载价格9.9 元
VIP免费
立即购买
