The EPA's network consistently failed to capture air quality in communities of color across six major pollutants. The monitors are the key data source driving decisions about pollution reduction, urban planning and public health initiatives. The data may
美国环保署的监管监测器是推动污染减排、城市规划和公共卫生举措决策的关键数据源。如果没有平等的监测器分布,数据可能误报污染浓度,使边缘化群体处于风险之中。
"这是问题背后的根本问题。研究人员、政策制定者,我们都使用空气质量数据,但它测量的是谁的空气?"犹他大学的博士生、该研究的主要作者布伦娜·凯利说。"尽管这些数据质量很高,但这并不意味着它对每个人都高质量。"
研究表明,边缘化社区的空气污染暴露率最高,但这些研究假设数据对所有社区都平等代表。这项研究首次在社区尺度上评估了所有美国人口普查群体的监测器本身存在差异。虽然所有非白人群体的差异存在,但最大的是夏威夷原住民和其他太平洋岛民,其次是美洲印第安人和阿拉斯加原住民群体。
空气质量研究和分析通常需要人工智能(AI)工具来处理海量数据。虽然AI算法中的偏见众所周知,但该研究示例了大数据用户面临的另一个伦理问题——数据集本身可能固有偏见的机会。
"如果只是某一种监测器存在差异,那可能只是偶然或设计不佳,"共同作者、地理学副教授、犹他大学负责任人工智能倡议执行委员会成员西蒙·布鲁尔说。"但事实是,在所有污染物中都存在这种一致模式,这表明决策过程需要仔细审视——这些监测器没有被公平分布。"
该研究于2024年12月4日发表在期刊《JAMA网络开放》上。
空气质量是超本地化的,街道之间可能发生巨大变化。作者将监测器位置和社区人口统计映射到人口普查区块级别,这是美国人口普查局最小的住宅模式单位之一。使用美国环保署空气质量系统监管监测库,他们识别了六种对人类健康有害的主要空气污染物监测器——铅、臭氧、二氧化氮、二氧化硫、一氧化碳和颗粒物。他们使用2022年美国社区调查估计了全国每个普查区块的种族和族群构成。调整人口规模后,研究者发现每种标准污染物都存在系统性监测差异。相对于非西班牙裔白人人口,所有群体都与较少的铅、臭氧、二氧化氮和颗粒物监测器相关。
凯利在攻读人口健康科学博士学位时,对环保署的空气质量监测网络产生了好奇,当时她专注于空气污染暴露对孕妇的风险。流行病学研究识别了人群中导致疾病的因素。她解释说,直到现在,都存在着一个基本假设,即数据平等代表了各地的空气质量问题。
"不仅仅是我们在某个群体上缺少一种污染物类型,而是我们对所有这些群体的一切了解都更少。这令人担忧,"凯利说。"如果我想将空气污染暴露与疾病联系起来,我需要很好地测量它。如果我对某一群体的空气质量有更好的理解,那将产生偏见的结果。"
空气质量和人口健康只是负责任地使用大数据和AI所面临挑战的众多领域中的两个。负责任人工智能倡议是犹他大学最近努力召集专家制定最佳实践的行动。
"这项研究在日益数据驱动的社会中尤其相关。负责任人工智能倡议的目标之一是研究人工智能方法的公平应用,"布鲁尔说。"我们的结果表明,数据中的偏见可能和任何算法偏差一样重要,需要考虑。"
其他作者包括犹他大学的研究者:人口健康科学的特雷西·奥尼加、环境、社会和可持续发展学院的托马斯·科瓦,以及妇产科学系的米歇尔·德宾克。