该存储库包含与 Caltrans 绩效测量系统 (PeMS) 数据集的存储、加载和汇总相关的所有对象。
PeMS 数据集来自位于 http://pems.dot.ca.gov/ 的 PeMS 数据交换所。要访问 PeMS 数据交换所,需要创建用户名和密码。
要下载数据集,建议使用批量下载器浏览器扩展程序,因为 Caltrans 故意禁止使用编程工具访问数据集。下载感兴趣的数据集后,请确保不存在重复文件或空文件,因为这种情况在数据交换所中并不罕见。
PeMS 数据集的最终目的地是项目 python 文件夹的 Python 文件 main.py 中指定的内部 SQL Server 实例。
下载数据集后,将其放置在项目数据文件夹中,并准备好加载到 SQL Server 实例中;确保项目 sql 文件夹中的 pemsObjects.sql 文件创建的 PeMS SQL 对象存在于感兴趣的目标数据库中。如果它们不存在,或者希望完全重新开始,请在感兴趣的目标数据库中运行 pemsObjects.sql 以删除并创建所有 PeMS 相关的 SQL 对象。
从项目的 Python 文件夹中提供的environment.yml 文件创建Python 解释器。将解释器设置为与该项目关联的默认 Python 解释器。从项目 python 文件夹运行 Python 文件 main.py。它将依次从数据文件夹中加载感兴趣的数据集,从压缩的 gz 文件和 zip 存档中提取必要的 txt 文件,并将它们直接加载到 Python 文件 main.py 中指定的感兴趣的 SQL 数据库中。
包含 PeMS 数据集的数据库内的存储过程提供站级 PeMS 数据集的年度聚合,以实现用户指定的时间分辨率。有关更多信息,请参阅每个 PeMS 数据集的 GitHub Wiki 页面。
项目匹配文件夹中包含一个 Python 微服务,该文件夹将加载到内部 SQL Server 实例中的用户指定年份的 PeMS 站元数据与用户指定的 SANDAG 高速公路网络 e00 文件进行匹配。 Python 脚本可以在项目文件夹结构之外运行,并包含来自主项目的单独的environment.yml 文件。