このリポジトリには、Caltrans Performance Measurement System (PeMS) からのデータセットの保存、読み込み、および要約に関連するすべてのオブジェクトが格納されます。
PeMS データセットは、http://pems.dot.ca.gov/ にある PeMS Data Clearinghouse から取得されます。 PeMS Data Clearinghouse にアクセスするには、ユーザー名とパスワードを作成する必要があります。
Caltrans では、データセットにアクセスするためのプログラム ツールの使用を意図的に禁止しているため、データセットをダウンロードするには、バッチ ダウンローダー ブラウザ拡張機能を使用することをお勧めします。対象のデータセットをダウンロードしたら、重複ファイルや空のファイルがないことを確認してください。これはデータ クリアリングハウスでは珍しいことではありません。
PeMS データセットの最終的な宛先は、プロジェクト python フォルダーの Python ファイル main.py で指定された内部 SQL サーバー インスタンスです。
データセットがダウンロードされ、プロジェクト データ フォルダーに配置されたら、SQL サーバー インスタンスにロードする準備が整います。プロジェクト SQL フォルダー内の pemsObjects.sql ファイルによって作成された PeMS SQL オブジェクトが対象のターゲット データベースに存在することを確認します。それらが存在しない場合、または完全に新しく開始したい場合は、対象のターゲット データベースで pemsObjects.sql を実行して、すべての PeMS 関連 SQL オブジェクトを削除して作成します。
プロジェクトの Python フォルダーにある、提供されたenvironment.yml ファイルから Python インタープリターを作成します。インタープリターを、このプロジェクトに関連付けられたデフォルトの Python インタープリターとして設定します。プロジェクト python フォルダーから Python ファイル main.py を実行します。データ フォルダーから対象のデータセットを順次ロードし、圧縮された gz ファイルと zip アーカイブから必要な txt ファイルを抽出し、Python ファイル main.py で指定された対象の SQL データベースに直接ロードします。
PeMS データセットを含むデータベース内のストアド プロシージャは、ユーザーが指定した時間解像度でステーション レベルでの PeMS データセットの年次集計を提供します。詳細については、各 PeMS データセットの GitHub の Wiki ページを参照してください。
Python マイクロサービスは、ユーザー指定の SANDAG ハイウェイ ネットワーク e00 ファイルを使用して内部 SQL サーバー インスタンスに読み込まれたユーザー指定の年の PeMS ステーション メタデータと一致するプロジェクト マッチング フォルダーに含まれています。 Python スクリプトはプロジェクト フォルダー構造の外部で実行でき、メイン プロジェクトとは別のenvironment.yml ファイルが含まれます。