disclosure backend static Download - disclosure backend static Quellcode-Download

disclosure backend static

Andere Kategorien

1.0.0

Herunterladen

Offenlegungs-Backend statisch

Das disclosure-backend-static -Repo ist das Backend, das Open Disclosure California unterstützt.

Es wurde in aller Eile im Vorfeld der Wahlen 2016 entwickelt und basiert daher auf der „Get it done“-Philosophie. Zu diesem Zeitpunkt hatten wir bereits eine API entworfen und (den größten Teil) ein Frontend erstellt; Dieses Repo wurde erstellt, um diese so schnell wie möglich umzusetzen.

Dieses Projekt implementiert eine grundlegende ETL-Pipeline, um die Netfile-Daten von Oakland herunterzuladen, die von Menschen kuratierten CSV-Daten für Oakland herunterzuladen und die beiden zu kombinieren. Die Ausgabe ist ein Verzeichnis mit JSON-Dateien, die die vorhandene API-Struktur nachahmen, sodass keine Änderungen am Client-Code erforderlich sind.

Voraussetzungen

Ruby 3.3.4 (siehe Version in .ruby-version )

Installation

Hinweis: Sie müssen diese Befehle nicht ausführen, um im Frontend zu entwickeln. Sie müssen lediglich das Repository neben dem Frontend-Repository klonen.

Wenn Sie planen, den Backend-Code zu ändern, befolgen Sie diese Schritte, um alle erforderlichen Entwicklungsabhängigkeiten einzurichten, einschließlich einer neuen PostgreSQL-Datenbank und Python 3:

Stellen Sie sicher, dass Homebrew auf dem neuesten Stand ist, indem Sie Folgendes ausführen:
```
 brew update && brew upgrade
```
Installieren Sie PostgreSQL Version 16 mit Homebrew:
```
 brew install postgresql@16
```
- Um die Datenbank beim Anmelden automatisch zu starten, verwenden Sie:
```
 brew services start postgresql@16
```
Stellen Sie sicher, dass Python 3 auf Ihrem System installiert ist. Wenn nicht, laden Sie es von python.org herunter.
- macOS führt Python 2 nativ aus. Verwenden Sie daher python3 -m pip anstelle von pip um sicherzustellen, dass Python 3 verwendet wird:
```
 python3 -m pip install ...
```
- Oder wenn pip Ihres Systems auf Python 3 verweist, können Sie pip direkt verwenden:
```
 pip install ...
```

Laufen

 sudo -H python -m pip install -r requirements.txt
gem install pg bundler
bundle install

Codespaces

Dieses Repository ist für die Arbeit in einem Container unter Codespaces eingerichtet. Mit anderen Worten: Sie können eine bereits eingerichtete Umgebung starten, ohne die Installationsschritte ausführen zu müssen, die zum Einrichten einer lokalen Umgebung erforderlich sind. Dies kann als Möglichkeit zur Fehlerbehebung bei Code verwendet werden, bevor er in die Produktionspipeline übernommen wird. Die folgenden Informationen können für den Einstieg in die Verwendung von Codespaces hilfreich sein:

Gehen Sie zur Seite mit dem Repository-Code: https://github.com/caciviclab/disclosure-backend-static
Ändern Sie den Zweig in den Zweig, den Sie ausführen und bearbeiten möchten.
Klicken Sie auf die Schaltfläche Code und dann im Dropdown-Menü auf die Registerkarte Codespaces .
Klicken Sie auf die Schaltfläche, um einen neuen Codespace zu starten
Warten Sie, bis der Container eingerichtet ist und auf der Webseite eine Terminal-Eingabeaufforderung unter /workspace angezeigt wird, die Ihnen bekannt vorkommt, wenn Sie bereits mit VS Code gearbeitet haben
Im Terminal können Sie mit der Ausführung der Befehle aus dem nächsten Abschnitt beginnen, z. B. make download
Auf localhost wird eine laufende Postgres-Datenbank gestartet und Sie können einfach psql in das Terminal eingeben, um eine Verbindung zum Server herzustellen
Der Befehl make import füllt die Postgres-Datenbank
Klicken Sie auf das Zylindersymbol links, um auf die SQL Tools-Erweiterung zuzugreifen, mit der Sie eine Verbindung zu Postgres herstellen, dessen Schema anzeigen und die von Ihnen importierten Daten abfragen können
Im Container sind Python 3.9 und eine aktuelle Version von Ruby sowie alle erforderlichen Pakete installiert
Wir werden versuchen, den Container an die Umgebung für Travis CI anzupassen, einschließlich des Versuchs, die gleiche Ruby-Version zu installieren
Mit demselben Setup kann jeder denselben Container auf seinem lokalen Computer in VS Code mit der Dev Containers-Erweiterung ausführen. Wir konzentrieren uns jedoch derzeit hauptsächlich darauf, Codespaces zu aktivieren und sicherzustellen, dass wir zunächst das Setup für Codespaces härten können. (Sobald dies feststeht, werden wir Anweisungen für Entwicklungscontainer hinzufügen.)
Wenn Sie Änderungen in Ihrer Codespaces-Umgebung vornehmen, vergessen Sie nicht, diese nach dem Commit mit Git zu pushen. Es ist wie eine andere Maschine und landet daher nicht im GitHub-Repository, wenn Sie keinen git push ausführen

Docker

Dieses Repository ist auch für die Ausführung in einem Docker-Container konfiguriert. Dies ähnelt Codespaces, außer dass Sie jede beliebige IDE und lokale Einrichtung verwenden können, die Sie bevorzugen. So beginnen Sie mit der Verwendung von Docker mit VSCode:

Laden Sie Docker herunter und starten Sie Docker Desktop.
- Es wurde verifiziert, dass Version 4.32.0 (157355) mit diesem Repository funktioniert.
Installieren Sie die VSCode Dev Containers-Erweiterung.
- Es wurde bestätigt, dass Version v0.375.1 mit diesem Repository kompatibel ist.
- Hinweis: VSCode schlägt möglicherweise auch die Installation der Docker-Erweiterung vor, Sie benötigen für dieses Setup jedoch nur die Dev Containers-Erweiterung.
Navigieren Sie in VSCode zu .devcontainer/Dockerfile oder starten Sie VSCode neu. Die Dev Containers-Erweiterung sollte Sie auffordern, das Repository in einem Container erneut zu öffnen. Fahren Sie mit dieser Option fort.
Sobald die Containerumgebung geladen ist, schließen Sie die Einrichtung ab, indem Sie die folgenden Befehle befolgen.

Läuft

Laden Sie die Rohdatendateien herunter. Sie müssen dies nur ab und zu ausführen, um die neuesten Daten zu erhalten.

 $ make download

Importieren Sie die Daten zur einfacheren Verarbeitung in die Datenbank. Sie müssen dies erst ausführen, nachdem Sie neue Daten heruntergeladen haben.

 $ make import

Führen Sie die Taschenrechner aus. Alles wird in den Ordner „build“ ausgegeben.

 $ make process

Optional können Sie die Build-Ausgaben in Algolia neu indizieren. (Für die Neuindizierung sind die Umgebungsvariablen ALGOLIASEARCH_APPLICATION_ID und ALGOLIASEARCH_API_KEY erforderlich.)

 $ make reindex

Wenn Sie die statischen JSON-Dateien über einen lokalen Webserver bereitstellen möchten:

 $ make run

Entwicklung

Pflege des Datenbankschemas

Wenn make import ausgeführt wird, werden mehrere Postgres-Tabellen zum Importieren der heruntergeladenen Daten erstellt. Das Schema dieser Tabellen ist explizit im Verzeichnis dbschema definiert und muss möglicherweise in Zukunft aktualisiert werden, um zukünftige Daten aufzunehmen. Spalten, die Zeichenfolgendaten enthalten, sind möglicherweise nicht groß genug für zukünftige Daten. Wenn beispielsweise eine Namensspalte Namen mit maximal 20 Zeichen akzeptiert und wir in Zukunft Daten haben, bei denen der Name 21 Zeichen lang ist, schlägt der Datenimport fehl. In diesem Fall müssen wir die entsprechende Schemadatei in dbschema aktualisieren, um mehr Zeichen zu unterstützen. Nehmen Sie einfach die Änderung vor und führen Sie make import erneut aus, um zu überprüfen, ob der Vorgang erfolgreich ist.

Überprüfung der Ausgabedatenänderungen

Dieses Repository wird zum Generieren von Datendateien verwendet, die von der Website verwendet werden. Nachdem make process ausgeführt wurde, wird ein build -Verzeichnis generiert, das die Datendateien enthält. Dieses Verzeichnis wird in das Repository eingecheckt und später beim Generieren der Website ausgecheckt. Nachdem Sie Codeänderungen vorgenommen haben, ist es wichtig, das generierte build -Verzeichnis mit dem build -Verzeichnis zu vergleichen, das vor den Codeänderungen generiert wurde, und zu überprüfen, ob die Änderungen aufgrund der Codeänderungen den Erwartungen entsprechen.

Da ein strikter Vergleich aller Inhalte des build -Verzeichnisses immer Änderungen einschließt, die unabhängig von Codeänderungen auftreten, muss jeder Entwickler über diese erwarteten Änderungen Bescheid wissen, um diese Prüfung durchführen zu können. Um dies zu vermeiden, generiert eine bestimmte Datei, bin/create-digests.py , Digests für JSON-Daten im build -Verzeichnis, nachdem diese erwarteten Änderungen ausgeschlossen wurden. Um nach Änderungen zu suchen, die diese erwarteten Änderungen ausschließen, suchen Sie einfach nach einer Änderung in der Datei build/digests.json .

Derzeit sind dies die erwarteten Änderungen, die unabhängig von Codeänderungen auftreten:

Zeitstempel ändern sich für jeden Lauf
Top-Mitwirkende-Listen enthalten eine undefinierte Reihenfolge der Mitwirkenden mit demselben Beitrag
Listen mit den höchsten Geldausgaben enthalten eine undefinierte Reihenfolge der Geldgeber mit den gleichen Ausgaben
Rundungsdifferenzen für Floats

Die erwarteten Änderungen werden ausgeschlossen, bevor Digests für Daten im build -Verzeichnis generiert werden. Die Logik hierfür finden Sie in der Funktion clean_data , die sich in der Datei bin/create-digests.py befindet. Nachdem der Code so geändert wurde, dass eine erwartete Änderung nicht mehr vorhanden ist, kann der Ausschluss dieser Änderung aus clean_data entfernt werden. Beispielsweise ist die Rundung von Gleitkommazahlen aufgrund von Unterschieden in der Umgebung nicht bei jeder Ausführung make process gleich. Wenn der Code so korrigiert ist, dass die Rundung von Gleitkommazahlen dieselbe ist, solange sich die Daten nicht geändert haben, kann der Aufruf round_float in clean_data entfernt werden.

Es wurde ein zusätzliches Skript erstellt, um einen Bericht zu erstellen, der den Vergleich der Gesamtergebnisse der Kandidaten ermöglicht. Das Skript heißt bin/report-candidates.py und generiert build/candidates.csv und build/candidates.xlsx . Die Berichte enthalten eine Liste aller Kandidaten und auf mehrere Arten berechnete Gesamtsummen, die in der Summe die gleiche Zahl ergeben sollten.

Um sicherzustellen, dass Datenbankschemaänderungen in Pull-Requests sichtbar sind, wird das vollständige Postgres-Schema auch in einer schema.sql Datei im build -Verzeichnis gespeichert. Da das build -Verzeichnis für jeden Zweig in einem PR automatisch neu erstellt und im Repository festgeschrieben wird, wird jede durch eine Codeänderung verursachte Änderung am Schema bei der Überprüfung des PR als Unterschied in der Datei schema.sql angezeigt.

Einen Taschenrechner hinzufügen

Jede Kennzahl für einen Kandidaten wird unabhängig berechnet. Eine Metrik könnte etwa „Gesamtzahl der erhaltenen Beiträge“ oder etwas komplexeres wie „Prozentsatz der Beiträge, die weniger als 100 US-Dollar betragen“ sein.

Wenn Sie eine neue Berechnung hinzufügen, ist das offizielle Formular 460 ein guter erster Ausgangspunkt. Sind die gesuchten Daten auf diesem Formular angegeben? Wenn ja, werden Sie es wahrscheinlich nach dem Importvorgang in Ihrer Datenbank finden. Es gibt auch ein paar andere Formulare, die wir importieren, wie z. B. Formular 496. (Dies sind die Namen der Dateien im input . Schauen Sie sich diese an.)

Jeder Zeitplan jedes Formulars wird in eine separate Postgres-Tabelle importiert. Beispielsweise wird Anhang A des Formulars 460 in die Tabelle A-Contributions importiert.

Da Sie nun die Möglichkeit haben, die Daten abzufragen, sollten Sie eine SQL-Abfrage erstellen, die den Wert berechnet, den Sie erhalten möchten. Sobald Sie Ihre Berechnung als SQL ausdrücken können, fügen Sie sie wie folgt in eine Rechnerdatei ein:

Erstellen Sie eine neue Datei mit dem Namen calculators/[your_thing]_calculator.rb
Hier ist ein Beispiel für diese Datei:

 # the name of this class _must_ match the filename of this file, i.e. end
# with "Calculator" if the file ends with "_calculator.rb"
class YourThingCalculator
  def initialize ( candidates : [ ] , ballot_measures : [ ] , committees : [ ] )
    @candidates = candidates
    @candidates_by_filer_id = @candidates . where ( '"FPPC" IS NOT NULL' )
      . index_by { | candidate | candidate [ 'FPPC' ] }
  end

  def fetch
    @results = ActiveRecord :: Base . connection . execute ( <<-SQL )
      -- your sql query here
    SQL

    @results . each do | row |
      # make sure Filer_ID is returned as a column by your query!
      candidate = @candidates_by_filer_id [ row [ 'Filer_ID' ] . to_i ]

      # change this!
      candidate . save_calculation ( :your_thing , row [ column_with_your_desired_data ] )
    end
  end
end

Sie sollten die SQL-Abfrage ausfüllen und sicherstellen, dass die Abfrage die Spalte Filer_ID auswählt.
Stellen Sie sicher, dass Sie den Aufruf auf candidate.save_calculation aktualisieren. Diese Methode serialisiert ihr zweites Argument als JSON, sodass jede Art von Daten gespeichert werden kann.
Ihre Berechnung kann mit candidate.calculation(:your_thing) abgerufen werden. Sie sollten dies zu einer API-Antwort in der Datei process.rb hinzufügen.

Datenfluss

Auf diese Weise fließen die Daten durch das Backend. Finanzdaten werden aus Netfile abgerufen, das durch ein Google Sheet ergänzt wird, das Filer-IDs den Wahlinformationen wie Kandidatennamen, Ämtern, Wahlmaßnahmen usw. zuordnet. Sobald die Daten gefiltert, aggregiert und transformiert sind, verarbeitet das Frontend sie und erstellt den statischen HTML-Code Frontend.

Diagramm, das zeigt, wie Finanzdaten durch verschiedene Offenlegungskomponenten fließen

Häufige Fehler

Während der Bundle-Installation

 error: use of undeclared identifier 'LZMA_OK'

Versuchen:

 brew unlink xz
bundle install
brew link xz

Während make download

 wget: command not found

Führen Sie brew install wget .

Während make import

Es scheint, dass auf Macintosh-Systemen, die Apple-Chips verwenden, ein Problem vorliegt.

 ImportError: You don't appear to have the necessary database backend installed for connection string you're trying to use. Available backends include:

PostgreSQL:	pip install psycopg2

Versuchen Sie Folgendes:

 pip uninstall psycopg2-binary
pip install psycopg2-binary --no-cache-dir

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Andere Kategorien
Aktualisierungszeit 2025-01-12
Größe 3.29MB
Kommt von Github

Ähnliche Anwendungen

amplify backend

2024-11-12
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
STATIC-Klasse für Alarmfunktion

2009-05-24
osFM Statisch

2009-05-08

disclosure backend static

Offenlegungs-Backend statisch

Voraussetzungen

Installation

Codespaces

Docker

Läuft

Entwicklung

Pflege des Datenbankschemas

Überprüfung der Ausgabedatenänderungen

Einen Taschenrechner hinzufügen

Datenfluss

Häufige Fehler

amplify backend

GitHub sgrebnov/cordova plugin background download

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

STATIC-Klasse für Alarmfunktion

osFM Statisch

chat.petals.dev

GPT Prompt Templates

GPTyped

catalogonline

ProEventos App

MichaelBrandonMorris.KingsportMillSafetyTraining

waymo open dataset

termwind

wp functions