Kommen Sie und sagen Sie Hallo auf Slack!
Feast ( Feature Store ) ist ein Open-Source-Feature-Store für maschinelles Lernen. Feast ist der schnellste Weg zur Verwaltung bestehender Infrastruktur zur Produktion analytischer Daten für Modelltraining und Online-Inferenz.
Mit Feast können ML-Plattform-Teams:
Weitere Informationen zum Projekt finden Sie in unserer Dokumentation.
Die obige Architektur ist die minimale Feast-Bereitstellung. Möchten Sie das komplette Feast auf Snowflake/GCP/AWS ausführen? Klicken Sie hier.
pip install feast
feast init my_feature_repo
cd my_feature_repo/feature_repo
feast apply
feast ui
from feast import FeatureStore
import pandas as pd
from datetime import datetime
entity_df = pd . DataFrame . from_dict ({
"driver_id" : [ 1001 , 1002 , 1003 , 1004 ],
"event_timestamp" : [
datetime ( 2021 , 4 , 12 , 10 , 59 , 42 ),
datetime ( 2021 , 4 , 12 , 8 , 12 , 10 ),
datetime ( 2021 , 4 , 12 , 16 , 40 , 26 ),
datetime ( 2021 , 4 , 12 , 15 , 1 , 12 )
]
})
store = FeatureStore ( repo_path = "." )
training_df = store . get_historical_features (
entity_df = entity_df ,
features = [
'driver_hourly_stats:conv_rate' ,
'driver_hourly_stats:acc_rate' ,
'driver_hourly_stats:avg_daily_trips'
],
). to_df ()
print ( training_df . head ())
# Train model
# model = ml.fit(training_df)
event_timestamp driver_id conv_rate acc_rate avg_daily_trips
0 2021-04-12 08:12:10+00:00 1002 0.713465 0.597095 531
1 2021-04-12 10:59:42+00:00 1001 0.072752 0.044344 11
2 2021-04-12 15:01:12+00:00 1004 0.658182 0.079150 220
3 2021-04-12 16:40:26+00:00 1003 0.162092 0.309035 959
CURRENT_TIME=$(date -u +"%Y-%m-%dT%H:%M:%S")
feast materialize-incremental $CURRENT_TIME
Materializing feature view driver_hourly_stats from 2021-04-14 to 2021-04-15 done!
from pprint import pprint
from feast import FeatureStore
store = FeatureStore ( repo_path = "." )
feature_vector = store . get_online_features (
features = [
'driver_hourly_stats:conv_rate' ,
'driver_hourly_stats:acc_rate' ,
'driver_hourly_stats:avg_daily_trips'
],
entity_rows = [{ "driver_id" : 1001 }]
). to_dict ()
pprint ( feature_vector )
# Make prediction
# model.predict(feature_vector)
{
"driver_id" : [ 1001 ],
"driver_hourly_stats__conv_rate" : [ 0.49274 ],
"driver_hourly_stats__acc_rate" : [ 0.92743 ],
"driver_hourly_stats__avg_daily_trips" : [ 72 ]
}
Die folgende Liste enthält die Funktionen, die Mitwirkende für Feast entwickeln möchten.
Wir freuen uns über Beiträge zu allen Punkten der Roadmap!
Datenquellen
Offline-Shops
Online-Shops
Feature-Engineering
Streaming
Bereitstellungen
Feature-Serving
Datenqualitätsmanagement (siehe RFC)
Feature-Erkennung und Governance
Verarbeitung natürlicher Sprache
Bitte beachten Sie die offizielle Dokumentation unter Dokumentation
Feast ist ein Gemeinschaftsprojekt und befindet sich noch in der aktiven Entwicklung. Bitte werfen Sie einen Blick auf unsere Beitrags- und Entwicklungsleitfäden, wenn Sie zum Projekt beitragen möchten:
Der Dank geht an diese unglaublichen Menschen: