feast
v0.41.3
Slack에서 인사해 보세요!
Feast( Feature Store )는 기계 학습을 위한 오픈 소스 기능 저장소입니다. Feast는 모델 교육 및 온라인 추론을 위한 분석 데이터를 생산하기 위해 기존 인프라를 관리하는 가장 빠른 경로입니다.
Feast를 통해 ML 플랫폼 팀은 다음을 수행할 수 있습니다.
프로젝트에 대한 자세한 내용은 설명서를 참조하세요.
위 아키텍처는 최소 Feast 배포입니다. Snowflake/GCP/AWS에서 전체 Feast를 실행하고 싶으십니까? 여기를 클릭하세요.
pip install feast
feast init my_feature_repo
cd my_feature_repo/feature_repo
feast apply
feast ui
from feast import FeatureStore
import pandas as pd
from datetime import datetime
entity_df = pd . DataFrame . from_dict ({
"driver_id" : [ 1001 , 1002 , 1003 , 1004 ],
"event_timestamp" : [
datetime ( 2021 , 4 , 12 , 10 , 59 , 42 ),
datetime ( 2021 , 4 , 12 , 8 , 12 , 10 ),
datetime ( 2021 , 4 , 12 , 16 , 40 , 26 ),
datetime ( 2021 , 4 , 12 , 15 , 1 , 12 )
]
})
store = FeatureStore ( repo_path = "." )
training_df = store . get_historical_features (
entity_df = entity_df ,
features = [
'driver_hourly_stats:conv_rate' ,
'driver_hourly_stats:acc_rate' ,
'driver_hourly_stats:avg_daily_trips'
],
). to_df ()
print ( training_df . head ())
# Train model
# model = ml.fit(training_df)
event_timestamp driver_id conv_rate acc_rate avg_daily_trips
0 2021-04-12 08:12:10+00:00 1002 0.713465 0.597095 531
1 2021-04-12 10:59:42+00:00 1001 0.072752 0.044344 11
2 2021-04-12 15:01:12+00:00 1004 0.658182 0.079150 220
3 2021-04-12 16:40:26+00:00 1003 0.162092 0.309035 959
CURRENT_TIME=$(date -u +"%Y-%m-%dT%H:%M:%S")
feast materialize-incremental $CURRENT_TIME
Materializing feature view driver_hourly_stats from 2021-04-14 to 2021-04-15 done!
from pprint import pprint
from feast import FeatureStore
store = FeatureStore ( repo_path = "." )
feature_vector = store . get_online_features (
features = [
'driver_hourly_stats:conv_rate' ,
'driver_hourly_stats:acc_rate' ,
'driver_hourly_stats:avg_daily_trips'
],
entity_rows = [{ "driver_id" : 1001 }]
). to_dict ()
pprint ( feature_vector )
# Make prediction
# model.predict(feature_vector)
{
"driver_id" : [ 1001 ],
"driver_hourly_stats__conv_rate" : [ 0.49274 ],
"driver_hourly_stats__acc_rate" : [ 0.92743 ],
"driver_hourly_stats__avg_daily_trips" : [ 72 ]
}
아래 목록에는 기여자가 Feast를 위해 개발할 계획인 기능이 포함되어 있습니다.
로드맵의 모든 항목에 대한 기여를 환영합니다!
데이터 소스
오프라인 매장
온라인 상점
기능 엔지니어링
스트리밍
배포
기능 제공
데이터 품질 관리(RFC 참조)
기능 발견 및 거버넌스
자연어 처리
문서의 공식 문서를 참조하세요.
Feast는 커뮤니티 프로젝트이며 아직 활발하게 개발 중입니다. 프로젝트에 기여하고 싶다면 기여 및 개발 가이드를 살펴보세요.
다음과 같은 놀라운 사람들에게 감사드립니다.