Venha dizer oi no Slack!
Feast ( Fea ture Store ) é um repositório de recursos de código aberto para aprendizado de máquina. O Feast é o caminho mais rápido para gerenciar a infraestrutura existente para produzir dados analíticos para treinamento de modelos e inferência online.
O Feast permite que as equipes da plataforma de ML:
Consulte nossa documentação para obter mais informações sobre o projeto.
A arquitetura acima é a implantação mínima do Feast. Quer realizar o banquete completo no Snowflake/GCP/AWS? Clique aqui.
pip install feast
feast init my_feature_repo
cd my_feature_repo/feature_repo
feast apply
feast ui
from feast import FeatureStore
import pandas as pd
from datetime import datetime
entity_df = pd . DataFrame . from_dict ({
"driver_id" : [ 1001 , 1002 , 1003 , 1004 ],
"event_timestamp" : [
datetime ( 2021 , 4 , 12 , 10 , 59 , 42 ),
datetime ( 2021 , 4 , 12 , 8 , 12 , 10 ),
datetime ( 2021 , 4 , 12 , 16 , 40 , 26 ),
datetime ( 2021 , 4 , 12 , 15 , 1 , 12 )
]
})
store = FeatureStore ( repo_path = "." )
training_df = store . get_historical_features (
entity_df = entity_df ,
features = [
'driver_hourly_stats:conv_rate' ,
'driver_hourly_stats:acc_rate' ,
'driver_hourly_stats:avg_daily_trips'
],
). to_df ()
print ( training_df . head ())
# Train model
# model = ml.fit(training_df)
event_timestamp driver_id conv_rate acc_rate avg_daily_trips
0 2021-04-12 08:12:10+00:00 1002 0.713465 0.597095 531
1 2021-04-12 10:59:42+00:00 1001 0.072752 0.044344 11
2 2021-04-12 15:01:12+00:00 1004 0.658182 0.079150 220
3 2021-04-12 16:40:26+00:00 1003 0.162092 0.309035 959
CURRENT_TIME=$(date -u +"%Y-%m-%dT%H:%M:%S")
feast materialize-incremental $CURRENT_TIME
Materializing feature view driver_hourly_stats from 2021-04-14 to 2021-04-15 done!
from pprint import pprint
from feast import FeatureStore
store = FeatureStore ( repo_path = "." )
feature_vector = store . get_online_features (
features = [
'driver_hourly_stats:conv_rate' ,
'driver_hourly_stats:acc_rate' ,
'driver_hourly_stats:avg_daily_trips'
],
entity_rows = [{ "driver_id" : 1001 }]
). to_dict ()
pprint ( feature_vector )
# Make prediction
# model.predict(feature_vector)
{
"driver_id" : [ 1001 ],
"driver_hourly_stats__conv_rate" : [ 0.49274 ],
"driver_hourly_stats__acc_rate" : [ 0.92743 ],
"driver_hourly_stats__avg_daily_trips" : [ 72 ]
}
A lista abaixo contém as funcionalidades que os contribuidores estão planejando desenvolver para o Feast.
Congratulamo-nos com contribuições para todos os itens do roteiro!
Fontes de dados
Lojas off-line
Lojas on-line
Engenharia de recursos
Transmissão
Implantações
Exibição de recursos
Gerenciamento de qualidade de dados (consulte RFC)
Descoberta e governança de recursos
Processamento de Linguagem Natural
Consulte a documentação oficial em Documentação
Feast é um projeto comunitário e ainda está em desenvolvimento ativo. Por favor, dê uma olhada em nossos guias de contribuição e desenvolvimento se quiser contribuir com o projeto:
Os agradecimentos vão para essas pessoas incríveis: