TensorFlow Serving adalah sistem penyajian yang fleksibel dan berperforma tinggi untuk model pembelajaran mesin, yang dirancang untuk lingkungan produksi. Ini berkaitan dengan aspek inferensi pembelajaran mesin, mengambil model setelah pelatihan dan mengelola masa hidup mereka, memberikan klien akses berversi melalui tabel pencarian berperforma tinggi dan dihitung referensi. TensorFlow Serving menyediakan integrasi unik dengan model TensorFlow, namun dapat dengan mudah diperluas untuk melayani jenis model dan data lainnya.
Perlu diperhatikan beberapa fitur:
# Download the TensorFlow Serving Docker image and repo
docker pull tensorflow/serving
git clone https://github.com/tensorflow/serving
# Location of demo models
TESTDATA= " $( pwd ) /serving/tensorflow_serving/servables/tensorflow/testdata "
# Start TensorFlow Serving container and open the REST API port
docker run -t --rm -p 8501:8501
-v " $TESTDATA /saved_model_half_plus_two_cpu:/models/half_plus_two "
-e MODEL_NAME=half_plus_two
tensorflow/serving &
# Query the model using the predict API
curl -d ' {"instances": [1.0, 2.0, 5.0]} '
-X POST http://localhost:8501/v1/models/half_plus_two:predict
# Returns => { "predictions": [2.5, 3.0, 4.5] }
Lihat situs dokumentasi Tensorflow resmi untuk tutorial lengkap dalam melatih dan menyajikan Model Tensorflow.
Cara termudah dan paling mudah untuk menggunakan TensorFlow Serving adalah dengan image Docker. Kami sangat merekomendasikan rute ini kecuali Anda memiliki kebutuhan khusus yang tidak dapat diatasi dengan menjalankannya dalam sebuah container.
Untuk menyajikan model Tensorflow, cukup ekspor SavedModel dari program Tensorflow Anda. SavedModel adalah format serialisasi hermetis yang netral bahasa, dapat dipulihkan, dan memungkinkan sistem dan alat tingkat tinggi memproduksi, menggunakan, dan mentransformasikan model TensorFlow.
Silakan lihat dokumentasi Tensorflow untuk petunjuk detail tentang cara mengekspor SavedModels.
Arsitektur Tensorflow Serving sangat modular. Anda dapat menggunakan beberapa bagian secara individual (misalnya penjadwalan batch) dan/atau memperluasnya untuk melayani kasus penggunaan baru.
Jika Anda ingin berkontribusi pada TensorFlow Serving, pastikan untuk meninjau pedoman kontribusi.
Silakan merujuk ke situs web resmi TensorFlow untuk informasi lebih lanjut.