Unduh Rasa_NLU_Chi - Unduh kode sumber Rasa_NLU

Rasa_NLU_Chi

Kode Sumber AI

1.0.0

Unduh

Rasa NLU untuk bahasa Mandarin, percabangan dari RasaHQ/rasa_nlu.

Silakan merujuk ke instruksi terbaru di dokumen resmi Rasa NLU

中文Blog

File yang harus Anda miliki:

data/total_word_feature_extractor_zh.dat

Dilatih dari korpus Cina dengan alat wordrep MITIE (membutuhkan waktu 2-3 hari untuk pelatihan)

Untuk pelatihan, silakan buat Alat Wordrep MITIE. Perhatikan bahwa korpus Tiongkok harus diberi token terlebih dahulu sebelum dimasukkan ke dalam alat untuk pelatihan. Korpus domain dekat yang paling cocok dengan kasus pengguna akan berfungsi paling baik.

Model terlatih dari Wikipedia bahasa Mandarin Dump dan Baidu Baike dapat diunduh dari 中文Blog.

data/examples/rasa/demo-rasa_zh.json

Sebaiknya tambahkan contoh sebanyak-banyaknya.

Penggunaan:

Kloning proyek ini, dan jalankan

 python setup.py install

Ubah konfigurasi.
Saat ini untuk Tiongkok kami memiliki dua saluran pipa:
Gunakan MITIE+Jieba (sample_configs/config_jieba_mitie.yml):

 language : " zh "

pipeline :
- name : " nlp_mitie "
  model : " data/total_word_feature_extractor_zh.dat "
- name : " tokenizer_jieba "
- name : " ner_mitie "
- name : " ner_synonyms "
- name : " intent_entity_featurizer_regex "
- name : " intent_classifier_mitie "

DIREKOMENDASIKAN: Gunakan MITIE+Jieba+sklearn (sample_configs/config_jieba_mitie_sklearn.yml):

 language : " zh "

pipeline :
- name : " nlp_mitie "
  model : " data/total_word_feature_extractor_zh.dat "
- name : " tokenizer_jieba "
- name : " ner_mitie "
- name : " ner_synonyms "
- name : " intent_entity_featurizer_regex "
- name : " intent_featurizer_mitie "
- name : " intent_classifier_sklearn "

(Opsional) Gunakan Kamus Buatan Pengguna Jieba atau Ganti Kamus Default Jieba:
Anda dapat memasukkan jalur file atau jalur direktori sebagai nilai "user_dicts". (sample_configs/config_jieba_mitie_sklearn_plus_dict_path.yml)

 language : " zh "

pipeline :
- name : " nlp_mitie "
  model : " data/total_word_feature_extractor_zh.dat "
- name : " tokenizer_jieba "
  default_dict : " ./default_dict.big "
  user_dicts : " ./jieba_userdict "
#  user_dicts: "./jieba_userdict/jieba_userdict.txt"
- name : " ner_mitie "
- name : " ner_synonyms "
- name : " intent_entity_featurizer_regex "
- name : " intent_featurizer_mitie "
- name : " intent_classifier_sklearn "

Latih model dengan menjalankan:
Jika Anda menentukan nama proyek Anda di file konfigurasi, ini akan menyimpan model Anda di /models/nama_proyek_Anda.
Jika tidak, model Anda akan disimpan di /models/default

 python -m rasa_nlu.train -c sample_configs/config_jieba_mitie_sklearn.yml --data data/examples/rasa/demo-rasa_zh.json --path models

Jalankan server rasa_nlu:

 python -m rasa_nlu.server -c sample_configs/config_jieba_mitie_sklearn.yml --path models

Buka terminal baru dan sekarang Anda dapat menggulung hasil dari server, misalnya:

 $ curl -XPOST localhost:5000/parse -d '{"q":"我发烧了该吃什么药？", "project": "rasa_nlu_test", "model": "model_20170921-170911"}' | python -mjson.tool
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   652    0   552  100   100    157     28  0:00:03  0:00:03 --:--:--   157
{
    "entities": [
        {
            "end": 3,
            "entity": "disease",
            "extractor": "ner_mitie",
            "start": 1,
            "value": "发烧"
        }
    ],
    "intent": {
        "confidence": 0.5397186422631861,
        "name": "medical"
    },
    "intent_ranking": [
        {
            "confidence": 0.5397186422631861,
            "name": "medical"
        },
        {
            "confidence": 0.16206323981749196,
            "name": "restaurant_search"
        },
        {
            "confidence": 0.1212448457737397,
            "name": "affirm"
        },
        {
            "confidence": 0.10333600028547868,
            "name": "goodbye"
        },
        {
            "confidence": 0.07363727186010374,
            "name": "greet"
        }
    ],
    "text": "我发烧了该吃什么药？"
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-11
ukuran 609.88KB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Anjing_Rubah_Kelinci

2022-08-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua