นี่คือไคลเอ็นต์ Python สำหรับ NLP Cloud API ดูเอกสารประกอบสำหรับรายละเอียดเพิ่มเติม
NLP Cloud ให้บริการโมเดลที่ได้รับการฝึกอบรมล่วงหน้าหรือแบบกำหนดเองที่มีประสิทธิภาพสูงสำหรับ NER, การวิเคราะห์ความรู้สึก, การจำแนกประเภท, การสรุป, การสรุปบทสนทนา, การถอดความ, การจำแนกประเภทเจตนา, คำอธิบายผลิตภัณฑ์และการสร้างโฆษณา, แชทบอท, การแก้ไขไวยากรณ์และการสะกดคำ, การแยกคำสำคัญและวลีคีย์, การสร้างข้อความ , การสร้างภาพ, การสร้างซอร์สโค้ด, การตอบคำถาม, การรู้จำคำพูดอัตโนมัติ, การแปลภาษาด้วยเครื่อง, การตรวจจับภาษา, การค้นหาความหมาย, ความคล้ายคลึงกันทางความหมาย, โทเค็นไนซ์, การแท็ก POS, การฝังและการแยกวิเคราะห์การพึ่งพา พร้อมสำหรับการผลิต โดยให้บริการผ่าน REST API
คุณสามารถใช้โมเดลที่ได้รับการฝึกอบรมล่วงหน้าของ NLP Cloud ปรับแต่งโมเดลของคุณเอง หรือปรับใช้โมเดลของคุณเองได้
หากคุณประสบปัญหา อย่าลังเลที่จะแจ้งเป็นปัญหา Github ขอบคุณ!
ติดตั้งผ่าน pip
pip install nlpcloud
นี่คือตัวอย่างแบบเต็มที่สรุปข้อความโดยใช้โมเดล Bart Large CNN ของ Facebook พร้อมด้วยโทเค็นปลอม:
import nlpcloud
client = nlpcloud . Client ( "bart-large-cnn" , "4eC39HqLyjWDarjtT1zdp7dc" )
client . summarization ( """One month after the United States began what has become a
troubled rollout of a national COVID vaccination campaign, the effort is finally
gathering real steam. Close to a million doses -- over 951,000, to be more exact --
made their way into the arms of Americans in the past 24 hours, the U.S. Centers
for Disease Control and Prevention reported Wednesday. That s the largest number
of shots given in one day since the rollout began and a big jump from the
previous day, when just under 340,000 doses were given, CBS News reported.
That number is likely to jump quickly after the federal government on Tuesday
gave states the OK to vaccinate anyone over 65 and said it would release all
the doses of vaccine it has available for distribution. Meanwhile, a number
of states have now opened mass vaccination sites in an effort to get larger
numbers of people inoculated, CBS News reported.""" )
นี่คือตัวอย่างแบบเต็มที่ทำสิ่งเดียวกัน แต่บน GPU:
import nlpcloud
client = nlpcloud . Client ( "bart-large-cnn" , "4eC39HqLyjWDarjtT1zdp7dc" , True )
client . summarization ( """One month after the United States began what has become a
troubled rollout of a national COVID vaccination campaign, the effort is finally
gathering real steam. Close to a million doses -- over 951,000, to be more exact --
made their way into the arms of Americans in the past 24 hours, the U.S. Centers
for Disease Control and Prevention reported Wednesday. That s the largest number
of shots given in one day since the rollout began and a big jump from the
previous day, when just under 340,000 doses were given, CBS News reported.
That number is likely to jump quickly after the federal government on Tuesday
gave states the OK to vaccinate anyone over 65 and said it would release all
the doses of vaccine it has available for distribution. Meanwhile, a number
of states have now opened mass vaccination sites in an effort to get larger
numbers of people inoculated, CBS News reported.""" )
นี่คือตัวอย่างแบบเต็มที่ทำสิ่งเดียวกัน แต่เป็นข้อความภาษาฝรั่งเศส:
import nlpcloud
client = nlpcloud . Client ( "bart-large-cnn" , "4eC39HqLyjWDarjtT1zdp7dc" , True , "fra_Latn" )
client . summarization ( """Sur des images aériennes, prises la veille par un vol de surveillance
de la Nouvelle-Zélande, la côte d’une île est bordée d’arbres passés du vert
au gris sous l’effet des retombées volcaniques. On y voit aussi des immeubles
endommagés côtoyer des bâtiments intacts. « D’après le peu d’informations
dont nous disposons, l’échelle de la dévastation pourrait être immense,
spécialement pour les îles les plus isolées », avait déclaré plus tôt
Katie Greenwood, de la Fédération internationale des sociétés de la Croix-Rouge.
Selon l’Organisation mondiale de la santé (OMS), une centaine de maisons ont
été endommagées, dont cinquante ont été détruites sur l’île principale de
Tonga, Tongatapu. La police locale, citée par les autorités néo-zélandaises,
a également fait état de deux morts, dont une Britannique âgée de 50 ans,
Angela Glover, emportée par le tsunami après avoir essayé de sauver les chiens
de son refuge, selon sa famille.""" )
วัตถุ json ถูกส่งกลับ:
{
"summary_text" : " Over 951,000 doses were given in the past 24 hours. That's the largest number of shots given in one day since the rollout began. That number is likely to jump quickly after the federal government gave states the OK to vaccinate anyone over 65. A number of states have now opened mass vaccination sites. "
}
ส่งโมเดลที่คุณต้องการใช้และโทเค็น NLP Cloud ไปยังไคลเอ็นต์ในระหว่างการเริ่มต้น
โมเดลนี้สามารถเป็นโมเดลที่ได้รับการฝึกล่วงหน้า เช่น en_core_web_lg
, bart-large-mnli
... แต่ยังเป็นหนึ่งในโมเดลที่คุณกำหนดเองด้วย โดยใช้ custom_model/
(เช่น custom_model/2568
) ดูเอกสารประกอบสำหรับรายการรุ่นทั้งหมดที่มีอยู่
โทเค็นของคุณสามารถดึงข้อมูลจากแดชบอร์ด NLP Cloud ของคุณ
import nlpcloud client = nlpcloud . Client ( "" , "" )
หากคุณต้องการใช้ GPU ให้ผ่าน gpu=True
import nlpcloud client = nlpcloud . Client ( "" , "" , gpu = True )
หากคุณต้องการใช้ส่วนเสริมหลายภาษาเพื่อประมวลผลข้อความที่ไม่ใช่ภาษาอังกฤษ ให้ส่ง lang="
ตัวอย่างเช่น หากคุณต้องการประมวลผลข้อความภาษาฝรั่งเศส คุณควรตั้งค่า lang="fra_Latn"
import nlpcloud client = nlpcloud . Client ( "" , "" , lang = "" )
หากคุณต้องการส่งคำขอแบบอะซิงโครนัส ให้ส่ง asynchronous=True
import nlpcloud client = nlpcloud . Client ( "" , "" , asynchronous = True )
หากคุณกำลังส่งคำขอแบบอะซิงโครนัส คุณจะได้รับการตอบกลับอย่างรวดเร็วที่มี URL เสมอ จากนั้นคุณควรสำรวจ URL นี้ด้วย async_result()
เป็นประจำ (เช่น ทุก 10 วินาที) เพื่อตรวจสอบว่าผลลัพธ์พร้อมใช้งานหรือไม่ นี่คือตัวอย่าง:
client . async_result ( "https://api.nlpcloud.io/v1/get-async-result/21718218-42e8-4be9-a67f-b7e18e03b436" )
คำสั่งดังกล่าวส่งคืนออบเจ็กต์ JSON เมื่อการตอบสนองพร้อม มันจะส่งกลับ None
เป็นอย่างอื่น
เรียกเมธอด asr()
และส่งผ่านอาร์กิวเมนต์ต่อไปนี้:
url
: URL ที่โฮสต์ไฟล์เสียงหรือวิดีโอของคุณencoded_file
: ไฟล์ของคุณเวอร์ชันเข้ารหัสฐาน 64input_language
: ภาษาของไฟล์ของคุณเป็นรหัส ISO client . asr ( "Your url" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด chatbot()
และส่งอินพุตของคุณ คุณยังสามารถส่งผ่านบริบทและประวัติการสนทนาที่เป็นรายการพจนานุกรมได้อีกด้วย พจนานุกรมแต่ละเล่มประกอบด้วย input
และ response
จากแชทบอท
client . chatbot ( "Your input" , "You context" , [{ "input" : "input 1" , "response" : "response 1" }, { "input" : "input 2" , "response" : "response 2" }, ...])
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด classification()
และส่งผ่านอาร์กิวเมนต์ต่อไปนี้:
multi_class
: การจัดหมวดหมู่ควรเป็นแบบหลายคลาสหรือไม่ โดยเป็นบูลีน ค่าเริ่มต้นเป็นจริง client . classification ( "" , [ "label 1" , "label 2" , "..." ])
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด code_generation()
และส่งคำสั่งสำหรับโปรแกรมที่คุณต้องการสร้าง:
client . code_generation ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด dependencies()
และส่งข้อความที่คุณต้องการดำเนินการเป็นส่วนหนึ่งของการแท็กคำพูด (POS) + ส่วนโค้ง
client . dependencies ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด embeddings()
และส่งรายการบล็อกข้อความที่คุณต้องการแยกการฝังออกมา
client . embeddings ([ "" , "" , "" , ...])
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด entities()
และส่งข้อความที่คุณต้องการใช้การจดจำเอนทิตีที่มีชื่อ (NER)
client . entities ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด generation()
และส่งผ่านอาร์กิวเมนต์ต่อไปนี้:
max_length
: ไม่บังคับ จำนวนโทเค็นสูงสุดที่ข้อความที่สร้างขึ้นควรมี โทเค็นสูงสุด 256 รายการสำหรับ GPT-J บน CPU, โทเค็นสูงสุด 1,024 รายการสำหรับ GPT-J และ GPT-NeoX 20B บน GPU และโทเค็นสูงสุด 2,048 รายการสำหรับ Fast GPT-J และ Finetuned GPT-NeoX 20B บน GPU หาก length_no_input
เป็นเท็จ ขนาดของข้อความที่สร้างขึ้นคือความแตกต่างระหว่าง max_length
และความยาวของข้อความที่คุณป้อน หาก length_no_input
เป็นจริง ขนาดของข้อความที่สร้างขึ้นจะเป็น max_length
ค่าเริ่มต้นคือ 50length_no_input
: min_length
และ max_length
ไม่ควรรวมความยาวของข้อความที่ป้อนเป็นบูลีนหรือไม่ หากเป็นเท็จ min_length
และ max_length
จะรวมความยาวของข้อความที่ป้อนด้วย หากเป็นจริง min_length และ max_length
จะไม่รวมความยาวของข้อความที่ป้อน ค่าเริ่มต้นเป็นเท็จend_sequence
: โทเค็นเฉพาะที่ควรเป็นจุดสิ้นสุดของลำดับที่สร้างขึ้นเป็นสตริง เช่น ถ้าเป็น .
หรือ n
หรือ ###
หรืออย่างอื่นที่มีความยาวต่ำกว่า 10 ตัวอักษรremove_input
: ไม่ว่าคุณต้องการลบข้อความที่ป้อนออกจากผลลัพธ์ในรูปแบบบูลีนหรือไม่ ค่าเริ่มต้นเป็นเท็จnum_beams
: จำนวนคานสำหรับการค้นหาลำแสง 1 หมายถึงไม่มีการค้นหาลำแสง นี่คือจำนวนเต็ม ค่าเริ่มต้นเป็น 1num_return_sequences
: จำนวนลำดับที่ส่งคืนที่คำนวณอย่างอิสระสำหรับแต่ละองค์ประกอบในชุดเป็นจำนวนเต็ม ค่าเริ่มต้นเป็น 1top_k
: จำนวนโทเค็นคำศัพท์ความน่าจะเป็นสูงสุดที่จะเก็บไว้สำหรับการกรอง top-k เป็นจำนวนเต็ม สูงสุด 1,000 โทเค็น ค่าเริ่มต้นเป็น 0top_p
: หากตั้งค่าเป็น float < 1 เฉพาะโทเค็นที่เป็นไปได้มากที่สุดที่มีความน่าจะเป็นที่รวมกันเป็น top_p หรือสูงกว่าเท่านั้นที่จะถูกเก็บไว้สำหรับการสร้าง นี่คือการลอย ควรอยู่ระหว่าง 0 ถึง 1 ค่าเริ่มต้นคือ 0.7temperature
: ค่าที่ใช้โมดูลความน่าจะเป็นของโทเค็นถัดไปเป็นแบบทศนิยม ควรอยู่ระหว่าง 0 ถึง 1 ค่าเริ่มต้นคือ 1repetition_penalty
: พารามิเตอร์สำหรับการลงโทษการทำซ้ำ เป็นแบบทศนิยม 1.0 หมายถึงไม่มีการลงโทษ ค่าเริ่มต้นเป็น 1.0bad_words
: รายการโทเค็นที่ไม่ได้รับอนุญาตให้สร้างเป็นรายการสตริง ค่าเริ่มต้นเป็นโมฆะremove_end_sequence
: ทางเลือก ไม่ว่าคุณต้องการลบสตริง end_sequence
ออกจากผลลัพธ์หรือไม่ ค่าเริ่มต้นเป็นเท็จ client . generation ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด gs_correction()
และส่งข้อความที่คุณต้องการให้ถูกต้อง:
client . gs_correction ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด image_generation()
และส่งข้อความคำสั่งสำหรับรูปภาพใหม่ที่คุณต้องการสร้าง:
client . image_generation ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด intent_classification()
และส่งข้อความที่คุณต้องการแยก Intent จาก:
client . intent_classification ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด kw_kp_extraction()
และส่งข้อความที่คุณต้องการแยกคำหลักและวลีจาก:
client . kw_kp_extraction ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด langdetection()
และส่งข้อความที่คุณต้องการวิเคราะห์เพื่อตรวจจับภาษา
client . langdetection ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด paraphrasing()
และส่งข้อความที่คุณต้องการถอดความ
client . paraphrasing ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด question()
แล้วส่งผ่านสิ่งต่อไปนี้:
client . question ( "" , "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด semantic_search()
และส่งข้อความค้นหาของคุณ
client . semantic_search ( "Your search query" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด semantic_similarity()
และส่งรายการที่ประกอบด้วยข้อความ 2 บล็อกที่คุณต้องการเปรียบเทียบ
client . semantic_similarity ([ "" , "" ])
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด sentence_dependencies()
และส่งบล็อกข้อความที่ประกอบด้วยหลายประโยคที่คุณต้องการใช้ POS + ส่วนโค้ง
client . sentence_dependencies ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด sentiment()
แล้วส่งผ่านสิ่งต่อไปนี้:
client . sentiment ( "" , "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด speech_synthesis()
และส่งข้อความที่คุณต้องการแปลงเป็นเสียง:
client . speech_synthesis ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกใช้เมธอด summarization()
และส่งข้อความที่คุณต้องการสรุป
client . summarization ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด tokens()
และส่งข้อความที่คุณต้องการโทเค็น
client . tokens ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON
เรียกเมธอด translation()
และส่งข้อความที่คุณต้องการแปล
client . translation ( "" )
คำสั่งดังกล่าวส่งคืนวัตถุ JSON