spaCy เป็นไลบรารีสำหรับ การประมวลผลภาษาธรรมชาติขั้นสูง ใน Python และ Cython สร้างขึ้นจากการวิจัยล่าสุด และได้รับการออกแบบตั้งแต่วันแรกเพื่อใช้กับผลิตภัณฑ์จริง
spaCy มาพร้อมกับไปป์ไลน์ที่ได้รับการฝึกอบรมและปัจจุบันรองรับโทเค็นและการฝึกอบรมสำหรับ ภาษามากกว่า 70 ภาษา โดยมีคุณลักษณะความเร็วที่ล้ำสมัยและ โมเดลโครงข่ายประสาทเทียม สำหรับการแท็ก การแยกวิเคราะห์ การจดจำเอนทิตีที่มีชื่อ การจัดหมวด หมู่ข้อความ และอื่นๆ อีกมากมาย การเรียนรู้แบบหลายงานด้วย หม้อแปลง ที่ผ่านการฝึกอบรมมาแล้วอย่าง BERT รวมถึง ระบบการฝึกอบรม ที่พร้อมสำหรับการผลิตและโมเดลที่ใช้งานง่าย การจัดการบรรจุภัณฑ์ การใช้งาน และขั้นตอนการทำงาน spaCy เป็นซอฟต์แวร์โอเพ่นซอร์สเชิงพาณิชย์ที่เผยแพร่ภายใต้ใบอนุญาต MIT
- เวอร์ชัน 3.7 ออกแล้ว! ตรวจสอบบันทึกประจำรุ่นได้ที่นี่
เอกสารประกอบ | |
---|---|
️ สปาซี101 | เพิ่งเริ่มใช้ spaCy? นี่คือทุกสิ่งที่คุณจำเป็นต้องรู้! |
คู่มือการใช้งาน | วิธีใช้ spaCy และคุณสมบัติต่างๆ |
ใหม่ในเวอร์ชัน 3.0 | คุณลักษณะใหม่ ความเข้ากันไม่ได้แบบย้อนหลัง และคำแนะนำในการย้ายข้อมูล |
- เทมเพลตโครงการ | เวิร์กโฟลว์แบบ end-to-end ที่คุณสามารถโคลน แก้ไข และเรียกใช้ได้ |
- การอ้างอิง API | ข้อมูลอ้างอิงโดยละเอียดสำหรับ API ของ spaCy |
⏩ การประมวลผล GPU | ใช้ spaCy กับการประมวลผล GPU ที่เข้ากันได้กับ CUDA |
- โมเดล | ดาวน์โหลดไปป์ไลน์ที่ได้รับการฝึกอบรมสำหรับ spaCy |
- โมเดลภาษาขนาดใหญ่ | รวม LLM เข้ากับไปป์ไลน์ spaCy |
- จักรวาล | ปลั๊กอิน ส่วนขยาย การสาธิต และหนังสือจากระบบนิเวศของ spaCy |
ส่วนขยายโค้ด spaCy VS | เครื่องมือและคุณสมบัติเพิ่มเติมสำหรับการทำงานกับไฟล์ปรับแต่งของ spaCy |
?? หลักสูตรออนไลน์ | เรียนรู้ spaCy ในหลักสูตรออนไลน์เชิงโต้ตอบฟรีนี้ |
- บล็อก | อ่านเกี่ยวกับการพัฒนา spaCy และ Prodigy ในปัจจุบัน การเผยแพร่ การพูดคุย และอื่นๆ อีกมากมายจาก Explosion |
วิดีโอ | ช่อง YouTube ของเราพร้อมวิดีโอแนะนำ การเสวนา และอื่นๆ อีกมากมาย |
- บันทึกการเปลี่ยนแปลง | การเปลี่ยนแปลงและประวัติเวอร์ชัน |
- มีส่วนช่วย | วิธีมีส่วนร่วมในโปรเจ็กต์ spaCy และฐานโค้ด |
- ย้อย | สนับสนุนเราและงานของเราด้วยพวงหรีดที่ออกแบบเองไม่ซ้ำใคร! |
การให้คำปรึกษา การใช้งาน และคำแนะนำเชิงกลยุทธ์ NLP แบบกำหนดเองโดยทีมพัฒนาหลักของ spaCy คล่องตัว พร้อมการผลิต คาดการณ์ได้ และบำรุงรักษาได้ ส่งอีเมลถึงเราหรือตอบแบบสอบถาม 5 นาทีแล้วติดต่อเราได้เลย! เรียนรู้เพิ่มเติม → |
โครงการ spaCy ได้รับการดูแลโดยทีมงาน spaCy โปรดทราบว่าเราไม่สามารถให้การสนับสนุนเป็นรายบุคคลผ่านทางอีเมลได้ นอกจากนี้เรายังเชื่อว่าความช่วยเหลือจะมีคุณค่ามากขึ้นหากแบ่งปันแบบสาธารณะ เพื่อให้ผู้คนได้รับประโยชน์จากความช่วยเหลือมากขึ้น
พิมพ์ | แพลตฟอร์ม |
---|---|
รายงานข้อผิดพลาด | ตัวติดตามปัญหา GitHub |
- คำขอคุณลักษณะและแนวคิด | การสนทนา GitHub |
? คำถามการใช้งาน | การสนทนา GitHub · สแต็กโอเวอร์โฟลว์ |
- การสนทนาทั่วไป | การสนทนา GitHub |
สำหรับรายละเอียดเพิ่มเติม โปรดดูข้อเท็จจริง ตัวเลข และเกณฑ์มาตรฐาน
สำหรับคำแนะนำในการติดตั้งโดยละเอียด โปรดดูเอกสารประกอบ
conda-forge
) เมื่อใช้ pip การเผยแพร่ spaCy จะพร้อมใช้งานเป็นแพ็คเกจซอร์สและล้อไบนารี ก่อนที่คุณจะติดตั้ง spaCy และการขึ้นต่อกัน ตรวจสอบให้แน่ใจว่า pip
, setuptools
และ wheel
ของคุณเป็นปัจจุบัน
pip install -U pip setuptools wheel
pip install spacy
หากต้องการติดตั้งตารางข้อมูลเพิ่มเติมสำหรับการย่อและการทำให้เป็นมาตรฐานคุณสามารถเรียกใช้ pip install spacy[lookups]
หรือติดตั้ง spacy-lookups-data
แยกต่างหาก แพ็คเกจการค้นหาจำเป็นสำหรับการสร้างแบบจำลองเปล่าที่มีข้อมูลการย่อคำ และเพื่อย่อเป็นภาษาที่ยังไม่มีโมเดลที่ได้รับการฝึกล่วงหน้า และไม่ได้ขับเคลื่อนโดยไลบรารีบุคคลที่สาม
เมื่อใช้ pip โดยทั่วไปแนะนำให้ติดตั้งแพ็คเกจในสภาพแวดล้อมเสมือนเพื่อหลีกเลี่ยงการแก้ไขสถานะของระบบ:
python -m venv .env
source .env/bin/activate
pip install -U pip setuptools wheel
pip install spacy
คุณยังสามารถติดตั้ง spaCy จาก conda
ผ่านช่องทาง conda-forge
สำหรับวัตถุดิบรวมถึงสูตรการผลิตและการกำหนดค่า โปรดดูที่พื้นที่เก็บข้อมูลนี้
conda install -c conda-forge spacy
การอัปเดต spaCy บางอย่างอาจจำเป็นต้องดาวน์โหลดแบบจำลองทางสถิติใหม่ หากคุณใช้ spaCy เวอร์ชัน 2.0 หรือสูงกว่า คุณสามารถใช้คำสั่ง validate
เพื่อตรวจสอบว่ารุ่นที่ติดตั้งของคุณเข้ากันได้หรือไม่ และหากไม่เป็นเช่นนั้น ให้พิมพ์รายละเอียดเกี่ยวกับวิธีการอัปเดต:
pip install -U spacy
python -m spacy validate
หากคุณได้ฝึกฝนโมเดลของคุณเอง โปรดทราบว่าอินพุตการฝึกและรันไทม์ของคุณจะต้องตรงกัน หลังจากอัปเดต spaCy เราขอแนะนำ ให้ฝึกโมเดลของคุณ ด้วยเวอร์ชันใหม่
สำหรับรายละเอียดเกี่ยวกับการอัปเกรดจาก spaCy 2.x เป็น spaCy 3.x โปรดดูคำแนะนำในการย้าย
ไปป์ไลน์ที่ได้รับการฝึกอบรมสำหรับ spaCy สามารถติดตั้งเป็น แพ็คเกจ Python ได้ ซึ่งหมายความว่าพวกมันเป็นส่วนประกอบของแอปพลิเคชันของคุณ เช่นเดียวกับโมดูลอื่นๆ สามารถติดตั้งโมเดลได้โดยใช้คำสั่ง download
ของ spaCy หรือด้วยตนเองโดยชี้ pip ไปยังเส้นทางหรือ URL
เอกสารประกอบ | |
---|---|
ท่อที่มีอยู่ | คำอธิบายไปป์ไลน์โดยละเอียด ตัวเลขความแม่นยำ และเกณฑ์มาตรฐาน |
เอกสารประกอบโมเดล | คำแนะนำการใช้งานและการติดตั้งโดยละเอียด |
การฝึกอบรม | วิธีฝึกไปป์ไลน์ของคุณเองกับข้อมูลของคุณ |
# Download best-matching version of specific model for your spaCy installation
python -m spacy download en_core_web_sm
# pip install .tar.gz archive or .whl from path or URL
pip install /Users/you/en_core_web_sm-3.0.0.tar.gz
pip install /Users/you/en_core_web_sm-3.0.0-py3-none-any.whl
pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.0.0/en_core_web_sm-3.0.0.tar.gz
หากต้องการโหลดโมเดล ให้ใช้ spacy.load()
พร้อมชื่อโมเดลหรือเส้นทางไปยังไดเร็กทอรีข้อมูลโมเดล
import spacy
nlp = spacy . load ( "en_core_web_sm" )
doc = nlp ( "This is a sentence." )
คุณยังสามารถ import
โมเดลได้โดยตรงผ่านชื่อเต็ม จากนั้นเรียกใช้เมธอด load()
โดยไม่มีข้อโต้แย้ง
import spacy
import en_core_web_sm
nlp = en_core_web_sm . load ()
doc = nlp ( "This is a sentence." )
สำหรับข้อมูลเพิ่มเติมและตัวอย่าง โปรดดูเอกสารประกอบเกี่ยวกับโมเดล
อีกวิธีหนึ่งในการติดตั้ง spaCy คือการโคลนพื้นที่เก็บข้อมูล GitHub และสร้างจากแหล่งที่มา นั่นเป็นวิธีทั่วไปหากคุณต้องการเปลี่ยนแปลงฐานโค้ด คุณจะต้องตรวจสอบให้แน่ใจว่าคุณมีสภาพแวดล้อมการพัฒนาที่ประกอบด้วยการแจกจ่าย Python รวมถึงไฟล์ส่วนหัว คอมไพเลอร์ pip การติดตั้ง virtualenv และ git ส่วนคอมไพเลอร์นั้นยากที่สุด วิธีการทำเช่นนั้นขึ้นอยู่กับระบบของคุณ
แพลตฟอร์ม | |
---|---|
อูบุนตู | ติดตั้งการพึ่งพาระดับระบบผ่าน apt-get : sudo apt-get install build-essential python-dev git |
แม็ค | ติดตั้ง XCode เวอร์ชันล่าสุด รวมถึงสิ่งที่เรียกว่า "เครื่องมือบรรทัดคำสั่ง" macOS และ OS X มาพร้อมกับ Python และติดตั้ง git ไว้ล่วงหน้าแล้ว |
หน้าต่าง | ติดตั้งเวอร์ชันของ Visual C++ Build Tools หรือ Visual Studio Express ที่ตรงกับเวอร์ชันที่ใช้ในการคอมไพล์ล่าม Python ของคุณ |
สำหรับรายละเอียดและคำแนะนำเพิ่มเติม โปรดดูเอกสารประกอบเกี่ยวกับการคอมไพล์ spaCy จากแหล่งที่มาและวิดเจ็ต QuickStart เพื่อรับคำสั่งที่เหมาะสมสำหรับแพลตฟอร์มและเวอร์ชัน Python ของคุณ
git clone https://github.com/explosion/spaCy
cd spaCy
python -m venv .env
source .env/bin/activate
# make sure you are using the latest pip
python -m pip install -U pip setuptools wheel
pip install -r requirements.txt
pip install --no-build-isolation --editable .
วิธีติดตั้งพร้อมบริการเสริม:
pip install --no-build-isolation --editable .[lookups,cuda102]
spaCy มาพร้อมกับชุดทดสอบที่ครอบคลุม ในการรันการทดสอบ โดยปกติคุณจะต้องการโคลนพื้นที่เก็บข้อมูลและสร้าง spaCy จากแหล่งที่มา นอกจากนี้ยังจะติดตั้งการพึ่งพาการพัฒนาที่จำเป็นและยูทิลิตี้ทดสอบที่กำหนดไว้ใน requirements.txt
หรือคุณสามารถรัน pytest
กับการทดสอบจากภายในแพ็คเกจ spacy
ที่ติดตั้งไว้ได้ อย่าลืมติดตั้งยูทิลิตี้ทดสอบผ่าน requirements.txt
ของ spaCy.txt :
pip install -r requirements.txt
python -m pytest --pyargs spacy