يمكن إجراء تجزئة الكلمات على الجمل الصينية والإنجليزية باستخدام علامات الترقيم المختلطة بالعرض الكامل ونصف العرض. يمكنك اختيار الحد الأقصى لطول الكلمة في العبارة، والحد الأدنى لطول الكلمة في جملة علامات الترقيم، وما إذا كنت تريد الاحتفاظ بكلمة واحدة في نتيجة تجزئة الكلمة، وما إذا كنت تريد الاحتفاظ بعلامات الترقيم، وغيرها من الوظائف. للحصول على إرشادات أكثر تفصيلاً، الرجاء عرض ملف Readme.txt الموجود في حزمة التنزيل.
يتم توفير ملف قاموس SQLite بشكل افتراضي. إذا كان مضيفك الافتراضي لا يدعم sqlite، فيمكنك استيراده إلى mysql أو إنشاء قواميس أخرى بنفسك.
ونظراً لقدراتي المحدودة، قد لا أتمكن من إرضاء الجميع من حيث الكفاءة، لذا يرجى إدراج المزيد من المعلومات.
إن تركيب القاموس وتفريغه والاستعلام عنه له وظائف منفصلة، لذلك يجب أن يكون من السهل تعديله. تحتاج خوارزمية تجزئة الكلمات الأساسية فقط إلى findinDict لإرجاع صحيح أو خطأ لإخباري ما إذا كانت الكلمة موجودة في القاموس.
شيء آخر يجب ملاحظته هو أن امتداد mbstring مطلوب. لا توجد طريقة لدمج الكلمات الصينية والإنجليزية والعرض الكامل ونصف العرض معًا لتقسيم الكلمات. من الصعب جدًا حساب طول الجملة دون استخدام mbstring.
يتم توفير البرنامج كامتداد لـ ThinkPHP بشكل افتراضي، ولكن يمكنك إزالة قاعدة الامتدادات واستخدام تجزئة الكلمات مباشرة. اتفاقية Apache2 مفتوحة المصدر، لذا، لا يهم إذا تم استخدامها لأغراض تجارية مغلقة المصدر، طالما أنك لا تكره برنامجي
يوسع