تصف هذه المقالة طريقة برمجة Java لاستخراج الكلمات الرئيسية من المقالة. شاركه للرجوع إليه ، على النحو التالي:
رمز التنفيذ:
/** * حزم جرة ذات صلة * Lucene-Core-3.6.2.jar ، Lucene-Memory-3.6.2.jar ، * Lucene-Highlighter-3.6.2.jar ، Lucene-Analyzers-3.6.2.jar * Ikanalyzer2012 .jar * * اعتراض الكلمات الرئيسية التي تظهر بشكل متكرر في مقالة ، ومنحها التجميع (الفلاش باك) ، وإعادة الكلمات الرئيسية في تنسيق الصفيف * * تحتوي هذه الفئة على طريقة 2map ، والتي يمكن أن تحوّل مجموعات مكررة. <string ، integer>* وحساب عدد التكرار من <string> وضعه في القيمة المقابلة*/package com.lifeix.api.Util ؛ استيراد java.Uraylist ؛ الدخول ؛ */ فئة عامة WordUtil {/ ** اختبار المقالة*/ Static String Keyword = "أصبحت الممثل الكوميدي Pan Changjiang" صانعًا للذكور "، لكن هذه المرة ليس رسمًا - الكوميديا الحضرية" Male Matchmaker "مكتوب ، موجه وموجه. تم تصرفه في 13 يناير ، تم عرضه لأول مرة على تلفزيون بكين. "Taiwan's No. 1 Dilm Beauty 2" قصة الحب الرومانسية "الهجوم المضاد للحرير" "+". مواد "" ذكور موتنينز "تدور حول دينغ إيرشون وهو"+ "وكالة الزواج" Full Love "التي أطلقت. يبدو أن Ding Erchunyan ، وهو في منتصف العمر ، وكأنه "زواج وحب الحب" المتزايد في فرص العمل ، ويريد أن يبدأ مهنة وحياة مع فم ذكي. " +" الربيع الثاني ". افتتحت وكالة الزواج بشكل جيد ، وكان العملاء مزدحمين ، لكن المتطلبات كانت جميع أنواعها الغريبة. واحدة من أبرز الأحداث في المسرحية هي مزيج من امرأة جميلة مع "رجل قبيح" ، وأصبح تشانغ تينغ وبان تشانغجيانغ زوجًا من الأعداء السعداء. قال تشانغ تينغ إن الاثنين في المسرحية "+" لهما فجوة في الارتفاع ، وفجوة في العمر ، ومظهر غير متكافئ ". عندما تحدث بان تشانغجيانغ عن هذا الإعداد بطل الرواية ، كان يعتقد أن "أدوار تشانغ تينغ السابقة كانت مستقلة ولطيفة للغاية ، و" امرأة كبيرة "و" " +" ليتل مان "هي إعدادات زوجنا ، لذلك تشانغ تينغ مناسب للغاية المرشح. قال بان تشانغجيانغ إن المسرحية بأكملها تُظهر قيم الزواج والحب المختلفة في المجتمع المعاصر من خلال منظور المهنة الخاصة لـ "صانع الثقاب" ، والتي تغطي العديد من الموضوعات التي تمت مناقشتها بشكل ساخن ، مثل "+" الغسق الحب ، الذهب- عبادة النساء ، والرجال فينيكس. (المراسل يين تشونفانغ) إخلاء المسئولية: تمثل هذه المقالة وجهات النظر الشخصية للمؤلف فقط وليس لها أي علاقة بالشبكة العالمية. لم يتم التحقق من أصالةها والكلمات ومحتوى البيان "+" في المقالة. ويطلب النص. "؛ /** احصل على عدد الكلمات الرئيسية* /عدد الأعداد الثابتة النهائية num = 5 ؛ /** المقالات ، تستخرج الكلمات بذكاء في قائمة * param مقالة * param a * regurn * throws ioException */ قائمة ثابتة خاصة <string> extract (مقالة سلسلة ، integer a) th th th {list <string> list = new ArrayList <string> () ؛ طريقة TokenStream (اقرأ دفق الأحرف من المقالة) محلل. هو نوع char tokenstream.getAttribute (chartermattribute.class) ؛ الكمية (الافتراضي هو أكثر من كلمتين). القيمة الافتراضية هي 1 * param list * @return */ private static map <string ، integer> list2map (list <string> list) {map <string ، integer> map = new hashmap <strin g ، integer> () ؛ لـ (مفتاح السلسلة: قائمة) {// loop-obtained list set if (list.contains (key)) {// just armain map.put (key ، map.get (key) == null؟ 1: map؟ 1: map؟ . / ** * طريقة استخراج الكلمات الرئيسية * param مقالة * param a * param n * return * throws ioException */ سلسلة ثابتة عامة [] <String> keywordslist = extract (مقال ، أ) مجموعات لمطابقة MA في p order of value arraylist <intern <string ، integer >> ript = new ArrayList <intern <string ، integer >> (map.entryset ()) ؛ en try <string ، integer >> () {public int compare (map.entry <string ، integer> o1 ، map.entry <string ، integer> o2) {return (o2.getValue () - o1.getValue ()) ؛ لكي يتم إخراج (int i = 0 ؛ i <list.size () ؛ i ++) {// array بعد فرز الحلقة إذا (i <n) i) .getkey () ؛ Return GetKeywords (المقالة ، الكمية ، num) ؛ ) {system.out.println (الكلمات الرئيسية [i]) ؛
آمل أن يكون هذا المقال مفيدًا لبرمجة Java للجميع.