قد يكون البحث عن العبارات التي يقولها الأشخاص من حولك أمرًا صعبًا. ماذا عن التحديثات الديناميكية لمجموعة البيانات هذه؟ تخزين قابل للتطوير وزمن وصول منخفض؟ هدفي الرئيسي من هذا المشروع هو بناء نظام يلبي هذه المتطلبات ويسمح بمواكبة الاتجاهات الموجودة في التغريدات في الوقت الفعلي.
باتباع فكرة الفهرس المقلوب، قمت بتنفيذ التطبيق الذي يبحث في الوقت الفعلي عن التغريدات ذات المحتوى المحدد، ويخزنها في نظام ملفات محلي ويسمح بإجراء بحث قائم على الكلمات مباشرة بعد تهيئة اتصال العميل.
لتشغيل التطبيق تحتاج إلى:
git clone https://github.com/cyberpunk317/inverted_index.git
TWITTER_APP_KEY = 'YOUR APP KEY'
TWITTER_APP_SECRET = 'YOUR APP SECRET'
TWITTER_KEY = 'YOUR KEY'
TWITTER_SECRET = 'YOUR SECRET'
إنشاء ملفات Dockerfiles للعميل والخادم:
./gradlew clean build createClientDockerfile createMainDockerfile
سيؤدي هذا إلى إنتاج app_server.Dockerfile وapp_client.Dockerfile في الدليل الجذر.
بدء التطبيق:
docker-compose up
إطلاق جلسة العميل:
docker build -f app_client.Dockerfile -t client:latest . && docker run -it --rm --network=host client:latest bash
ابدأ في كتابة الكلمات التي تهمك. سيعرض الخادم موقع التغريدات بالتنسيق "dataset_v2//tweet_N.txt". على سبيل المثال:
You entered: war
Server response: [dataset_v2/Veeresh Dambal/tweet_30.txt, dataset_v2/pedro schliesser/tweet_1.txt]
راجع المشكلات المفتوحة للحصول على قائمة بالميزات المقترحة (والمشكلات المعروفة).
وزعت بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. راجع LICENSE
لمزيد من المعلومات.