โทรเลขคีย์เวิร์ดแนวโน้ม
เครื่องมือวิเคราะห์เพื่อสำรวจการปรากฏตัวของคำพูดแสดงความเกลียดชัง ข้อมูลบิดเบือน และเรื่องเล่าที่น่าสนใจบนแพลตฟอร์มแชท Telegram โปรดใช้เครื่องมือนี้ด้วยความระมัดระวัง เนื่องจากไม่มีการกลั่นกรองหรือกรองเนื้อหา คุณต้องรับผิดชอบต่อเนื้อหาที่อาจส่งออก
กล่าวโดยสรุป เครื่องมือนี้ช่วยให้คุณค้นหาช่องทั้งหมดที่คุณติดตามด้วยรายการคำหลัก/วลี และส่งคืนผลลัพธ์ที่ตรงกันทั้งหมดในรูปแบบต่างๆ พร้อมการแสดงภาพกราฟ นอกจากนี้ยังเป็นทางเลือกในการดาวน์โหลดสื่อและสามารถใช้เป็นเครื่องมือค้นหาสื่อได้ (ปัจจุบันมีข้อบกพร่องบางประการในฟีเจอร์นี้ - อย่าใช้เป็นเครื่องมือค้นหาสื่อที่ละเอียดถี่ถ้วน)
ภาพหน้าจอของเครื่องมือที่ใช้งานจริง สำรวจคำพูดแสดงความเกลียดชังระหว่างการรุกรานยูเครนอย่างเต็มรูปแบบของรัสเซีย
คุณสมบัติที่สำคัญ
- เครื่องมือนี้ออกแบบมาเพื่อทำงานกับหุ่นเชิดที่ติดตามหลายช่องทางซึ่งครอบคลุมหัวข้อใดหัวข้อหนึ่ง
- คุณสามารถเปลี่ยนรายละเอียด API เพื่อใช้บัญชีอื่นได้โดยแก้ไขไฟล์ api_values.txt
- เครื่องมือนี้ได้รับการออกแบบมาให้ทำงานเหมือนกับ Google Trends ที่แสดงปริมาณรายวันของคำศัพท์สำคัญและแผนที่ในช่วงเวลาหนึ่ง
- การกรองวันที่ทำให้คุณสามารถจำกัดการค้นหาให้แคบลงในช่วงเวลาที่สั้นลงได้ หากเว้นว่างไว้ ระบบจะปรับขนาดเป็นช่วงสูงสุดของข้อมูลโดยอัตโนมัติ
- เครื่องมือนี้ใช้การค้นหาด้วย Telegram ซึ่งหมายความว่ามันดีเป็นพิเศษสำหรับการค้นหาภาษารัสเซีย และโดยทั่วไปสามารถจัดการการลงท้ายคำได้ดี
- สร้างกราฟเดี่ยวสำหรับแต่ละคำสำคัญ
- สร้างกราฟรวมที่แสดงคำสำคัญทั้งหมดในการค้นหาบนกราฟเดียวกันเพื่อการเปรียบเทียบ
- รวบรวมรายงาน PDF ที่แสดงกราฟและพิมพ์รหัสแบบเต็มสำหรับการตรวจสอบข้อมูลและการตรวจสอบความถูกต้องของหลักฐาน
- ส่งออกสรุปไฟล์ TXT รวมถึงสถิติหลักทั้งหมด เช่น วันที่ดำเนินการ ค้นหาช่อง และปริมาณสัมพันธ์ต่อช่อง
- การดาวน์โหลดสื่อเสริมเพื่อดูผลลัพธ์ (อย่างหนาแน่น (เช่น อย่างหนาแน่นมาก) จะช่วยยืดเวลาที่จำเป็นในการเรียกใช้เครื่องมือ)
- สื่อที่ดาวน์โหลดมีชื่อไฟล์ channelid_postid จึงสามารถค้นหาต้นฉบับได้ง่าย
สคริปต์นี้ค้นหาข้อความที่มีคำค้นหาที่ระบุในช่องโทรเลขที่ผู้ใช้เป็นสมาชิก โดยจะส่งออกผลการค้นหาในรูปแบบ HTML และ CSV สร้างรายงาน และวางแผนจำนวนข้อความต่อวัน
ได้รับการออกแบบมาเพื่อติดตามแนวโน้มของข้อความค้นหาในลักษณะเดียวกับที่ Google Trends ทำ ข้อมูลนี้มีประโยชน์มากในการระบุการเกิดขึ้นของคำพูดแสดงความเกลียดชัง หรือการพูดคุย/เรื่องเล่าหลังจากเหตุการณ์บางอย่าง
เวอร์ชันปัจจุบันนี้ไม่ได้ทำการปรับเปลี่ยนข้อมูลอย่างมีนัยสำคัญ เช่น กราฟไม่แสดงอุบัติการณ์ของคำที่ปรับตามอุบัติการณ์ของข้อความทั้งหมด ซึ่งหมายความว่าควรมีการวิเคราะห์เพิ่มเติมเพื่อให้แน่ใจว่าการเพิ่มขึ้นอย่างรวดเร็วของคำศัพท์จะไม่ถูกบดบังด้วยกิจกรรมทั่วไปที่เพิ่มขึ้นอย่างรวดเร็ว ด้วยเหตุนี้ ผลลัพธ์ของกราฟจึงควรถือเป็นตัวบ่งชี้ถึงความจำเป็นในการวิจัยเพิ่มเติมและการวิเคราะห์ทางสถิติ
ตัวอย่างผลลัพธ์ที่สำรวจคำพูดแสดงความเกลียดชังระหว่างการรุกรานยูเครนเต็มรูปแบบของรัสเซีย
รูปภาพนี้เป็นผลลัพธ์ตัวอย่างที่แสดงให้เห็นว่าช่องที่อยู่ระหว่างการตรวจสอบพบว่ามีการใช้คำเฉพาะเพิ่มขึ้นอย่างรวดเร็วได้อย่างไร
ตัวอย่างรายงานที่สร้างขึ้น
รูปภาพนี้เป็นตัวอย่างผลลัพธ์จากรายงาน ซึ่งเป็นเอกสาร PDF ที่แสดงโค้ดและพิมพ์สคริปต์ในตอนท้าย ซึ่งหมายความว่าไม่ว่าจะมีการเปลี่ยนแปลงใดหรือใช้สคริปต์เวอร์ชันใด ก็สามารถพิจารณากระบวนการที่แน่นอนได้
ภาพหน้าจอของข้อมูลบางส่วนที่สร้างขึ้นในรายงานสถิติ txt
เครื่องมือนี้ได้รับการทดสอบกับคำค้นหาภาษาอังกฤษและรัสเซีย
คำเตือน: เครื่องมือนี้ใช้รายการกลุ่มที่ติดตามของคุณเป็นรายการที่ค้นหา อาจรวมถึงการแชท/กลุ่มส่วนตัว เพื่อประโยชน์ของ OPSEC ขอแนะนำให้ใช้บัญชี Burner และติดตามเฉพาะการสนทนาที่เกี่ยวข้องกับการสืบสวนเท่านั้น
การติดตั้ง
โคลนพื้นที่เก็บข้อมูล tg-keyword-trends โดยการรันคำสั่งต่อไปนี้ในเทอร์มินัลหรือพร้อมท์คำสั่งของคุณ:
git clone https://github.com/thomasjjj/tg-keyword-trends.git
นำทางไปยังไดเร็กทอรี tg-keyword-trends:
cd tg-keyword-trends
ติดตั้งการพึ่งพา Python ที่จำเป็นโดยใช้ pip:
pip install -r requirements.txt
คุณสมบัติ
- กราฟจะปรับขนาดเป็นโพสต์ที่เก่าที่สุดและใหม่ล่าสุด
- CSV สร้างขึ้นเพื่อการประมวลผลต่อไป
- ไฟล์ HTML ที่สร้างขึ้นสำหรับการเปิดลิงก์
- สร้างรายงานที่บันทึกรายละเอียดที่สำคัญของการคัดลอก (วันที่ ช่องทางที่เข้าถึง ฯลฯ) เพื่อการตรวจสอบผลการค้นพบ
- ดาวน์โหลดสื่อ
การใช้งาน:
- เพิ่มคำค้นหา หนึ่งคำต่อบรรทัดลงในไฟล์ .txt คุณจะได้รับแจ้งให้ป้อนตำแหน่งไฟล์ในไม่ช้า
- ตรวจสอบให้แน่ใจว่าคุณมีรายละเอียด Telegram API ของคุณพร้อมแล้ว [https://my.telegram.org/auth]
- สคริปต์จะค้นหาทุกช่องทางที่ผู้ใช้เป็นสมาชิก
- ผลการค้นหาจะถูกส่งออกเป็นไฟล์ HTML และ CSV ในโฟลเดอร์เอาต์พุตที่มีการประทับเวลา
- สคริปต์จะสร้างรายงานที่มีผลการค้นหาสำหรับแต่ละช่อง
- สคริปต์จะพล็อตจำนวนข้อความต่อวันสำหรับคำค้นหาแต่ละคำในกราฟและบันทึกเป็นรูปภาพ
ฟังก์ชั่น:
- get_api_details : อ่านรายละเอียด API จาก 'api_details.txt'
- check_search_terms_file : อ่านคำค้นหาจาก 'search_terms.txt' หรือแจ้งให้ผู้ใช้ป้อนคำค้นหา
- create_output_directory : สร้างไดเร็กทอรีประทับเวลาสำหรับจัดเก็บไฟล์เอาต์พุต
- print_color : พิมพ์ข้อความในสีที่ระบุโดยใช้โมดูล colorama
- render_url : สร้างโค้ด HTML สำหรับไฮเปอร์ลิงก์โดยใช้ URL และข้อความ
- Generate_report : สร้างรายงานที่มีผลการค้นหาสำหรับแต่ละช่อง
- plot_keyword_frequency : พล็อตจำนวนข้อความต่อวันสำหรับข้อความค้นหาแต่ละคำในกราฟ
เคล็ดลับ:
- เนื่องจากคุณสมบัติการกรองวันที่ เครื่องมือนี้ยังทำงานได้ดีกับเครื่องมือค้นหา Telegram ที่ให้ผลลัพธ์ที่กรองวันที่ เพียงทำการค้นหาในหน้าต่างวันที่ที่ต้องการ และเปิดไฟล์ html เอาต์พุตเพื่อดูรายการข้อความที่ตรงกันและลิงก์ของข้อความเหล่านั้น
- เครื่องมือจะจัดการเขตเวลาโดยอัตโนมัติและปรับเปลี่ยนตามเขตเวลา โปรดใช้ความระมัดระวังเป็นพิเศษเมื่อแก้ไขส่วนใดๆ ของโค้ดที่เกี่ยวข้องกับรูปแบบเวลาและวันที่ เนื่องจากเป็นการยากที่จะแก้ไข
- ขอแนะนำให้คุณสร้างบัญชี Telegram เฉพาะสำหรับแต่ละหัวข้อ สิ่งนี้จะช่วยให้คุณสามารถกำหนดเป้าหมายเฉพาะช่องที่เกี่ยวข้องและกำจัดสิ่งรบกวนได้
- คุณไม่จำเป็นต้องค้นหาคำนามเอกพจน์และพหูพจน์แยกกัน เนื่องจากการค้นหาของ Telegram จะจัดการเรื่องนี้ (โดยทั่วไปคือ สำหรับภาษาอังกฤษและรัสเซีย)
*ภาพนี้แสดงการใช้ชื่อสถานที่ต่างๆ สำหรับ "บักมุต" รวมถึงชื่อโซเวียตเก่าด้วย การใช้เครื่องมือนี้เพียงครั้งเดียวอาจเป็นการตรวจสอบคำค้นหาที่ใช้ในการวิจัย OSINT ดังที่เห็นในที่นี้ เราอาจจำกัดศักยภาพในการสะสมหากพวกเขาใช้เฉพาะชื่อเมืองอย่างเป็นทางการในปัจจุบัน แทนที่จะเป็นชื่อในอดีตและเป็นที่ถกเถียงกันเช่นกัน -
การพึ่งพา:
- แพนด้า~=2.0.0
- matplotlib~=3.7.1
- เทเลทอน~=1.28.2
- สี~=0.4.6
- หมอน~=9.5.0
- รายงานห้องปฏิบัติการ~=3.6.12
- ตัวเลข~=1.24.2
- พิทซ์~=2023.3
- ทีคิวเอ็ม~=4.65.0
เวอร์ชัน Python: Python 3.11 หรือสูงกว่า
สิ่งที่ต้องทำ