TASE(Telegram 音訊搜尋引擎)
基於 Telegram 的閃電般的音頻全文搜尋引擎
它允許用戶快速、輕鬆地找到真正感興趣或有價值的信息,而無需費力通過眾多不相關的管道。它為用戶提供搜尋結果,找到有關高品質音訊檔案的相關資訊。
是什麼讓 TASE 如此特別?
TASE 是一個不斷發展的開源全文音訊搜尋引擎平台,可滿足用戶的大量請求。基於Python和Telegram,最新的重大更新引入了許多新功能,其中由Elasticsearch和ArangoDB提供支援的高度抽象和模組化的設計模式,支援位於世界不同地區的不同伺服器上的平行叢集。
泰斯一目了然
- 進階音訊檔案全文搜尋引擎
- 極快的音訊檔案索引器(基準:每個客戶端每天至少 400 萬首歌曲)
- 支援多個並行客戶端作為索引器
- 支援多個伺服器上的分散式並行叢集(搜尋和索引)(所有音訊檔案、圖形和文件模型)
- 使用者和專案圖
- 動態 URL
- 非同步
- 使用管理工具
- 多種語言
- 音訊檔案快取
- 輕鬆配置和自訂
- 友善的外觀和感覺
TASE 是免費的,而且永遠都是免費的。幫助我們......如果您喜歡免費的東西和優秀的軟體,請給我們一顆星! :星::星2:
特徵
面向開發人員的功能
- 在語言環境中加入新語言(我們建議使用 Poedit)
- 透過在按鈕基底類別中實作抽象方法,輕鬆新增按鈕和功能(查詢和內嵌)
- 圖形模型和音訊檔案的即時視覺化(Kibana、ArangoDB)
- 抽象和立面設計模式
廣泛的功能
搜尋引擎
- 透過直接機器人搜尋搜尋音訊文件
- 使用 @bot_name 提及從群組和私人聊天中搜尋音訊檔案並將其直接發送到聊天
- 透過顯示內聯結果列表,使用 @bot_name 提及進行即時搜尋
- 私聊、群聊中直接即時搜尋
- 根據檔案名稱、表演者姓名和音訊名稱進行搜索
- 在一則訊息中顯示前 10 個相關結果,並在更多結果中無限制;作為內聯列表返回
- 下載前先播放內嵌清單中的歌曲
- 快取搜尋到的音訊檔案以避免不必要的冗餘資料庫請求
- 結果的動態 URL
- 允許所有者追蹤下載的音訊文件
- 高準確性和相關性
- 以多種語言進行搜尋
- 顯示來源通道名稱和文件鏈接
- 以反向模式對結果進行排序(以使更相關的結果位於底部)
搜尋範例截圖
結果音訊範例螢幕截圖
索引功能
- 以樂觀的方式自動尋找新通道(首先假設它是有效通道,然後在開始索引之前對其進行驗證)
- 從文字和標題中摘錄
- 摘自“轉寄提及”
- 從連結中提取
- 自動索引新頻道
- 迭代之前的通道並從先前的檢查點恢復索引
- 極快的索引(每個客戶端每天至少 400 萬首歌曲
- 分析渠道並根據其計算分數 (0-5)
- 音訊檔案的密度(音訊檔案的比例
- 頻道的活動(共享新文件的頻率)
- 會員人數
- 避免被 Telegram 伺服器禁止
- 支援使用多個 Telegram 用戶端並行索引
- 以特定方式對檔案 ID 進行哈希處理,從而在很大程度上避免衝突,並且仍然保持短至八個字符
- 使用者和頻道擁有者可以使用“/indexchannel_name”發送請求以索引特定頻道
- 即時建立使用者和音訊檔案的圖表,可用於推薦系統和連結預測任務
使用者限制/控制功能
- 近乎即時地處理您頻道中的用戶會員資格
- 根據用戶的會員狀態設定限制
- 限制非會員用戶自由搜尋5個音訊文件,然後等待一分鐘才能收到搜尋到的音訊檔案
- 非會員在直接聊天搜尋方面受到限制
使用者介面
- 使用者指南
- 多個選單(主頁、說明、播放清單等)
- 每個部分都有一個鍵盤,以簡化使用者的流程
- 多語言機器人 - 目前支援:
- ??英語
- ??西班牙語
- ??俄文
- ??阿拉伯
- ??葡萄牙語
- ??印地語
- ??德文
- ??庫德語(索拉尼語)
- ??庫德語(庫爾曼吉語)
- ??荷蘭語
- ??義大利語
- ??波斯語
- 如果用戶超過一周或超過兩週沒有活動,則根據用戶的活動向他們發送問候訊息
- 透過按下主鍵盤中的歷史記錄按鈕,透過可滾動內聯清單顯示每位使用者的搜尋記錄
- 美麗而充滿活力的使用者介面(訊息和表情符號)
播放清單
- 用戶可以擁有無限的播放列表,並在每個列表中保存無限的音頻文件
- 用戶可以編輯播放清單元數據
- 使用者可以編輯已儲存的音訊文件
主選單截圖
管理功能
- 即時圖形視覺化(支援ArangoDB儀表板)
- 即時索引音訊檔案視覺化(支援 Kibana 儀表板)
* Kibana 是一種資料視覺化和探索工具,用於日誌和時間序列分析、應用程式監控和營運智慧用例。它提供強大且易於使用的功能,例如直方圖、折線圖、圓餅圖、熱圖和內建地理空間支援。
其他
- 極快
- 程式碼中提供了文件(文檔字串)
- 處理資料庫相關異常
- 多執行緒搜尋(非同步搜尋多個請求)
- 完美處理 RTL 文本
技術堆疊
開發TASE所使用的主要工具和技術如下:
- 彈性搜尋
- 阿蘭戈資料庫
- 熱解圖
- Python 取得文字
- 芹菜
- RabbitMQ
- 雷迪斯
- 派丹提克
- 金賈
徵件捐款
我們歡迎您的專業知識和熱情!
為 Telegram 音訊搜尋引擎做出貢獻的方式:
- 編寫程式碼
- 審查拉取請求
- 開發教程、簡報、文件和其他教育材料
- 翻譯文件和自述文件內容
我們熱愛您的貢獻,並盡力為您提供指導和支持。如果您正在尋找要解決的問題,請查看問題。
問題
如果您在程式碼中遇到任何問題,請在此處報告。更好的方法是在Github上分叉儲存庫和/或建立拉取請求。
未來的工作
如果您覺得有幫助,請給我們一個
執照
TASE 根據 Apache 授權 2.0 版授權。請參閱許可證以取得完整的許可證文字。