- 推薦一些我喜歡的科學研究工具(有些限定於AI 領域)
- 標記【待嘗試】的是我還未使用過但感覺比較有用的工具,會盡快嘗試並根據體驗決定是否保留
- 請透過issues 等方式向我推薦您覺得好用的但不在此清單上的AI 領域科研工具,感謝
一般來說,當我需要根據論文標題或其他資訊尋找PDF 文件時,我會首選使用dblp(檢索結果清晰,無需科學上網)。對於某些特殊情況,我會再使用Google Scholar。
dblp: computer science bibliography:專為CS 設計的論文查詢網站,收錄比較頂級並可以被檢索到的論文。可以依照會議、期刊等分類查詢作者的論文,想搜尋所有電腦會議的文章時好用。
Google scholar:除開搜尋論文之外,可以在這裡查看論文統計和引用參考文獻,還能透過關注作者或論文獲得新論文更新提醒,以及利用自動化推薦來提供一個基本庫。
Semantic scholar:可以結合外部材料整合進行論文的語意分析。功能包括:展示引用和參考文獻、度量論文影響力、展示論文圖表、自動生成關鍵字(根據標題)、分析作者、在網路上尋找額外資源(例如,相關youtube 影片),以及推薦論文。
arXiv: 論文預印本收錄網站。
arXiv-sanity:在功能上比起arXiv 有很大的改進,包括在瀏覽中顯示摘要、評論和非常基本的社交、推薦、庫功能。搜尋也更好用。
Semantic Sanity: A Personalized Adaptive Feed:創建自己的個人化arXiv 選讀Feed。創建每個Feed 時,會讓您先選擇幾篇論文,然後根據這幾篇論文開始推薦,對於推薦結果可以點讚或不喜歡來幫助調整推薦結果。
Paper Digest – AI for tracking and summarizing papers: 提供郵件訂閱前一天出的論文的列表,附有每篇論文的一句話總結。對我更重要的是這個網站也會在每個頂會論文全部公佈時進行整理。
Papers With Code:自動把論文連接到實作程式碼的GitHub 資源庫和資料集,並依照GitHub 的收藏量排序。展示各任務上的SOTA 以供比較。
labmlai/annotated_deep_learning_paper_implementations:很多演算法的PyTorch 實現,帶有線上版的註解。缺點是展示的部分不是從頭實現,一部分程式碼放在自己的包包裡了。
Mendeley:我目前使用這個。支援web、PC、Mac 和行動手機等多個平台,可直接註解和高亮顯示PDF,有限的免費雲端儲存。
Zotero:能夠對文獻資料庫網頁中的文獻題錄直接抓取,常與堅果雲搭配使用,來實現文獻管理多端同步(支援MacOS、Windows、iPad、Linux、iOS)。
Kimi Chat:類ChatPGT 產品,大夥應該都比較熟悉了。
Cool Papers:蘇劍林大佬開發的刷論文網站。可依README 自行探索使用。
CopyTranslator:最大的優點在於有置頂、點按複製、監聽剪貼簿等功能,閱讀文獻配合使用時可以無縫切換,非常方便。
Saladict 沙拉查詞:瀏覽器翻譯插件,有非常豐富的設定來配合使用者的使用習慣。除了官方文檔,也可以看沙拉查詞+ Alfred,打造最佳文獻翻譯體驗! 來了解。我還在探索如何在Windows 系統上實現瀏覽器外翻譯。
我之前使用印象筆記,但目前已經停用並考慮遷移。
語雀:非常輕量,我通常會使用網頁端。偶爾有些清單同步到手機端也很好用。新使用的同學可以填我的邀請碼QPFTUN 領取30 天會員:kissing_heart:
Notion:如果需要多人協作、專案管理,可能Notion 會更適合。
the-incredible-pytorch:有關PyTorch 的各種教學、專案、影片等資源。
computervision-recipes:微軟出品,基於PyTorch 的各種CV 任務的教學。
Pytorch-Project-Template:一個可擴展的PyTorch 專案模板,包括影像分割、目標分類、GANs 和強化學習等實例。
pytorch-template:另一份PyTorch 專案範本。
torchinfo:列印PyTorch 模型訊息,包含模型每層的參數量、輸出張量大小等。
flops-counter.pytorch:計算模型總共的FLOPs(浮點運算數,理解為計算量,可以用來衡量演算法/模型的複雜度)以及每層的佔比。缺點是似乎不支援RNN 相關層,另外印出來的資訊不是很方便看。
PyTorch 最新版本已經有tensorboard。官方tutorial。
visdom:【待嘗試】用於創建、組織和共享即時豐富資料視覺化的靈活工具。
Convolution Visualizer:如果卷積層配置比較複雜,不方便計算輸出大小時,可以利用這個視覺化工具輔助。
Google Dataset Search
Data Search | Bifrost:視覺資料集搜尋。
optuna:自動超參數最佳化框架。
microsoft/nni:【待嘗試】用於神經模型搜尋和超參數調優的開源自動機學習(AutoML)的工具包,支援絕大多數主流框架和運行環境。
Hyperopt:【待嘗試】分散式非同步超參數最佳化。看到知乎上有人推薦,不過根據文件來看,目前支援的最佳化演算法只有兩種,且不包括貝葉斯優化。
BoTorch:【待嘗試】基於PyTorch 的貝葉斯優化庫。
automl/Auto-PyTorch:【待嘗試】基於PyTorch 的自動結構搜素和超參數搜尋。
包括論文、報告、海報等在內的各種LaTeX 範本。
Templates from Overleaf
LaTeX Templates
多人協作推薦Overleaf,也是我絕大多數時候的選擇。單人專案可以使用VSCode 進行離線的LaTeX 寫作,配合Github 私有庫進行版本管理。
可以看一下這篇文章的推薦:有了這些網站,英文論文再也不難寫了(15個英文論文寫作輔助網站介紹和使用技巧) - 知乎
Linggle:搜尋最常出現的英文字詞搭配。不確定自己的表達方式是否正確時使用。
Corpus of Contemporary American English (COCA):可以查詞彙搭配的美式英語語料庫,可以查看具體的用了這個字的句子。 British National Corpus (BYU-BNC):英式英語的語料庫,語料比美式的少一些
Thesaurus:將低階詞彙轉換為同義的高端詞彙。
易搜搭ESODA:清華HCI Lab工作室出品的一款適合國人英語寫作的詞組搭配查詢工具。可切換具體研究方向的論文語料庫,展示相關的可替換用法,支援中英混搜。
Words and phrases: frequency, genres, collocates, concordances, synonyms, and WordNet:用不同顏色區分高中低頻詞,展現代表文章類型的詞彙,並歸類出相關可替換的詞。雖然說是英文寫作措詞輔助工具,感覺最大的用途是學習相關領域論文常用的詞彙和搭配。
除開各種類ChatGPT 外的一些選擇。請注意線上檢測工具的外洩風險,謹慎處理關鍵文字。
Grammarly:文法、句型、標點、選字偵測修改,有瀏覽器插件。
Nounplus.net:免費的線上英文文法檢測。
Mathpix:透過截取複雜數學方程式的截圖將其轉換為LaTeX 程式碼。可以處理PDF 的印刷體和照片中的手寫公式等。
MyScript Webdemo:Math 模組可以將手寫公式轉換為LaTeX 程式碼;同時,Diagram 模組可以將手繪的框圖轉換為工整的框圖。
Detexify LaTeX handwritten symbol recognition: 忘記某些字元用LaTeX 怎麼表示時,可以在這個網站上透過手寫來查詢。
Mac OS 系統可以使用OmniGraffle。
PPT 通常是我的第一個選擇:入手快,種類多,自由度高,支援導出向量圖。
Paper-Picture-Writing-Code:基於LaTex 的畫圖程式碼,包含折線圖、長條圖、散佈圖、注意力視覺化以及結構圖。
academic-drawing:Matlab/Python 繪圖,主要用於畫時序資料。
awesome-latex-drawing:LaTeX 繪圖,主要用於畫貝葉斯網路、張量分解等。
PlotNeuralNet:Python 得到可用於LaTeX 的圖,主要畫CNN。
提供各種格式的圖片的轉換服務的網站很多。這裡只是簡單列舉,你也可以透過搜尋引擎找到其他類似的網站。
Convert PNG/JPEG (Raster) to EPS/PDF (Vector) Format:將jpg、png 格式的圖片檔案轉換為eps 檔案。
EPS到PDF轉換器:也可以將eps 檔案轉換成別的格式的圖片。
Crop PDF files online - PDF Tools:裁剪pdf 檔的白邊。
TexLive 自帶了一些命令列工具:
epstopdf <file.eps>
;pdfcrop <file.pdf>
。 ccf-deadlines:可以根據研究方向和CCF 等級來篩選本年度已經確定截止日期的會議。對國內的同學比較友善。
AI Conference Deadlines:可以依照研究方向篩選會議。但好像需要科學上網才能看到全部資訊。
Conference List:依照截止時間排序,過期的會議不在首頁出現。有一頁可以看每個研究方向有哪些會議,但沒有辦法根據研究方向篩選還沒過期的會議。
Conference Partner (會伴):電腦最新國際會議與期刊清單。可以註冊以關注會議或期刊。比較全,但目前資訊更新不及時。
出於論文盲審考慮,有時文件(如源碼)連結需要是匿名的。有些人會選擇在Github 上建立匿名帳號,但為每個會議的每一篇論文都建立帳號可能過於繁瑣。我查到有一些工具支援匿名分享文件如下。
Dropbox:應該是最常使用的。
Open Science Framework
Figshare
Arxiv 論文提交流程-看這篇就夠了:文章,用於了解將論文提交至arXiv 上的流程。
arxiv-latex-cleaner:將論文的LaTeX 程式碼清理為提交至arXiv 上的要求。一個亮點是能夠自動清理掉論文中所有被註解掉的內容。
overleaf -> arxiv 絲滑提交過程:如果是使用Overleaf(而不是在本地將LaTeX 程式碼編譯為論文),可以先參考本文下載合適的原始碼包,然後再考慮使用arxiv-latex-cleaner。
為已發表的論文提供清晰、可重複的程式碼能夠有效推動領域發展。這裡推薦一些對開源程式碼有幫助的工具。
ReproducibilityChecklist-v2.0:一份機器學習復現清單,列舉了你應該提供哪些文件來增強你的論文的可複現性。
pigar:Python 專案requirements 檔案自動產生工具。
Rainyscope rain simulator:下雨聲。
LofiGirl的音樂自習室:Lo-Fi 音樂直播間。