A comprehensive mapping database of English to Chinese technical vocabulary in the artificial intelligence domain.
本術語庫目前擁有專業術語約2442 個、專項領域篇2 篇,主要為人工智能領域基礎概念和術語。
本術語庫前兩版主要是將機器之心在編譯技術文章和論文過程中所遇到的專業術語記錄下來,希望有助於大家查閱和翻譯,同時也希望大家能積極指出我們編譯的不當之處,共同推進知識高效、廣泛地傳播。
自第三版起,在日常編譯工作積累之外,我們將逐領域基於權威教科書及文獻,聯合領域專家進一步擴展並完善本倉庫,為社區提供具有統一性的AI 及相關領域的中英術語翻譯對照參考。
機器之心將從三個方面持續完善術語的收錄和擴展閱讀的構建:
①第一階段機器之心將繼續完善基礎術語的構建,即通過權威教科書或其它有公信力的資料抽取常見術語;
②第二階段機器之心將持續性地把編譯論文或其他資料中所出現的非常見術語更新到術語表中;
③第三階段機器之心將聯合更多的領域專家,構建專項領域的術語表。
索引 | V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | V10 |
---|---|---|---|---|---|---|---|---|---|---|
U1 | - Q - | - W - | - E - | - R - | - T - | - Y - | - U - | - I - | - O - | - P - |
U2 | - A - | - S - | - D - | - F - | - G - | - H - | - J - | - K - | - L - | |
U3 | - Z - | - X - | - C - | - V - | - B - | - N - | - M - |
讀者在此項目中,可通過以上字母錶盤或不同領域查看自己想要了解的專業術語。其中,術語的組織形式為:
本項目中所有英文專業術語對照的中文都來自機器之心編譯的文章和系列機器學習教科書(如周志華教授的《機器學習》、李航博士的《統計學習方法》、邱錫鵬教授的《神經網絡與深度學習》、李沐博士的《動手學深度學習》、李宏毅教授的《機器學習方法》和Ian Goodfellow 的《深度學習》中譯版等),我們力求在提供準確翻譯的同時保留最常用的形式。同時,為了保證術語翻譯的準確性,我們將此項目向讀者開源,並希望能與讀者共同迭代術語的準確度。
因為該項目很多術語都是機器之心平常編譯文章所積累的,所以我們首先需要向讀者說明機器之心術語編譯的標準。
機器之心常見術語的編譯首先會確保術語的正確性,其次再考慮術語的傳播廣度。機器之心在對常見術語編譯時並不會保留英文,也不會作進一步說明。
機器之心在編譯技術文章或論文時,常常會遇到非常見的術語。因為像論文那樣的文章是在特定領域下為解決特定問題而規範化書寫的,所以就會存在較多的非常見的術語。而機器之心在編譯非常見術語時,唯一的標準就是準確性,通常我們也會保留英文。因為非常見術語通常是數學、神經科學和物理學等領域上的專業術語,機器之心會盡可能地借鑒其他領域內的譯法和意義而確定如何編譯。例如fixed-point theorem,在參考數學的情況下,我們會更傾向於譯為不動點定理,fixed-point 譯為不動點而不是定點。
還有很多術語其實是有歧義的,而對於這一類術語,機器之心的編譯標準會根據語義進行確定,因此也會有一些誤差。例如bias 在描述神經網絡層級單元時可以譯為偏置項,而在描述訓練誤差和交叉驗證誤差間的關係或學習曲線時,bias 可以譯為偏差。這樣的例子還有很多,比如Stationary 在馬爾可夫模型中可譯為穩態分佈(Stationary Distribution),在最優化問題中可譯為駐點(Stationary Point),而在涉及博弈論或對抗性訓練時,其又可能表達為靜態。
以上是機器之心大概編譯術語的標準,雖然我們在常用術語的編譯上錯誤率相對較低,但在非常見術語和歧義術語上仍然會出現一些錯誤。尤其是在非常見術語的編譯上,沒有特定的背景知識很容易在編譯上出現誤差。因此我們希望能與讀者共同加強術語的編譯質量。
除了機器之心積累的術語庫之外,本項目還包含了來自專項領域的術語,專項領域篇的質量會更高。對於專項領域篇術語編譯標准說明如下:
專項領域專家的參與確保我們收集到的術語具有專業性。例如在機器學習(Machine Learning)篇中,我們在周志華教授、李航博士、邱錫鵬教授、李沐博士、Aston Zhang 博士等該領域權威專家及經典教科書作者的指導下,不僅完成了對該領域術語收錄的覆蓋度、術語中文翻譯用法的準確性、專業性及公信力的提升,同時也完成了為社區構建一套具有公信力的領域術語統一中文翻譯用法參考資料的工作。
機器之心將蒐集自權威教科書、論文等具有公信力的資料源中的術語表進行校驗匯總,並從中篩選出一些具有爭議、沒有翻譯等情況的術語給到領域專家進行集中討論以確認翻譯、統一翻譯。在與專家討論的過程中,不同的專家對同一個詞的翻譯也會有分歧。在這種情況下,專家們會從自身經驗、理解出發,幫助其餘專家理解自己這樣翻譯的一個背景知識。經過專家們不斷的討論,對於一個詞的翻譯最終會接近或達到一個共識。
在此過程中,我們也記錄了一些有意思的結果。例如“Robust” 經常會被翻譯為“魯棒性”,專家們認為這個翻譯缺少了中文的美感。此外,在控制論中有將“Robust” 翻譯成“強健性的,在經過專家討論之後,我們將“穩健性”作為“Robust”的推薦翻譯;“Dropout”一直沒有較好的翻譯,幾位專家根據Dropout 原文中“temporarily removing” 的表述,一致認為“暫退法”是較為合適的翻譯;“Zero/Few/One-shot Learning”一般翻譯為“零/少/單樣本學習”,但專家們認為“樣本”不嚴謹,因為它並不是真的“零/少/單”樣本,而是在建立一個映射之後,再利用少量樣本進行遷移。翻譯成樣本的話,很容易跟學習理論中真正的“小樣本學習”混淆了。尤其是“shot”本身並沒有“樣本”的含義,而是“快照”的含義更接近,在確定中文翻譯時,聯想到“have a shot” 的意思是“試一試”,於是專家們傾向翻譯為“零/少/單試學習”。
類似Accuracy、Recall 等常用的術語在不同領域中都會有使用,因此會有同一個術語出現在不同的專項領域篇中的情況。
在使用術語表的過程中若發現了存在的錯誤、或是想要擴展術語庫的內容、討論特定術語的翻譯等等非常歡迎大家提Issue 與我們以及各位讀者進行討論。同時也非常歡迎讀者們進行Fork、提Pull Request,共同加強術語的編譯質量以及擴充術語庫的規模。
讀者的反饋意見和更新建議將貫穿整個階段,我們也將在項目致謝頁中展示對該項目起積極作用的讀者。我們希望術語的更新更具準確度和置信度,所以我們希望讀者能附上該術語的來源地址與擴展地址。這樣,我們能更客觀地更新術語,並附上可信的來源與擴展。
衷心感謝以下人員參與了包含但不限於術語提供、校對、翻譯討論等工作,為該項目擴展了專項領域術語收錄的覆蓋度、提升了術語中文翻譯用法的準確性、專業性及公信力,感謝老師們的辛勤貢獻。
排名將以A~Z 進行排序:
機器學習(Machine Learning)篇特別緻謝
AI for Science 篇特別緻謝
基礎工作由機器之心多位項目組成員完成
除目前已包含的機器學習(Machine Learning)、AI for Science 篇,本項目還將進一步製作更多專項領域篇。對我們項目感興趣並願意一起支持這個項目的領域專家可以通過[email protected] 聯繫我們。
我們邀請更多感興趣一起參與「AITD」項目的小伙伴通過加入「機器之心分析師網絡」加入到「AITD」項目工作中來。
掃碼關注「機器之心SOTA模型」服務號,參與「AITD」項目。
本作品採用知識共享署名-非商業性使用-相同方式共享4.0 國際許可協議進行許可。