AI Resources Central下載 - AI Resources Central源代碼下載

AI Resource Central

匯集全球優秀的人工智能開源項目！

簡體中文· English

歡迎來到AI Resource Central ！本倉庫專注於匯集來自全球的優秀人工智能（AI）開源項目。無論你是尋找靈感來啟動自己的項目，還是想要學習如何使用最新的AI技術，這裡都是一個絕佳的起點。我們致力於為AI開發者、研究人員以及愛好者提供一個平台，以便於探索、交流並共享各種AI項目的代碼與實現。

AI項目匯總

智能體
提示詞工程
AI開發接口
智能體開發框架
模型
AI列表
推理優化
信息聚合
代碼助手
AI教程
工作流自動化
AI機器人
多模態模型
多語言模型
數據組織
AI服務
向量數據庫
AI教育
AI開發工具
模型訓練
AI圖像生成
數據集
模型評估
計算管理
AI寫作
智能體監控
視頻生成
數據管理
AI應用
AI工程
目標
項目目錄
如何貢獻
許可證

目標

我們的主要目標是：

建立全面的AI項目庫：涵蓋機器學習、深度學習、自然語言處理等廣泛領域的項目。
促進開源精神：通過展示高質量的開源項目，鼓勵更多人參與到開源社區中。
推動技術創新：為開發者提供實際案例和解決方案，加速AI技術的應用和發展。
支持學習與發展：為不同水平的學習者提供實踐機會，幫助他們掌握最新的AI工具和技術。

項目目錄

以下是我們按照不同領域分類的部分精選AI項目列表：

智能體

Significant-Gravitas/AutoGPT - AutoGPT旨在讓所有人都能使用和開發人工智能。其使命是為人們提供專注於重要事務的工具。
geekan/MetaGPT - 第一家人工智能軟件公司的多智能體框架面向自然語言編程。
microsoft/autogen - 一個用於自主人工智能的編程框架，在PyPi、Discord和Office Hour上有相關資源。
reworkd/AgentGPT - 在瀏覽器中組裝、配置和部署自主人工智能代理。
joaomdmoura/crewAI - 角色扮演和自主人工智能體框架。它使智能體能夠協作並處理複雜任務。
microsoft/JARVIS - JARVIS是一個用於將大型語言模型（LLMs）與機器學習（ML）社區連接起來的系統。（論文：https://arxiv.org/pdf/2303.17580.pdf）
mem0ai/mem0 - 人工智能應用的存儲層。
microsoft/semantic-kernel - 快速且輕鬆地將最先進的大型語言模型（LLM）技術集成到您的應用程序中。
yoheinakajima/babyagi -
openai/swarm - 由OpenAI解決方案團隊管理的符合人體工程學、輕量級多智能體編排的教育框架。
phidatahq/phidata - 構建具有記憶、知識、工具和推理能力的多模態智能體，並通過美觀的智能體用戶界面進行聊天。
TransformerOptimus/SuperAGI - SuperAGI是一個開發者優先的開源自主人工智能代理框架，它能讓開發者快速、可靠地構建、管理和運行有用的自主代理。
composiohq/composio - Composio通過函數調用為人工智能代理和大型語言模型（LLMs）配備100多種高質量集成。
cpacker/MemGPT - Letta（以前叫MemGPT），一個用於創建具有記憶功能的大型語言模型（LLM）服務的框架。
google-deepmind/deepmind-research - 該存儲庫包含DeepMind出版物的實現代碼和示例代碼。
botpress/botpress - 用於構建和部署GPT/LLM智能體的開源中心。
OpenMOSS/MOSS - 一個由複旦大學開發且借助工具增強的開源對話式語言模型。
smol-ai/developer - 首個能讓你在自己的應用中嵌入開發者代理的庫。
OpenBMB/XAgent - 用於解決複雜任務的自主語言模型代理。
langchain-ai/langgraph - 以圖的形式構建具有彈性的語言智能體。
e2b-dev/e2b - 用於人工智能應用程序和代理的安全開源雲運行時。
modelscope/agentscope - 更輕鬆地構建由大型語言模型（LLM）賦能的多智能體應用程序。
homanp/superagent - 通過API運行人工智能代理。
aiwaves-cn/agents -
frdel/agent-zero - 零號特工人工智能框架。
microsoft/TinyTroupe - 由大型語言模型（LLM）驅動的多智能體角色模擬，用於提升想像力和獲取商業洞見。
QwenLM/Qwen-Agent - 基於Qwen≥2.0的代理框架和應用程序，具有函數調用、代碼解釋器、檢索增強生成（RAG）和Chrome擴展功能。
OpenBMB/AgentVerse - AgentVerse旨在用於在應用程序中部署多個基於大型語言模型（LLM）的代理，主要提供任務解決和模擬框架。
Significant-Gravitas/Auto-GPT-Plugins - Auto - GPT的插件。
huggingface/smolagents - Smolagents是一個用於代理（agents）的基礎庫。代理（agents）使用它來編寫用於工具調用（tool - calling）和代理編排（agent - orchestrating）的Python代碼。
Ironclad/rivet - 一個開源的可視化人工智能編程環境和TypeScript庫。
gmpetrov/databerry - 一個用於創建自定義大型語言模型（LLM）智能體的無代碼平台。
OpenBMB/BMTools - 大型模型的工具學習與ChatGPT插件的開源解決方案。
langroid/langroid - 使用多智能體編程來控制大型語言模型。
muellerberndt/mini-agi - MiniAGI是一個簡單的通用型自主智能體，依賴於OpenAI API。
Farama-Foundation/PettingZoo - 一種多智能體強化學習的應用程序接口（API）標準，包括常用的參考環境和實用程序。
Josh-XT/AGiXT - AGiXT是一個動態的人工智能平台，它使用自適應記憶、智能功能和插件系統管理指令並在多個人工智能供應商之間執行任務，以提供高效的人工智能解決方案。
togethercomputer/moa - 混合代理（MoA）在使用開源軟件模型的情況下，在羊駝評估（AlpacaEval）中達到了65.1%的成績。
AgentOps-AI/agentops - 用於人工智能代理監測、大型語言模型（LLM）成本追踪和基準測試的Python軟件開發工具包（SDK）。它與各種大型語言模型和代理框架集成。
noahshinn/reflexion - [NeurIPS 2023]《反思（Reflexion）：基於言語強化學習的語言智能體》
SciSharp/BotSharp - .NET中的人工智能多智能體框架。
dot-agent/nextpy -
iterative/datachain - 非結構化數據的提取、轉換、加載（ETL）、分析和版本控制。
agiresearch/OpenAGI - OpenAGI：大型語言模型（LLM）與領域專家的相遇。
InternLM/lagent - 一個用於創建基於大型語言模型的代理的輕量級框架。
MineDojo/MineDojo - 利用互聯網規模的知識構建開放式具身智能體。
Forethought-Technologies/AutoChain - AutoChain用於創建輕量級、可擴展且可測試的大型語言模型（LLM）智能體。
landing-ai/vision-agent - 視覺代理。
BCG-X-Official/agentkit - 一個用於使用Nextjs、FastAPI和Langchain構建受限代理的入門套件。
jina-ai/thinkgpt - 用於增強大型語言模型（LLM）並突破其局限的代理技術。
farizrahman4u/loopgpt - 一個用於Auto - GPT的模塊化框架。
Farama-Foundation/chatarena - ChatArena是一個用於大型語言模型（LLMs）的多智能體語言遊戲環境，旨在開發人工智能的溝通和協作能力。
THUDM/AgentTuning - 智能體調優（Agent Tuning）為大型語言模型賦予通用的智能體能力。
Yifan-Song793/RestGPT - 基於大型語言模型的自主代理通過RESTful API（表述性狀態傳遞應用程序接口）控制現實世界中的應用。
Link-AGI/AutoAgents - 在2024年國際人工智能聯合會議（IJCAI）上，生成了不同的GPT角色以構成一個協作實體來處理複雜任務。
AI-Engineer-Foundation/agent-protocol - 這是一個與人工智能代理交互的通用接口，與技術棧無關，可用於任何代理構建框架。
kreneskyp/ix - 一個用於自主GPT - 4的代理平台。

提示詞工程

f/awesome-chatgpt-prompts - 這個資源庫整理了ChatGPT提示詞，以更好地使用ChatGPT和其他大型語言模型（LLM）工具。
PlexPt/awesome-chatgpt-prompts-zh - ChatGPT中文調教指南。各類場景使用指南。學習如何讓它遵循你的指令。
dair-ai/Prompt-Engineering-Guide - 提示工程的指南、論文、講座、筆記和資源。
stanfordnlp/dspy - DSPy：一個用於對編程語言模型進行編程而非提示（prompting）的框架。
guidance-ai/guidance - 一種用於控制大型語言模型的引導語言。
outlines-dev/outlines - 結構化文本生成
mshumer/gpt-prompt-engineer -
jxnl/instructor - 大型語言模型（LLMs）的結構化輸出。
brexhq/prompt-engineering - 使用OpenAI的GPT - 4等大型語言模型的技巧和訣竅。
LouisShark/chatgpt_system_prompt - 一組GPT系統提示詞以及有關提示注入/洩露的知識。
microsoft/TypeChat - TypeChat是一個用於構建帶有類型的自然語言接口的庫。
sgl-project/sglang - SGLang是一個用於大型語言模型和視覺- 語言模型的快速服務框架。
mit-han-lab/streaming-llm - 2024年國際學習表徵會議（ICLR）上提出的帶有註意力匯聚（Attention Sinks）的高效流式語言模型。
spdustin/ChatGPT-AutoExpert - 用於ChatGPT（非編碼）和ChatGPT高級數據分析（編碼）的增強型自定義指令。
civitai/civitai - 一個包含模型和文本反轉的存儲庫。
Moonvy/OpenPromptStudio - AIGC提示詞可視化編輯器| 運維| 開放式提示工作室
rockbenben/ChatGPT-Shortcut - 通過人工智能快捷方式最大限度地提高效率和生產力。定制、保存並分享提示，並在共享社區中找到適用於不同場景的提示。
microsoft/promptbase - 與提示工程相關的所有內容。
PrefectHQ/marvin - 創建令人愉悅的人工智能接口。
promptfoo/promptfoo - 測試提示詞、代理和檢索增強生成（RAG）。同時對大型語言模型（LLM）進行紅隊測試、滲透測試和漏洞掃描，比較大型語言模型的性能，並通過命令行和持續集成/持續部署（CI/CD）集成進行簡單配置。
princeton-nlp/tree-of-thought-llm - 關於在2023年神經信息處理系統大會（NeurIPS 2023）上利用大型語言模型進行蓄意問題解決的思考。
pydantic/pydantic-ai - 用於在大型語言模型（LLMs）中使用Pydantic的代理框架或填充程序。
1rgs/jsonformer - 一種從語言模型生成結構化JSON的可靠方法。
thunlp/OpenPrompt - 一個用於提示學習的開源框架。
guardrails-ai/guardrails - 為大型語言模型添加安全限製或約束條件。
eth-sri/lmql - 一種在約束引導下高效對大型語言模型（LLMs）進行編程的語言。
promptslab/Promptify - 提示工程與版本控制，使用GPT或其他基於提示的模型以獲取結構化輸出。加入Discord進行相關研究。
shreyashankar/gpt3-sandbox - 該項目旨在讓用戶通過使用新的OpenAI GPT-3 API用幾行Python代碼創建出色的網絡演示。
hegelai/prompttools - 用於提示測試/試驗的開源工具，支持大型語言模型（如OpenAI、LLaMA）和向量數據庫（如Chroma、Weaviate、LanceDB）。
bigscience-workshop/promptsource - 一個用於自然語言提示的工具包，包括創建、共享和使用。
YiVal/YiVal - 你的通用人工智能應用自動提示工程助手。
microsoft/prompt-engine - 一個協助開發者創建大型語言模型提示的庫。
ianarawjo/ChainForge - 一個用於可視化編程的開源環境，用於對大型語言模型（LLMs）的提示進行實戰測試。
spcl/graph-of-thoughts - 《思維圖譜：用大型語言模型解決複雜問題》的官方實現。
ysymyth/ReAct - [ICLR 2023] 《ReAct：在語言模型中結合推理與行動》
Microsoft/genaiscript - 人工智能（生成式人工智能）腳本的自動化生成。
jackmpcollins/magentic - 不間斷地將大型語言模型集成為Python函數。
adieyal/sd-dynamic-prompts - 一個為AUTOMATIC1111/stable - diffusion - webui編寫的自定義腳本，用於創建一個小型模板語言以隨機生成提示詞。
zjunlp/EasyEdit - 一種用於2024年美國計算語言學協會（ACL）會議中大型語言模型（LLMs）的易於使用的知識編輯框架。
microsoft/aici - AICI：提示作為WebAssembly程序。
zou-group/textgrad - TextGrad：通過文本的自動“求導”，利用大型語言模型對文本梯度進行反向傳播。
microsoft/PromptCraft-Robotics - 一個在機器人領域使用大型語言模型（LLMs）的社區以及一個與ChatGPT集成的機器人模擬器。
greshake/llm-security - 破壞集成應用的大型語言模型的新方法。
noamgat/lm-format-enforcer - 強化語言模型的輸出格式（如JSON模式、正則表達式等）。
Ber666/llm-reasoners - 一個用於大型語言模型中復雜推理的庫。
jujumilk3/leaked-system-prompts - 洩露系統提示的集合。
laiyer-ai/llm-guard - 大型語言模型交互的安全工具包。
hiyouga/FastEdit - 10秒內快速編輯大型語言模型。
timqian/openprompt.co - 創建、使用和分享ChatGPT提示。
explosion/spacy-llm - 將大型語言模型（LLMs）集成到結構化自然語言處理（NLP）流程中。
protectai/rebuff - 大型語言模型（LLM）提示注入檢測器。
getmetal/motorhead - Motorhead是一個用於大型語言模型（LLMs）的服務器，用於內存和信息檢索。
Mirascope/mirascope - 不具阻礙性的大型語言模型（LLM）抽象概念。
cocacola-lab/ChatIE -

AI開發接口

jmorganca/ollama - 使用Llama 3.3、Mistral、Gemma 2和其他大型語言模型快速上手。
ChatGPTNextWeb/ChatGPT-Next-Web - ChatGPT、Gemini等的跨平台用戶界面（UI）使您能夠一鍵擁有自己的大型語言模型（LLM）應用程序。
xtekky/gpt4free - 官方的gpt4free倉庫包含各種強大的語言模型。
oobabooga/text-generation-webui - 一個用於大型語言模型的Gradio網絡用戶界面，支持多個推理後端。
RVC-Boss/GPT-SoVITS - 一分鐘的語音數據可用於訓練一個良好的語音合成（TTS）模型（小樣本語音克隆）。
gradio-app/gradio - 構建並分享優秀的Python機器學習應用程序。點贊以支持。
mckaywrigley/chatbot-ui - 所有型號均提供人工智能聊天功能。
openai/openai-python - 用於OpenAI API的官方Python庫。
danny-avila/LibreChat - 一個增強版的ChatGPT克隆版本，具有各種特性，如不同的API、人工智能模型和功能，並且它是一個活躍的自託管開源項目。
sunner/ChatALL - 同時與多個聊天機器人（如ChatGPT、必應聊天等）聊天以找到最佳答案。
GaiZhenbiao/ChuanhuChatGPT - ChatGPT API和許多大型語言模型（LLMs）的圖形用戶界面（GUI）。它有各種功能，如智能體（agents）和基於文件的問答（file - based QA）等，並且有一個美觀的用戶界面。
CopilotKit/CopilotKit - 用於各種人工智能應用（如副駕駛、應用內代理、聊天機器人和文本區域）的React UI和優雅的基礎架構。
mlc-ai/web-llm - 高性能的瀏覽器內大型語言模型（LLM）推理引擎。
jina-ai/clip-as-service - 使用CLIP對圖像和句子進行可擴展的嵌入、推理和排序。
chathub-dev/chathub - 一站式聊天機器人客戶端。
TheRamU/Fay - Fay是一個開源數字人框架。它有適用於各種應用的不同版本。
sashabaranov/go-openai - 用於OpenAI ChatGPT、GPT - 3、GPT - 4、DALL·E和Whisper API的Go語言包裝器。
SillyTavern/SillyTavern - 大型語言模型（LLM）中面向高級用戶的前端。
openai/openai-node - OpenAI API的官方JavaScript/TypeScript庫。
sebastianstarke/AI4Animation - 在Unity中利用電腦智能讓角色栩栩如生。
xiangsx/gpt4free-ts - 在一個xtekky/gpt4free的TypeScript版本的複刻項目中提供了一個免費的OpenAI GPT - 4 API。
wzpan/wukong-robot - 悟空機器人是一個簡單、靈活且優雅的中文語音對話機器人/智能音箱項目。它支持ChatGPT多輪對話，並且可能是首個支持腦機交互的開源智能音箱項目。
yihong0618/xiaogpt - 使用小米智能音箱玩ChatGPT和其他大型語言模型（LLM）。
nat/openplayground - 一個可在筆記本電腦上運行的大型語言模型（LLM）遊樂場。
postgresml/postgresml - 適用於機器學習和人工智能應用的帶GPU的Postgres（一種數據庫管理系統）。
Shaunwei/RealChar - 創建、定制人工智能角色/夥伴並與其進行實時對話。利用各種技術實現隨時隨地無縫的人工智能對話。
ParisNeo/lollms-webui - 大型語言模型之主的網絡用戶界面。
zhayujie/bot-on-anything - 基於大型模型的聊天機器人構建器能夠迅速將ChatGPT、Claude和Gemini等人工智能模型集成到Telegram、Gmail、Slack等軟件應用程序和網站中。
deanxv/coze-discord-proxy - 通過Coze - Bot代理Discord對話，經由API請求GPT4模型，提供對話、文生圖、圖生文和知識庫檢索等功能。
vocodedev/vocode-python - 構建基於語音的、模塊化且開源的大型語言模型（LLM）智能體。
alexrudall/ruby-openai - OpenAI API與Ruby。
ahmadbilaldev/langui - 人工智能用戶界面。用於GPT、生成式人工智能和大型語言模型(LLM)項目的開源Tailwind組件。
ollama/ollama-js - Ollama JavaScript庫。
xusenlinzy/api-for-open-llm - 用於開放大型語言模型的OpenAI風格的API。支持各種模型，如LLaMA、ChatGLM等。
anse-app/anse - ChatGPT、DALL - E和Stable Diffusion模型的超強體驗。
mylxsw/aidea-server - AIdEA是一款多功能一體的APP，支持GPT、國內大型語言模型（如通義千問和文心一言），以及用於文生圖、圖生圖、SDXL1.0、超分辨率和圖像上色的Stable Diffusion。
aallam/openai-kotlin - 支持多平台和協程的Kotlin OpenAI API客戶端。
guinmoon/LLMFarm - 在iOS和MacOS上離線使用適用於Llama和其他大型語言模型的GGML庫。
uezo/ChatdollKit - ChatdollKit可讓你將自己的3D模型轉化為聊天機器人。

智能體開發框架

langchain-ai/langchain - 構建具有情境感知推理能力的應用程序。
nomic-ai/gpt4all - GPT4All能夠在任何設備上運行本地大型語言模型（LLMs）。它是開源的，可用於商業用途。
comfyanonymous/ComfyUI - 最強大且模塊化的擴散模型具有用於圖形用戶界面（GUI）、應用程序接口（API）和後端的圖/節點接口。
langgenius/dify - Dify是一個開源的大型語言模型（LLM）應用開發平台，擁有直觀的界面，具備多種功能，可實現從快速製作原型到投入生產的過程。
lobehub/lobe-chat - Lobe Chat是一個具有現代設計的開源人工智能聊天框架。它支持多個人工智能供應商、知識庫和多模態，並能一鍵免費部署私人聊天應用程序。
logspace-ai/langflow - Langflow是一個基於Python的、與模型無關的低代碼應用構建器，用於RAG（檢索增強生成）和多智能體AI應用程序。它可以與任何API或數據庫協同工作。
run-llama/llama_index - LlamaIndex是一個用於大型語言模型（LLM）應用的數據框架。
FlowiseAI/Flowise - 使用拖放式用戶界面創建您的個性化大型語言模型（LLM）流程。
chatchat-space/Langchain-Chatchat - Langchain - Chatchat（最初名為Langchain - ChatGLM）是一個基於Langchain、ChatGLM、Qwen、Llama等的檢索增強生成（RAG）和代理（Agent）應用程序，用於基於本地知識的大型語言模型（LLM）。
go-skynet/LocalAI - 一個可替代OpenAI和Claude等服務的開源項目。它可以在消費級硬件上運行，並執行諸如生成不同媒體類型等各種任務。
infiniflow/ragflow - RAGFlow是一個用於深度文檔理解的開源RAG（檢索增強生成）引擎。
mindsdb/mindsdb - AGI的查詢引擎是一個構建人工智能的平台，該人工智能能夠在聯邦數據上進行學習和回答問題。
embedchain/embedchain - 你的人工智能應用的存儲層。
songquanpeng/one-api - 這是一個OpenAI密鑰管理與再分配系統。它支持多種大型語言模型（LLMs），擁有英文用戶界面（UI），可單文件執行，並且有Docker鏡像以便於部署。
Cinnamon/kotaemon - 一個基於檢索增強生成（RAG）技術、可用於與文檔聊天的開源工具。
labring/FastGPT - FastGPT是一個基於大型語言模型（LLMs）的知識平台，提供多種功能，可輕鬆開發和部署問答系統。
deepset-ai/haystack - 一個用於構建大型語言模型（LLM）應用的人工智能編排框架，適用於像檢索增強生成（RAG）以及帶有高級檢索方法的聊天機器人之類的任務。
BerriAI/litellm - Python SDK和代理服務器（LLM網關）能夠調用100多個OpenAI格式的大型語言模型（LLM）API，包括Bedrock、Azure等的API。
flairNLP/flair - 一個用於高級自然語言處理的非常基礎的框架。
langchain-ai/langchainjs - 構建具有情境感知能力的推理應用程序。
xenova/transformers.js - 用於網絡的最先進的機器學習技術允許在沒有服務器的瀏覽器中運行? Transformers模型。
netease-youdao/QAnything - 基於任何事物的問答。
h2oai/h2ogpt - 與本地GPT的私人聊天，支持文檔、圖像、視頻等各種內容。它是100%私密的，基於Apache 2.0協議，支持oLLaMa、Mixtral、llama.cpp等，在給定鏈接中有示例。
pathwaycom/llm-app - 適用於檢索增強生成（RAG）、人工智能管道（AI pipelines）和企業搜索的即用型雲模板，可處理實時數據，對Docker友好並能與各種數據源同步。
ludwig-ai/ludwig - 用於創建像大型語言模型（LLMs）和神經網絡這樣的定制人工智能模型的低代碼框架。
vercel/ai - 使用React、Svelte、Vue和Solid構建人工智能驅動的應用程序。
microsoft/promptflow - 通過原型製作、測試、生產部署和監控來構建高質量的大型語言模型（LLM）應用程序。
Unstructured-IO/unstructured - 用於創建機器學習中自定義預處理管道（如標記、訓練或生產任務）的開源庫和API。
dataelement/bisheng - 必升（BISHENG）是一個面向企業人工智能應用的開放大語言模型（LLM）運維平台。它具備生成式人工智能（GenAI）工作流、檢索增強生成（RAG）等功能。
togethercomputer/OpenChatKit -
llmware-ai/llmware - 一個使用小型專用模型創建企業級檢索增強生成（RAG）管道的統一框架。
leptonai/search_with_lepton - 使用Lepton AI快速創建一個基於對話的搜索演示。
Deeptrain-Community/chatnio - 下一代人工智能一站式B/C端解決方案，支持多種模型和各類功能。
Chainlit/chainlit - 在數分鐘內快速構建對話式人工智能。
modelscope/modelscope - ModelScope將模型即服務（Model - as - a - Service）的概念變為現實。
deeppavlov/DeepPavlov - 一個用於深度學習端到端對話系統和聊天機器人的開源庫。
langchain-ai/opengpts -
TaskingAI/TaskingAI - 一個用於開發原生人工智能應用程序的開源平台。
wenda-LLM/wenda - 文達（Wenda）是一個大型語言模型（LLM）調用平台，旨在特定環境中高效生成內容，同時考慮到個人和中小企業計算資源的限制以及知識安全和隱私問題。
rustformers/llm - 一個用於處理大型語言模型的未經維護的Rust庫生態系統。詳見自述文件。
josStorer/RWKV-Runner - 一個8MB的全自動RWKV管理和啟動工具，帶有與OpenAI API兼容的接口。 RWKV是一個完全開源且可用於商業用途的大型語言模型。
langchain4j/langchain4j - LangChain的Java版本。
OpenBMB/ToolBench - 一個用於工具學習的大型語言模型訓練、服務和評估的開放平台（ICLR'24焦點論文）。
microsoft/FLAML - 一個用於自動機器學習（AutoML）和調參的快速庫。還有一個可加入的Discord（一款聊天軟件）鏈接。
microsoft/lmops - 用於通過大型語言模型（LLMs）和多模態大型語言模型（MLLMs）實現人工智能能力的通用技術。
llm-workflow-engine/llm-workflow-engine - 適用於大型語言模型（核心包）的Power CLI和工作流管理器。
timescale/pgai - 一組用於更輕鬆地開發使用PostgreSQL的檢索增強生成（RAG）、語義搜索和其他人工智能應用程序的工具。
FreedomIntelligence/LLMZoo - LLM Zoo是一個為大型語言模型提供數據、模型和評估基準的項目。
casibase/casibase - AI Cloud是一個類似於LangChain的開源檢索增強生成（RAG）知識庫。它支持多種模型，並擁有聊天機器人和管理用戶界面（UI）演示。
getzep/zep - Zep：你的人工智能堆棧的內存基礎。
leptonai/leptonai - 一個用於簡化人工智能服務構建的Python框架。
pezzolabs/pezzo - 一個開源的、以開發者為先的LLMOps平台，用於簡化提示設計和版本管理等各個方面的工作。
cheshire-cat-ai/core - 人工智能代理微服務。
aurelio-labs/semantic-router - 用於多模態數據決策和智能處理的超高速人工智能。
instill-ai/vdp - Instill Core是一款用於數據、模型和管道編排的全棧人工智能基礎設施工具，它簡化了構建多種以人工智能為先的應用程序的過程。
intel/intel-extension-for-transformers - 使用最先進的壓縮技術，在您的設備上快速構建您的聊天機器人，並在英特爾平台上高效運行大型語言模型。
griptape-ai/griptape - 一個用於人工智能代理和工作流程的模塊化Python框架，具有思維鏈推理、工具和記憶功能。
run-llama/LlamaIndexTS - 用於大型語言模型（LLM）應用的數據框架，重點關注服務器端解決方案。
Agenta-AI/agenta - 一個集成了提示詞遊樂場、提示詞管理、大型語言模型（LLM）評估和大型語言模型可觀測性的開源LLMOps平台。
marella/ctransformers - 通過GGML庫為C/C++中的Transformer模型提供的Python綁定。
devflowinc/trieve - 一個基於API的集搜索、推薦、檢索增強生成（RAG）和分析於一體的基礎設施。
YangLing0818/RPG-DiffusionMaster - [ICML 2024] 通過多模態大型語言模型（LLMs）的重新字幕、規劃和生成來掌握文本到圖像擴散的角色扮演遊戲（RPG）。
trypromptly/LLMStack - 一個無代碼的多代理框架，用於使用您的數據構建大型語言模型（LLM）代理、工作流和應用程序。
getzep/graphiti - 構建和查詢具有時間感知能力的動態知識圖譜。
KimMeen/Time-LLM - ICLR 2024中《Time - LLM：通過重新編程大型語言模型進行時間序列預測》的官方實現。
floneum/floneum - 即時、可控且在本地預訓練的Rust語言中的人工智能模型。
jina-ai/langchain-serve - 使用Jina和FastAPI進行生產的Langchain應用程序。
SqueezeAILab/LLMCompiler - 在2024年國際機器學習會議（ICML）上提出的LLM編譯器（LLMCompiler）是一種用於並行函數調用的大型語言模型（LLM）編譯器。
andreibondarev/langchainrb - 使用Ruby構建由大型語言模型（LLM）提供支持的應用程序。
psychic-api/rag-stack - 在虛擬專用雲（VPC）中部署一個私有版的ChatGPT替代方案，連接到組織的知識庫，並支持開源大型語言模型（LLMs）。
DAGWorks-Inc/burr - 構建用於決策的應用程序，如聊天機器人等，並在自己的基礎設施上進行管理。
IntelLabs/fastRAG - 高效檢索增強與生成框架。
sobelio/llm-chain - “llm - chain”是一個強大的Rust crate（板條箱，可理解為代碼庫），用於構建大型語言模型中的鏈，實現文本摘要和復雜任務的完成。
microsoft/windows-ai-studio -
vercel/modelfusion - 一個用於創建人工智能應用程序的TypeScript庫。
axflow/axflow - 一個用於人工智能開發的TypeScript框架。
gabrielchua/RAGxplorer - 一個用於可視化你的檢索增強生成（RAG）的開源工具。
parthsarthi03/raptor - 通過遞歸抽象處理進行樹狀組織檢索的RAPTOR（猛禽）官方實現。
google/generative-ai-swift - 用於Google Gemini API的官方Swift庫。
pinecone-io/canopy - 由Pinecone驅動的檢索增強生成（RAG）框架和上下文引擎。
safevideo/autollm - 在數秒內推出基於檢索增強生成（RAG）的大型語言模型（LLM）網絡應用。

模型

openai/whisper - 通過大規模弱監督實現穩健的語音識別。
CompVis/stable-diffusion - 一個潛在的文本到圖像的擴散模型。
facebookresearch/llama - 用於Llama模型的推理代碼。
xai-org/grok-1 - Grok的公開版本發布。
Stability-AI/stablediffusion - 使用潛在擴散模型進行高分辨率圖像合成。
karpathy/nanoGPT - 用於訓練/微調中型GPT的最簡單、最快速的庫。
TencentARC/GFPGAN - GFPGAN專注於創建適用於現實場景中人臉修復的實用算法。
lllyasviel/ControlNet -
tatsu-lab/stanford_alpaca - 用於訓練斯坦福羊駝（Alpaca）模型和生成數據的代碼與文檔。
meta-llama/llama3 - 官方Meta Llama 3 GitHub網站。
Stability-AI/generative-models - Stability AI的生成式模型
lucidrains/vit-pytorch - 在PyTorch中實現視覺變換器（Vision Transformer），僅使用一個變換器編碼器在視覺分類任務中達到最先進水平（SOTA）。
apple/ml-stable-diffusion - 在蘋果矽芯片（Apple Silicon）上使用Core ML的Stable Diffusion。
facebookresearch/codellama - CodeLlama模型的推理代碼。
QwenLM/Qwen - 通義千問（Qwen）的官方代碼庫，通義千問是阿里雲提出的一個聊天和預訓練大型語言模型。
AI4Finance-Foundation/FinGPT - FinGPT - 開源金融大型語言模型。在HuggingFace發布的訓練模型。
state-spaces/mamba - 曼巴SSM架構
BlinkDL/RWKV-LM - RWKV是一種在大型語言模型（LLM）方面表現良好的循環神經網絡（RNN），可以像GPT變換器那樣進行訓練。它具有性能優異、線性時間等特點。
CompVis/latent-diffusion - 使用潛在擴散模型進行高分辨率圖像合成。
QwenLM/Qwen1.5 - 通義千問2.5是阿里云通義千問團隊開發的大型語言模型系列。
lucidrains/DALLE2-pytorch - 在PyTorch中實現OpenAI更新的用於文圖合成的神經網絡DALL - E 2。
NVIDIA/Megatron-LM - 繼續進行對Transformer模型大規模訓練的研究。
guoyww/AnimateDiff - AnimateDiff的官方實現。
databrickslabs/dolly - Databricks的Dolly是一個在Databricks機器學習平台上訓練的大型語言模型。
mlfoundations/open_clip - 一個CLIP（對比語言-圖像預訓練）的開源實現。
THUDM/CogVideo - 文本和圖像到視頻的生成：CogVideoX（2024年）和CogVideo（2023年國際表徵學習會議）
AIGC-Audio/AudioGPT - AudioGPT與理解和生成語音、音樂、聲音以及說話頭像相關。
nlpxucan/WizardLM - 大型語言模型（LLMs）建立在Evol Insturct（Evol指令）之上：WizardLM（嚮導語言模型）、WizardCoder（嚮導編碼器）、WizardMath（嚮導數學）。
lucidrains/denoising-diffusion-pytorch - 在Pytorch中實現去噪擴散概率模型。
THUDM/CodeGeeX - CodeGeeX是一個開源的多語言代碼生成模型（KDD 2023）。
Vaibhavs10/insanely-fast-whisper -
01-ai/Yi - 由01 - ai開發者從頭開始開發的一系列大型語言模型。
lucidrains/PaLM-rlhf-pytorch - 在PaLM上實施類似於ChatGPT的人類反饋強化學習（RLHF）。
HumanAIGC/EMO - 在弱條件下使用音視頻擴散模型（Audio2Video Diffusion Model）生成富有表現力的人像視頻：生動的表情人像。
alembics/disco-diffusion - 沒有提供可翻譯的描述。
openlm-research/open_llama - OpenLLaMA是Meta AI的LLaMA 7B的開源複製品，具有寬鬆的許可協議，並且在RedPajama數據集上進行訓練。
OpenBMB/MiniCPM - MiniCPM3 - 4B，一個邊緣端的大型語言模型（LLM），性能優於GPT - 3.5 - Turbo。
LargeWorldModel/LWM - 用於文本和視頻建模的大型世界模型，擁有數百萬的大語境。
LiheYoung/Depth-Anything - 《深度萬物：釋放大規模無標註數據的力量》，一個用於2024年計算機視覺與模式識別會議（CVPR）中基於單目圖像的深度估計基礎模型。
openai/point-e - 點雲擴散用於3D模型合成。
google-research/text-to-text-transfer-transformer - 論文《用統一的文本到文本轉換器探索遷移學習的極限》的代碼
Lightning-AI/lit-llama - 基於nanoGPT的LLaMA語言模型實現支持多種特性，如快速注意力機制、量化、微調以及預訓練，並且採用Apache 2.0許可協議。
OpenGVLab/LLaMA-Adapter - 在2024年國際學習表徵會議（ICLR）上，使用120萬個參數在1小時內對LLaMA進行微調以遵循指令。
NVIDIA/DALI - 一個GPU（圖形處理器）加速庫擁有高度優化的構建模塊和用於數據處理的執行引擎，以加速深度學習訓練和推理應用程序。
allenai/OLMo - 用於建模、訓練、評估和推理的OLMo代碼。
salesforce/CodeGen - CodeGen是一個用於程序合成的開源模型系列，在TPU - v4上進行訓練，可與OpenAI Codex相媲美。
lucidrains/x-transformers - 一個專注度高、簡潔而完整的變換器，具備來自多篇論文的實驗性特徵。
SCIR-HI/Huatuo-Llama-Med-Chinese - 本曹（原名華佗）的代碼庫，這是一個用中國醫學知識對大型語言模型進行指令微調的模型庫。
luosiallen/latent-consistency-model - 潛在一致性模型：通過少步推理合成高分辨率圖像。
microsoft/BioGPT -
google-research/simclr - SimCLRv2：大型自監督模型是強大的半監督學習器。
llSourcell/Doctor-Dignity - 尊嚴博士（Doctor Dignity）是一個能夠通過美國醫師執照考試（USMLE）、可離線使用、跨平台且能保護健康數據隱私的大型語言模型（LLM）。
google-research/multinerf - 用於Mip - NeRF 360、Ref - NeRF和RawNeRF的代碼發布。
jaymody/picoGPT - 一個用NumPy實現的非常小的GPT - 2版本。
google-research/albert - ALBERT是一種精簡版的BERT（Bidirectional Encoder Representations from Transformers，雙向編碼器表徵轉換模型），用於語言表徵的自監督學習。
project-baize/baize-chatbot - 僅用一個GPU在數小時內使用ChatGPT來訓練你的聊天機器人。
salesforce/CodeT5 - CodeT5旨在為開放代碼的大型語言模型（LLM）提供代碼理解和生成方面的支持。
facebookresearch/jepa - 通過視覺- 基於聯合嵌入預測架構（V - JEPA）從視頻進行自監督學習的PyTorch代碼和模型。
paperswithcode/galai - GALACTICA的模型應用程序接口。
dvlab-research/LongLoRA - LongLoRA和LongAlpaca（ICLR 2024口頭報告）的代碼和文檔。
baaivision/Painter - 畫家與SegGPT系列：來自北京智源人工智能研究院（BAAI）的視覺基礎模型。
databricks/dbrx - 用於Databricks的大型語言模型DBRX的代碼示例和資源。
state-spaces/s4 - 結構化狀態空間序列模型。
google-research/electra - ELECTRA將文本編碼器預訓練為鑑別器而不是生成器。
EleutherAI/pythia - EleutherAI在可解釋性和學習動態方面的研究中心。
ise-uiuc/magicoder - Magicoder（ICML'24）通過開源指令（OSS - Instruct）實現代碼生成。
epfLLM/meditron - Meditron是一套開源的醫療大型語言模型。
MetaGLM/FinGLM - FinGLM旨在構建一個開放、公益且持久的金融大模型項目，通過開源推動“AI+金融”發展。
deepseek-ai/DeepSeek-LLM - 深度求索（DeepSeek）大語言模型（LLM）：將會有答案。
allenai/scispacy - 適用於科學/生物醫學文檔的完整spaCy管道和模型。
apple/ml-4m - 4M：大規模多模態掩碼建模。
google-research/language - 谷歌人工智能語言團隊開源項目的共享庫。
google/maxtext - 一個簡單、高性能且可擴展的Jax大型語言模型（LLM）。
netease-youdao/BCEmbedding - 網易有道用於檢索增強生成（RAG）產品（嵌入和重排序器）的開源模型。
SHI-Labs/OneFormer - CVPR 2023中的OneFormer是一種用於通用圖像分割的Transformer。
google-research/FLAN -
lxtGH/OMG-Seg - OMG - LLaVA和OMG - Seg代碼庫與CVPR - 24（計算機視覺與模式識別會議- 2024）和NeurIPS - 24（神經信息處理系統大會- 2024）相關。
SHI-Labs/Versatile-Diffusion - 通用擴散（Versatile Diffusion）：一個融合文本、圖像和變體的擴散模型，於2022年發表於預印本平台arXiv，2023年在國際計算機視覺大會（ICCV）上展示。
time-series-foundation-models/lag-llama - Lag - Llama：概率性時間序列預測基礎模型的方法
openai/lm-human-preferences - 人類偏好微調語言模型論文的代碼。
IBM/Dromedary - 單峰駝（Dromedary）旨在成為有用、合乎道德且可靠的大型語言模型。
dauparas/ProteinMPNN - 名為ProteinMPNN的論文代碼。
SHI-Labs/Neighborhood-Attention-Transformer - 2022年發表於arxiv以及2023年發表於CVPR的鄰域注意力變換器。此外，2022年發表於arxiv的空洞鄰域注意力變換器。
THUDM/SwissArmyTransformer - SwissArmyTransformer是一個靈活且強大的用於開發Transformer變體的庫。
ctlllll/LLM-ToolMaker -
Xwin-LM/Xwin-LM - Xwin - LM：一個強大、穩定且可複現的大型語言模型對齊。
microsoft/ToRA - ToRA（用於ICLR'24）是一系列集成工具以解決困難數學推理問題的大型語言模型智能體。
SalesforceAIResearch/uni2ts - 通用時間序列預測變換器被統一訓練。
replit/ReplitLM - ReplitLM模型系列的推理代碼和配置。
HazyResearch/safari - 序列建模背景下的捲積。

AI列表

fighting41love/funNLP -
linexjlin/GPTs - 與GPT相關的洩露提示。
e2b-dev/awesome-ai-agents - 一系列人工智能自主代理。
eugeneyan/open-llms - 可供商業使用的開放大語言模型（LLM）列表。
Shubhamsaboo/awesome-llm-apps - 一組很棒的帶有檢索增強生成（RAG）功能的大型語言模型（LLM）應用程序，它們使用OpenAI、Anthropic、Gemini和開源模型。
RUCAIBox/LLMSurvey - 大型語言模型綜述（A Survey of Large Language Models）這篇調查論文的官方GitHub頁面。
WooooDyy/LLM-Agent-Paper-List - 席之恆（音譯）等人所著的86頁論文《基於大型語言模型的智能體的興起與潛力：綜述》的論文列表
steven2358/awesome-generative-ai - 當代生成式人工智能項目和服務列表。
wgwang/LLMs-In-China - 中國大型模型。
lonePatient/awesome-pretrained-chinese-nlp-models - 一系列高質量的中文預訓練模型、大型模型、多模態模型和大型語言模型。
tensorchord/Awesome-LLMOps - 為開發者精選的優秀LLMOps工具大清單。
opendilab/awesome-RLHF - 一份持續更新的基於人類反饋的強化學習資源清單。
DSXiangLi/DecryptPrompt - 總結提示（Prompt）與大型語言模型（LLM）相關論文、開源數據與模型，以及人工智能生成內容（AIGC）的應用。
FreedomIntelligence/Medical_NLP - 醫學自然語言處理競賽、數據集、大型模型與論文。
archinetai/audio-ai-timeline - 一個從2023年開始的最新音頻生成人工智能模型的時間表。
chiphuyen/aie-book - 人工智能工程師的資源以及《人工智能工程》（奇普·休恩著，2025年）的輔助材料。
EgoAlpha/prompt-in-context-learning - 用於情境學習和提示工程的優質資源。掌握具有最新更新的大型語言模型，如ChatGPT、GPT - 3和FlanT5。
taranjeet/awesome-gpts - 社區製作的所有GPT（生成式預訓練轉換器）的集合。
cfahlgren1/natural-sql - 一系列高性能的文本到SQL的大型語言模型。
yokoffing/ChatGPT-Prompts - ChatGPT和必應AI的提示詞管理。

推理優化

ggerganov/llama.cpp - C/C++中的大型語言模型（LLM）推理。
ggerganov/whisper.cpp - 一個用C/C++編寫的OpenAI的Whisper模型的移植版本。
karpathy/llm.c - 使用簡單的原始C/CUDA訓練大型語言模型（LLM）。
Mozilla-Ocho/llamafile - 僅使用一個文件來分發和運行大型語言模型（LLMs）。
unslothai/unsloth - 在使用少70%內存的同時，將Llama 3.3、Mistral、Phi、Qwen 2.5和Gemma大型語言模型（LLMs）的微調速度提高2 - 5倍。
mlc-ai/mlc-llm - 帶有機器學習（ML）編譯功能的通用大型語言模型（LLM）部署引擎。
karpathy/llama2.c - 在單個純C文件中推斷Llama 2。
Dao-AILab/flash-attention - 快速且高效的精確注意力機制，既快速又節省內存。
openai/triton - 特里同（Triton）語言和編譯器的開發庫。
microsoft/BitNet - 1位大型語言模型（LLMs）的官方推理框架。
ggerganov/ggml - 一個用於機器學習的張量庫。
NVIDIA/TensorRT - NVIDIA TensorRT是一個用於在NVIDIA GPU上進行高性能深度學習推理的軟件開發工具包（SDK）。這個代碼倉庫有其開源組件。
bigscience-workshop/petals - 以類似BitTorrent的方式在家運行大型語言模型（LLMs），微調與推理速度比卸載（offloading）快多達10倍。
NVIDIA/TensorRT-LLM - TensorRT - LLM提供了一個易於使用的Python API，用於定義大型語言模型（LLMs）並構建優化的TensorRT引擎以實現高效的GPU推理，並且具有用於創建Python和C++運行時來執行這些引擎的組件。
intel-analytics/BigDL - 在英特爾XPU上加速本地大型語言模型（LLM）推理和微調，並與各種相關框架集成。
intel-analytics/ipex-llm - 在英特爾XPU（英特爾架構的加速處理器）上加速本地大型語言模型（LLM）推理和微調，並與多種工具集成。
TimDettmers/bitsandbytes - 通過PyTorch的k位量化實現可訪問的大型語言模型。
google/gemma.cpp - 一個用於谷歌Gemma模型的輕量級獨立C++推理引擎。
NVIDIA/cutlass - 用於線性代數子例程的CUDA模板。
pytorch-labs/gpt-fast - 用不到1000行Python代碼實現用於文本生成的簡單高效的原生PyTorch變壓器。
PanQiWei/AutoGPTQ - 一個基於GPTQ算法、易於使用且具有用戶友好型接口的大型語言模型量化包。
turboderp/exllamav2 - 一個用於在常見消費級GPU上本地運行大型語言模型（LLM）的快速推理庫。
OpenNMT/CTranslate2 - 快速變壓器模型推理引擎。
ztxz16/fastllm - 一個純C++的全平台大型語言模型（LLM）加速庫，支持Python調用。它能使單卡ChatGLM - 6B級別的模型達到每秒超過10,000個詞元（token），支持GLM、Llama、Moss基礎模型，並且在移動設備上能流暢運行。
qwopqwop200/GPTQ-for-LLaMa - 使用GPTQ將LLaMA量化為4位。
VainF/Torch-Pruning - [CVPR 2023] DepGraph：面向任意結構剪枝。
turboderp/exllama - 用於量化權重的HF Transformers版Llama重寫版本，其內存效率更高。
lucidrains/vector-quantize-pytorch - PyTorch中的向量（和標量）量化
mit-han-lab/llm-awq - AWQ：用於大型語言模型壓縮與加速的激活感知權重量化（方法）榮獲2024年MLSys最佳論文獎。
Jittor/JittorLLMs - Jittor模型推理庫具有高性能、低配置要求、良好的中文支持和可移植性等特點。
FasterDecoding/Medusa - 美杜莎：一個通過多個解碼頭加速大型語言模型（LLM）生成的簡單框架。
intel/neural-compressor - SOTA低比特LLM量化（包括INT8/FP8/INT4/FP4/NF4）和稀疏性是用於TensorFlow、PyTorch和ONNX運行時的領先的模型壓縮技術。
neuralmagic/sparseml - 便於將稀疏化輕鬆應用於神經網絡的庫，從而得到更快且更小的模型。
IST-DASLab/gptq - 2023年國際學習表徵會議（ICLR）上關於生成式預訓練變壓器（GPT）精確的訓練後量化（post - training quantization）的論文代碼，名為“GPTQ”。
HazyResearch/ThunderKittens - 用於快速內核的圖塊基元。
uTensor/uTensor - 一個微型機器學習人工智能推理庫。
pytorch-labs/ao - 用於訓練和推理的PyTorch原生量化與稀疏性。
saharNooby/rwkv.cpp - 用於RWKV語言模型的CPU上的INT4/INT5/INT8和FP16推理。
mit-han-lab/smoothquant - SmoothQuant：大型語言模型準確且高效的訓練後量化。
Lightning-AI/lightning-thunder - Thunder是一個PyTorch源到源編譯器，它可以使模型速度提高達40%，並在多個GPU上使用不同的硬件執行器。
pytorch-labs/segment-anything-fast - 一個用於批量離線推理的Segment - Anything版本。
Vahe1994/AQLM - 官方PyTorch庫，包含兩篇關於大型語言模型極限壓縮的論文：一篇是通過加法量化（https://arxiv.org/pdf/2401.06118.pdf），另一篇是PV - 微調（ https://arxiv.org/abs/2405.14852）。
hao-ai-lab/LookaheadDecoding - 使用前瞻解碼來打破大型語言模型（LLM）推理中的順序依賴關係（ICML 2024）。
horseee/LLM-Pruner - [NeurIPS 2023] 大型語言模型（如Llama - 3/3.1、Llama - 2、LLaMA等）結構剪枝的LLM - Pruner。
kuleshov/minillm - MiniLLM是一種以最小化方式在消費級GPU上運行現代大型語言模型（LLM）的系統。

信息聚合

binary-husky/gpt_academic - 為GPT/GLM等大型語言模型（LLM）提供實用的交互界面，尤其優化論文閱讀、潤色和寫作體驗。支持多種功能並集成多個模型。
imartinez/privateGPT - 使用GPT私下與文檔交互，無數據洩露。
Mintplex-Labs/anything-llm - 桌面與Docker AI應用是一體化的，內置了檢索增強生成（RAG）和AI代理。
khoj-ai/khoj - 它是一個可以自託管的人工智能第二大腦，能從各種來源獲取答案、構建自定義代理、安排自動化任務以及進行研究，並且能夠免費將大型語言模型轉化為個人人工智能。
PromtEngineer/localGPT - 通過GPT模型私下與本地文檔聊天，數據不會離開設備。
kaixindelele/ChatPaper - 使用ChatGPT對科研進行全流程加速，包括總結arXiv論文、專業翻譯、潤色、同行評審和回應同行評審。
assafelovic/gpt-researcher - 基於大型語言模型（LLM）的自主代理對任何主題進行本地和網絡研究，並創建一份帶有引用的綜合報告。
arc53/DocsGPT - 文檔聊天機器人能夠與數據聊天，可私人部署，並將知識集成到人工智能工作流程中以進行共享。
mayooear/gpt4-pdf-chatbot-langchain - 用於大型PDF文檔的GPT4和LangChain聊天機器人。
danswer-ai/danswer - Gen - AI Chat for Teams就像ChatGPT一樣，但可以獲取團隊的特殊知識。
josStorer/chatGPTBox - 將ChatGPT深度集成到你的瀏覽器中。你所需的一切都在這裡。
facebookresearch/nougat - 牛軋糖（Nougat）在學術文檔神經光學理解方面的應用。
bhaskatripathi/pdfGPT - PDF GPT能夠通過GPT功能與PDF內容進行交互，是一種將PDF轉變為聊天機器人的有效開源解決方案。
whitead/paper-qa - 用於回答基於科學文獻且帶有引用的問題的高精度檢索增強生成（RAG）技術。
weaviate/Verba - 一個檢索增強生成（RAG）聊天機器人由Weaviate提供動力。
run-llama/rags - 使用你的數據構建ChatGPT，全部採用自然語言。
MuiseDestiny/zotero-gpt - GPT與Zotero相遇。
madawei2699/myGPTReader - 一種使用ChatGPT進行閱讀和聊天的、社區驅動的與人工智能機器人交互的方法。
swirlai/swirl-search - 人工智能搜索和檢索增強生成（AI Search & RAG）能夠在確保數據安全和快速部署的同時，從眾多應用程序中的公司知識中獲取即時答案。
dvorka/mindforger - 一個思考筆記和一個Markdown編輯器。
kha-white/manga-ocr - 主要用於日漫的日文字符光學字符識別。
nlmatics/llmsherpa - 用於加速大型語言模型（LLM）項目的開發者應用程序接口（API）。
ucbepic/docetl - 一個由自主語言模型（LLM）驅動的數據處理和ETL（抽取、轉換、加載）系統。
KnowledgeCanvas/knowledge - 知識是用於網站、文檔和文件的各種操作（如保存、搜索等）的工具。
rotemweiss57/gpt-newspaper - 一個基於GPT的自主代理程序，能根據用戶偏好創建個性化報紙。
nlmatics/nlm-ingestor - 此存儲庫提供用於llmsherpa API連接的服務器端代碼以及用於不同文件格式的解析器。
kha-white/mokuro - 在瀏覽器中閱讀可選擇文字的日本漫畫。
BruceMacD/chatd - 通過本地人工智能與你的文檔進行聊天。
akshata29/entaoai - 使用自己的數據進行聊天和提問。快速上傳企業數據，以便使用OpenAI服務對上傳的數據進行聊天和提問。

代碼助手

abi/screenshot-to-code - 插入一張屏幕截圖並將其轉換為簡潔的代碼（HTML/Tailwind/React/Vue）。
gpt-engineer-org/gpt-engineer - 一個用於體驗人工智能軟件工程師的基於終端的平台，與https://gptengineer.app不同。
OpenDevin/OpenDevin - OpenHands：用更少的代碼實現更多功能。
Pythagora-io/gpt-pilot - 第一位真正成為人工智能領域開發者的人。
getcursor/cursor - 人工智能代碼編輯器。
OpenBMB/ChatDev - 通過具有大型語言模型（LLM）支持的多智能體協作，依據自然語言思路創建定制軟件。
paul-gauthier/aider - Aider是終端中的人工智能結對編程。
TabbyML/tabby - 一個自託管的人工智能編碼助手。
continuedev/continue - Continue是一個開源的人工智能代碼助手。它可以連接到模型和上下文，以便在VS Code和JetBrains中進行自定義自動補全和聊天。
stitionai/devika - 迪維卡（Devika）是一個智能體人工智能軟件工程師，能夠理解人類指令，分解指令，進行研究並編寫代碼。它的目標是成為認知人工智能（Cognition AI）公司開發的德文（Devin）的開源替代品，並且沒有官方網站。
emilwallner/Screenshot-to-code - 一個用於將設計模型轉換為靜態網站的神經網絡。
fauxpilot/fauxpilot - FauxPilot是GitHub Copilot服務器的一個開源替代品。
eosphoros-ai/DB-GPT - 帶有AWEL（智能體工作流表達式語言）和智能體的原生人工智能數據應用開發框架。
princeton-nlp/SWE-agent - SWE - 代理使用GPT - 4或其他語言模型自動修復GitHub問題，也可用於攻擊性網絡安全或競爭性編程挑戰。 [NeurIPS 2024]
Sinaptik-AI/pandas-ai - 與各種數據庫（SQL、CSV等）進行交互，並使用PandasAI通過大型語言模型（LLMs）和檢索增強生成（RAG）進行對話式數據分析。
vanna-ai/vanna - 與你的SQL數據庫進行交互。使用基於檢索的生成（RAG）技術，通過大型語言模型（LLM）生成準確的文本到SQL語句。
ShishirPatil/gorilla - 大猩猩：用於函數調用（工具調用）的大型語言模型的訓練與評估。
codota/TabNine - 人工智能代碼補全是指人工智能係統為程序員提供建議或補全代碼段的功能。
TheR1D/shell_gpt - 一款由GPT - 4等人工智能大語言模型驅動的命令行生產力工具，有助於更快速高效地完成任務。
Nutlope/aicommits - 一個利用人工智能為你編寫git提交信息的命令行界面（CLI）。
GreyDGL/PentestGPT - 一款由GPT賦能的滲透測試工具。
joshpxyne/gpt-migrate - 輕鬆地在框架或語言之間遷移您的代碼庫。
kuafuai/DevOpsGPT - 一個由人工智能驅動的軟件開發多智能體系統將大型語言模型（LLM）與DevOps工具相結合，將自然語言需求轉化為可運行的軟件，支持任何開發語言並擴展現有代碼。
di-sukharev/opencommit - 用於Git的GPT封裝器能夠使用大型語言模型（LLM）在1秒內生成提交消息，與Claude 3.5配合良好，並支持本地模型。
sqlchat/sqlchat - 一款基於聊天功能的、面向未來十年的SQL客戶端與編輯器。
Exafunction/codeium.vim - 一個用於Vim和Neovim的免費且超快的Copilot替代方案。
varunshenoy/GraphGPT - 使用GPT - 3從非結構化文本推斷知識圖譜。
Nutlope/llamacoder - 克勞德（Claude）製作的開源製品，使用Llama 3.1 405B構建。
mckaywrigley/ai-code-translator - 利用人工智能在不同語言之間翻譯代碼。
shobrook/adrenaline - 與代碼庫進行交互並對其可視化。
QwenLM/Qwen2.5-Coder - 通義千問2.5 - Coder是通義千問2.5的代碼版本，通義千問2.5是阿里云通義千問團隊開發的大型語言模型系列。
ricklamers/gpt-code-ui - OpenAI公司的ChatGPT代碼解釋器的一個開源實現。
gofireflyio/aiac - 人工智能基礎設施代碼生成器。
defog-ai/sqlcoder - 用於將自然語言問題轉換為SQL查詢的最先進的語言模型。
gptscript-ai/gptscript - 構建用於與您的系統進行交互的人工智能助手。
RootbeerComputer/backend-GPT -
mpoon/gpt-repository-loader - 將代碼庫轉換為對大型語言模型（LLM）提示友好的格式，該格式主要由GPT - 4創建。
Canner/WrenAI - 一個開源人工智能代理使數據和產品團隊能夠通過文本到SQL（Text - to - SQL）與數據進行交互聊天，創建圖表、電子表格、報告和商業智能（BI）。
nus-apr/auto-code-rover - 一位了解項目結構的自主軟件工程師致力於自主程序改進。它在兩個基準測試中完成了一定比例的任務，且每項任務的成本低於0.7美元。
fern-api/fern - 輸入OpenAPI，並輸出SDK（軟件開發工具包）和文檔。
georgia-tech-db/evadb - 一個由人工智能驅動的應用程序數據庫系統。
AbanteAI/mentat - Mentat - 人工智能編碼助手
emcf/engshell - 一個由大型語言模型（LLMs）驅動的英語語言外殼（shell），可在任何操作系統（OS）上使用。
AI-Citizen/SolidGPT - 一個用於搜索角色的開發者人工智能。
context-labs/autodoc - 一個使用大型語言模型（LLMs）自動生成代碼庫文檔的實驗性工具包。
knuckleswtf/scribe - 從Laravel代碼庫為人類生成API文檔。
jina-ai/dev-gpt - 你的虛擬開發團隊可以是一群遠程工作的開發人員，通過虛擬協作來開發軟件或其他項目。
Pythagora-io/pythagora - 使用大型語言模型（LLMs）為Node.js應用程序生成自動化測試，開發人員無需編寫任何代碼。
eli64s/readme-ai - 一個由人工智能驅動的自述文件生成器。
mattzcarey/code-review-gpt - 使用大型語言模型（GPT4、Sonnet 3.5）和嵌入（Embeddings）進行代碼審查可提高代碼質量並在預生產階段發現錯誤，並且與Github/GitLab/Azure DevOps持續集成（CI ）集成。
smallcloudai/refact - 用於微調以及自行託管開源大型編碼語言模型的WebUI。
eylonmiz/react-agent - 開源的React.js自治大型語言模型（LLM）代理。
gorilla-llm/gorilla-cli - 用於命令行界面（CLI）的大型語言模型（LLMs）。
huggingface/llm-vscode - 在VSCode中由大型語言模型（LLM）驅動的開發。
peterw/Chat-with-Github-Repo - 這個存儲庫有兩個Python腳本，用於通過Streamlit、OpenAI GPT - 3.5 - turbo和Activeloop的Deep Lake創建聊天機器人。
paralleldrive/sudolang-llm-support - Visual Studio Code中的SudoLang大型語言模型（LLM）支持。
ricklamers/shell-ai - 一個由LangChain提供支持的用於生成和運行shell命令的命令行界面（CLI）。
google/oss-fuzz-gen - 通過OSS - Fuzz由大型語言模型(LLM) 驅動的模糊測試。
kantord/SeaGOAT - 採用本地優先方法的語義代碼搜索引擎。
OpenAutoCoder/Agentless - 一種用於自動解決軟件開發問題的無代理方法。
ferrislucas/promptr - Promptr是一個命令行界面（CLI）工具，它能使用通俗易懂的英語指示GPT3或GPT4修改代碼庫。

AI教程

microsoft/generative-ai-for-beginners - 使用生成式人工智能開始構建的21個課程。鏈接：https://microsoft.github.io/generative-ai-for-beginners/
openai/openai-cookbook - OpenAI API使用示例與指南。
mlabonne/llm-course - 一個深入大型語言模型（LLMs）的課程，包含路線圖和Colab筆記本。
rasbt/LLMs-from-scratch - 從頭開始逐步在PyTorch中實現一個類似ChatGPT的大型語言模型（LLM）。
lutzroeder/netron - 一個用於神經網絡、深度學習和機器學習模型的可視化工具。
datawhalechina/prompt-engineering-for-developers - 面向開發者的大型語言模型（LLM）入門教程，吳恩達模型系列課程中文版。
liguodongiot/llm-action - 本項目旨在分享與大型模型相關的技術原理以及實踐經驗（大型模型工程和大型模型應用實施）。
stas00/ml-engineering - 機器學習工程方面的開放書籍。
mikeroyal/Self-Hosting-Guide - 自託管指南：由個人或組織在本地託管和管理軟件應用程序，涵蓋雲、大型語言模型（LLMs）等內容。
hua1995116/awesome-ai-painting - 人工智能繪畫素材收集，包括國內外平台、教程和新聞，如Stable diffusion（穩定擴散）、AnimateDiff（動畫擴散）、Stable Cascade（穩定級聯）、Stable SDXL Turbo（穩定SDXL渦輪增壓）。
Mooler0410/LLMsPracticalGuide - 大型語言模型（LLMs）實用指南資源列表，包括LLMs樹、示例和論文。
GoogleCloudPlatform/generative-ai - 谷歌云（Google Cloud）上使用Vertex AI中的Gemini進行生成式人工智能（Generative AI）的示例代碼和筆記本。
kyrolabs/awesome-langchain - 使用LangChain框架的工具和項目的優秀列表。
microsoft/DeepSpeedExamples - DeepSpeed示例模型。
huggingface/alignment-handbook - 使語言模型符合人類和人工智能偏好的穩健方法。
trigaten/Learn_Prompting - 提示工程、生成式人工智能和大型語言模型（LLM）指南，由Learn Prompting提供。加入其Discord（一款聊天軟件），獲取最大的提示工程學習社區。
bbycroft/llm-viz - GPT風格大型語言模型的3D可視化。
ray-project/llm-numbers - 每個大型語言模型（LLM）開發者都應該知曉的數字。
luban-agi/Awesome-AIGC-Tutorials - 大型語言模型、人工智能繪畫等方面的精選教程和資源。
georgezouq/awesome-ai-in-finance - 金融市場中一系列精心挑選的優秀大型語言模型（LLMs）、深度學習策略和工具。
howl-anderson/unlocking-the-power-of-llms - 使用提示（Prompts）和鏈（Chains）使ChatGPT成為強大的生產力工具。釋放大型語言模型（LLMs）的潛力。
ashishpatel26/LLM-Finetuning - 使用PEFT（參數高效微調）對大型語言模型（LLM）進行微調。
ray-project/llm-applications - 一份面向生產開發基於檢索增強生成（RAG）的大型語言模型（LLM）應用的綜合指南。
premAI-io/state-of-open-source-ai - 在開源創新這個混亂又快節奏的世界裡，需要有清晰的思路。
pionxzh/chatgpt-exporter - 導出並分享你的ChatGPT聊天記錄。
ianand/spreadsheets-are-all-you-need -
majacinka/crewai-experiments - 使用本地模型和可通過應用程序接口（API）訪問的模型進行實驗。
thu-vu92/local-llms-analyse-finance -

工作流自動化

KillianLucas/open-interpreter - 計算機的自然語言界面。
StanGirard/quivr - 用於將生成式人工智能（GenAI）集成到應用中的有主見的檢索增強生成（RAG）技術，重點關注產品。可在現有產品中輕鬆集成並定制，並且在大型語言模型（LLM）、向量存儲和文件方面具有多功能性。
danielmiessler/fabric - Fabric是一個開源的人工智能增強人類框架，它具有模塊化結構，可通過眾包人工智能提示來解決問題。
openai-translator/openai-translator - 使用ChatGPT API進行翻譯的瀏覽器和桌面應用程序。
Skyvern-AI/skyvern - 使用大型語言模型（LLMs）和計算機視覺技術實現基於瀏覽器的任務自動化。
activepieces/activepieces - 您最友好的開源人工智能自動化工具。它是一個具有200多種集成的工作流自動化工具，是企業自動化方面Zapier的替代品。
OthersideAI/self-operating-computer - 一種供多模態模型操作計算機的框架。
microsoft/UFO - 一個專注於用戶界面的Windows操作系統交互代理。
yihong0618/bilingual_book_maker - 利用人工智能翻譯手段創作雙語的epub書籍。
lavague-ai/LaVague - 用於開發人工智能網絡代理的大型動作模型框架。
aisingapore/TagUI - 由新加坡人工智能開發的一款免費的機器人流程自動化（RPA）工具。
openchatai/OpenCopilot - 語言到行為引擎
KillianLucas/01 - 適用於桌面端、移動端和ESP32芯片的頂級開源語音接口。
katanaml/sparrow - 使用機器學習、大型語言模型（LLM）和基於視覺的大型語言模型進行數據處理。
xlang-ai/OpenAgents - 2024年的OpenAgents：一個面向野生語言智能體（agents）的開放平台。
BAAI-Agents/Cradle -
Cormanz/smartgpt - 一個使大型語言模型（LLMs）能夠借助插件完成複雜任務的程序。
fiatrete/OpenDAN-Personal-AI-OS - OpenDAN是一個開源的個人人工智能操作系統，它整合了各種人工智能模塊供個人使用。
n4ze3m/page-assist - 使用本地運行的人工智能模型來協助網絡瀏覽。
OS-Copilot/FRIDAY -
andrewnguonly/Lumos - 一個由本地大型語言模型（LLM）提供支持、用於網絡瀏覽的檢索增強生成（RAG）大型語言模型（LLM）副駕駛。
Dicklesworthstone/swiss_army_llama - 一個通過預先計算的嵌入、相似性度量以及通過textract支持文件類型來進行語義文本搜索的FastAPI服務。

AI機器人

lencx/ChatGPT - 適用於Mac、Windows和Linux系統的ChatGPT桌面應用程序。
LAION-AI/Open-Assistant - OpenAssistant是一個基於聊天的助手，能夠理解任務、與第三方系統交互並動態檢索信息。
zhayujie/chatgpt-on-wechat - 一個基於大型模型的聊天機器人，支持多個平台（微信公眾號、企業微信應用、飛書、釘釘等）、多個模型（GPT3.5/GPT - 4o/GPT - o1/克勞德/文心一言/訊飛星火/通義千問/雙子座/GLM - 4/克勞德/奇米/鏈愛），能夠處理文本、語音和圖片，訪問操作系統和互聯網，並支持基於自有知識庫定制企業智能客服。
Chanzhaoyu/chatgpt-web - 一個使用Express和Vue3構建的ChatGPT演示網頁。
janhq/jan - Jan是一個開源的ChatGPT替代品，可在計算機上完全離線運行。
Bin-Huang/chatbox - 對人工智能模型/大型語言模型（如GPT、Claude、Gemini、Ollama等）友好的桌面客戶端應用程序。
joonspk-research/generative_agents - 生成式智能體：人類行為的交互模擬。
Unity-Technologies/ml-agents - Unity ML - Agents工具包是一個開源項目，用於通過深度強化學習和模仿學習在遊戲和模擬中訓練智能體。
transitive-bullshit/chatgpt-api - 一個兼容任何大型語言模型（LLM）和TypeScript人工智能軟件開發工具包（SDK）的人工智能代理標準庫。
leon-ai/leon - 利昂是你的開源個人助手。
xcanwin/KeepChatGPT - 這是一個增強ChatGPT數據安全性和效率的插件。它提供許多免費的創新功能以提供更好的人工智能體驗。
lss233/chatgpt-mirai-qq-bot - 一鍵部署！真正的人工智能聊天機器人，支持多平台和多種功能。
getumbrel/llama-gpt - 一個像ChatGPT一樣的自託管離線聊天機器人，由Llama 2提供支持，是私有的，沒有數據離開設備，現在還支持Code Llama。
sfyc23/EverydayWechat - 微信助手：1. 每天定期向朋友（女友）發送定制消息。 2. 機器人自動回复朋友。 3. 群助手功能（如垃圾分類查詢、天氣、日曆、實時電影票房、快遞物流、PM2.5等）。
BlinkDL/ChatRWKV - ChatRWKV是一個像ChatGPT一樣的開源語言模型，但由RWKV（一種100%的循環神經網絡）提供動力。
ztjhz/BetterChatGPT - ChatGPT的一個很棒的用戶界面，可在網站以及包括Windows、MacOS和Linux在內的多種操作系統上使用。
a16z-infra/ai-town - 一個用於構建人工智能小鎮（人工智能角色在其中生活、聊天和社交）的、遵循麻省理工學院（MIT）許可的入門工具包可部署且可定制。
memochou1993/gpt-ai-assistant - OpenAI、LINE和Vercel結合起來形成了GPT AI助手。
miurla/morphic - 一個由人工智能驅動並具有生成式用戶界面的搜索引擎。
interstellard/chatgpt-advanced - WebChatGPT是一款瀏覽器擴展程序，可通過網絡結果增強ChatGPT提示。
linyiLYi/street-fighter-ai - 這是一個針對《街頭霸王II冠軍版》的人工智能代理。
vincelwt/chatgpt-mac - 適用於Mac的ChatGPT駐留在你的菜單欄中。
camel-ai/camel - CAMEL：首個也是最佳的多智能體框架，用於發現智能體的擴展定律。 (https://www.camel - ai.org)
MineDojo/Voyager - 與大型語言模型相關的開放式具身智能體。
a16z-infra/companion-app - 具有記憶功能的人工智能夥伴：一個用於創建和託管自己的人工智能夥伴的輕量級堆棧。
ConnectAI-E/Feishu-OpenAI - 飛書（結合GPT - 4、GPT - 4V、DALL·E - 3和Whisper）提供了很棒的工作體驗，包括語音對話、角色扮演、多話題討論、圖像創作、表格分析和文檔導出。
simonw/llm - 通過命令行訪問大型語言模型。
sigoden/aichat - 一款集Shell助手、聊天交互（Chat - REPL）、檢索增強生成（RAG）、人工智能工具與代理於一體的大型語言模型（LLM）命令行界面（CLI）工具，可訪問OpenAI 、Claude等多個平台。
lencx/nofwl - 無防火牆（No FireWall，簡稱NoFWL）桌面應用程序。
Kent0n-Li/ChatDoctor -
xtekky/chatgpt-clone - 具有改進用戶界面的ChatGPT界面。
deep-diver/LLM-As-Chatbot - 大型語言模型（LLM）作為一種聊天機器人服務。
gragland/chatgpt-chrome-extension - 一個將ChatGPT集成到互聯網上每個文本框的ChatGPT Chrome擴展程序。
ohmplatform/FreedomGPT - 這個代碼庫是用於一個帶有基於聊天界面的React - Electron（一種將React框架用於構建桌面應用的技術）應用程序，可在Mac和Windows系統本地運行FreedomGPT大型語言模型（ LLM）。
SoraWebui/SoraWebui - SoraWebui是一個開源的Sora網絡客戶端，可輕鬆使用OpenAI的Sora模型從文本創建視頻。
karthink/gptel - 一個使用大型語言模型的簡單Emacs客戶端。
a16z-infra/llama2-chatbot - LLaMA v2聊天機器人。
ItsPi3141/alpaca-electron - 在自己的個人電腦上運行羊駝（Alpaca）和其他基於LLaMA的本地大型語言模型（LLM）的最簡單方法。
opendilab/DI-star - 一個用於《星際爭霸II》的人工智能平台，具備大規模分佈式訓練和宗師級智能體。
jncraton/languagemodels - 使用512MB內存探索大型語言模型。
SamurAIGPT/Camel-AutoGPT - 介紹CAMEL，一種針對大型語言模型（LLMs）和自動代理（auto - agents）的角色扮演方法。它使代理能夠協作，並在多個領域具有潛力。
Syan-Lin/CyberWaifu - 一個由大型語言模型（LLM）+語音合成（TTS）構成的具有真實感的聊天機器人，一個支持表情符號、QQ表情和互聯網搜索的QQ機器人。

多模態模型

PaddlePaddle/PaddleOCR - 基於飛槳（PaddlePaddle）的超棒多語言光學字符識別（OCR）工具包。它們實用、超輕量，支持80多種語言，可在多種設備上使用。
suno-ai/bark - 一種由文本提示的生成式音頻模型。
openai/CLIP - CLIP（對比語言- 圖像預訓練）：為圖像預測最相關的文本片段。
hpcaitech/Open-Sora - Open - Sora：使每個人都能以民主的方式進行高效的視頻製作。
haotian-liu/LLaVA - NeurIPS'23 Oral（神經信息處理系統大會2023年口頭報告）中的視覺指令調整（LLaVA）旨在獲得GPT - 4V級別的能力甚至更強的能力。
fishaudio/fish-speech - 最先進的開源語音合成（TTS）技術。
borisdayma/dalle-mini - DALL·E Mini根據文本提示生成圖像。
google-deepmind/alphafold - AlphaFold 2的開源代碼。
OpenBMB/OmniLMM - MiniCPM - V 2.6是一款在手機上用於單張圖像、多張圖像和視頻的、達到GPT - 4V水平的多模態大語言模型（MLLM）。
PKU-YuanGroup/Open-Sora-Plan - 該項目旨在復現Sora（OpenAI的文本到視頻模型），並希望開源社區做出貢獻。
openai/shap-e - 基於文本或圖像生成3D對象。
facebookresearch/seamless_communication - 用於最先進的語音和文本翻譯的基礎模型。
openai/DALL-E - PyTorch軟件包用於DALL·E中的離散變分自編碼器（VAE）。
google-research/vision_transformer -
magic-research/magic-animate - CVPR 2024中的MagicAnimate使用擴散模型實現時序一致的人體圖像動畫。
ashawkey/stable-dreamfusion - 使用神經輻射場（NeRF）+擴散技術進行文本到3D、圖像到3D以及網格導出。
lucidrains/imagen-pytorch - 在Pytorch中實現谷歌的文本到圖像神經網絡Imagen。
openai/jukebox - 論文《Jukebox：一種音樂生成模型》的代碼。
deep-floyd/IF -
netease-youdao/EmotiVoice - EmotiVoice?：一款擁有多種音色並且受提示控制的語音合成（TTS）引擎。
IDEA-Research/GroundingDINO - 論文《Grounding DINO：將DINO與基礎預訓練相結合用於開集目標檢測》在ECCV 2024中的官方實現。
FoundationVision/VAR - NeurIPS 2024口頭報告《視覺自回歸建模：通過下一尺度預測進行可擴展圖像生成》的官方實現。這是一個用於自回歸圖像生成的極其簡單、用戶友好的最先進代碼庫。
threestudio-project/threestudio - 一種統一生成3D內容的框架。
openai/guided-diffusion -
THUDM/CogVLM - 一種最先進的開放式視覺語言模型，一種多模態預訓練模型。
openai/consistency_models - 一致性模型官方庫。
levihsu/OOTDiffusion - OOTDiffusion：基於潛擴散的服裝融合用於可控虛擬試穿——官方實現。
clovaai/donut - ECCV 2022的Donut（無光學字符識別的文檔理解變換器）和SynthDoG（合成文檔生成器）的官方實現。
google/gemma_pytorch - 谷歌Gemma模型的官方PyTorch實現。
QwenLM/Qwen-VL - 通義千問- VL（阿里雲的一個聊天和預訓練大視覺語言模型）的官方倉庫。
yl4579/StyleTTS2 - StyleTTS 2旨在通過風格擴散和利用大型語音語言模型進行對抗訓練來實現人類水平的文本到語音轉換。
snakers4/silero-models - Silero模型是用於語音轉文本、文本轉語音和文本增強的預訓練模型，這些模型製作得非常簡單。
salesforce/BLIP - 用於BLIP（Bootstrapping Language - Image Pre - training，自舉語言- 圖像預訓練）的PyTorch代碼，BLIP用於通過自舉語言- 圖像預訓練來實現統一的視覺- 語言理解和生成。
google-deepmind/alphageometry -
metavoiceio/metavoice-src - 一個類人、富有表現力的文本到語音（TTS）基礎模型。
Luodian/Otter - 水獺（Otter）是一個基於OpenFlamingo的多模態模型，在MIMIC - IT數據集上進行訓練，具有更好的指令遵循和上下文學習能力。
NExT-GPT/NExT-GPT - NExT - GPT（一種任意到任意多模態大型語言模型）的代碼和模型。
openai/improved-diffusion - 發布用於改進的去噪擴散概率模型。
X-PLUG/MobileAgent - 移動設備- 代理：強大的移動設備操作助手家族。
dvlab-research/MiniGemini - 《Mini - Gemini：挖掘多模態視覺語言模型的潛力》官方知識庫。
lucidrains/musiclm-pytorch - 使用注意力網絡在PyTorch中實現谷歌最先進的音樂生成模型MusicLM。
hustvl/Vim - Vision Mamba（於2024年國際機器學習會議中提出）通過雙向狀態空間模型實現高效的視覺表徵學習。
OpenGVLab/Ask-Anything - CVPR2024亮點：VideoChatGPT使ChatGPT能夠理解視頻。它還支持其他語言模型，如miniGPT4、StableLM和MOSS。
microsoft/lida - 通過大型語言模型自動生成可視化內容和信息圖表。
google-research/frame-interpolation - ECCV 2022中的大運動幀插值（FILM）
InternLM/InternLM-XComposer - InternLM - XComposer2.5 - OmniLive：一個用於長期視頻和音頻交互的多模態系統。
yerfor/GeneFace - GeneFace：廣義且高保真的3D說話人臉合成，ICLR 2023，含官方代碼。
OpenGVLab/InternImage - CVPR 2023中的InternImage：利用可變形卷積探索大規模視覺基礎模型。
google-deepmind/gemma - 谷歌DeepMind的開放權重大型語言模型。
baaivision/EVA - EVA系列：來自北京智源人工智能研究院（BAAI）的視覺表象的幻想。
MzeroMiko/VMamba - VMamba：視覺狀態空間模型。其代碼基於Mamba。
deepseek-ai/DeepSeek-VL - DeepSeek - VL旨在對現實世界中的視覺- 語言進行理解。
openai/consistencydecoder - 一致性蒸餾差分變分自編碼器。
gligen/GLIGEN - 開放- 基於基礎（grounding）的文本到圖像生成。
dvlab-research/LISA - “LISA：基於大型語言模型的推理分割”項目頁面。
3DTopia/LGM - ECCV 2024口頭報告中的LGM用於高分辨率3D內容創作。
lyuchenyang/Macaw-LLM - 金剛鸚鵡（Macaw）——大型語言模型（LLM）集成了圖像、視頻、音頻和文本，用於多模態語言建模。
OpenMotionLab/MotionGPT - MotionGPT在2023年神經信息處理系統大會（NeurIPS 2023）上是一個使用大型語言模型（LLMs）的統一運動- 語言生成模型。
OpenGVLab/InternVideo - ECCV2024（歐洲計算機視覺國際會議2024）中用於多模態理解的視頻基礎模型和數據。
openai/Video-Pre-Training - 視頻預訓練（VPT）包括通過觀察未標記的在線視頻來學習行動。
THUDM/ImageReward - NeurIPS 2023中的ImageReward：學習和評估人類對文生圖的偏好。
evo-design/evo - 從分子到基因組規模的生物學基礎建模。
google-research/tapas - 用於理解表格和文本的端到端神經模型。
apple/ml-aim - 該存儲庫提供用於AIMv1和AIMv2研究項目的代碼和模型檢查點。
showlab/Show-o - Show - o的代碼庫，一個用於統一多模態理解和生成的單一Transformer。
ELLA-Diffusion/ELLA - 為擴散模型配備大型語言模型（LLM）以加強語義對齊。
declare-lab/tango - 一種用於文生音的擴散模型家族。
OpenBMB/VisCPM - 基於CPM基礎模型的漢英雙模態大模型系列（聊天與繪畫）
OpenGVLab/VisionLLM - 視覺大型語言模型（VisionLLM）系列。
BAAI-DCAI/Bunny - 輕量級多模態模型家族。
Ligo-Biosciences/AlphaFold3 - AlphaFold3的開源實現。
Vchitect/SEINE - SEINE：一種用於2024年國際學習表徵會議（ICLR）中生成性轉換和預測的短視頻到長視頻擴散模型。
google-deepmind/materials_discovery -
OpenGVLab/SAM-Med2D - SAM - Med2D的官方實現。
OpenMOSS/AnyGPT - 用於“AnyGPT：具有離散序列建模的統一多模態大型語言模型（LLM）”的代碼。

多語言模型

THUDM/ChatGLM-6B - ChatGLM - 6B是一個開放的雙語對話語言模型。
ymcui/Chinese-LLaMA-Alpaca - 中國的LLaMA（小羊駝）和Alpaca（羊駝）大型語言模型+ 本地CPU（中央處理器）/GPU（圖形處理器）訓練與部署
UKPLab/sentence-transformers - 最先進的文本嵌入技術。
FlagAlpha/Llama2-Chinese - 羊駝（Llama）中文社區已開放Llama3以供在線體驗和微調。它更新了Llama3的所有代碼，完全開源且可用於商業用途，並且還編寫了最新的Llama3學習資料。
THUDM/ChatGLM3 - ChatGLM3系列：開源雙語聊天大型語言模型。
ymcui/Chinese-LLaMA-Alpaca-2 - 中國版LLaMA - 2和Alpaca - 2大型模型二期項目以及64K長文本模型。
InternLM/InternLM - InternLM2.5基礎模型和聊天模型正式發布，支持100萬（1M）的上下文。
Facico/Chinese-Vicuna - 中國- Vicuna：一個遵循指令的基於LLaMA的中文模型- 一種參考羊駝結構的低資源中文llama + lora解決方案。
LC1332/Luotuo-Chinese-LLM - 駱駝（Luotuo）是由華中師範大學的陳啟源、商湯科技的李路路和冷子昂開發的開源中文語言模型。
wenge-research/YAYI2 - YAYI 2是中科聞歌開發的新一代開源大語言模型，使用超過2萬億個高質量、多語言語料庫的標記進行預訓練。
wenge-research/YaYi - 亞一大型模型由中科文歌算法團隊開發，是為客戶打造的安全可靠的專屬大型模型，它基於LlaMA2和BLOOM系列的大規模中英文多領域指令數據進行訓練。
TigerResearch/TigerBot - TigerBot是一個支持多種語言和任務的大型語言模型。
LinkSoul-AI/Chinese-Llama-2-7b - 開源社區中首個可下載且可運行的中文LLaMA2模型！
MiuLab/Taiwan-LLM - 面向台灣的傳統普通話語言模型。
zjunlp/KnowLM - 一個帶有知識的開源大語言模型框架。
google-research/multilingual-t5 -
SkyworkAI/Skywork - Skywork系列模型在3.2TB的多語言和代碼數據上進行了預訓練，相關項目已開源。

數據組織

photoprism/photoprism - 去中心化網絡上由人工智能驅動的照片應用。
freedmand/semantra - 一種用於語義搜索的多功能工具。
neo4j/NaLLM - NaLLM項目的存儲庫。

AI服務

vllm-project/vllm - 一種用於大型語言模型（LLMs）推理和服務的高通量且內存高效的引擎。
guillaumekln/faster-whisper - 使用CTranslate2進行更快速的Whisper轉錄。
bentoml/OpenLLM - 在雲端將像Llama和Mistral這樣的開源大型語言模型（LLM）作為與OpenAI兼容的API端點來運行。
huggingface/text-generation-inference - 大規模語言模型文本生成推理。
FMInference/FlexGen - 在以吞吐量為重點的場景下，在單個GPU上運行大型語言模型。
triton-inference-server/server - Triton推理服務器為雲端和邊緣端提供了優化的推理解決方案。
dusty-nv/jetson-inference - 《Hello AI World》中使用TensorRT和NVIDIA Jetson部署深度學習推理網絡和深度視覺原語指南。
openvinotoolkit/openvino - OpenVINO™是一個開源的人工智能推理優化和部署工具包。
zilliztech/GPTCache - 用於大型語言模型（LLMs）的語義緩存，與LangChain和llama_index完全集成。
Portkey-AI/gateway - 一個速度非常快、集成了防護欄並且可以通過一個API路由到許多大型語言模型（LLMs）和人工智能防護欄的人工智能網關。
tensorflow/serving - 一個靈活且高性能的機器學習模型服務系統。
xorbitsai/inference - 通過使用Xinference修改一行代碼，在你的應用中用另一個大型語言模型（LLM）替換OpenAI GPT，Xinference支持在任何地方運行各種模型的推理。
allegroai/clearml - ClearML是一種用於人工智能工作負載（包括實驗和數據管理等）的MLOps/LLMOps解決方案。
InternLM/lmdeploy - LMDeploy是一個用於壓縮、部署和服務大型語言模型的工具包。
argmaxinc/WhisperKit - 蘋果矽芯片設備端語音識別。
kserve/kserve - 一個基於Kubernetes的標準化無服務器機器學習推理平台。
neuralmagic/deepsparse - 基於CPU的稀疏感知深度學習推理運行時。
huggingface/text-embeddings-inference - 一種用於文本嵌入模型的非常快速的推理解決方案。
open-mmlab/mmdeploy - OpenMMLab的模型部署框架。
ModelTC/lightllm - LightLLM是一個基於Python的大型語言模型（LLM）推理和服務框架，它輕巧、易於擴展且速度快。
predibase/lorax - 一個可擴展至數千個微調大型語言模型（LLM）的多LoRA推理服務器。
langchain-ai/langserve - 朗格服務（LangServe） ?️?
S-LoRA/S-LoRA - S - LoRA：服務大量並發的LoRA適配器。
michaelfeil/infinity - Infinity是一種用於文本嵌入、重排序模型、clip、clap和colpali的服務引擎，具有高吞吐量和低延遲的特點。
roboflow/inference - 將任何計算機或邊緣設備轉變為計算機視覺項目的指揮樞紐。
ray-project/ray-llm - RayLLM - 基於Ray的大型語言模型。
PygmalionAI/aphrodite-engine - 大規模語言模型（LLM）推理引擎。
punica-ai/punica - 將多個LoRA微調的大型語言模型作為一個來服務。
msoedov/langcorn - 使用FastApi為LLMops自動為LangChain大型語言模型（LLM）應用程序和代理提供服務。
mosecorg/mosec - 一種高性能機器學習模型服務框架，具有動態批處理和CPU/GPU管道，可最大限度地提高計算機利用率。

向量數據庫

facebookresearch/faiss - 一個用於高效稠密向量相似性搜索和聚類的庫。
milvus-io/milvus - Milvus是一個高性能、雲原生的向量數據庫，用於可擴展的向量近似最近鄰搜索。
qdrant/qdrant - Qdrant是一款面向下一代人工智能的高性能、大規模矢量數據庫和搜索引擎，也提供雲服務。
chroma-core/chroma - 人工智能原生的開源嵌入數據庫。
spotify/annoy - 針對內存使用和磁盤I/O進行優化的C++/Python近似最近鄰算法。
weaviate/weaviate - Weaviate是一個開源向量數據庫。它存儲對象和向量，並能夠在結構化過濾下進行向量搜索，具備容錯性和可擴展性。
neuml/txtai - 一個用於語義搜索、大型語言模型（LLM）編排和語言模型工作流的一體化開源嵌入數據庫。
activeloopai/deeplake - 一個供人工智能使用的數據庫，它能夠存儲諸如向量、圖像、文本和視頻等各種類型的數據。它可與大型語言模型/語言鏈（LLMs/LangChain）一起用於存儲、查詢、版本管理和可視化人工智能數據等操作，並且能夠向PyTorch/ TensorFlow實時傳輸數據。
vespa-engine/vespa - 人工智能+數據，可在https://vespa.ai在線獲取。
lancedb/lancedb - 一種用於人工智能應用的無服務器矢量數據庫，對開發者友好，能輕鬆為大型語言模型（LLM）應用添加長期記憶。
marqo-ai/marqo - 統一的嵌入生成和搜索引擎，也可在雲端使用- cloud.marqo.ai。
nmslib/hnswlib - 一個僅含頭文件的C++/python庫，用於快速近似最近鄰搜索。
unum-cloud/usearch - 適用於多種編程語言的快速開源搜索與聚類引擎。
tensorchord/pgvecto.rs - 借助混合功能在Postgres（一種數據庫管理系統）中進行可擴展、低延遲的向量搜索。它革新的是向量搜索而非數據庫。
spotify/voyager - 一個用於近似最近鄰搜索的Python和Java庫，側重於易用性、簡潔性和可部署性。
rapidsai/raft - RAFT擁有用於機器學習和信息檢索（IR）的基本算法和原語，這些算法和原語通過CUDA加速以用於高性能應用。

AI教育

JushBJJ/Mr.-Ranedeer-AI-Tutor - 一種用於個性化學習體驗且可定制的GPT - 4人工智能導師提示詞。
Nutlope/llamatutor - 一個AI私人導師是基於Llama 3.1構建的。
codeacme17/examor - 對於學生、學者、受訪者和終身學習者來說，大型語言模型（LLMs）有助於學習。

AI開發工具

jina-ai/jina - 使用雲原生技術棧構建多模態人工智能應用。
iterative/dvc - 數據版本控制與機器學習實驗。
unifyai/ivy - 在不同框架之間轉換機器學習代碼。
HigherOrderCO/HVM - 用Rust編寫的大規模並行最優函數運行時。
marimo-team/marimo - Python反應式筆記本可用於可重現性實驗、腳本執行、應用程序部署以及使用Git進行版本控制。
arogozhnikov/einops - 用於創建可讀性和可靠性兼具的代碼的靈活且強大的張量操作，適用於PyTorch、Jax、TensorFlow等。
replicate/cog - 機器學習中使用的容器。
jessevig/bertviz - BertViz：可視化如BERT、GPT2、BART等自然語言處理模型中的注意力。
AbdBarho/stable-diffusion-webui-docker - 通過用戶友好界面輕鬆設置用於Stable Diffusion的Docker。
huggingface/safetensors - 一種存儲和分配張量的簡單且安全的方法。
wangzhaode/mnn-llm - 基於MNN部署一個大型語言模型（LLM）項目。
ajndkr/lanarky - 用於構建大型語言模型（LLM）微服務的網絡框架。

模型訓練

tensorflow/tensorflow - 一個所有人都能使用的開源機器學習框架。
huggingface/transformers - Transformer：適用於Pytorch、TensorFlow和JAX的最先進機器學習技術。
pytorch/pytorch - 使用強大的GPU加速功能、基於Python的張量和動態神經網絡。
hpcaitech/ColossalAI - 降低大型人工智能模型的成本、提高其速度並增強其可及性。
hiyouga/LLaMA-Factory - 對100多個大型語言模型（LLMs）進行統一高效的微調（ACL 2024）
lm-sys/FastChat - 一個用於大型語言模型訓練、服務和評估的開放平台，也是Vicuna和Chatbot Arena的發布庫。
coqui-ai/TTS - ?是一個用於文本轉語音的深度學習工具包，在研究和生產中得到驗證。
microsoft/DeepSpeed - DeepSpeed是一個深度學習庫，用於輕鬆、高效且有效的分佈式訓練和推理。
ray-project/ray - Ray是一個人工智能計算引擎，它具有核心分佈式運行時和人工智能庫，用於加速機器學習工作負載。
google-research/google-research - 谷歌研究
google/jax - Python+NumPy程序可以通過多種方式進行組合轉換，例如求導、向量化以及即時編譯（JIT）到GPU/TPU等。
open-mmlab/mmdetection - OpenMMLab檢測工具包與基準測試。
tinygrad/tinygrad - 如果你喜歡PyTorch和Micrograd，那麼你也會喜歡Tinygrad。
huggingface/diffusers - Diffusers：用於生成圖像、視頻和音頻的PyTorch和FLAX最先進的擴散模型。
mozilla/DeepSpeech - DeepSpeech是一個開源的語音轉文本引擎，可在各種設備上實時使用。
modularml/mojo - 莫霍編程語言（給定描述中未提供更多細節）
microsoft/unilm - 大規模涵蓋任務、語言和模態的自監督預訓練。
ml-explore/mlx - MLX是一個適用於蘋果芯片的數組框架。
HigherOrderCO/Bend - 一種具有大規模並行性的高級編程語言。
huggingface/peft - PEFT：最佳的參數高效微調。
huggingface/candle - 一個用於Rust語言的極簡機器學習框架。
NVIDIA/NeMo - 一個適用於大型語言模型（LLMs）、多模態和語音人工智能等人工智能領域研究人員和開發人員的框架，該框架具有可擴展性和生成性。
PaddlePaddle/PaddleNLP - 一個易於使用且功能強大的自然語言處理（NLP）和大型語言模型（LLM）庫，擁有大量優秀的模型，支持從研究到工業應用的各種自然語言處理任務。
PaddlePaddle/PaddleSpeech - 一個易用的語音工具包包含多種功能，並獲得了NAACL2022最佳演示獎。
Lightning-AI/litgpt - 20多個高性能大型語言模型（LLM）以及大規模預訓練、微調與部署的相關方案。
huggingface/trl - 利用強化學習來訓練Transformer語言模型。
artidoro/qlora - QLoRA能夠實現量化大型語言模型的高效微調。
salesforce/LAVIS - LAVIS是一個一站式的語言- 視覺智能庫。
nerfstudio-project/nerfstudio - 一個對神經輻射場（NeRFs）協作友好的工作室。
mozilla/TTS - 用於語音合成的深度學習（討論論壇：https://discourse.mozilla.org/c/tts）
tracel-ai/burn - Burn是一個全新的動態深度學習框架，由Rust構建，旨在實現靈活性、高效性和可移植性。
facebookresearch/pytorch3d - PyTorch3D是FAIR（Facebook人工智能研究）用於3D數據深度學習的庫。
facebookresearch/xformers - Transformer構建模塊可靈活調整且經過優化，支持組合式構建。
OptimalScale/LMFlow - 一個用於大型基礎模型微調及推理的可擴展工具包，讓所有人都能使用大型模型。
OpenAccess-AI-Collective/axolotl - 只管去問蠑螈問題就好。
FlagOpen/FlagEmbedding - 檢索與檢索增強型大型語言模型（LLMs）
huggingface/accelerate - 一種在各種設備和配置上處理PyTorch模型的簡單方法，具有自動混合精度等功能，並支持完全分片數據並行（FSDP）和DeepSpeed。
LianjiaTech/BELLE - BELLE是一個開源的面向所有人的中文對話大型語言模型引擎。
cloneofsimo/lora - 通過低秩適應快速微調擴散模型。
EleutherAI/gpt-neox - 使用Megatron和DeepSpeed庫在GPU上實現具有模型並行性的自回歸變換器。
open-mmlab/mmagic - OpenMMLab是一個多模態工具箱，可用於像人工智能生成內容（AIGC）等各種任務，擁有易用的應用程序接口（API）和模型庫。
facebookresearch/metaseq - 外部大型工作資料庫。
Maartengr/BERTopic - 使用BERT和c - TF - IDF生成易於理解的主題。
Project-MONAI/MONAI - 一個用於人工智能領域醫療影像（處理）的工具包。
yangjianxin1/Firefly - Firefly是一個大型模型訓練工具，支持訓練多個大型模型，如Qwen2.5、Qwen2等。
google-deepmind/graphcast -
mosaicml/composer - 增強你的模型訓練。
cg123/mergekit - 用於組合預訓練大型語言模型的工具。
CarperAI/trlx - 一個用於使用人類反饋強化學習（RLHF）進行語言模型分佈式訓練的代碼庫。
pytorch/torchtune - 一個PyTorch原生的訓練後庫。
google-deepmind/open_spiel - OpenSpiel是一組用於通用強化學習以及遊戲搜索/規劃研究的環境和算法。
huggingface/autotrain-advanced - 自動訓練進階版。
InternLM/xtuner - 一個高效、靈活且功能齊全的用於對各種大型語言模型（LLMs）進行微調的工具包。
mosaicml/llm-foundry - 用於Databricks基礎模型的大型語言模型（LLM）訓練代碼。
baidu-research/warp-ctc - 快速並行的連接主義時間分類（CTC）。
JohnSnowLabs/spark-nlp - 自然語言處理的最先進技術。
FlagAI-Open/FlagAI - FlagAI是一個用於大規模模型的工具包，它快速、易用且可擴展。
mlfoundations/open_flamingo - 一個用於訓練大型多模態模型的開源框架。
OpenLLMAI/OpenRLHF - 一個易用、可擴展且高性能的人類反饋強化學習（RLHF）框架，具有700億以上參數的近端策略優化（PPO）完全微調、迭代直接偏好優化（DPO）、低秩自適應（LoRA）、環形注意力（RingAttention）和遞歸微調（RFT）等功能。
google-deepmind/acme - 一個用於強化學習的組件和代理庫。
open-mmlab/mmpretrain - OpenMMLab的預訓練工具箱和基準測試。
shibing624/MedicalGPT - MedicalGPT使用ChatGPT訓練管道來訓練醫學GPT模型，實現增量預訓練、有監督微調、人類反饋強化學習（RLHF）、直接偏好優化（DPO）和基於排序的偏好優化（ORPO）。
iryna-kondr/scikit-llm - 毫無問題地將大型語言模型（LLMs）集成到scikit - learn中。
google-research/scenic - Scenic：一個用於計算機視覺研究及其他更多用途的Jax庫。
facebookresearch/fairscale - 用於高性能和大規模訓練的PyTorch擴展。
alpa-projects/alpa - 通過自動並行化訓練和服務大規模神經網絡。
microsoft/torchscale - 大中型語言模型的基礎架構。
google-deepmind/dm-haiku - 基於JAX的神經網絡庫。
eureka-research/Eureka - ICLR 2024會議上發表的論文《Eureka：通過對大型語言模型進行編碼實現人類水平的獎勵設計》的官方存儲庫。
Alpha-VLLM/LLaMA2-Accessory - 一個用於開發大型語言模型的開源工具包。
google-research/t5x -
google-deepmind/alphatensor -
PhoebusSi/Alpaca-CoT -
huggingface/optimum - 使用易用的硬件優化工具來加速Transformer、Diffuser、TIMM和Sentence Transformer的推理和訓練。
stochasticai/xTuring - 通過xTuring可以輕鬆地從數據預處理到微調構建、定制和控制您自己的大型語言模型（LLMs），並加入其Discord社區。
adapter-hub/adapters - 一個用於參數高效和模塊化遷移學習的統一庫。
openai/weak-to-strong -
OpenPipe/OpenPipe - 將昂貴的提示轉換為價格實惠的微調模型。
lamini-ai/lamini - Lamini API的官方Python客戶端。
google-research/big_vision - 用於開發視覺變換器（Vision Transformer）、SigLIP、多層感知機混合器（MLP - Mixer）、LiT等的官方代碼庫。
young-geng/EasyLM - EasyLM（基於JAX/Flax）為預訓練、微調、評估和服務等各種大型語言模型（LLM）操作提供一站式解決方案。
pyro-ppl/numpyro - 使用NumPy進行概率編程，並利用JAX進行自動求導以及將即時編譯（JIT編譯）到GPU/TPU/CPU。
eric-mitchell/direct-preference-optimization - 直接偏好優化（DPO）的參考實現。
huggingface/setfit - 使用句向量轉換器（Sentence Transformers）進行高效的小樣本學習。
allenai/open-instruct -
allenai/RL4LMs - 一個用於根據人類偏好微調語言模型的模塊化強化學習（RL）庫。
lxe/simple-llm-finetuner - 用於微調大型語言模型（LLM）的簡單用戶界面。
THUDM/P-tuning-v2 - 一種優化的深度提示微調策略在不同規模和任務中的效果與微調一樣好。
tensorflow/privacy - 一個用於訓練機器學習模型且對訓練數據有隱私保護的庫。
xlang-ai/instructor-embedding - 適用於任何任務的單一嵌入器：指令- 微調文本嵌入（ACL 2023）
unslothai/hyperlearn - 機器學習算法的速度提高了2 - 2000倍，內存使用量減少50%，並且可在所有硬件上運行。
salesforce/ctrl - 一種用於可控生成的條件轉換語言模型。
google-deepmind/optax - Optax是一個用於梯度處理和優化的JAX庫。
google-deepmind/penzai - 一個用於構建、修改和可視化神經網絡的JAX工具包。
microsoft/i-Code -
kubeflow/training-operator - 在Kubernetes上進行分佈式機器學習訓練和微調。
AetherCortex/Llama-X - 開展使LLaMA達到最先進大型語言模型的開放學術研究。
salesforce/ALBEF - 一種新的視覺- 語言預訓練方法ALBEF的代碼。
kubeflow/katib - Kubernetes環境下的自動化機器學習。
facebookresearch/multimodal - TorchMultimodal是一個PyTorch庫，用於對最先進的多模態多任務模型進行大規模訓練。
jina-ai/finetuner - 用於BERT、CLIP等的面向任務的嵌入調整。
salesforce/CodeTF - CodeTF：用於最新代碼大型語言模型（LLM）的一站式Transformer庫。
AnswerDotAI/fsdp_qlora - 使用QLoRA和全分片數據並行（FSDP）訓練大型語言模型（LLM）。
nerfstudio-project/nerfacc - 一個基於PyTorch的通用神經輻射場（NeRF）加速工具箱。
jquesnelle/yarn - YaRN：大型語言模型的高效上下文窗口擴展。
PKU-Alignment/safe-rlhf - 安全的人類反饋強化學習（Safe RLHF）利用基於人類反饋的安全強化學習來實現受限的值對齊。
lucidrains/self-rewarding-lm-pytorch - 實現MetaAI在《自獎勵語言模型》中提出的訓練框架。
OpenLMLab/MOSS-RLHF - 這是關於大型語言模型中人類反饋強化學習（RLHF）的秘密，特別是關於近端策略優化算法（PPO）的第一部分。
JonasGeiping/cramming - 在有限的計算資源內壓縮BERT類型語言模型的訓練。
AlibabaResearch/DAMO-ConvAI - 達摩- 對話式人工智能（ConvAI）是擁有阿里巴巴達摩院對話式人工智能（DAMO Conversational AI）代碼庫的官方資源庫。
databricks/megablocks -
AGI-Edgerunners/LLM-Adapters - EMNLP 2023論文《LLM - 適配器：用於大型語言模型參數高效微調的適配器家族》的代碼。
KhoomeiK/LlamaGym - 通過在線強化學習對大型語言模型（LLM）智能體進行微調。
thunlp/OpenDelta - 一個即插即用的參數高效調整（Delta Tuning）庫。
Liuhong99/Sophia - 論文《Sophia：一種用於語言模型預訓練的可擴展隨機二階優化器》的官方實現。
yuchenlin/LLM-Blender - LLM - Blender是[ACL2023]中的一個集成框架，它通過排序來消除弱點，並通過生成融合優勢以提升大型語言模型（LLMs）的能力。
google-deepmind/xmanager - 一個用於處理機器學習實驗的平台。
google-deepmind/chex -

AI圖像生成

AUTOMATIC1111/stable-diffusion-webui - 穩定擴散Web用戶界面。
lllyasviel/Fooocus - 描述內容是關於專注於提示和生成。
upscayl/upscayl - Upscayl是適用於Linux、MacOS和Windows系統的排名第一的免費開源人工智能圖像放大器。
s0md3v/roop - 一鍵換臉意味著只需點擊一下就可以完成換臉。
invoke-ai/InvokeAI - Invoke是一個用於Stable Diffusion模型的創意引擎，它提供了一個WebUI（用戶界面）並作為商業產品的基礎。
facefusion/facefusion - 一個行業領先的面部處理平台。
Sanster/lama-cleaner - 由最先進的人工智能模型驅動的圖像修復工具可以去除圖片中不需要的元素或替換其中的事物。
Mikubill/sd-webui-controlnet - 用於ControlNet的WebUI擴展。
camenduru/stable-diffusion-webui-colab - 在Colab（谷歌協作平台）上的Stable diffusion（穩定擴散）網頁用戶界面。
divamgupta/diffusionbee-stable-diffusion-ui - Diffusion Bee是在M1 Mac本地運行Stable Diffusion的最簡單方法。它有一個一鍵安裝程序，不需要依賴項或技術知識。
Baiyuetribe/paper2gui - 將人工智能論文轉換為圖形用戶界面（GUI），以便每個人都能輕鬆使用人工智能技術。
easydiffusion/easydiffusion - 在PC端利用人工智能創作精美藝術作品最簡單的方法是一鍵操作。只需輸入文本提示詞，就能通過瀏覽器用戶界面生成圖像，無需技術知識。
Stability-AI/StableStudio - 生成式人工智能的社區界面。
carson-katri/dream-textures - Stable Diffusion集成到Blender中。
TheLastBen/fast-stable-diffusion - 快速- 穩定- 擴散和DreamBooth。
godly-devotion/MochiDiffusion - 在Mac上本地運行Stable Diffusion。
HumanAIGC/OutfitAnyone - 超高質量的適用於所有人和衣物的虛擬試穿。
sensity-ai/dot - 深度偽造攻擊工具包。
leap-ai/headshots-starter -
Nutlope/restorePhotos - 使用人工智能修復模糊的舊人臉照片。
jina-ai/discoart - 一行創建迪斯科擴散藝術作品。
mlc-ai/web-stable-diffusion - 將穩定擴散模型引入網絡瀏覽器；無需服務器支持，一切都在瀏覽器中運行。
all-in-aigc/aicover - 一個用於生成人工智能封面的工具。

數據集

huggingface/datasets - 最大的機器學習模型數據集中心擁有快速、易用且高效的數據操作工具。
BuilderIO/gpt-crawler - 從一個網址抓取網站內容以生成創建自定義GPT所需的知識文件。
joke2k/faker - Faker是一個用於生成虛假數據的Python包。
DS4SD/docling - 為生成式人工智能準備好你的文檔。
openai/tiktoken - Tiktoken是適用於OpenAI模型的一種快速的BPE分詞器。
cleanlab/cleanlab - 標準的人工智能包專注於用於質量和機器學習的數據，處理雜亂的現實世界數據和標籤。
karpathy/minbpe - 用於大型語言模型（LLM）標記化中常用的字節對編碼（BPE）算法的簡潔代碼。
huggingface/tokenizers - 快速、先進的分詞器，為研究和生產進行了優化。
arsenetar/dupeguru - 查找重複文件。
QuivrHQ/MegaParse - 優化的文件解析器，用於無損的大型語言模型（LLM）攝入，能夠將PDF、Docx、PPTx文件解析成適合大型語言模型（LLM）的理想格式。
togethercomputer/RedPajama-Data - RedPajama - 數據存儲庫中有用於為大型語言模型訓練準備大型數據集的代碼。
lk-geimfari/mimesis - Mimesis是一個Python數據生成器，能夠創建多種語言的各類虛假數據。
Instruction-Tuning-with-GPT-4/GPT-4-LLM - 使用GPT - 4進行指令微調。
yizhongw/self-instruct - 將預訓練語言模型與其自身生成的指令數據進行對齊。
dedupeio/dedupe - 一個用於精確和可擴展的模糊匹配、記錄去重和實體解析的Python庫。
argilla-io/argilla - Argilla是一種可供人工智能工程師和領域專家共同創建高質量數據集的工具。
mshumer/gpt-llm-trainer -
life4/textdistance - 使用30多種純Python算法、通用接口以及可選擇使用外部庫來計算序列之間的距離。
Docta-ai/docta - 一位醫生來照管你的數據。
alibaba/data-juicer - 為基礎模型提供高質量、豐富且易於處理的數據。
towhee-io/towhee - Towhee是一個使神經數據處理管道變得簡單快速的框架。
QData/TextAttack - TextAttack是一個用於自然語言處理（NLP）任務（如對抗性攻擊、數據增強和模型訓練）的Python框架。
seatgeek/thefuzz - Python中的模糊字符串匹配。
ekzhu/datasketch - 最小哈希、局部敏感哈希、局部敏感哈希森林、加權最小哈希、超對數、超對數++、局部敏感哈希集成和分層可導航小世界圖。
thunlp/UltraChat - 大規模、信息豐富且多樣的多輪聊天數據和模型。
modAL-python/modAL - 一個用Python編寫的模塊化主動學習框架。
chiphuyen/lazynlp - 一個用於爬取和清理網頁以生成大型數據集的庫。
huggingface/datatrove - 提供一組與平台無關的可定制管道處理模塊，使數據處理不再依賴腳本編寫。
refuel-ai/autolabel - 使用大型語言模型對文本數據集進行標記、清理和擴充。
google-deepmind/code_contests -
Tencent/MedicalNet - 許多研究表明，訓練數據量會顯著影響深度學習的性能。 MedicalNet項目提供3D - ResNet預訓練模型和代碼。
argilla-io/distilabel - Distilabel是一個合成數據和人工智能反饋框架，適用於需要基於經過驗證的研究論文構建快速、可靠且可擴展管道的工程師。
google-deepmind/mathematics_dataset - 該數據集代碼從各種題型中創建學校難度級別的數學問答對。
openai/prm800k - 80萬條針對大型語言模型（LLM）解決數學問題的答案的步驟級正確性標籤。
salesforce/WikiSQL - 一個用於帶有語義分析註釋的自然語言界面開發的大型語料庫。
anthropics/hh-rlhf - 用於訓練通過人類反饋強化學習的助手（使其有用且無害）的人類偏好數據。
moj-analytical-services/splink - 快速、可擴展且精確的概率性數據鏈接，支持多種SQL後端。
dleemiller/WordLlama - 大型語言模型（LLM）的標記嵌入可完成的事情。
AI4Finance-Foundation/FinRL-Meta - FinRL - Meta為FinRL提供動態數據集和市場環境。
tensorflow/text - 將文本作為TensorFlow中的首要元素。
google-research/deduplicate-text-datasets -
allenai/dolma - 用於創建和檢查OLMo預訓練數據的數據和工具。
lilacai/lilac - 改進大型語言模型的數據管理。
1e0ng/simhash - 一種Simhash算法的Python實現。
J535D165/recordlinkage - 一個用於記錄鏈接和重複數據檢測的Python工具包，功能強大且模塊化。
google-deepmind/tree - Tree是一個用於處理嵌套數據結構的庫。
xtreme1-io/xtreme1 - Xtreme1是一個多模態數據訓練一體化平台，支持3D激光雷達點雲、圖像和大型語言模型（LLM）進行數據標記和註釋。
datadreamer-dev/DataDreamer - DataDreamer：提示、生成合成數據、訓練和校準模型。
HazyResearch/meerkat - 所有數據集的創意性和交互性視圖。

模型評估

openai/evals - Evals是一個用於評估大型語言模型（LLMs）及其係統的框架，也是一個開源的基準測試註冊中心。
explodinggradients/ragas - 為你對大型語言模型（LLM）應用的評估注入強大動力。
EleutherAI/lm-evaluation-harness - 一種使用少量樣本評估語言模型的框架。
erikbern/ann-benchmarks - Python中近似最近鄰庫的基準測試。
Trusted-AI/adversarial-robustness-toolbox - 對抗性魯棒性工具包（ART）是一個用於機器學習安全的Python庫，涵蓋了紅藍兩隊（攻防雙方）的規避、投毒、提取和推理（攻擊）。
open-compass/opencompass - OpenCompass是一個大型語言模型（LLM）評估平台，支持100多個數據集以及諸如Llama3、Mistral等各種各樣的模型。
Arize-ai/phoenix - 人工智能可觀察性與評估。
NVIDIA/NeMo-Guardrails - NeMo Guardrails是一個開源工具包，可輕鬆為基於大型語言模型（LLM）的對話系統添加可編程的防護欄。
confident-ai/deepeval - 大語言模型（LLM）評估框架。
Giskard-AI/giskard - 人工智能與大型語言模型（LLM）系統的開源評估與測試。
fchollet/ARC - 抽象推理語料庫是一種資源，但沒有更多細節的情況下，很難給出更具體的描述。它可能可用於各個領域中與抽象和推理相關的任務。
llm-attacks/llm-attacks - 對齊語言模型的通用可遷移攻擊。
leondz/garak - 大型語言模型（LLM）漏洞掃描器。
jeinlee1991/chinese-llm-benchmark - 中國大模型能力評估清單包含134個模型，包括商業和開源模型，並提供能力評分和原始輸出。
google/BIG-bench - 超越模仿遊戲：一個用於衡量和推斷語言模型能力的協作性基準。
meta-llama/PurpleLlama - 一組用於評估和增強大型語言模型（LLM）安全性的工具。
openai/human-eval - 論文《評估基於代碼訓練的大型語言模型》的代碼
salesforce/decaNLP - 自然語言十項全能（競賽）是自然語言處理領域的一項多任務挑戰。
THUDM/AgentBench - 一個用於評估作為智能體的大型語言模型（LLMs）的綜合基準（國際學習表徵會議ICLR'24）。
truera/trulens - 大型語言模型（LLM）實驗中的評估與跟踪。
princeton-nlp/SWE-bench - [國際學習表徵會議（ICLR）2024] SWE - bench：語言模型能否解決現實世界中的GitHub（代碼託管平台）問題。
Lightning-AI/torchmetrics - 適用於分佈式且可擴展的PyTorch應用程序的機器學習指標。
openai/simple-evals -
huggingface/evaluate - 一個名為Evaluate的庫，用於輕鬆評估機器學習模型和數據集。
embeddings-benchmark/mteb - MTEB是大規模文本嵌入基準測試。
Azure/PyRIT - PyRIT是一個開源框架，可幫助安全專業人員和工程師主動識別生成式人工智能係統中的風險。
stanford-crfm/helm - HELM是一個用於提高語言模型透明度的框架，它還用於評估其他模型，如HEIM中的文本到圖像模型和VHELM中的視覺- 語言模型。
TransformerLensOrg/TransformerLens - 一個用於類GPT語言模型的機械可解釋性的庫。
beir-cellar/beir - 一個異構信息檢索（IR）基準，用於輕鬆評估15個以上不同數據集的模型。
tatsu-lab/alpaca_eval - 一種指令遵循型語言模型的自動評估器。它經過人工驗證，質量高、成本低且速度快。
microsoft/CodeXGLUE - CodeXGLUE是一個項目或者實體，但沒有更多的上下文信息的話，很難說得更具體。
google-deepmind/bsuite - Bsuite是一組精心設計的實驗，用於探索強化學習智能體的核心能力。
CalculatedContent/WeightWatcher - WeightWatcher工具用於預測深度神經網絡的準確性。
facebookresearch/LAMA - 語言模型分析。
evalplus/evalplus - 在NeurIPS 2023和COLM 2024對大型語言模型（LLM）合成的代碼進行嚴格評估。
vectara/hallucination-leaderboard - 用於比較大型語言模型（LLM）在總結短文時產生幻覺表現的排行榜。
hendrycks/test - 在2021年國際學習表徵會議（ICLR）上衡量大規模多任務語言理解能力。
mlcommons/inference - MLPerf™推理基準的參考實現。
openai/grade-school-math -
rlancemartin/auto-evaluator - 大型語言模型問答鏈的評估工具。
openai/automated-interpretability -
allenai/natural-instructions - 該描述是關於擴展自然指令的。
WeOpenML/PandaLM -
thu-coai/Safety-Prompts - 用於評估和提升大型語言模型安全性的中國安全提示。
salesforce/OmniXAI - OmniXAI是一個可解釋人工智能（XAI）庫。
bigcode-project/bigcode-evaluation-harness - 用於評估自回歸代碼生成語言模型的框架。
hsiehjackson/RULER - 這個存儲庫包含RULER（關於長上下文語言模型的真實上下文大小）的源代碼。

計算管理

kubeflow/kubeflow - 一個專為Kubernetes設計的機器學習工具包。
Netflix/metaflow - 一個人工智能與機器學習的開源平台。
skypilot-org/skypilot - SkyPilot能夠在任何基礎設施（Kubernetes或12種以上的雲）上運行AI和批處理作業，通過一個簡單的接口提供統一的執行、成本節約和高GPU可用性。
gpuweb/gpuweb - 這是網絡中GPU（圖形處理器）工作的地方。
zenml-io/zenml - ZenML：機器學習與操作之間的聯繫。
higgsfield-ai/higgsfield - 容錯且高度可擴展的GPU編排，以及用於訓練大規模模型的機器學習框架。
Haidra-Org/AI-Horde - 一個用於生成人工智能藝術和文本的眾包分佈式集群。

AI寫作

steven-tey/novel - 一個所見即所得且具有人工智能驅動的自動補全功能的類似Notion的編輯器。
reorproject/reor - 一款面向高熵人群的、私密且本地化的人工智能個人知識管理應用。
shibing624/pycorrector - Pycorrector是一個文本糾錯工具包，有多種用於糾錯的模型應用且易於使用。
BlinkDL/AI-Writer - 人工智能創作諸如奇幻和浪漫網絡小說之類的小說。它是一個類似於GPT - 2、使用RWKV模型的中文預訓練生成模型。
mshumer/gpt-author -
Nutlope/twitterbio - 使用人工智能創建你的推特簡介。
nhaouari/obsidian-textgenerator-plugin - Text Generator是一個Obsidian插件，可用於與OpenAI、Anthropic、Google等各種人工智能供應商以及本地模型一起生成文本。
google-deepmind/dramatron - Dramatron利用大型語言模型來生成連貫的腳本和劇本。

智能體監控

nebuly-ai/nebuly - 一組用於優化人工智能模型性能的庫。
langfuse/langfuse - 具有多種集成（用於大型語言模型可觀測性、指標等）的開源大型語言模型工程平台。它來自於YC W23。
evidentlyai/evidently - Evidently是一個用於機器學習（ML）和大型語言模型（LLM）可觀測性的開源框架，可用於評估、測試和監控與人工智能相關的系統或數據管道，它擁有100多項指標。
traceloop/openllmetry - 依靠OpenTelemetry（開放遙測）為您的大型語言模型（LLM）應用提供開源可觀測性。
Helicone/helicone - 一個開源的大型語言模型（LLM）可觀測性平台。一行代碼即可用於監控、評估和實驗。
whylabs/whylogs - 一個用於記錄機器學習模型和管道中數據的開源庫。它提供數據質量和模型性能的可見性，以及受隱私保護的數據收集。
uptrain-ai/uptrain - UpTrain是一個用於評估和改進生成式人工智能應用的開源平台。它為預配置的檢查提供評分，分析故障並給出解決方案。
labmlai/labml - 通過手機監控深度學習模型訓練和硬件使用情況。
lmnr-ai/lmnr - Laminar是一個用於構建人工智能產品的開源一體化平台。它通過跟踪、評估、數據集和標籤為人工智能應用創建數據飛輪（YC S24）。
llmonitor/llmonitor - 大語言模型（LLMs）的生產工具包涉及可觀測性、提示管理和評估。
lunary-ai/lunary - 大型語言模型（LLMs）的生產工具包包括可觀測性、提示管理和評估。
dillionverma/llm.report - llm.report是一個針對OpenAI的開源平台，用於記錄API請求、成本分析和提示優化。
whylabs/langkit - LangKit是一個用於大型語言模型（LLM）監控的開源工具包。它具有用於LLM可觀測性的文本質量和情感分析等功能。

視頻生成

RayVentura/ShortGPT - ShortGPT——一個用於自動化運營YouTube Shorts（短視頻）/TikTok（抖音國際版）頻道的實驗性AI框架。
all-in-aigc/sorafm - 由Sora.FM提供的Sora人工智能視頻生成器。

數據管理

ibis-project/ibis - 可移植的Python數據框庫。
SuperDuperDB/superduperdb - Superduper能夠在現有數據基礎設施和首選工具上構建端到端的人工智能應用程序和代理工作流，無需進行數據遷移。
run-llama/llama-hub - 由社區製作的數據加載器庫，用於LlamaIndex和/或LangChain的大型語言模型（LLM）。
webdataset/webdataset - 一個適用於各種規模深度學習問題的基於Python的輸入輸出（I/O）系統，強力支持PyTorch。
NVIDIA/aistore - AIStore：可擴展的AI應用程序存儲。
mosaicml/streaming - 一種用於高效神經網絡訓練的數據流庫。