ดาวน์โหลด awesome colab notebooks - awesome colab notebooks ดาวน์โหลดซอร์สโค้ด

เพจอาจแสดงผลไม่ถูกต้อง กรุณาเปิดไฟล์ README.md โดยตรง

คอลเล็กชันสมุดบันทึก Colab ที่ยอดเยี่ยมสำหรับการทดลอง ML

กำลังมาแรง

ที่เก็บ	เอกสาร
facebookresearch/ผู้ร่วมติดตาม วนซ้ำ/ดาต้าเชน callummcdougall/ARENA_3.0 ถึงจุดเริ่มต้น/PuLID ZhengPeng7/BiRefNet อัลตราไลติก/อัลตราไลติก ไม่เฉื่อยชา / ไม่เฉื่อยชา facebookresearch/เซ็กเมนต์-อะไรก็ได้-2 lllyasviel/IC-Light gemelo-ai/vocos สะดวกสบายไม่ระบุชื่อ / ComfyUI TransformerLensOrg/TransformerLens หงเหวินจาง/PyMAF-X โรโบโฟลว์/การกำกับดูแล KwaiVGI/LivePortrait pidnad/DDColor TencentARC/InstantMesh LAION-AI/สุนทรียภาพทำนาย Doubiiu/DynamiCrafter facebookresearch/home-robot คิลเลียนลูคัส/ล่ามเปิด jxnl/ผู้สอน	ลิด้า การสาดแบบเกาส์เซียน ปรับแต่ง-A-Video ทำตามท่าของคุณ Text2Video-ศูนย์ กลิป ยูนิฟอร์เมอร์V2 เศร้าทอล์คเกอร์ นกฮูก-ViT วิดีโอรีทอล์คกิ้ง แอลดีเอ็ม ทุ่งฝัน เดติก GraphCast ลากแกน วีอาร์ที แบบจำลองการเคลื่อนที่แบบ Spline แบบแผ่นบาง PyMAF-X เฟทซีโร่ ไพ-irt VQ-การแพร่กระจาย เศรษฐกิจ

ที่เก็บ

เอกสาร

facebookresearch/ผู้ร่วมติดตาม
วนซ้ำ/ดาต้าเชน
callummcdougall/ARENA_3.0
ถึงจุดเริ่มต้น/PuLID
ZhengPeng7/BiRefNet
อัลตราไลติก/อัลตราไลติก
ไม่เฉื่อยชา / ไม่เฉื่อยชา
facebookresearch/เซ็กเมนต์-อะไรก็ได้-2
lllyasviel/IC-Light
gemelo-ai/vocos
สะดวกสบายไม่ระบุชื่อ / ComfyUI
TransformerLensOrg/TransformerLens
หงเหวินจาง/PyMAF-X
โรโบโฟลว์/การกำกับดูแล
KwaiVGI/LivePortrait
pidnad/DDColor
TencentARC/InstantMesh
LAION-AI/สุนทรียภาพทำนาย
Doubiiu/DynamiCrafter
facebookresearch/home-robot
คิลเลียนลูคัส/ล่ามเปิด
jxnl/ผู้สอน

ลิด้า
การสาดแบบเกาส์เซียน
ปรับแต่ง-A-Video
ทำตามท่าของคุณ
Text2Video-ศูนย์
กลิป
ยูนิฟอร์เมอร์V2
เศร้าทอล์คเกอร์
นกฮูก-ViT
วิดีโอรีทอล์คกิ้ง
แอลดีเอ็ม
ทุ่งฝัน
เดติก
GraphCast
ลากแกน
วีอาร์ที
แบบจำลองการเคลื่อนที่แบบ Spline แบบแผ่นบาง
PyMAF-X
เฟทซีโร่
ไพ-irt
VQ-การแพร่กระจาย
เศรษฐกิจ

วิจัย

ชื่อ	คำอธิบาย	ผู้เขียน	ลิงค์	อัปเดต
CoTracker	สถาปัตยกรรมที่ร่วมกันติดตามหลายจุดตลอดทั้งวิดีโอ	นิกิต้า คาราเยฟ อิกนาซิโอ ร็อคโค เบนจามิน เกรแฮม นาตาเลีย เนเวโรวา คนอื่น อันเดรีย เวดาลดี คริสเตียน รุพเพรชท์	- โครงการ	16.10.2024
PIFU	ฟังก์ชันโดยนัยที่จัดแนวพิกเซลสำหรับการเปลี่ยนภาพมนุษย์แบบสวมเสื้อผ้าที่มีความละเอียดสูง	เรียวตะ นัตสึเมะ ชุนสุเกะ ไซโตะ เจิง ฮวง อังจู คานาซาว่า เฮา ลี่		08.10.2024
ดิฟเฟซ	วิธีการที่สามารถรับมือกับการย่อยสลายที่ซับซ้อนและมองไม่เห็นได้อย่างสวยงามยิ่งขึ้น โดยไม่ต้องมีการออกแบบการสูญเสียที่ซับซ้อน	จงเซิงเยว่ เฉินเปลี่ยนลอย	-	05.10.2024
แบ่งส่วนอะไรก็ได้ที่ 2	แบบจำลองพื้นฐานในการแก้ปัญหาการแบ่งส่วนภาพที่รวดเร็วในรูปภาพและวิดีโอ	นิกิลา ราวี วาเลนติน กาเบอร์ หยวนถิงหู หรงฮัง หู คนอื่น ชัยธัญญา ไรอาลี เต็งหยูหม่า ไฮธรรม เคดร์ โรมัน เรเดิล โคลอี โรลแลนด์ ลอร่า กุสตาฟสัน เอริค มินตัน จันติงปาน [กัลยาน วาซูเดฟ](lwala](https://scholar.google.co.in/citations?user=m34oaWEAAAAJ) นิโคลัส คาเรียน [เจ้าหยวน](u](https://chaoyuan.org/) รอสส์ เกอร์ชิค ปิโอเตอร์ ดอลลาร์ คริสตอฟ ไฟช์เทนโฮเฟอร์	การสาธิต - โครงการ -	01.10.2024
เปิด-Unmix	การใช้งานอ้างอิงเครือข่ายประสาทเชิงลึกสำหรับการแยกแหล่งเพลง ใช้ได้กับนักวิจัย วิศวกรด้านเสียง และศิลปิน	ฟาเบียน-โรเบิร์ต สเตอเตอร์ อองตวน ลิอุตกุส	ข้อมูล โครงการ	25.09.2024
การประสานกันของจิตรกรอย่างลึกซึ้ง	อัลกอริธึมให้ผลลัพธ์ที่ดีกว่าเทคนิคการจัดภาพหรือการจัดสไตล์ทั่วโลกอย่างเห็นได้ชัด และช่วยให้สามารถแก้ไขงานจิตรกรได้อย่างสร้างสรรค์ ซึ่งหากทำได้ยาก	ฟู่จุน หลวน ซิลแว็ง ปารีส เอไล เชชท์แมน กวิตา บาลา	- -	23.09.2024
audio2photoreal	กรอบการทำงานสำหรับการสร้างอวตารที่สมจริงเหมือนจริงซึ่งแสดงท่าทางตามไดนามิกการสนทนาของการโต้ตอบแบบไดอะดิก	อีวอนน์ อึ้ง ฮาเวียร์ โรเมโร ติมูร์ บาเกาต์ดินอฟ เชาเจี๋ยไป๋ คนอื่น เทรเวอร์ ดาร์เรล อังจู คานาซาว่า อเล็กซานเดอร์ ริชาร์ด	โครงการ	13.09.2024
แบ่งส่วนอย่างรวดเร็วอะไรก็ได้	โมเดลอะไรก็ได้ของ CNN Segment ได้รับการฝึกฝนโดยใช้เพียง 2% ของชุดข้อมูล SA-1B ที่เผยแพร่โดยผู้เขียน SAM	ซู่ จ้าว เหวินเชา ติง หย่งฉี อัน หยิงหลง ตู่ คนอื่น เต๋า หยู มิน ลี หมิงถัง จินเฉียว หวาง	- -	10.09.2024
Neuralangelo	กรอบงานสำหรับการสร้างพื้นผิว 3 มิติที่มีความเที่ยงตรงสูงใหม่จากการจับภาพวิดีโอ RGB	จ้าวซั่ว ลี่ โธมัส มุลเลอร์ อเล็กซ์ อีแวนส์ รัสเซล เทย์เลอร์ คนอื่น มาติอัส อุนเบราธ หมิงหยูหลิว เฉิน-ซวน หลิน	โพสต์ในบล็อก โครงการ -	02.09.2024
BiRefNet	กรอบอ้างอิงทวิภาคีสำหรับการแบ่งส่วนภาพแบบไดโคโตมัสที่มีความละเอียดสูง	เผิงเจิ้ง เต๋อหง เกา แฟนเติ้งปิง หลี่ หลิว คนอื่น จอร์มา ลักโซเนน ว่านลี่ โอวหยาง นิคู เซเบ	- - - โครงการ -	23.08.2024
สปิน	การเรียนรู้ที่จะสร้างท่าทางและรูปร่างของมนุษย์ 3 มิติขึ้นมาใหม่ผ่านการสร้างแบบจำลองในลูป	นิคอส โคโลตูรอส จอร์จิโอส ปาฟลาคอส ไมเคิล แบล็ค คอสตาส ดานิลิดิส	- โครงการ	21.08.2024
โยโลฟ10	มุ่งหวังที่จะพัฒนาขอบเขตประสิทธิภาพและประสิทธิภาพของ YOLO จากทั้งสถาปัตยกรรมหลังการประมวลผลและสถาปัตยกรรมแบบจำลอง	อ่าววัง ฮุ่ย เฉิน ไคเฉิน ซีเจีย หลิน คนอื่น จุงกง ฮัน กุ้ยกวง ติง	โพสต์ในบล็อก การสาธิต - - - -	20.08.2024
ข้อมูลจำเพาะ VQGAN	ควบคุมการสร้างเสียงด้วยภาพโดยการลดขนาดชุดข้อมูลการฝึกให้เหลือชุดเวกเตอร์ที่เป็นตัวแทน	วลาดิเมียร์ ยาชิน เอซา ราห์ตู	- - โครงการ -	12.07.2024
ภาพเหมือนแบบสด	เฟรมเวิร์กแอนิเมชั่นแนวตั้งที่ขับเคลื่อนด้วยวิดีโอโดยเน้นไปที่ลักษณะทั่วไปที่ดีขึ้น ความสามารถในการควบคุม และประสิทธิภาพสำหรับการใช้งานจริง	เจี้ยนจู้ กัว ติงหยุน จาง เสี่ยวเฉียง หลิว จือโจว จง คนอื่น หยวน จาง เผิงเฟย วาน ดิจาง	- โครงการ -	10.07.2024
สมเสร็จ	ติดตามจุดใดๆ ด้วยการเริ่มต้นต่อเฟรมและการปรับแต่งชั่วคราว	คาร์ล ดอร์ช ยี่หยาง เมล เวเซริก ดิลารา โกเคย์ คนอื่น อังคุช กุปตะ ยูซุฟ ไอตาร์ เจา การ์เรร่า แอนดรูว์ ซิสเซอร์แมน	- โพสต์ในบล็อก, โพสต์ในบล็อก -	05.07.2024
Wav2Lip	ผู้เชี่ยวชาญด้านลิปซิงค์คือทุกสิ่งที่คุณต้องการสำหรับการพูดเพื่อสร้างริมฝีปากในป่า	ปรัชญา เรณูกานันท์ รุทรภา มุกโภทัย วินัย นามบุดริ CV ชวาฮาร์	ข้อมูล การสาธิต โครงการ	27.06.2024
DeepLabCut	วิธีการที่มีประสิทธิภาพสำหรับการประมาณค่าท่าทางแบบไม่มีมาร์กเกอร์โดยอิงจากการเรียนรู้แบบถ่ายโอนด้วยโครงข่ายประสาทเทียมระดับลึกที่ให้ผลลัพธ์ที่ยอดเยี่ยมด้วยข้อมูลการฝึกที่น้อยที่สุด	อเล็กซานเดอร์ มาติส ปรานาฟ มามิดันนา เควิน คิวรี ไทกะ อาเบะ คนอื่น เวนคาเตช เมอร์ธี่ แม็กเคนซี่ มาติส แมทเธียส เบธจ์	- ฟอรั่ม - เว็บไซต์ -	05.06.2024
สระว่ายน้ำอดีต	MetaFormer คือสิ่งที่คุณต้องการสำหรับการมองเห็นจริงๆ	เหวยห่าว หยู หมี่หลัว ปานโจว เฉินหยางสี คนอื่น อี้เฉิน โจว ซินเชา หวาง เจียซือเฟิง ซุยเฉิง หยาน	-	01.06.2024
เรื่องราวการแพร่กระจาย	วิธีการคำนวณการเอาใจใส่ตนเอง เรียกว่าการใส่ใจในตนเองที่สอดคล้องกัน ซึ่งช่วยเพิ่มความสอดคล้องกันอย่างมากระหว่างรูปภาพที่สร้างขึ้นและส่วนเสริมซึ่งใช้โมเดลข้อความเป็นรูปภาพที่อิงตามการแพร่กระจายที่ฝึกไว้ล่วงหน้าในลักษณะซีโร่ช็อต	หยูเผิง โจว ต้าฉวน โจว หมิงหมิงเฉิง เจียซือเฟิง ฉีปินโหว	โครงการ -	04.05.2024
พูลลิด	การปรับแต่ง Pure และ Lightning ID ซึ่งเป็นวิธีการปรับแต่ง ID โดยไม่ต้องปรับแต่งสำหรับการสร้างข้อความเป็นรูปภาพ	ซีหนาน กัว แยนเซ วู โจวเว่ย เฉิน หลางเฉิน เฉียนเหอ	-	03.05.2024
ฟิล์ม	อัลกอริธึมการแก้ไขเฟรมที่สังเคราะห์เฟรมกลางหลายเฟรมจากรูปภาพอินพุตสองภาพที่มีการเคลื่อนไหวขนาดใหญ่อยู่ระหว่างนั้น	ฟิตซัม เรดา ยานน์ คอนต์คาเนน เอริก ทาเบลเลียน เต๋อชิง ซุน คนอื่น แคโรไลน์ ปันโตฟารู ไบรอัน เคอร์เลส	ข้อมูล ข้อมูล ข้อมูล โครงการ -	03.05.2024
วอยซ์คราฟต์	โทเค็นที่เติมโมเดลภาษาโคเดกแบบนิวรอล ซึ่งให้ประสิทธิภาพที่ล้ำสมัยทั้งในด้านการแก้ไขคำพูดและการอ่านออกเสียงข้อความแบบ Zero-shot บนหนังสือเสียง วิดีโอทางอินเทอร์เน็ต และพอดแคสต์	ผู่หยวน เผิง โปเย้าฮวง ซางเหวิน ลี อับเดลราห์มาน โมฮาเหม็ด เดวิด ฮาร์วัต	โครงการ -	21.04.2024
ซีเอสที	วิธีการถ่ายโอนวัสดุแบบซีโร่ช็อตไปยังวัตถุในภาพอินพุตโดยให้รูปภาพตัวอย่างวัสดุ	ทา-หยิงเฉิง ปราฟูล ชาร์มา แอนดรูว์ มาร์คัม นิกิ ทริโกนี วรุณ จำปานี	- โครงการ	16.04.2024
InstantMesh	กรอบการส่งต่อสำหรับการสร้าง 3D mesh ทันทีจากภาพเดียว โดดเด่นด้วยคุณภาพการสร้างที่ล้ำสมัยและความสามารถในการปรับขนาดการฝึกอบรมที่สำคัญ	เจียเล่ ซู เหวยเฮาเฉิง ยี่หมิง เกา ซินเทา หวัง คนอื่น เซิงฮวา เกา หยิงซาน	-	16.04.2024
อัลฟ่าพับ	การทำนายโครงสร้างโปรตีนที่แม่นยำสูง	จอห์น จัมเปอร์ ริชาร์ด อีแวนส์ อเล็กซานเดอร์ พริตเซล ทิม กรีน คนอื่น มิคาเอล ฟิกูร์นอฟ โอลาฟ รอนเนเบอร์เกอร์ แคทรีน ตุลย์สุวรรณกุล รัส เบทส์ ออกัสติน ชิเดก แอนนา โพทาเพนโก อเล็กซ์ บริดจ์แลนด์ คลีเมนส์ เมเยอร์ ไซมอน โคห์ล แอนดรูว์ บัลลาร์ด แบร์นาร์ดิโน โรเมรา-ปาเรเดส สตานิสลาฟ นิโคลอฟ ริชุบ เจน	โพสต์ในบล็อก, โพสต์ในบล็อก - กระดาษ -	15.04.2024
เวิร์สเชน	สถาปัตยกรรมสำหรับการสังเคราะห์ข้อความเป็นรูปภาพที่ผสมผสานประสิทธิภาพการแข่งขันเข้ากับความคุ้มทุนอย่างที่ไม่เคยมีมาก่อนสำหรับโมเดลการแพร่กระจายข้อความเป็นภาพขนาดใหญ่	ปาโบล เปอร์เนียส โดมินิค แรมปาส แมตส์ ริกเตอร์ คริสโตเฟอร์ ปาล มาร์ค ออเบรวิลล์		06.04.2024
AQLM	การบีบอัดโมเดลภาษาขนาดใหญ่ขั้นสูงสุดผ่านการเพิ่มปริมาณ	วาเก เอกิอาซาเรียน อังเดร ปานเฟรอฟ เดนิส คุซเนเดเลฟ เอเลียส ฟรานตาร์ คนอื่น อาร์เทม บาเบนโก้ แดน อลิสตาร์ห์	- -	08.03.2024
โยโลฟ9	การเรียนรู้สิ่งที่คุณต้องการเรียนรู้โดยใช้ข้อมูลการไล่ระดับสีแบบตั้งโปรแกรมได้	เชียนเหยาหวาง ไอ-หาว หง-หยวน มาร์ค เหลียว	- โพสต์ในบล็อก - - -	05.03.2024
องค์ประกอบ LoRA หลายตัว	LoRA Switch และ LoRA Composite มุ่งหวังที่จะก้าวข้ามเทคนิคแบบดั้งเดิมในแง่ของความแม่นยำและคุณภาพของภาพ โดยเฉพาะอย่างยิ่งในองค์ประกอบที่ซับซ้อน	หมิงจง เย่หลง เซิน ซั่วหัง หวาง ยาตง ลู่ คนอื่น อี๋จู เจียว ซีรู โอวยัง ดงฮัน หยู เจียเว่ย ฮั่น เว่ยจู เฉิน	เว็บไซต์	03.03.2024
อมาเร็ตโต	การอนุมานหลายระดับและหลายรูปแบบของเครือข่ายการกำกับดูแลเพื่อระบุวงจรเซลล์และตัวขับเคลื่อนที่ใช้ร่วมกันและชัดเจนภายในและข้ามระบบทางชีววิทยาของโรคในมนุษย์	นาตาลี โปเชต์ โอลิวิเยร์ เกวาร์ต โมห์เซ่น นาเบียน เจเยนดรา ชินเด คนอื่น เซลีน เอเวอร์เอิร์ต ธอริน ตะบอร์	ตัวนำทางชีวภาพ โครงการ	28.02.2024
ลิด้า	เครื่องมือสำหรับสร้างการแสดงภาพข้อมูลและอินโฟกราฟิกที่ไม่เชื่อเรื่องไวยากรณ์	วิคเตอร์ ดิเบีย	- โครงการ -	06.02.2024
ไวที	วิชันซิสเต็มทรานส์ฟอร์มเมอร์และสถาปัตยกรรม MLP-Mixer	อเล็กเซย์ โดโซวิตสกี ลูคัส เบเยอร์ อเล็กซานเดอร์ โคเลสนิคอฟ เดิร์ก ไวส์เซนบอร์น คนอื่น เสี่ยวฮวา ไจ๋ โธมัส อันเทอร์ธิเนอร์ มอสตาฟา เดห์กานี แมทเธียส มินเดอเรอร์ จอร์จ ไฮโกลด์ ซิลเวน เจลลี่ ยาคอบ อุสโคไรต์ นีล โฮลสบี้	- โพสต์ในบล็อก - -	06.02.2024
3D เคน เบิร์นส์	การใช้งานอ้างอิงของเอฟเฟกต์ 3D Ken Burns จากภาพเดียวโดยใช้ PyTorch - เมื่อได้รับภาพอินพุตเดียว จะทำให้ภาพนิ่งนี้เคลื่อนไหวด้วยการสแกนกล้องเสมือนและซูมวัตถุตามการเคลื่อนไหวแบบพารัลแลกซ์	มานูเอล โรเมโร		24.01.2024
วัล-อี เอ็กซ์	แบบจำลองภาษาตัวแปลงสัญญาณประสาทข้ามภาษาสำหรับการสังเคราะห์เสียงพูดข้ามภาษา	จื่อเฉียง จาง หลงโจว เฉิงอี้ หวาง ซานหยวน เฉิน คนอื่น หยูหวู่ ซูเจี๋ย หลิว จัว เฉิน หยานชิง หลิว ฮวาหมิง หวัง จินหยู ลี่ เล่ยเหอ เซิงจ้าว ฟูรุ เว่ย	- การสาธิต โครงการ	19.01.2024
โฟโต้เมคเกอร์	วิธีสร้างข้อความเป็นรูปภาพส่วนบุคคลที่มีประสิทธิภาพ ซึ่งส่วนใหญ่จะเข้ารหัสรูปภาพ ID อินพุตจำนวนเท่าใดก็ได้ลงใน Stack ID ที่ฝังไว้เพื่อรักษาข้อมูล ID	เจิ้นหลี่ หมิงเติ้ง เฉา ซินเทา หวัง จงกังฉี คนอื่น หมิงหมิงเฉิง หยิงซาน	- โครงการ -	18.01.2024
DDColor	วิธีการแบบ end-to-end พร้อมตัวถอดรหัสคู่สำหรับการปรับสีของภาพ	เสี่ยวหยางคัง เต๋าหยาง เหวินฉี โอวหยาง เพียร์รัน เรน คนอื่น เห็ดหลินจือ ลี่ ซวนซ่งเซี่ย	-	15.01.2024
พีเอสดี	เครือข่ายการแพร่กระจายที่เสถียรที่รับรู้พิกเซลเพื่อให้ได้ Real-ISR ที่แข็งแกร่งรวมถึงสไตล์ส่วนบุคคล	เต๋าหยาง เพียร์รัน เรน ซวนซ่งเซี่ย เล่ย จาง	-	12.01.2024
HandRefiner	การปรับแต่งมือที่มีรูปแบบไม่ถูกต้องในภาพที่สร้างขึ้นโดยการวาดภาพแบบมีเงื่อนไขแบบกระจาย	เหวินฉวน หลู หยูเฟย ซู จิง จาง เฉาเยว่หวาง ต้าเฉิงเต๋า	-	08.01.2024
GraphCast	เรียนรู้การพยากรณ์อากาศทั่วโลกระยะกลางที่มีทักษะ	เรมี แลม อัลบาโร ซานเชซ-กอนซาเลซ แมทธิว วิลสัน ปีเตอร์ วินส์เบอร์เกอร์ คนอื่น เมียร์ ฟอร์จูนาโต เฟร์รัน อาเล็ต สุมาน ราวูริ ติโม เอวาลด์ส แซค อีตัน-โรเซน เว่ยหัว หู อเล็กซานเดอร์ เมโรส สเตฟาน ฮอยเออร์ จอร์จ ฮอลแลนด์ โอเรียล ไวนิลอลส์ แจ็คลินน์ สตอตต์ อเล็กซานเดอร์ พริตเซล ชากีร์ โมฮาเหม็ด ปีเตอร์ บัตทาเกลีย	ข้อมูล - -	04.01.2024
อีเอสเอ็ม	การสร้างแบบจำลองขนาดเชิงวิวัฒนาการ: แบบจำลองภาษาที่ได้รับการฝึกอบรมล่วงหน้าสำหรับโปรตีน	เจ๋อหมิง หลิน โรชาน เรา ไบรอัน ฮี จงไค จู คนอื่น อัลลัน ดอส ซานโตส คอสต้า มารียัม ฟาเซล-ซารานดี ทอม เซอร์คู ซัลวาตอเร่ แคนดิโด้ อเล็กซานเดอร์ ริฟส์ โจชัว ไมเออร์ โรเบิร์ต เวอร์คูอิล เจสัน หลิว โคลอี ซู อดัม เลอเรอร์	อีเอสเอ็ม แอตลาส สสส ไอซีเอ็มแอล ข้อมูล กระดาษ กระดาษ กระดาษ กระดาษ ตีพิมพ์ -	28.12.2023
ลาวา	Large Language and Vision Assistant ซึ่งเป็นโมเดลต่อเนื่องขนาดใหญ่ที่ได้รับการฝึกอบรมแบบ end-to-end ที่เชื่อมต่อเครื่องเข้ารหัสการมองเห็นและ LLM เพื่อการทำความเข้าใจด้านภาพและภาษาทั่วไป	ห่าวเทียน หลิว ชุนหยวน ลี่ ชิงหยาง วู ยง แจ ลี หยูเหิง ลี่	- การสาธิต - - โครงการ -	22.12.2023
การปูพื้นหลัง V2	เทคนิคการเปลี่ยนพื้นหลังแบบเรียลไทม์ที่มีความละเอียดสูง ซึ่งทำงานที่ 30fps ในความละเอียด 4K และ 60fps สำหรับ HD บน GPU สมัยใหม่	ซานชวน หลิน อันเดรย์ เรียบต์เซฟ สมยดิพ เส็งคุปตะ ไบรอัน เคอร์เลส คนอื่น สตีฟ ไซทซ์ ไอรา เคเมลมาเชอร์-ชไลเซอร์มาน	- โครงการ -	22.12.2023
การสาดแบบเกาส์เซียน	คุณภาพของภาพที่ล้ำสมัยในขณะที่ยังคงรักษาเวลาการฝึกซ้อมที่แข่งขันได้ และที่สำคัญช่วยให้สามารถสังเคราะห์มุมมองใหม่แบบเรียลไทม์คุณภาพสูง (≥ 100 fps) ที่ความละเอียด 1080p	แบร์นฮาร์ด เคิร์บล์ จอร์จิโอส โคปานาส โธมัส ไลม์คูห์เลอร์ จอร์จ เดรตตาคิส	โครงการ -	19.12.2023
เอสเอ็มเพลอร์-X	ปรับขนาด EHPS สู่โมเดลพื้นฐานทั่วไปรุ่นแรก โดยมี ViT-Huge เป็นแกนหลักและการฝึกอบรมด้วยอินสแตนซ์สูงสุด 4.5M จากแหล่งข้อมูลที่หลากหลาย	จงกังไฉ ว่านฉี หยิน ไม่สบายเซง เฉินเหว่ย คนอื่น ชิงผิงซุน หยานจุน หวัง ฮุยเอนปัง ไฮยี่ เหมย หมิงหยวน จาง เล่ย จาง เฉินเปลี่ยนลอย เล่ยหยาง จือเว่ย หลิว	- โครงการ -	18.12.2023
ดีพแคช	กระบวนทัศน์ที่ไม่ต้องฝึกอบรมซึ่งจะช่วยเร่งโมเดลการแพร่กระจายจากมุมมองของสถาปัตยกรรมโมเดล	ซินหยิน หม่า กงฟาน ฟาง ซินเชา หวาง	โครงการ	18.12.2023
มายากลเคลื่อนไหว	เฟรมเวิร์กแบบกระจายที่มีจุดมุ่งหมายเพื่อเพิ่มความสอดคล้องชั่วคราว รักษาภาพอ้างอิงอย่างซื่อสัตย์ และปรับปรุงความเที่ยงตรงของแอนิเมชั่น	จงฉง ซู เจี้ยนเฟิง จาง จุน ห่าว หลิว ฮันซู หยาน คนอื่น เจียเว่ย หลิว เฉินซู จาง เจียซือเฟิง ไมค์ โชว	- โครงการ เว็บไซต์ -	18.12.2023
ดิฟบีอาร์	สู่การฟื้นฟูภาพคนตาบอดด้วย Generative Diffusion Prior	ซินฉี หลิน จิงเหวินเหอ จื่อเอียน เฉิน จ้าวหยาง หลิว คนอื่น เบน เฟย โบได ว่านลี่ โอวหยาง หยูเฉียว เจ้าดง	โครงการ -	18.12.2023
เสียงLDM	ระบบแปลงข้อความเป็นเสียงที่สร้างขึ้นบนพื้นที่แฝงเพื่อเรียนรู้การนำเสนอเสียงอย่างต่อเนื่องจากแฝงการฝึกอบรมล่วงหน้าภาษาและเสียงที่ตัดกัน	ห่าวเหอ หลิว เจ๋อฮวา เฉิน ยี่ หยวน ซินห่าว เหมย คนอื่น ซูโป หลิว ดานิโล มันดิช เหวินหวู่ หวัง มาร์ค พลัมบลีย์	- โครงการ	02.12.2023
TabPFN	โครงข่ายประสาทเทียมที่เรียนรู้การทำนายข้อมูลแบบตาราง	โนอาห์ ฮอลแมนน์ ซามูเอล มุลเลอร์ คาธารินา เอ็กเกนสเปอร์เกอร์ แฟรงค์ ฮัตเตอร์	- โพสต์ในบล็อก	29.11.2023
แถบเลื่อนแนวคิด	อะแดปเตอร์ระดับต่ำแบบ Plug-and-Play ใช้กับโมเดลที่ผ่านการฝึกอบรมมาแล้ว	โรหิต กันดิโคตา โจอันนา มาเทอร์ซินสกา ติงรุ่ย โจว อันโตนิโอ ตอร์ราลบา เดวิด เบา	- โครงการ	26.11.2023
เคว่น-VL	ชุดโมเดลภาษาวิสัยทัศน์ขนาดใหญ่ที่ออกแบบมาเพื่อรับรู้และเข้าใจทั้งข้อความและรูปภาพ	จินเซ่ ไป๋ ฉุยไป๋ ซูเซิง หยาง ซือเจี๋ย หวาง คนอื่น สินัน ตัน เป็งหวาง จุนหยาง ลิน ฉางโจว จิงเหริน โจว	- การสาธิต - - -	24.11.2023
อะนิเมะGANv3	เครือข่ายฝ่ายตรงข้ามกำเนิดแบบ Double-tail สำหรับแอนิเมชั่นภาพถ่ายที่รวดเร็ว	กังหลิว ซิน เฉิน	โครงการ -	23.11.2023
อิธาก้า	เครือข่าย Deep Neural Network แห่งแรกสำหรับการฟื้นฟูข้อความ การระบุแหล่งที่มาทางภูมิศาสตร์และลำดับเวลาของจารึกกรีกโบราณ	ยานนิส อัสซาเอล เธีย ซอมเมอร์สฟิลด์ เบรนแดน ชิลลิงฟอร์ด มายาร์ บอร์ดบาร์ คนอื่น จอห์น ปาฟโลปูลอส มาริต้า ชัทซิปานากิโอตู ไอออน อันโดรโซปูลอส โจนาธาน พราก นันโด เด เฟรตัส	- โครงการ	21.11.2023
PixArt-Σ	การฝึกหม้อแปลงแบบกระจายจากน้อยไปมากสำหรับการสร้างข้อความเป็นภาพ 4K	จุนซอง เฉิน ชงเจียน เกอ เอนเซ่ เซี่ย เยว่หวู่ คนอื่น ลี่เว่ย เหยา เสี่ยวเจ๋อ เร็น จงเตา หวัง ปิงหลัว หูชวน หลู เจิ้งกั๋ว ลี่	- - โครงการ	07.11.2023
ซีโร่123++	แบบจำลองการแพร่กระจายแบบปรับสภาพภาพสำหรับการสร้างภาพหลายมุมมองที่สอดคล้องกันแบบ 3 มิติจากมุมมองอินพุตเดียว	รัวซี ชิ ฮันเซิง เฉิน จัวหยาง จาง หมิงฮัว หลิว คนอื่น เฉาซู ซินเยว่ เว่ย หลิงเหอ เฉิน ชงเซ้ง ห่าวซู	- -	26.10.2023
ยูนิฟอร์เมอร์V2	หม้อแปลงแบบครบวงจรเพื่อการเรียนรู้การเป็นตัวแทน Spatiotemporal ที่มีประสิทธิภาพ	คุนชาง ลี่ ยาลี่ หวัง อี้หนานเหอ ยี่จูว ลี่ คนอื่น ยี่หวาง หลี่หมินหวาง หยูเฉียว	- -	20.10.2023
แสดง-1	โมเดลไฮบริดซึ่งมีชื่อว่า Show-1 ซึ่งผสมผสาน VDM แบบอิงพิกเซลและแบบแฝงสำหรับการสร้างข้อความเป็นวิดีโอ	เดวิด จุนห่าว จาง เจย์ จางเจี๋ย อู๋ เจียเว่ย หลิว รุย จ้าว คนอื่น หลิงหมิน รัน หยูเฉา กู ดิเฟย เกา ไมค์ เจิ้ง โชว	- โครงการ	15.10.2023
เสียงก.ย	แบบจำลองพื้นฐานสำหรับการแยกแหล่งกำเนิดเสียงแบบโอเพ่นโดเมนด้วยการสืบค้นภาษาธรรมชาติ	ซูโป หลิว ชิวเฉียงกง หยานจ้าว ห่าวเหอ หลิว คนอื่น ยี่ หยวน หยูโจว หลิว รุยเซี่ย หยูซวน หวัง มาร์ค พลัมบลีย์ เหวินหวู่ หวัง	โครงการ	12.10.2023
ดา-คลิป	โมเดลภาษาการมองเห็นที่รับรู้การเสื่อมสลายเพื่อถ่ายโอนแบบจำลองภาษาการมองเห็นที่ได้รับการฝึกไว้ล่วงหน้าไปยังงานการมองเห็นระดับต่ำได้ดียิ่งขึ้นในฐานะกรอบงานสากลสำหรับการฟื้นฟูภาพ	จือเว่ย หลัว เฟรดริก กุสตาฟส์สัน เจิ้งจ้าว เจนส์ โชลันด์ โธมัส เชิน	โครงการ	11.10.2023
เศร้าทอล์คเกอร์	สร้างค่าสัมประสิทธิ์การเคลื่อนไหว 3 มิติของ 3DMM จากเสียง และปรับเปลี่ยนการเรนเดอร์ใบหน้าที่รับรู้ 3 มิติแบบใหม่โดยปริยายสำหรับการสร้างศีรษะที่พูดได้	เหวินซวน จาง เสี่ยวตง ชุน ซวนหวาง หย่งจาง คนอื่น ซีเซิน หยูกัว หยิงซาน เฟยหวาง	- โครงการ -	10.10.2023
มูสิกา	ระบบการสร้างเพลงที่สามารถฝึกฝนกับเพลงหลายร้อยชั่วโมงได้โดยใช้ GPU สำหรับผู้บริโภคเพียงตัวเดียว และช่วยให้สร้างเพลงได้เร็วกว่าการสร้างเพลงแบบเรียลไทม์ที่มีความยาวตามใจชอบบน CPU สำหรับผู้บริโภค	มาร์โก ปาซินี ยาน ชลูเทอร์	- ข้อมูล - โครงการ -	09.10.2023
โยโลฟ6	กรอบงานการตรวจจับวัตถุขั้นตอนเดียวโดยเฉพาะสำหรับการใช้งานทางอุตสาหกรรม	ไคเฮงเวง เมิ่งเฉิง อี้ตั่ว ลี่ เซียงเซียง ชู เสี่ยวหลิน เว่ย	- โพสต์ในบล็อก ข้อมูล - -	08.10.2023
ดรีมเกาส์เซียน	อัลกอริทึมในการแปลง 3D Gaussians ให้เป็น textured mesh และใช้ขั้นตอนการปรับแต่งแบบละเอียดเพื่อปรับแต่งรายละเอียด	เจียเซียงถัง เจียเว่ย เหริน หางโจว จือเว่ย หลิว กังเซ็ง	- โครงการ	04.10.2023
ไอคอน	เมื่อกำหนดชุดรูปภาพ วิธีการจะประมาณพื้นผิว 3 มิติที่มีรายละเอียดจากแต่ละภาพ จากนั้นจึงรวมสิ่งเหล่านี้เข้าด้วยกันเป็นอวตารที่เคลื่อนไหวได้	ยู่เหลียงซิ่ว จินหลงหยาง ดิมิทริออส ซิโอนาส ไมเคิล แบล็ค	- โครงการ	31.08.2023
ไดโนฟ2	สร้างคุณลักษณะด้านภาพที่มีประสิทธิภาพสูงซึ่งสามารถนำมาใช้โดยตรงกับตัวแยกประเภทได้ง่ายเหมือนกับเลเยอร์เชิงเส้นในงานคอมพิวเตอร์วิทัศน์ที่หลากหลาย คุณลักษณะด้านภาพเหล่านี้มีประสิทธิภาพและทำงานได้ดีทั่วทั้งโดเมนโดยไม่มีข้อกำหนดในการปรับแต่งอย่างละเอียด	แม็กซิม โอควับ ทิโมธี ดาร์เซ็ต ธีโอ มูตาคานนี ฮุย โว คนอื่น มาร์ค ซาฟราเนียค วาซิล คาลิดอฟ ปิแอร์ เฟอร์นันเดซ ดาเนียล ฮาซิซ่า ฟรานซิสโก มาสซ่า อะลาเอลดิน เอล-นูบี้ มาห์มุด อัสราน นิโคลัส บัลลาส วอจเซียค กาลูบา รัสเซล ฮาวส์ โปเย้าฮวง ซางเหวิน ลี อิชาน มิสรา ไมเคิล ราบัต วสุ ชาร์มา กาเบรียล ซินเนฟ หู ซู แอร์เว เจกู จูเลียน ไมรัล แพทริค ลาบาตุต อาร์ม็อง จูลิน ปิโอเตอร์ โบยาโนฟสกี้	โพสต์ในบล็อก การสาธิต - -	31.08.2023
นกฮูก-ViT	การตรวจจับวัตถุคำศัพท์เปิดอย่างง่ายด้วย Vision Transformers	แมทเธียส มินเดอเรอร์ อเล็กเซย์ กริตเซนโก ออสติน สโตน แม็กซิม นอยมันน์ คนอื่น เดิร์ก ไวส์เซนบอร์น อเล็กเซย์ โดโซวิตสกี อราวินธ์ มเหนดราน อนุรัก อานับ มอสตาฟา เดห์กานี จูหราน เซิน เสี่ยวหวาง เสี่ยวฮวา ไจ๋ โธมัส คิปฟ์ นีล โฮลสบี้		21.08.2023
สไตล์GAN3	เครือข่ายฝ่ายตรงข้ามที่สร้างโดยปราศจากนามแฝง	เทโร คาร์ราส มิก้า ไอตตาลา สมูลี เลน เอริค ฮาร์โคเนน คนอื่น ยานน์ เฮลสเตน แจ็กโก้ เลห์ติเนน ติโม ไอลา	- - โครงการ	13.08.2023
เฟทซีโร่	วิธีการแก้ไขข้อความแบบ Zero-shot บนวิดีโอในโลกแห่งความเป็นจริง โดยไม่ต้องมีการฝึกอบรมหรือการใช้มาสก์แบบเฉพาะเจาะจง	เฉินหยางฉี เสี่ยวตง ชุน หย่งจาง เฉินหยาง เล่ย คนอื่น ซินเทา หวัง หยิงซาน ฉีเฟิง เฉิน	- - โครงการ วิดีโอ	13.08.2023
บิ๊กแกน	การฝึกอบรม GAN ขนาดใหญ่เพื่อการสังเคราะห์ภาพธรรมชาติที่มีความเที่ยงตรงสูง	แอนดรูว์ บร็อค เจฟฟ์ โดนาฮิว คาเรน ซิโมยัน		03.08.2023
ลามะ	การลงสีมาสก์ขนาดใหญ่ที่มีความละเอียดทนทานพร้อมฟูริเยร์คอนโวลูชั่น	โรมัน ซูโวรอฟ เอลิซาเวตา โลกาเชวา แอนตัน มาชิคิน อนาสตาเซีย เรมิโซวา คนอื่น อาร์เซนี อาชูคา อเล็กเซย์ ซิลเวสตรอฟ แนจินกง ฮาร์ชิธ โกก้า ปาร์คกีอุง วิคเตอร์ เลมปิตสกี้	- โครงการ	02.08.2023
เมคอิททอล์ค	วิธีการสร้างวิดีโอหัวพูดที่แสดงออกถึงความรู้สึกจากภาพใบหน้าเดียวโดยมีเพียงเสียงเท่านั้น	หยางโจว ซินถง ฮั่น เอไล เชชท์แมน โฮเซ่ เอเชวาร์เรีย คนอื่น เอวานเจลอส คาโลเกราคิส ติงเจ๋อหยู ลี่	ข้อมูล โครงการ	27.07.2023
ไฮดีที	โมเดลภาพต่อภาพเชิงสร้างสรรค์และรูปแบบอัปแซมปลิงใหม่ที่ช่วยให้สามารถใช้การแปลภาพด้วยความละเอียดสูง	เดนิส คอร์เชนคอฟ เกลบ สเตอร์กิน เซอร์เกย์ นิโคเลนโก วิคเตอร์ เลมปิตสกี้	โครงการ -	24.07.2023
คัตเลอร์	วิธีการง่ายๆ สำหรับการฝึกอบรมแบบจำลองการตรวจจับวัตถุและการแบ่งส่วนแบบไม่มีผู้ดูแล	ซูตง หวาง โรหิต เกิร์ดฮาร์ สเตลล่า ยู อิชาน มิสรา	- โครงการ	24.07.2023
รับรู้ทุกสิ่งและ Tag2Text	กรอบการฝึกอบรมก่อนการฝึกอบรมภาษาวิสัยทัศน์ ซึ่งแนะนำการแท็กรูปภาพในแบบจำลองภาษาวิสัยทัศน์เพื่อเป็นแนวทางในการเรียนรู้คุณลักษณะทางภาพและภาษา	ซินหยู่ ฮวง โหยวไค จาง จินหยูหม่า จ้าวหยาง ลี่ คนอื่น หยานชุนเซี่ย หยูโจว ฉิน ตงหลัว หยาเชียน ลี่ หยานตง กัว หยานตง กัว เล่ย จาง	- - โครงการโครงการ	09.07.2023
แบบจำลองการเคลื่อนที่แบบ Spline แบบแผ่นบาง	กรอบการถ่ายโอนการเคลื่อนไหวแบบไม่มีผู้ดูแลจากต้นทางถึงปลายทาง	เจียนจ้าว ฮุ่ยจาง	- อาหารเสริม	07.07.2023
ลากแกน	ลาก GAN ของคุณ: การจัดการตามจุดเชิงโต้ตอบบน Generative Image Manifold	ซิงกังปาน อายุช เทวารี โธมัส ไลม์คูห์เลอร์ หลิงเจี่ย หลิว คนอื่น อภิมิตรา เมกะ คริสเตียน ธีโอบอลต์	โครงการ	03.07.2023
อุปกรณ์เคลื่อนที่SAM	มุ่งสู่ Lightweight SAM สำหรับแอปพลิเคชันบนมือถือ	เฉาหนิง จาง ตงเซิน ฮั่น หยูเฉียว จุง อุค คิม คนอื่น ซองโฮ เบ ซึงกยู ลี ชุง ซอน ฮง	-	30.06.2023
การต่อสายดิน DINO	แต่งงานกับ DINO ด้วยการฝึกอบรมล่วงหน้าแบบมีสายดินสำหรับการตรวจจับวัตถุแบบเปิด	ชิหลง หลิว จ้าวหยาง เจิง เทียนเหอ เหริน เฟิง ลี่ คนอื่น ห่าวจาง เจียหยาง ชุนหยวน ลี่ เจี้ยนเว่ย หยาง ฮังซู จุนจู้ เล่ย จาง	- - -	28.06.2023
T5X	กรอบงานแบบโมดูลาร์ที่ประกอบได้และเป็นมิตรกับการวิจัยสำหรับการฝึกอบรมแบบบริการตนเอง การประเมิน และการอนุมานที่มีประสิทธิภาพสูง กำหนดค่าได้ ในหลายระดับ	อดัม โรเบิร์ตส์ ฮยอน วอน ชุง อันเซล์ม เลฟสกายา เการาฟ มิชรา คนอื่น เจมส์ แบรดเบอรี ดาเนียล อันดอร์ ชารัน ณรัง ไบรอัน เลสเตอร์ คอลิน กัฟนีย์ อาฟรอซ โมฮิอุดดิน เคอร์ติส ฮอว์ธอร์น ไอตอร์ ลิวโควิช อเล็กซ์ ซัลชานู มาร์ค ฟาน ซี เจค็อบ ออสติน เซบาสเตียน กู๊ดแมน ลิวิโอ บัลดินี่ ซวาเรส ไห่ถัง หู Sasha Tsvyashchenko อัครัคชา เชาวรี จัสไมจ์น บาสติงส์ ยานนิส บูเลียน ซาเวียร์ การ์เซีย เจียนโม นี แคธลีน คีเนียลี โจนาธาน คลาร์ก แดน การ์เรตต์ เจมส์ ลี-ธอร์ป คอลิน ราฟเฟิล โนม ชาเซียร์ มาร์วิน ริตเตอร์ มาร์เทน บอสมา อเล็กซานเดอร์ พาสโซส เจเรมี ไมติน-เชพเพิร์ด โนอาห์ ฟีเดล เบรนแนน ซาเอต้า ไรอัน เซปาสซี อเล็กซานเดอร์ สปิริโดนอฟ โจชัว นิวแลน อันเดรีย เจสมุนโด	- - -	27.06.2023
โค้ดทอล์คเกอร์	ส่งแอนิเมชั่นใบหน้าที่ขับเคลื่อนด้วยคำพูดเป็นงานสืบค้นโค้ดในพื้นที่พร็อกซีอันจำกัดของ Codebook ที่เรียนรู้ ซึ่งส่งเสริมความสดใสของการเคลื่อนไหวที่สร้างขึ้นอย่างมีประสิทธิภาพโดยการลดความไม่แน่นอนของการทำแผนที่ข้ามโมดัล	[จินป๋อซิง](จินป๋อซิง) เมิ่งฮันเซี่ย จางเยว่เฉิน เสี่ยวตง ชุน คนอื่น จือหวาง เทียน ซิน หว่อง	- - - โครงการ	16.06.2023
โมเดลการเคลื่อนไหวอันดับหนึ่งสำหรับแอนิเมชั่นภาพ	ถ่ายโอนการเคลื่อนไหวใบหน้าจากวิดีโอไปยังรูปภาพ	อลิอัคซานเดอร์ เซียโรฮิน	โครงการ	04.06.2023
WaveGAN แบบขนาน	โมเดลที่ไม่ถดถอยอัตโนมัติล้ำสมัยเพื่อสร้างผู้ร้องที่ยอดเยี่ยมของคุณเอง	โทโมกิ ฮายาชิ	- การสาธิต -	01.06.2023
เศรษฐกิจ	ออกแบบมาสำหรับ "การแปลงเป็นดิจิทัลของมนุษย์จากภาพสี" ซึ่งรวมคุณสมบัติที่ดีที่สุดของการนำเสนอโดยนัยและชัดเจน เพื่ออนุมานมนุษย์ที่สวมเสื้อผ้า 3 มิติที่มีความเที่ยงตรงสูงจากรูปภาพในป่า แม้จะสวมเสื้อผ้าหลวม ๆ หรือในท่าทางที่ท้าทาย	ยู่เหลียงซิ่ว จินหลงหยาง ซู่เฉา ดิมิทริออส ซิโอนาส ไมเคิล แบล็ค	- -	31.05.2023
เอ็มเอ็มเอส	โครงการ Massively Multilingual Speech ขยายเทคโนโลยีคำพูดจากประมาณ 100 ภาษาเป็นมากกว่า 1,000 ภาษาโดยการสร้างโมเดลการรู้จำเสียงพูดหลายภาษาเดียวที่รองรับมากกว่า 1,100 ภาษา โมเดลการระบุภาษาที่สามารถระบุภาษาได้มากกว่า 4,000 ภาษา โมเดลที่ผ่านการฝึกอบรมมาแล้วซึ่งรองรับมากกว่า 1,400 ภาษา และการแปลงข้อความเป็น โมเดลคำพูดมากกว่า 1,100 ภาษา	วินีล ประทักษ์ แอนดรอส ชานดรา โบเวน ชิ ปาเดน โทมาเซลโล คนอื่น อรุณ บาบู ซายานี คุนดู อาลี เอลคากี้ จ้าวเหิง หนี่ อปูร์ วาส มารียัม ฟาเซล-ซารานดี อเล็กเซย์ เบฟสกี้ ยอสซี่ อาดี เสี่ยวหุย จาง เว่ยหนิง ซู อเล็กซิส คอนโน ไมเคิล ออลี	- -	26.05.2023
เยี่ยม	Flow AIS Bootstrap ใช้ AIS เพื่อสร้างตัวอย่างในภูมิภาคที่การไหลใกล้เคียงกับเป้าหมายไม่ดี ช่วยให้ค้นพบโหมดใหม่ๆ ได้ง่ายขึ้น	ลอเรนซ์ มิดจ์ลีย์ วินเซนต์ สติมเปอร์ เกรเกอร์ เอ็นซี ซิมม์ แบร์นฮาร์ด โชลคอปฟ์ โฆเซ่ มิเกล เอร์นันเดซ-โลบาโต	-	29.04.2023
รหัสอดีต	เครือข่ายการคาดการณ์ที่ใช้หม้อแปลงไฟฟ้าเพื่อสร้างแบบจำลององค์ประกอบทั่วโลกและบริบทของใบหน้าคุณภาพต่ำสำหรับการทำนายโค้ด ทำให้สามารถค้นพบใบหน้าธรรมชาติที่ใกล้เคียงกับใบหน้าเป้าหมายได้อย่างใกล้ชิด แม้ว่าอินพุตจะถูกลดระดับลงอย่างรุนแรง	ซางเฉิน โจว เคลวิน ชาน ชงอี ลี่ เฉินเปลี่ยนลอย	- โครงการ -	21.04.2023
Text2Video-ศูนย์	โมเดลการแพร่กระจายข้อความเป็นภาพเป็นตัวสร้างวิดีโอแบบ Zero-Shot	เลวอน คาชาตรีน อันดรานิค มอฟซิสยาน วาห์ราม ทาเทโวเซียน โรแบร์โต เฮนเชล คนอื่น จางหยาง หวาง ชานต์ นาวาซาร์ยาน ฮัมฟรีย์ ชิ	- - โครงการ วิดีโอ -	11.04.2023
แบ่งส่วนอะไรก็ได้	โมเดลอะไรก็ได้ของเซ็กเมนต์จะสร้างมาสก์วัตถุคุณภาพสูงจากข้อความแจ้งอินพุต เช่น จุดหรือกล่อง และสามารถใช้เพื่อสร้างมาสก์สำหรับวัตถุทั้งหมดในรูปภาพได้	อเล็กซานเดอร์ คิริลลอฟ เอริค มินตัน นิกิลา ราวี ฮันซี เหมา คนอื่น โคลอี้ โรลแลนด์ ลอร่า กุสตาฟสัน เตเต้ เสี่ยว สเปนเซอร์ ไวท์เฮด อเล็กซ์ เบิร์ก วัน เย็น โล ปิโอเตอร์ ดอลลาร์ รอสส์ เกอร์ชิค	ข้อมูล - เว็บไซต์ -	10.04.2023
ทำตามท่าของคุณ	รูปแบบการฝึกอบรมสองขั้นตอนที่สามารถใช้คู่ท่าทางรูปภาพและชุดข้อมูลวิดีโอที่ไม่มีท่าทางและโมเดลข้อความเป็นรูปภาพที่ได้รับการฝึกอบรมล่วงหน้าเพื่อให้ได้วิดีโอตัวละครที่ควบคุมท่าทางได้	เยว่มา หยิงชิงเหอ เสี่ยวตง ชุน ซินเทา หวัง คนอื่น ไซราน เฉิน หยิงซาน ซิ่ว หลี่ ฉีเฟิง เฉิน	- - - โครงการ วิดีโอ	07.04.2023
อีวา3ดี	โมเดลกำเนิดมนุษย์ 3 มิติคุณภาพสูงแบบไม่มีเงื่อนไขซึ่งต้องการเพียงคอลเลกชันภาพ 2 มิติสำหรับการฝึกอบรม	ฟางโจว ฮอง จ้าวซี เฉิน ยู่ซือ หลาน เหลียงปาน จือเว่ย หลิว	โครงการ -	06.04.2023
ดรีมฟิวชั่นที่เสถียร	การใช้แบบจำลองการแพร่กระจายข้อความเป็นภาพ 2 มิติที่ได้รับการฝึกล่วงหน้าเพื่อทำการสังเคราะห์ข้อความเป็น 3 มิติ	เจียเซียงถัง เบน พูล อาเจย์ เจน จอน บาร์รอน เบน มิลเดนฮอลล์	- โครงการ -	04.04.2023
PIFUHD	ฟังก์ชันโดยนัยที่จัดแนวพิกเซลหลายระดับสำหรับการแปลงเป็นดิจิทัลของมนุษย์ 3 มิติที่มีความละเอียดสูง	ชุนสุเกะ ไซโตะ โทมัส ไซมอน เจสัน ซารากีห์ ฮันบยอลจู	-	26.03.2023
วิดีโอรีทอล์คกิ้ง	ระบบสำหรับแก้ไขใบหน้าของวิดีโอหัวพูดในโลกแห่งความเป็นจริงตามเสียงอินพุต ทำให้เกิดวิดีโอเอาท์พุตคุณภาพสูงและลิปซิงค์แม้จะมีอารมณ์ที่แตกต่างกัน	คุนเฉิง เสี่ยวตง ชุน หย่งจาง เมิ่งฮันเซี่ย คนอื่น เฟยหยิน หมิงรุ่ย จู ซวนหวาง จือหวาง หนานหนานหวาง	- โครงการ -	19.03.2023
Visual ChatGPT	เชื่อมต่อ ChatGPT และชุด Visual Foundation Models เพื่อเปิดใช้งานการส่งและรับภาพระหว่างการสนทนา	เฉินเฟย หวู่ เซิงหมิงหยิน เว่ยเจิ้นฉี เสี่ยวตง หวาง คนอื่น เจ๋อเฉิง ถัง แนนเดือน	- -	15.03.2023
ปรับแต่ง-A-Video	การปรับแต่ง One-Shot ของโมเดลการแพร่กระจายภาพสำหรับการสร้างข้อความเป็นวิดีโอ	เจย์ จางเจี๋ย อู๋ อี้เซียว เกอ ซินเทา หวัง สแตน เว่ยเซียน เล่ย คนอื่น หยูเฉา กู หยูเฟย ชิ วินน์ ซู หยิงซาน เสี่ยวหู่ฉี ไมค์ เจิ้ง โชว	- - โครงการ -	23.02.2023
จีเพน	เครือข่ายฝังตัว GAN Prior สำหรับการฟื้นฟูใบหน้าคนตาบอดในป่า	เต๋าหยาง เพียร์รัน เรน ซวนซ่งเซี่ย เล่ย จาง	การสาธิต -	15.02.2023
PyMAF-X	วิธีการแบบ Egression ในการกู้คืนโมเดลตัวเต็มแบบพาราเมตริกจากภาพตาข้างเดียว	หงเหวิน จาง ยาติง เทียน หยูเซียง จาง เมิ่งเฉิง ลี่ คนอื่น เหลียง อัน เจิ้นหนาน ซุน เย่ปิน หลิว	- โครงการ	14.02.2023
การแพร่กระจายของดิสโก้	การรวมสมุดบันทึก แบบจำลอง และเทคนิคแบบแฟรงเกนสไตเนียนสำหรับการสร้างงานศิลปะและแอนิเมชัน AI	แม็กซ์ อิงแฮม อดัม เล็ตต์ แดเนียล รัสเซลล์ ชิโกซี่ นีรี	-	11.02.2023
GrooVAE	แอปพลิเคชันบางอย่างของการเรียนรู้ของเครื่องเพื่อสร้างและจัดการจังหวะและการแสดงกลอง	จอน กิลลิค อดัม โรเบิร์ตส์ เจสซี่ เองเกล	โพสต์ในบล็อก ข้อมูล แอปพลิเคชันเว็บ	02.02.2023
มัลติแทร็ก MusicVAE	รุ่นในสมุดบันทึกนี้สามารถเข้ารหัสและถอดรหัสหน่วยวัดเดี่ยวได้สูงสุด 8 แทร็ก โดยสามารถเลือกปรับเงื่อนไขบนคอร์ดพื้นฐานได้	เอียน ไซมอน อดัม โรเบิร์ตส์ คอลิน ราฟเฟิล เจสซี่ เองเกล คนอื่น เคอร์ติส ฮอว์ธอร์น ดักลาส เอ็ค	โพสต์ในบล็อก	02.02.2023
ดนตรีVAE	แบบจำลองเวกเตอร์แฝงแบบลำดับชั้นสำหรับการเรียนรู้โครงสร้างระยะยาวทางดนตรี	อดัม โรเบิร์ตส์ เจสซี่ เองเกล คอลิน ราฟเฟิล เคอร์ติส ฮอว์ธอร์น ดักลาส เอ็ค	โพสต์ในบล็อก โครงการ	02.02.2023
การเรียนรู้การทาสี	การเรียนรู้การระบายสีด้วยการเรียนรู้การเสริมแรงเชิงลึกตามแบบจำลอง	มานูเอล โรเมโร		01.02.2023
ทันที NGP	ดั้งเดิมกราฟิกประสาททันทีพร้อมการเข้ารหัสแฮชแบบหลายความละเอียด	โธมัส มุลเลอร์ อเล็กซ์ อีแวนส์ คริสตอฟ ชีด อเล็กซานเดอร์ เคลเลอร์	โพสต์ในบล็อก - โครงการ กวดวิชา -	18.01.2023
เครือข่ายฟีเจอร์ฟูริเยร์	คุณสมบัติฟูริเยร์ช่วยให้เครือข่ายเรียนรู้ฟังก์ชันความถี่สูงในโดเมนขนาดต่ำ	แมทธิว แทนซิก ประตุล ศรีนิวาสัน เบน มิลเดนฮอลล์ ซารา ฟริโดวิช-คีล คนอื่น นิธิน รากวัน อุทคาร์ช สิงคาล ราวี รามามูธี จอน บาร์รอน เร็น อึ้ง	- โครงการ	17.01.2023
อัลฟ่าโพส	การประมาณค่าท่าโพสแบบหลายบุคคลในระดับภูมิภาคทั่วร่างกายและการติดตามแบบเรียลไทม์	ห่าวซู่ฟาง เจียเฟิง หลี่ หงหยางถัง เฉาซู คนอื่น ห่าวอี้ จู ยู่เหลียงซิ่ว ยง-ลู่ ลี่ เซวู หลู่	- โครงการ -	07.01.2023
ไฮบริดไอเค	โซลูชันจลนศาสตร์แบบผกผันเชิงวิเคราะห์-ประสาทแบบไฮบริดสำหรับการประมาณท่าทางและการประมาณรูปร่างของมนุษย์แบบ 3 มิติ	เจียเฟิง หลี่ เฉาซู จื้อคุน เฉิน ซือหยวนเปี้ยน คนอื่น ลี่ซิน หยาง เซวู หลู่	โครงการ อาหารเสริม	01.01.2023
คะแนนการผูกมัดจาโคเบียน	ใช้กฎลูกโซ่กับการไล่ระดับสีที่เรียนรู้ และเผยแพร่คะแนนของแบบจำลองการแพร่กระจายกลับผ่านจาโคเบียนของตัวเรนเดอร์ที่สร้างความแตกต่างได้ ซึ่งเราสร้างอินสแตนซ์ให้เป็นสนามรัศมีว็อกเซล	ห่าวเฉิน หวาง เซียวตัน ตู่ เจียห่าว ลี่ เรย์มอนด์ เย เกร็ก ชาคนาโรวิช	- โครงการ -	05.12.2022
เดมัคส์	ไฮบริดสเปกโตรแกรมและการแยกแหล่งกำเนิดสัญญาณรูปคลื่น	อเล็กซองดร์ เดฟอสเซซ	- -	21.11.2022
สไตล์คลิป	การจัดการกับข้อความของ StyleGAN Imager	หรือปาตัชนิค ซงซี วู เอไล เชชท์แมน แดเนียล โคเฮน-ออร์ ดานี่ ลิสชินสกี้	- -	30.10.2022
โมชั่นกระจาย	เฟรมเวิร์กการสร้างการเคลื่อนไหวที่ขับเคลื่อนด้วยข้อความตามแบบจำลองการแพร่กระจายครั้งแรก ซึ่งแสดงคุณสมบัติที่ต้องการหลายประการเหนือวิธีการที่มีอยู่	หมิงหยวน จาง จงกังไฉ เหลียงปาน ฟางโจว ฮอง คนอื่น ซินหยิง กัว เล่ยหยาง จือเว่ย หลิว	โครงการ	13.10.2022
VToonify	ใช้ประโยชน์จากเลเยอร์ระดับกลางและความละเอียดสูงของ StyleGAN เพื่อแสดงภาพบุคคลเชิงศิลปะคุณภาพสูงโดยอิงตามคุณสมบัติเนื้อหาหลายขนาดที่แยกโดยตัวเข้ารหัสเพื่อรักษารายละเอียดของเฟรมได้ดียิ่งขึ้น	ฉุ่ยหยาง ลี่หมิงเจียง จือเว่ย หลิว เฉินเปลี่ยนลอย	- - - โครงการ	07.10.2022
PyMAF	Pyramidal Mesh Alignment Feedback loop ในเครือข่าย regression สำหรับการกู้คืน body mesh ที่ได้รับการจัดตำแหน่งอย่างดี และขยายออกไปสำหรับการกู้คืนโมเดลเต็มตัวที่แสดงออกอย่างชัดเจน	หงเหวิน จาง ยาติง เทียน หยูเซียง จาง เมิ่งเฉิง ลี่ คนอื่น เหลียง อัน เจิ้นหนาน ซุน เย่ปิน หลิว	- - โครงการ -	06.10.2022
อัลฟ่าเทนเซอร์	การค้นพบอัลกอริธึมการคูณเมทริกซ์ที่เร็วขึ้นด้วยการเรียนรู้แบบเสริมกำลัง	อัลฮุสเซน ฟาวซี มาเตจ บาล็อก อาจา หวาง โธมัส ฮูเบิร์ต คนอื่น แบร์นาร์ดิโน โรเมรา-ปาเรเดส โมฮัมมาดามิน บาเรกาเทน อเล็กซานเดอร์ โนวิคอฟ ฟรานซิสโก รุยซ์ จูเลียน ชริทไวเซอร์ เกรเซกอร์ซ สเวียร์สซ์ เดวิด ซิลเวอร์ เดมิส ฮาสซาบิส พุชมีท โคห์ลี	-	04.10.2022
สวิน2เอสอาร์	Novel Swin Transformer V2 เพื่อปรับปรุง SwinIR สำหรับภาพที่มีความละเอียดสูงเป็นพิเศษ และโดยเฉพาะอย่างยิ่งสถานการณ์อินพุตที่ถูกบีบอัด	มาร์กอส คอนเต้ อุยจินชอย มักซีม บูร์ชี่ ราดู ทิมอฟเต้	- - -	03.10.2022
ฟังก์ต้า	จากข้อมูลสู่ฟังก์ชัน: จุดข้อมูลของคุณคือฟังก์ชัน และคุณสามารถปฏิบัติต่อมันได้เหมือนเป็นฟังก์ชันเดียว	เอมิเลียน ดูปองท์ ฮยอนจิก คิม อาลี อิสลามี ดานิโล เรเซนเด้ แดน โรเซนบัม	-	24.09.2022
กระซิบ	ระบบรู้จำเสียงพูดอัตโนมัติที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลหลายภาษาและหลายงานที่ได้รับการดูแลจากเว็บเป็นเวลา 680,000 ชั่วโมง	อเล็ค แรดฟอร์ด จงอุค คิม เต๋า ซู เกร็ก บร็อคแมน คนอื่น คริสติน แมคลีวีย์ อิลยา ซุตสเคเวอร์	โพสต์ในบล็อก -	21.09.2022
ยกเลิกการทำให้เก่า (วิดีโอ)	เติมสีสันให้วิดีโอของคุณเอง!	เจสัน แอนติค	- แบบอย่าง - เว็บไซต์ -	19.09.2022
ยกเลิกความเก่า (ภาพ)	เติมสีสันให้ภาพถ่ายของคุณเอง!	เจสัน แอนติค แมตต์ โรบินสัน มาเรีย เบนาเวนเต้	- แบบอย่าง เว็บไซต์	19.09.2022
จริง-ESRGAN	ขยาย ESRGAN อันทรงพลังไปสู่แอปพลิเคชันการกู้คืนที่ใช้งานได้จริง ซึ่งได้รับการฝึกฝนด้วยข้อมูลสังเคราะห์แท้	ซินเทา หวัง เหลียงปินเซี่ย เจ้าดง หยิงซาน	-	18.09.2022
IDE-3D	การแก้ไขแบบแยกส่วนเชิงโต้ตอบสำหรับการสังเคราะห์ภาพบุคคล 3D ที่มีความละเอียดสูง	จิงเซียงซุน ซวนหวาง อี้ชุนชิ ลิเจิ้น หวาง คนอื่น จือหวาง เย่ปิน หลิว	-	08.09.2022
หม้อแปลงการตัดสินใจ	สถาปัตยกรรมที่ทอดทิ้งปัญหาของ RL เป็นรูปแบบลำดับแบบมีเงื่อนไข ขยาย ข้อมูลเพิ่มเติม เวอร์ชัน 1.0.0 ประเภท ซอร์สโค้ดอื่น ๆ เวลาอัปเดต 2024-12-27 ขนาด 804.02KB มาจาก Github แอปที่เกี่ยวข้อง awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 เกมปีศาจที่ยอดเยี่ยม 2023-04-16 โฆษณาสุดเจ๋ง 2022-08-08 แนะนำสำหรับคุณ chat.petals.dev ซอร์สโค้ดอื่น ๆ 1.0.0 GPT Prompt Templates ซอร์สโค้ดอื่น ๆ 1.0.0 GPTyped ซอร์สโค้ดอื่น ๆ GPTyped 1.0.5 waymo open dataset ซอร์สโค้ดอื่น ๆ December 2023 Update SmartTube ซอร์สโค้ดอื่น ๆ 24.71 Stable Sunamu ซอร์สโค้ดอื่น ๆ Release 2.2.0 waymo open dataset ซอร์สโค้ดอื่น ๆ December 2023 Update termwind หมวดหมู่อื่นๆ v2.3.0 wp functions หมวดหมู่อื่นๆ 1.0.0 ข้อมูลที่เกี่ยวข้อง ทั้งหมด วิธีแก้ไขอาการพูดติดอ่างใน Stalker 2: Heart of Chornobyl 2024-11-23 Juice WRLD ใน Fortnite อยู่ที่ไหน? 2024-11-23 วิธีเริ่มการขยาย Wild Card ใน Star Wars Outlaws 2024-11-23 ปักกิ่งเพิ่มสถาบันวิจัยและพัฒนาแห่งใหม่เพื่อปรับปรุงความปลอดภัยด้านปัญญาประดิษฐ์และรูปแบบการกำกับดูแล 2024-11-22 การสัมมนาเปิดขึ้นในเซี่ยงไฮ้ โดยมีกูเตอร์เรสเข้าร่วม และข้อเสนอของจีนในการร่วมมือเพื่อเสริมสร้างขีดความสามารถด้านปัญญาประดิษฐ์ได้รับการรับรองโดยสมัชชาใหญ่แห่งสหประชาชาติ 2024-11-22 สร้างกรอบการทำงานปัญญาประดิษฐ์เพื่อค้นหาไลโซไซม์ที่มีประสิทธิภาพสูงสุด 2024-11-22 AI ขนาดใหญ่เข้าสู่ปีแรกของการใช้งาน สถาบันการเงินกำลังเพิ่มความพยายามในการสร้างระบบนิเวศใหม่ของพลังการประมวลผลอัจฉริยะ 2024-11-22 MiniMax Yan Junjie: ความเร็วนั้นดีสำหรับรุ่นใหญ่ แต่บางครั้งการช้าก็เพื่อให้เร็วขึ้นเท่านั้น 2024-11-22 ปัญญาประดิษฐ์เข้าสู่มหาวิทยาลัยเพื่อจุดประกายความฝันทางวิทยาศาสตร์ของนักเรียน 2024-11-22 ปัญญาประดิษฐ์กระตุ้นการผลิตสำหรับผู้บริโภค และอุปกรณ์ออกกำลังกาย Yongkang ขายดีทั้งในตลาดในประเทศและต่างประเทศ 2024-11-22 Nvidia ลงทุนในการจัดหาเงินทุน Series B ของ Sakana AI เพื่อช่วยพัฒนาปัญญาประดิษฐ์เชิงกำเนิด 2024-11-22 AI กำลังปลดล็อกการปฏิวัติทางปัญญาครั้งใหม่! หลักสูตรทั่วไปการอ่านวิทยาศาสตร์และเทคโนโลยีใหม่สากล ตารางเวลาการพัฒนาปัญญาประดิษฐ์: ทำวิดีโอในปี 2571 เขียนหนังสือขายดีในปี 2592... 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]