awesome colab notebooksダウンロード - awesome colab notebooksソースコードのダウンロード

ページが正しく表示されない可能性があります。 README.md ファイルを直接開いてください。

ML 実験用の素晴らしい colab ノートブックコレクション

トレンド

リポジトリ	論文
フェイスブックリサーチ/共同トラッカー反復/データチェーンコールムクドゥガル/ARENA_3.0 ToTheBeginning/PuLID ZhengPeng7/BiRefNet ウルトラリティクス/ウルトラリティクス怠け者/怠け者 facebookresearch/セグメント-何でも-2 llyasviel/IC-Light ジェメロアイ/ヴォコス comfyanonymous/ComfyUI TransformerLensOrg/TransformerLens HonwenZhang/PyMAF-X ロボフロー/監視 KwaiVGI/ライブポートレートピドナド/DDColor TencentARC/インスタントメッシュ LAION-AI/美的予測器ドゥビイウ/DynamiCrafter フェイスブックリサーチ/ホームロボット KillianLucas/オープンインタープリター jxnl/インストラクター	リダガウススプラッティングビデオの調整ポーズに従ってください Text2Video-Zero グリップ UniFormerV2 サッドトーカー OWL-ViT ビデオリトーキング LDM ドリームフィールズデティックグラフキャストドラッグガン VRT 薄板スプライン運動モデル PyMAF-X FateZero py-irt VQ 拡散 ECON

リポジトリ

論文

フェイスブックリサーチ/共同トラッカー
反復/データチェーン
コールムクドゥガル/ARENA_3.0
ToTheBeginning/PuLID
ZhengPeng7/BiRefNet
ウルトラリティクス/ウルトラリティクス
怠け者/怠け者
facebookresearch/セグメント-何でも-2
llyasviel/IC-Light
ジェメロアイ/ヴォコス
comfyanonymous/ComfyUI
TransformerLensOrg/TransformerLens
HonwenZhang/PyMAF-X
ロボフロー/監視
KwaiVGI/ライブポートレート
ピドナド/DDColor
TencentARC/インスタントメッシュ
LAION-AI/美的予測器
ドゥビイウ/DynamiCrafter
フェイスブックリサーチ/ホームロボット
KillianLucas/オープンインタープリター
jxnl/インストラクター

リダ
ガウススプラッティング
ビデオの調整
ポーズに従ってください
Text2Video-Zero
グリップ
UniFormerV2
サッドトーカー
OWL-ViT
ビデオリトーキング
LDM
ドリームフィールズ
デティック
グラフキャスト
ドラッグガン
VRT
薄板スプライン運動モデル
PyMAF-X
FateZero
py-irt
VQ 拡散
ECON

研究

名前	説明	著者	リンク	アップデート
コトラッカー	ビデオ全体を通じて複数のポイントを共同で追跡するアーキテクチャ	ニキータ・カラエフイグナシオ・ロッコベンジャミン・グレアムナタリア・ネベロワその他アンドレア・ヴェダルディクリスチャン・ルプレヒト	、プロジェクト	2024 年 10 月 16 日
ピフ	高解像度の着衣人物デジタル化のためのピクセル整列された暗黙関数	夏目涼太斉藤俊介曾黄アンジュー金沢ハオ・リー		2024 年 8 月 10 日
ディフェイス	複雑な損失設計を行わずに、目に見えない複雑な劣化により適切に対処できる手法	ユエ・ゾンシェンチェン・チェンジ・ロイ	、、、、	2024 年 5 月 10 日
何でもセグメント 2	画像やビデオの視覚的なセグメンテーションを迅速に解決するための基礎モデル	ニキラ・ラヴィヴァレンタン・ガブールユアンティン・フー胡栄航その他チャイタニヤ・リアリ天牛馬ハイサム・ケドルローマン・レードルクロエ・ローランドローラ・グスタフソンエリック・ミンタンジュンティン・パン [Kalyan Vasudev](lwala](https://scholar.google.co.in/quotes?user=m34oaWEAAAAJ) ニコラス・カリオン [チャオユアン](u](https://chaoyuan.org/) ロス・ガーシックピョートル・ドルクリストフ・フェイヒテンホーファー	デモ、、プロジェクト、、、、	2024 年 10 月 1 日
オープンアンミックス	研究者、オーディオエンジニア、アーティストに適用可能な、音楽ソース分離のためのディープニューラルネットワークのリファレンス実装	ファビアン＝ロバート・シュテターアントワーヌ・リュークス	データプロジェクト	2024 年 9 月 25 日
絵画のような深い調和	アルゴリズムは、写真合成やグローバルスタイライゼーション技術よりも大幅に優れた結果を生成し、他の方法では達成が困難な創造的な絵画のような編集を可能にします。	フジュン・ルアンシルヴァン・パリイーライ・シェクトマンカビタ・バラ	、、、	2024 年 9 月 23 日
オーディオ2フォトリアル	二項対話の会話ダイナミクスに従ってジェスチャーを行う全身の写真のようにリアルなアバターを生成するためのフレームワーク	エボンヌ・ンハビエル・ロメロティムール・バガウディノフシャオジー・バイその他トレバー・ダレルアンジュー金沢アレクサンダー・リチャード	プロジェクト	2024 年 9 月 13 日
何でも高速セグメント化	SAM 著者が公開した SA-1B データセットのわずか 2% を使用してトレーニングされた CNN セグメント Anything モデル	徐趙丁文超アン・ヨンキドゥ・インロンその他タオユウミン・リーミンタン王金橋	、、、	2024 年 9 月 10 日
ニューラランジェロ	RGB ビデオキャプチャから高忠実度 3D サーフェスを再構築するためのフレームワーク	李趙朔トーマス・ミュラーアレックス・エヴァンスラッセル・テイラーその他マティアス・ウンベラスミンユー・リウチェン・シュアン・リン	ブログ投稿プロジェクト、、	2024 年 9 月 2 日
BiRefNet	高解像度二分画像セグメンテーションのための双方向参照フレームワーク	彭鄭デホン・ガオデンピン・ファンリー・リウその他ヨルマ・ラークソネン欧陽万里ニク・セベ	、、、、プロジェクト、、	2024.08.23
スピン	ループ内でのモデルフィッティングによる 3D 人間のポーズと形状の再構成の学習	ニコス・コロトゥロスゲオルギオス・パブラコスマイケル・ブラックコスタス・ダニリディス	、プロジェクト	2024.08.21
YOLOv10	後処理とモデルアーキテクチャの両方から YOLO のパフォーマンスと効率の境界をさらに前進させることを目指します	アオ・ワンホイ・チェンカイ・チェン林子佳その他ハン・ジョンゴンディン・グイグアン	ブログ投稿デモ、、、、、、、、、、、、、、、、	2024.08.20
スペックVQGAN	トレーニングデータセットを代表的なベクトルのセットに縮小することで、視覚的にガイドされたサウンド生成を制御する	ウラジミール・イアシンエサ・ラートゥ	、、、、、、、、、、プロジェクト、、	2024 年 7 月 12 日
ライブポートレート	実用化のための汎用性、制御性、効率性の向上に重点を置いた、ビデオ主導のポートレートアニメーションフレームワーク	郭建珠チャン・ディンユン劉暁強鍾志州その他張元ワン・ペンフェイディ・チャン	、、、、、プロジェクト、、、、、、	2024 年 7 月 10 日
バク	フレームごとの初期化と時間的精密化による任意のポイントの追跡	カール・ドーシュイヤンメル・ヴェセリックディララ・ゴーケイその他アンクシュ・グプタユスフ・アイタルジョアン・カレイラアンドリュー・ジッサーマン	、ブログ投稿、ブログ投稿、	2024 年 5 月 7 日
Wav2Lip	リップシンクのエキスパートがあれば、現場での Speech to Lip の生成に必要なすべてが得られます	プラジュワル・レヌカナンドルドラバ・ムコパディヤイビナイ・ナンブーディリ CV ジャワハル	データデモプロジェクト	2024.06.27
ディープラボカット	最小限のトレーニングデータで優れた結果を達成する、ディープニューラルネットワークを使用した転移学習に基づくマーカーレス姿勢推定の効率的な方法	アレクサンダー・マティスプラナフ・マミダンナケビン・キュリー安倍大河その他ヴェンカテシュ・マーティマッケンジー・マティスマティアス・ベスゲ	、、、、、、フォーラム、 Webサイト、、	2024 年 5 月 6 日
プール元	MetaFormer は実際にビジョンに必要なものです	ウェイハオ・ユウ美羅潘周晨陽市その他周宜辰王新超ジアシー・フォンヤン・シュイチェン	、、	2024 年 6 月 1 日
ストーリーの拡散	生成された画像間の一貫性を大幅に高め、一般的な事前学習済みの拡散ベースのテキストから画像へのモデルをゼロショット方式で強化する、一貫したセルフアテンションと呼ばれるセルフアテンションの計算方法。	周裕鵬周大泉ミンミン・チェンジアシー・フォンキビン・ホウ	プロジェクト、	2024 年 4 月 5 日
プリド	Pure および Lightning ID カスタマイズ、テキストから画像への生成のためのチューニング不要の ID カスタマイズ方法	郭紫南ヤンゼ・ウー陳卓偉ラン・チェン銭和	、、	2024 年 3 月 5 日
膜	中間の動きが大きい 2 つの入力画像から複数の中間フレームを合成するフレーム補間アルゴリズム	フィツム・レダヤンネ・コントカネンエリック・タベリオン孫徳清その他キャロライン・パントファルブライアン・カーレス	データ、データ、データプロジェクト、、	2024 年 3 月 5 日
ボイスクラフト	トークン充填ニューラルコーデック言語モデル。オーディオブック、インターネットビデオ、ポッドキャストでの音声編集とゼロショットテキスト読み上げの両方で最先端のパフォーマンスを実現します。	プユアン・ペンポー・ヤオ・ファンシャンウェン・リーアブデルラフマン・モハメッドデビッド・ハーワス	プロジェクト、、	2024.04.21
ゼスト	マテリアルのサンプル画像を与えられた入力画像内のオブジェクトにゼロショットマテリアルを転送する方法	チェン・ターインプラフル・シャルマアンドリュー・マーカムニキ・トリゴーニヴァルン・ジャンパニ	、プロジェクト	2024 年 4 月 16 日
インスタントメッシュ	単一の画像から 3D メッシュを瞬時に生成するためのフィードフォワードフレームワーク。最先端の生成品質と優れたトレーニングスケーラビリティを備えています。	徐佳楽チェン・ウェイハオ高一明王欣濤その他高盛華インシャン	、、	2024 年 4 月 16 日
アルファフォールド	高精度なタンパク質構造予測	ジョン・ジャンパーリチャード・エヴァンスアレクサンダー・プリッツェルティム・グリーンその他マイケル・フィグルノフオラフ・ロンネベルガーキャスリン・トゥニャスヴナクールラス・ベイツアウグスティン・ジデクアンナ・ポタペンコアレックス・ブリッジランドクレメンス・マイヤーサイモン・コールアンドリュー・バラードベルナルディーノ・ロメラ＝パレデススタニスラフ・ニコロフリシュブ・ジェイン	ブログ投稿、ブログ投稿、紙、	2024 年 4 月 15 日
ヴュルストヒェン	大規模なテキストから画像への拡散モデル向けに、競争力のあるパフォーマンスと前例のない費用対効果を組み合わせたテキストから画像への合成のためのアーキテクチャ	パブロ・ペルニアスドミニク・ランパスマッツ・リヒタークリストファー・パルマーク・オーブルヴィル		2024 年 4 月 6 日
AQLM	加算量子化による大規模言語モデルの極端な圧縮	ヴァージ・エギアザリアンアンドレイ・パンフェロフデニス・クズネデレフエリアス・フランタルその他アルテム・バベンコダン・アリスター	、、、	2024 年 3 月 8 日
YOLOv9	プログラム可能な勾配情報を使用して学びたいことを学ぶ	チェン・ヤオ・ワンイ・ハウ・イェーホンユアン・マーク・リオ	、ブログ投稿、、、、、	2024 年 3 月 5 日
マルチLoRA構成	LoRA スイッチと LoRA コンポジット、特に複雑な構図において、精度と画質の点で従来の技術を超えることを目的としたアプローチ	ミン・ゾンイェロン・シェン王朔航ヤドン・ルーその他イジュ・ジャオ欧陽シルユ・ドンハンハン・ジアウェイ陳偉珠	Webサイト	2024 年 3 月 3 日
アマレット	ヒト疾患の生物学的システム内および生物学的システム全体で共有および区別される細胞回路とそのドライバーを特定するための制御ネットワークのマルチスケールおよびマルチモーダル推論	ナタリー・ポシェオリヴィエ・ゲベールモーセン・ナビアンジャエンドラ・シンデその他セリーヌ・エヴェラートトーリン・タボール	生体伝導体プロジェクト	2024 年 2 月 28 日
リダ	文法に依存しないビジュアライゼーションとインフォグラフィックを生成するツール	ビクター・ディビア	、プロジェクト、、	2024 年 6 月 2 日
ViT	ビジョントランスフォーマーとMLPミキサーのアーキテクチャ	アレクセイ・ドソヴィツキールーカス・ベイヤーアレクサンダー・コレスニコフダーク・ワイセンボルンその他ザイ・シャオファトーマス・ウンターティナーモスタファ・デガニマティアス・ミンデラーゲオルグ・ハイゴールドシルヴァン・ジェリーヤコブ・ウシュコライトニール・ホールズビー	、、、、、、、ブログ投稿、、、、、、	2024 年 6 月 2 日
3D ケン・バーンズ	PyTorch を使用した単一画像からの 3D Ken Burns エフェクトのリファレンス実装 - 単一の入力画像が与えられると、仮想カメラスキャンと動き視差に応じたズームを使用してこの静止画像をアニメーション化します。	マヌエル・ロメロ		2024 年 1 月 24 日
ヴァリーX	クロスリンガル音声合成のためのクロスリンガルニューラルコーデック言語モデル	張自強龍周ワン・チェンイーチェン・サンユアンその他ユウ・ウーリュウ・シュジエヂュオ・チェンヤンチン・リウ王華明リー・ジンユレイ・ヘシェン・ジャオフルウェイ	、、デモプロジェクト	2024 年 1 月 19 日
フォトメーカー	効率的なパーソナライズされたテキストから画像への生成方法。主に、ID 情報を保存するために、任意の数の入力 ID 画像をスタック ID 埋め込みにエンコードします。	ジェン・リー曹明登王欣濤チー・ジョンガンその他ミンミン・チェンインシャン	、、、、、、プロジェクト、	2024 年 1 月 18 日
DDカラー	画像のカラー化のためのデュアルデコーダを使用したエンドツーエンド方式	シャオヤン・カンタオ・ヤン欧陽文奇漣ペイランその他リー・リンジー謝玄松	、	2024 年 1 月 15 日
PASD	堅牢な Real-ISR とパーソナライズされたスタイルを実現するピクセル認識の安定した拡散ネットワーク	タオ・ヤン漣ペイラン謝玄松張雷	、	2024 年 1 月 12 日
ハンドリファイナー	拡散ベースの条件付き修復による、生成された画像内の不正な手を調整する	ルー・ウェンチュン徐裕飛ジン・チャンワン・チャオユエダチェン・タオ	、、	2024 年 8 月 1 日
グラフキャスト	上手に中期の地球天気予報を学ぶ	レミ・ラムアルバロ・サンチェス・ゴンザレスマシュー・ウィルソンピーター・ウィルンズバーガーその他メイレ・フォルトゥナートフェラン・アレスマン・ラブリティモ・エワルズザック・イートン＝ローゼン胡偉華アレクサンダー・メローズステファン・ホイヤージョージ・ホランドオリオール・ヴィニャルズジャックリン・ストットアレクサンダー・プリッツェルシャキール・モハメドピーター・バタグリア	データ、、、、、、、、、、	2024 年 4 月 1 日
ESM	進化スケールモデリング: タンパク質の事前トレーニング済み言語モデル	林澤明ロシャン・ラオブライアン・ヒエ朱中凱その他アラン・ドス・サントス・コスタマリアム・ファゼル＝ザランディトム・セルクサルヴァトーレ・カンディドアレクサンダー・リヴスジョシュア・マイヤーロバート・ベルクイルジェイソン・リュークロエ・スーアダム・レラー	ESM アトラス FSDP ICML データ紙、紙、紙、紙パブメド、	2023.12.28
LLaVA	Large Language and Vision Assistant は、汎用の視覚と言語の理解のためにビジョンエンコーダと LLM を接続する、エンドツーエンドでトレーニングされた大規模マルチモーダルモデルです。	劉豪天リー・チュンユアン呉青陽イ・ヨンジェユヘン・リー	、、、、、デモ、、、、、、、プロジェクト、、、、、、	2023.12.22
背景マット V2	最新の GPU で 4K 解像度では 30fps、HD では 60fps で動作する、リアルタイムの高解像度背景置換技術	林山川アンドレイ・リャブツェフソウミャディップ・セングプタブライアン・カーレスその他スティーブ・サイツアイラ・ケメルマッハー・シュライザーマン	、プロジェクト、	2023.12.22
ガウススプラッティング	競争力のあるトレーニング時間を維持しながら最先端のビジュアル品質を実現し、重要な点として、1080p 解像度での高品質のリアルタイム (100 fps 以上) のノベルビュー合成が可能になります。	ベルンハルト・ケルブルゲオルギオス・コパナストーマス・ライムキューラージョージ・ドレッタキス	プロジェクト、、、、、、、	2023.12.19
SMPLer-X	バックボーンとして最大 ViT-Huge を使用し、多様なデータソースからの最大 450 万のインスタンスを使用してトレーニングする、最初のジェネラリスト基盤モデルに向けて EHPS をスケールアップします。	蔡中港ワンキ・イン病める曽チェン・ウェイその他サン・チンピンワン・ヤンジュンホイ・エン・パンハイイ・メイチャン・ミンユアン張雷チェン・チェンジ・ロイレイ・ヤン劉紫偉	、、プロジェクト、	2023.12.18
ディープキャッシュ	モデルアーキテクチャの観点から普及モデルを加速するトレーニング不要のパラダイム	シンイン・マファン・ゴンファン王新超	プロジェクト	2023.12.18
マジックアニメイト	時間的一貫性の強化、参照画像の忠実な保存、アニメーションの忠実度の向上を目的とした拡散ベースのフレームワーク	シュ・ジョンコンジャンフェンジュン・ハオ・リューヤン・ハンシュウその他劉佳偉チャン・チェンシュウジアシー・フォンマイク・ショウ	、、プロジェクト Webサイト、、	2023.12.18
ディフBIR	生成拡散事前によるブラインド画像復元に向けて	リン・シンチー何ジンウェンジヤン・チェンリュウ・ジャオヤンその他ベン・フェイボダイ欧陽万里ユウチャオチャオドン	プロジェクト、	2023.12.18
オーディオLDM	潜在空間上に構築され、対照的な言語音声の事前学習潜在から連続音声表現を学習するテキスト音声変換システム	劉豪河陳澤華イー・ユアンシンハオ・メイその他劉徐波ダニーロ・マンディックワン・ウェンウーマーク・プランブリー	、、プロジェクト	2023 年 2 月 12 日
TabPFN	表形式のデータ予測を学習したニューラルネットワーク	ノア・ホルマンサミュエル・ミュラーカタリーナ・エッゲンスペルガーフランク・ハッター	、、、、、、ブログ投稿	2023.11.29
コンセプトスライダー	事前トレーニングされたモデルの上に適用されるプラグアンドプレイの低ランクアダプター	ロヒット・ガンディコタジョアンナ・マテルジンスカ周廷瑞アントニオ・トラルバデビッド・バウ	、プロジェクト	2023.11.26
クウェン-VL	テキストと画像の両方を認識して理解するように設計された大規模な視覚言語モデルのセット	ジンゼ・バイシュアイバイヤン・シュシェン王世傑その他シナン・タン王彭リン・ジュンヤン常州周静仁	、、デモ、、、、、	2023.11.24
アニメGANv3	高速写真アニメーションのためのダブルテール生成敵対的ネットワーク	ガン・リウシン・チェン	プロジェクト、、、、、、	2023.11.23
イサカ	古代ギリシャ碑文のテキスト復元、地理的および年代的帰属のための初のディープニューラルネットワーク	ヤニス・アサーエルテア・サマーシールドブレンダン・シリングフォードマヒャル・ボルドバールその他ジョン・パブロプロスマリタ・チャツィパナジオトゥイオン・アンドロツォプロスジョナサン・プラグナンド・デ・フレイタス	、プロジェクト	2023.11.21
PixArt-Σ	4K テキストから画像への生成のための拡散トランスフォーマーの弱から強へのトレーニング	ジュンソン・チェンチョンジャン・ゲエンゼ・シェユエ・ウーその他ルーウェイ・ヤオレン・シャオゼ王忠道平羅ルー・フーチュアン李正国	、、、プロジェクト	2023 年 7 月 11 日
ゼロ123++	単一の入力ビューから 3D 一貫性のあるマルチビュー画像を生成するための画像条件付き拡散モデル	若西市ハンシェン・チェン張卓陽ミンファ・リウその他チャオ・シュウウェイ・シンユエチェン・リンハオチョン・ゼンハオスー	、、	2023.10.26
UniFormerV2	効率的な時空間表現学習のための統合トランスフォーマー	クンチャン・リーヤリー・ワンイーナン・ヘ李亦卓その他ワン・イー王立民ユウチャオ	、、、、、、、、、	2023.10.20
ショー-1	Show-1 と呼ばれるハイブリッドモデル。ピクセルベースと潜在ベースの VDM を組み合わせてテキストからビデオを生成します。	デビッド・ジュンハオ・チャンジェイ・チャンジエ・ウー劉佳偉趙瑞その他ラン・リンミンユチャオ・グディフェイ・ガオマイク・ジェンショウ	、、、、、、プロジェクト	2023.10.15
オーディオセプ	自然言語クエリによるオープンドメイン音源分離の基礎モデル	劉徐波孔秋強ヤン・ジャオ劉豪河その他イー・ユアン劉裕卓ルイ・シア王玉軒マーク・プランブリーワン・ウェンウー	プロジェクト	2023.10.12
DAクリップ	劣化を認識した視覚言語モデルにより、画像復元のための普遍的なフレームワークとして、事前トレーニングされた視覚言語モデルを低レベルの視覚タスクに適切に転送できます。	ルオ・ツィウェイフレドリック・グスタフソン鄭昭イェンス・ショーランドトーマス・シェーン	プロジェクト	2023 年 10 月 11 日
サッドトーカー	オーディオから 3DMM の 3D モーション係数を生成し、トーキングヘッド生成用の新しい 3D 対応の顔レンダリングを暗黙的に変調します。	チャン・ウェンシュアン小東村スアン・ワン張永その他シー・シェン郭裕インシャンフェイ・ワン	、、、、、、、、、プロジェクト、、、、	2023 年 10 月 10 日
ムシカ	単一のコンシューマ GPU を使用して数百時間の音楽でトレーニングでき、コンシューマ CPU で任意の長さの音楽をリアルタイムよりもはるかに高速に生成できる音楽生成システム	マルコ・パシーニヤン・シュリューター	、データ、プロジェクト、	2023 年 9 月 10 日
YOLOv6	産業用アプリケーション専用の一段階物体検出フレームワーク	ウェン・カイヘンメン・チェンリー・イードゥオシャンシャン・チューウェイ・シャオリン	、ブログ投稿データ、、、、、、、、	2023 年 8 月 10 日
ドリームガウス	3D ガウスをテクスチャメッシュに変換し、微調整ステージを適用して詳細を調整するアルゴリズム	唐嘉祥レン・ジアウェイ杭州劉紫偉ガン・ゼン	、、プロジェクト	2023 年 4 月 10 日
アイコン	一連の画像を指定すると、各画像から詳細な 3D サーフェスを推定し、これらを組み合わせてアニメーション化可能なアバターを作成します。	ユリャン・シュウヤン・ジンロンディミトリオス・ツィオナスマイケル・ブラック	、、、、、、、、、プロジェクト	2023.08.31
DINOv2	さまざまなコンピュータービジョンタスクで、線形レイヤーと同じくらい単純な分類器で直接使用できる高性能の視覚機能を生成します。これらの視覚機能は堅牢であり、微調整を必要とせずにドメイン間で良好に機能します。	マキシム・オクアブティモシー・ダルセテオ・ムタカンニフイ・ヴォその他マルク・サフラニエツワシル・ハリドフピエール・フェルナンデスダニエル・ハジザフランシスコ・マッサアラエルディン・エル・ノウビーマフムード・アスランニコラス・バラスヴォイチェフ・ガルバラッセル・ハウズポー・ヤオ・ファンシャンウェン・リーイシャン・ミスラマイケル・ラバットヴァス・シャルマガブリエル・シンナイブ胡徐エルベ・ジェグージュリアン・マイラルパトリック・ラバトゥアルマン・ジュランピョートル・ボヤノフスキー	ブログ投稿デモ、、、	2023.08.31
OWL-ViT	ビジョントランスフォーマーを使用したシンプルなオープンボキャブラリーオブジェクト検出	マティアス・ミンデラーアレクセイ・グリツェンコオースティン・ストーンマキシム・ノイマンその他ダーク・ワイセンボルンアレクセイ・ドソヴィツキーアラヴィンド・マヘンドランアヌラグ・アルナブモスタファ・デガニ沈卓然シャオ・ワンザイ・シャオファトーマス・キプフニール・ホールズビー		2023.08.21
スタイルGAN3	エイリアスフリーの敵対的生成ネットワーク	テロ・カラスミイカ・アイッタラサムリ・レインエリック・ハルコネンその他ヤンネ・ヘルステンヤーコ・レティネンティモ・アイラ	、、、、、、、、、、、プロジェクト	2023.08.13
FateZero	プロンプトごとのトレーニングや用途固有のマスクを使用しない、現実世界のビデオに対するゼロショットテキストベースの編集方法	晨陽斉小東村張永チェンヤン・レイその他王欣濤インシャンチェン・チーフェン	、、プロジェクトビデオ	2023.08.13
ビッグGAN	高忠実度の自然画像合成のための大規模 GAN トレーニング	アンドリュー・ブロックジェフ・ドナヒューカレン・シモニャン		2023 年 3 月 8 日
ラマ	フーリエ畳み込みを使用した解像度に強い大型マスクの修復	ロマン・スヴォーロフエリザベタ・ロガチェワアントン・マシヒンアナスタシア・レミゾワその他アルセニ・アシュカアレクセイ・シルベストロフネジン・コンハルシス・ゴカキウン・パークヴィクトル・レンピツキー	、、、、プロジェクト	2023 年 8 月 2 日
メイクイットトーク	唯一の入力として音声を使用し、単一の顔画像から表情豊かなトーキングヘッドビデオを生成する方法	ヤン・ジョウハン・シントンイーライ・シェクトマンホセ・エチェバリアその他エヴァンゲロス・カロゲラキスディンゼユ・リー	データプロジェクト	2023.07.27
HiDT	生成的な画像間モデルと、高解像度での画像変換の適用を可能にする新しいアップサンプリングスキーム	デニス・コルジェンコフグレブ・スターキンセルゲイ・ニコレンコヴィクトル・レンピツキー	プロジェクト、	2023.07.24
カトラー	教師なし物体検出およびセグメンテーションモデルをトレーニングするためのシンプルなアプローチ	王徐東ロヒット・ギルダールステラ・ユウイシャン・ミスラ	、プロジェクト	2023.07.24
何でも認識＆Tag2Text	視覚言語の事前トレーニングフレームワーク。視覚言語モデルに画像のタグ付けを導入して、視覚言語の特徴の学習をガイドします。	ファン・シンユー張友彩ジンユ・マリー・ジャオヤンその他謝燕春秦裕卓銅羅ヤキアン・リー郭延東郭延東張雷	、、プロジェクト、プロジェクト	2023 年 9 月 7 日
薄板スプライン運動モデル	エンドツーエンドの教師なしモーション転送フレームワーク	ジャン・ジャオ張恵	、、、、スープ	2023 年 7 月 7 日
ドラッグガン	GAN をドラッグ: 生成画像マニホールドでのインタラクティブなポイントベースの操作	シンガン・パンアユシュ・テワリトーマス・ライムキューラー劉玲傑その他アビミトラ・メカクリスチャン・テオバルト	プロジェクト	2023 年 3 月 7 日
モバイルSAM	モバイルアプリケーション向けの軽量 SAM を目指して	チャン・チャオニンハン・ドンシェンユウチャオキム・ジョンウクその他ペ・ソンホイ・スンギュチョン・ソンホン	、、、、、、、、、	2023.06.30
グランディングDINO	DINO と開集合物体検出のための接地された事前トレーニングを組み合わせる	シロン・リウ曾趙陽天河仁フェン・リーその他ハオ・チャンヤン・ジエリー・チュンユアンヤン・ジャンウェイハン・スジュン・ジュウ張雷	、、、、、、、、、、、、、、、	2023.06.28
T5X	さまざまなスケールでのシーケンスモデルの高性能で構成可能なセルフサービストレーニング、評価、推論のための、モジュール式で構成可能で研究しやすいフレームワーク	アダム・ロバーツチョン・ヒョンウォンアンセルム・レフスカヤガウラフ・ミシュラその他ジェームズ・ブラッドベリダニエル・アンドールシャラン・ナランブライアン・レスターコリン・ガフニーアフロス・モヒウディンカーティス・ホーソーンアイトール・レウコヴィチアレックス・サルシヌマルク・ヴァン・ゼージェイコブ・オースティンセバスチャン・グッドマンリビオ・バルディーニ・ソアレス胡海棠サーシャ・ツビャシチェンコアーカンクシャ・チョードリージャスミン・ベイスティングスジャニス・ブリアンザビエル・ガルシアジャンモ・ニーキャスリーン・キニーリージョナサン・クラークダン・ギャレットジェームズ・リー・ソープコリン・ラフェルノーム・シェイザーマービン・リッターマールテン・ボスマアレクサンドル・パソスジェレミー・メイティン＝シェパードノア・フィーデルブレナン・サエタライアン・セパッシアレクサンダー・スピリドノフジョシュア・ニューランアンドレア・ゲスムンド	、、、、	2023.06.27
コードトーカー	学習済みコードブックの有限プロキシ空間でコードクエリタスクとして音声駆動のフェイシャルアニメーションをキャストします。これにより、クロスモーダルマッピングの不確実性が低減され、生成されたモーションの鮮やかさが効果的に促進されます。	[ジンボシン](ジンボシン) 孟漢夏ユエチェン・チャン小東村その他王覚ウォン・ティエンツィン	、、、、、、、、、、、、、、、、、、プロジェクト	2023.06.16
画像アニメーションの一次運動モデル	顔の動きをビデオから画像に転送する	アリアクサンドル・シアロヒン	プロジェクト	2023 年 4 月 6 日
パラレルWaveGAN	独自の優れたボコーダーを構築するための最先端の非自己回帰モデル	林智樹	、、デモ、	2023 年 6 月 1 日
ECON	暗黙的表現と明示的表現の最良の特性を組み合わせた「カラー画像からの人間のデジタル化」用に設計されており、たとえ緩い服を着ていたり、難しいポーズを取っていても、野生の画像から服を着た高忠実度の 3D の人間を推測できます。	ユリャン・シュウヤン・ジンロン徐曹ディミトリオス・ツィオナスマイケル・ブラック	、、、、、、、、、、、	2023.05.31
MMS	Massively Multilingual Speech プロジェクトは、1,100 を超える言語をサポートする単一の多言語音声認識モデル、4,000 を超える言語を識別できる言語識別モデル、1,400 を超える言語をサポートする事前トレーニング済みモデル、およびテキストから1100以上の言語の音声モデル	ヴィニール・プラタップアンドロス・チャンドラボーエン・シーパデン・トマセロその他アルン・バブサヤニ・クンドゥアリ・エルカキー趙恒尼アプールヴ・ヴィャスマリアム・ファゼル＝ザランディアレクセイ・バエフスキーヨッシ・アディ張暁輝スー・ウェイニンアレクシス・コノーマイケル・アウリ	、、、	2023.05.26
FAB	フロー AIS ブートストラップは、AIS を使用して、フローがターゲットの近似に乏しい領域でサンプルを生成し、新しいモードの発見を容易にします。	ローレンス・ミジリーヴィンセント・スティンパーグレガー NC シムベルンハルト・シェルコップフホセ・ミゲル・エルナンデス・ロバト	、	2023.04.29
コードフォーマー	コード予測用に低品質の顔の全体的な構成とコンテキストをモデル化するトランスフォーマーベースの予測ネットワークにより、入力が著しく劣化している場合でも、ターゲットの顔に非常に近い自然な顔を検出できます。	周尚チェンケルビン・チャンリー・チョンイチェン・チェンジ・ロイ	、、プロジェクト、、、、	2023.04.21
Text2Video-Zero	テキストから画像への拡散モデルはゼロショットビデオジェネレーターです	レヴォン・ハチャトリアンアンドラニク・モフシヤンヴァフラム・タデヴォシアンロベルト・ヘンシェルその他王張陽シャント・ナバサルディアンハンフリー・シー	、、、、、、プロジェクトビデオ、	2023 年 4 月 11 日
何でもセグメント化	セグメント何でもモデルは、ポイントやボックスなどの入力プロンプトから高品質のオブジェクトマスクを生成し、画像内のすべてのオブジェクトのマスクを生成するために使用できます。	アレクサンダー・キリロフエリック・ミンタンニキラ・ラヴィハンジ・マオその他クロエ・ローランドローラ・グスタフソンテテ・シャオスペンサー・ホワイトヘッドアレックス・バーグワン・イェン・ローピョートル・ドルロス・ガーシック	データ、 Webサイト、、	2023 年 4 月 10 日
ポーズに従ってください	画像ポーズペアとポーズフリービデオデータセット、および事前トレーニングされたテキストから画像へのモデルを利用して、ポーズ制御可能なキャラクタービデオを取得できる 2 段階のトレーニングスキーム	ユエ・マ彼・インチン小東村王欣濤その他サイラン・チェンインシャンシウ・リーチェン・チーフェン	、、、プロジェクトビデオ	2023 年 4 月 7 日
EVA3D	トレーニングには 2D 画像コレクションのみが必要な、高品質の無条件 3D 人体生成モデル	方州紅チャオシー・チェンユシ・ランリャン・パン劉紫偉	プロジェクト、	2023 年 4 月 6 日
安定のドリームフュージョン	事前トレーニングされた 2D テキストから画像への拡散モデルを使用してテキストから 3D への合成を実行する	唐嘉祥ベン・プールアジャイ・ジェインジョン・バロンベン・ミルデンホール	、プロジェクト、、、、	2023 年 4 月 4 日
PIFuHD	高解像度 3D 人間デジタル化のためのマルチレベルのピクセル位置合わせされた暗黙関数	斉藤俊介トーマス・サイモンジェイソン・サラギハンビョル・ジュ	、	2023.03.26
ビデオリトーキング	入力音声に応じて現実世界のトーキングヘッドビデオの顔を編集し、異なる感情があっても高品質で口パクの出力ビデオを生成するシステム	クン・チェン小東村張永孟漢夏その他フェイ・イン朱明瑞スアン・ワン王覚ワン・ナンナン	、、、、、プロジェクト、、	2023.03.19
ビジュアルチャットGPT	ChatGPTと一連のVisual Foundation Modelを接続し、チャット中に画像の送受信を可能にします。	ウー・チェンフェイイン・シェンミンウェイジェン・チー王暁東その他沢城唐ナン・ドゥアン	、、、、、	2023.03.15
ビデオの調整	テキストからビデオへの生成のための画像拡散モデルのワンショット調整	ジェイ・チャンジエ・ウーイーシャオ・ゲー王欣濤スタン・ウェイシアン・レイその他ユチャオ・グユフェイ・シーウィン・スーインシャン斉暁湖マイク・ジェンショウ	、、、プロジェクト、	2023.02.23
GPEN	野外でのブラインドフェイス修復のための GAN 事前組み込みネットワーク	タオ・ヤン漣ペイラン謝玄松張雷	デモ、	2023.02.15
PyMAF-X	単眼画像からパラメトリック全身モデルを復元するための出口ベースのアプローチ	チャン・ホンウェンヤティン・ティアン張玉祥リー・メンチェンその他梁安スン・ジェナンイェビン・リウ	、、、、、プロジェクト	2023 年 2 月 14 日
ディスコの普及	AI アートとアニメーションを生成するためのノートブック、モデル、技術をフランケンシュタインのように融合したもの	マックス・インガムアダム・レッツダニエル・ラッセルチゴジ・ヌリ	、、	2023 年 2 月 11 日
GrooVAE	ビートとドラムパフォーマンスの生成と操作のための機械学習のいくつかの応用	ジョン・ギリックアダム・ロバーツジェシー・エンゲル	ブログ投稿データウェブアプリ	2023 年 2 月 2 日
マルチトラック音楽VAE	このノートブックのモデルは、オプションで基礎となるコードを条件として、最大 8 トラックの単一小節をエンコードおよびデコードできます。	イアン・サイモンアダム・ロバーツコリン・ラフェルジェシー・エンゲルその他カーティス・ホーソーンダグラス・エック	ブログ投稿	2023 年 2 月 2 日
音楽VAE	音楽の長期構造を学習するための階層型潜在ベクトルモデル	アダム・ロバーツジェシー・エンゲルコリン・ラフェルカーティス・ホーソーンダグラス・エック	ブログ投稿プロジェクト	2023 年 2 月 2 日
絵を描くことを学ぶ	モデルベースの深層強化学習によるペイントの学習	マヌエル・ロメロ		2023 年 2 月 1 日
インスタントNGP	多重解像度ハッシュエンコーディングを使用したインスタントニューラルグラフィックスプリミティブ	トーマス・ミュラーアレックス・エヴァンスクリストフ・シードアレクサンダー・ケラー	ブログ投稿、、、、、プロジェクトチュートリアル、、、、	2023.01.18
フーリエ特徴ネットワーク	フーリエ特徴によりネットワークは低次元領域の高周波関数を学習できる	マシュー・タンシクプラトゥルスリニバサンベン・ミルデンホールサラ・フリドヴィッチ・ケイルその他ニシン・ラガバンウトカルシュ・シンハルラビ・ラマモーティジョン・バロンレン・ン	、プロジェクト	2023.01.17
アルファポーズ	全身の局所的な複数人の姿勢の推定とリアルタイムの追跡	ハオ・シュー・ファンリー・ジェフェンホンヤン・タンチャオ・シュウその他ジュー・ハオイユリャン・シュウヨン・ルー・リーチェウ・ルー	、プロジェクト、、、、	2023 年 7 月 1 日
HybrIK	3D 人間の姿勢と形状を推定するためのハイブリッド分析-ニューラル逆運動学ソリューション	リー・ジェフェンチャオ・シュウ陳志村シユアン・ビアンその他ヤン・リーシンチェウ・ルー	プロジェクトスープ	2023 年 1 月 1 日
スコアヤコビアン連鎖	学習した勾配にチェーンルールを適用し、微分可能レンダラーのヤコビアンを介して拡散モデルのスコアを逆伝播します。これをボクセル放射フィールドとしてインスタンス化します。	ワン・ハオチェンドゥ・シャオダンリー・ジアハオレイモンド・イェーグレッグ・シャクナロビッチ	、プロジェクト、	2022 年 5 月 12 日
デムクス	ハイブリッドスペクトログラムと波形ソースの分離	アレクサンドル・デフォセ	、、、、、、、、	2022.11.21
スタイルクリップ	StyleGAN Imager のテキスト駆動の操作	あるいはパタシュニク呉宗澤イーライ・シェクトマンダニエル・コーエン・オールダニ・リシンスキー	、、、、、	2022.10.30
モーションディフューズ	初の拡散モデルベースのテキスト駆動モーション生成フレームワーク。既存の方法に比べて望ましいいくつかの特性を実証します。	チャン・ミンユアン蔡中港リャン・パン方州紅その他郭信英レイ・ヤン劉紫偉	プロジェクト	2022 年 10 月 13 日
VToonify	StyleGAN の中解像度および高解像度レイヤーを活用して、エンコーダーによって抽出されたマルチスケールコンテンツの特徴に基づいて高品質の芸術的なポートレートをレンダリングし、フレームの詳細をより適切に保存します。	ヤン・シュアイジャン・リーミン劉紫偉チェン・チェンジ・ロイ	、、、、プロジェクト	2022 年 7 月 10 日
PyMAF	ピラミッドメッシュアライメント回帰ネットワークのフィードバックループにより、適切に位置合わせされたボディメッシュを回復し、それを拡張して表現力豊かな全身モデルを回復します。	チャン・ホンウェンヤティン・ティアン張玉祥リー・メンチェンその他梁安スン・ジェナンイェビン・リウ	、、、、、プロジェクト、	2022 年 6 月 10 日
アルファテンソル	強化学習によるより高速な行列乗算アルゴリズムの発見	アルフセイン・ファウジマテイ・バログアジャ・ファントーマス・ヒューバートその他ベルナルディーノ・ロメラ＝パレデスモハマダミン・バレカティンアレクサンダー・ノヴィコフフランシスコ・ルイスジュリアン・シュリットヴィーザーグジェゴシュ・スヴィルシュチュデビッド・シルバーデミス・ハサビスプッシュミート・コーリ	、、、、	2022 年 4 月 10 日
Swin2SR	Novel Swin Transformer V2 は、画像の超解像度、特に圧縮入力シナリオ向けに SwinIR を改善します。	マルコス・コンデチェ・ウィジンマキシム・ブルキラドゥ・ティモフテ	、、、、、、、、	2022 年 3 月 10 日
機能	データから関数へ: データポイントは関数であり、関数のように扱うことができます。	エミリアン・デュポンキム・ヒョンジクアリ・エスラミダニーロ・レゼンデダン・ローゼンバウム	、	2022.09.24
ささやき	Web から収集した 680,000 時間の多言語およびマルチタスクの監視データに基づいてトレーニングされた自動音声認識システム	アレック・ラドフォードキム・ジョンウクタオ・シューグレッグ・ブロックマンその他クリスティン・マクリービーイリヤ・サツケヴァー	ブログ投稿、、	2022.09.21
DeOldify (ビデオ)	自分のビデオに色を付けましょう！	ジェイソン・アンティック	、モデル、 Webサイト、	2022 年 9 月 19 日
古いものを取り除く（写真）	自分の写真に色を付けてみましょう！	ジェイソン・アンティックマット・ロビンソンマリア・ベナベンテ	、モデル Webサイト	2022.09.19
リアル ESRGAN	強力な ESRGAN を、純粋な合成データでトレーニングされた実用的な復元アプリケーションに拡張します。	王欣濤謝梁斌チャオドンインシャン	、、、、、	2022.09.18
IDE-3D	高解像度の 3D 対応ポートレート合成のためのインタラクティブな解きほぐし編集	スン・ジンシャンスアン・ワン宜春市王麗珍その他王覚イェビン・リウ	、、、、	2022 年 8 月 9 日
意思決定トランスフォーマー	RLの問題を条件付きシーケンスモデルとしてキャストするアーキテクチャ拡大する追加情報バージョン 1.0.0 タイプその他のソースコード更新時間 2024-12-27 サイズ 804.02KB から Github 関連アプリ awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 素晴らしい悪魔のゲーム 2023-04-16 素晴らしい広告 2022-08-08 おすすめ chat.petals.dev その他のソースコード 1.0.0 GPT Prompt Templates その他のソースコード 1.0.0 GPTyped その他のソースコード GPTyped 1.0.5 waymo open dataset その他のソースコード December 2023 Update SmartTube その他のソースコード 24.71 Stable Sunamu その他のソースコード Release 2.2.0 waymo open dataset その他のソースコード December 2023 Update termwind その他のカテゴリー v2.3.0 wp functions その他のカテゴリー 1.0.0 関連情報すべて Stalker 2: Heart of Chornobyl のスタッターを修正する方法 2024-11-23 フォートナイトのジュースワールドはどこにありますか? 2024-11-23 Star Wars Outlaws でワイルドカード拡張を開始する方法 2024-11-23 北京、人工知能のセキュリティとガバナンスのレイアウトを改善するための新しい研究開発機関を追加 2024-11-22 上海でセミナーが開かれ、グテーレス首相も出席、人工知能の能力構築強化に協力するという中国の提案が国連総会で採択 2024-11-22 最も効果的なリゾチームを見つけるための人工知能フレームワークを構築する 2024-11-22 AI の大規模モデルは適用初年度に入り、金融機関はインテリジェントなコンピューティング能力の新しいエコシステムを構築する取り組みを強化しています。 2024-11-22 MiniMax Yan Junjie: 大きいモデルには高速が適していますが、より速くするために低速が必要な場合もあります。 2024-11-22 人工知能がキャンパスに登場し、学生の科学的夢を輝かせる 2024-11-22 人工知能により消費者向け製造業が活性化され、永康フィットネス機器は国内外の市場でよく売れています 2024-11-22 Nvidia、生成人工知能の開発を支援するため、Sakana AI のシリーズ B 資金調達に投資 2024-11-22 AI は新たな認知革命を解き放ちます。新しい科学技術一般コースの普遍的な読み物、人工知能開発スケジュール: 2028 年にビデオを作成、2049 年にベストセラーの本を執筆... 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]

awesome colab notebooks

ML 実験用の素晴らしい colab ノートブック コレクション

トレンド

研究

ML 実験用の素晴らしい colab ノートブックコレクション