Unduhan ndvr - Unduhan kode sumber ndvr

ndvr

Kode sumber lainnya

1.0.0

Unduh

Dekat Pengambilan Video Duplikat

Peringkat ke-2 untuk Hackathon Penelusuran Neural?

Kita telah menyaksikan pertumbuhan data video yang eksplosif di berbagai situs berbagi video dengan miliaran video tersedia di internet, menjadi tantangan besar untuk melakukan pengambilan video hampir duplikat (NDVR) dari database video berskala besar. NDVR bertujuan untuk mengambil video yang hampir duplikat dari database video yang sangat besar, dimana video yang hampir duplikat didefinisikan sebagai video yang secara visual mirip dengan video aslinya.

Pengguna memiliki insentif yang kuat untuk menyalin video pendek yang sedang tren & mengunggah versi tambahannya untuk mendapatkan perhatian. Dengan pertumbuhan video pendek, kesulitan dan tantangan baru untuk mendeteksi video pendek yang hampir duplikat pun muncul.

Di sini, kami telah membangun solusi Neural Search menggunakan Jina untuk mengatasi tantangan NDVR.

Daftar isi

Dekat Pengambilan Video Duplikat
- Bagaimana tampilannya?
- Tantangan
- Data
- Prasyarat
  - Unduh datanya
- Jalankan Aliran Indeks
- Jalankan Alur Kueri
- Perbaikan Lebih Lanjut
- Kredit

Bagaimana tampilannya?

Contoh

_{Contoh video kandidat hard positif. Baris atas: morro samping, disaring warna, dan dicuci air. Baris tengah: layar horizontal diubah menjadi layar vertikal dengan margin hitam besar. Baris bawah: diputar}

Tantangan

_{Contoh video negatif keras. Semua kandidat secara visual mirip dengan kueri tetapi tidak hampir duplikat.}

Data

Ada tiga strategi untuk memilih kandidat video:

Pengambilan Berulang
Pengambilan yang Diubah
Penambangan Berbasis Fitur

Kami memutuskan untuk menggunakan strategi Transformed Retrieval karena keterbatasan waktu & sumber daya. Dalam aplikasi nyata, pengguna akan menyalin video yang sedang tren untuk insentif pribadi. Pengguna biasanya memilih untuk sedikit memodifikasi video yang disalin untuk melewati deteksi. Modifikasi ini mencakup pemotongan video, penyisipan batas, dan sebagainya.

Untuk meniru perilaku pengguna tersebut, kami mendefinisikan satu transformasi temporal, yaitu kecepatan video, dan tiga transformasi spasial, yaitu pemotongan video, penyisipan batas hitam, dan rotasi video.

Sayangnya, kumpulan data NDVR yang diteliti memiliki resolusi rendah atau besar, spesifik domain, atau tidak tersedia untuk umum (kami juga menghubungi beberapa orang secara pribadi). Oleh karena itu, kami memutuskan untuk membuat kumpulan data khusus kecil untuk bereksperimen.

Kumpulan data

Prasyarat

pip install --upgrade -r requirements.txt

Unduh datanya

bash ./get_data.sh

Jalankan Aliran Indeks

python app.py -t index

Indeks Arus didefinisikan sebagai berikut:

 !Flow
with :
  logserver : false
pods :
  chunk_seg :
    uses : craft/craft.yml
    parallel : $PARALLEL
    read_only : true
    timeout_ready : 600000
  tf_encode :
    uses : encode/encode.yml
    needs : chunk_seg
    parallel : $PARALLEL
    read_only : true
    timeout_ready : 600000
  chunk_idx :
    uses : index/chunk.yml
    shards : $SHARDS
    separated_workspace : true
  doc_idx :
    uses : index/doc.yml
    needs : gateway
  join_all :
    uses : _merge
    needs : [doc_idx, chunk_idx]
    read_only : true

Ini dipecah menjadi langkah-langkah berikut:

Segmentasikan setiap video ke dalam bingkai utama (potongan);
1. Bingkai utama didefinisikan sebagai bingkai representatif dari streaming video, bingkai yang memberikan ringkasan konten video paling akurat dan ringkas.
2. Ini akan menjadi cara yang efisien untuk menyandikan Video, karena banyak frame yang berlebihan.
3. Kami melakukan beberapa analisis waktu pada ekstraksi Keyframe. Dibutuhkan sekitar 17 detik untuk mengekstrak 15 bingkai utama dari video berdurasi 5 menit (17 Mb).
Encode setiap keyframe (potongan) sebagai vektor dengan panjang tetap;
Simpan semua representasi vektor dalam database vektor dengan pecahan .

Di sini kita menggunakan file YAML untuk mendefinisikan Aliran dan menggunakannya untuk mengindeks data. Fungsi index mengambil parameter input_fn yang menggunakan Iterator untuk meneruskan jalur file, yang selanjutnya akan dibungkus dalam IndexRequest dan dikirim ke Aliran.

 DATA_BLOB = "./index-videos/*.mp4"
if task == "index" :
    f = Flow (). load_config ( "flow-index.yml" )
    with f :
        f . index ( input_fn = input_index_data ( DATA_BLOB , size = num_docs ), batch_size = 2 )

 def input_index_data ( patterns , size ):
    def iter_file_exts ( ps ):
        return it . chain . from_iterable ( glob . iglob ( p , recursive = True ) for p in ps )

    d = 0
    if isinstance ( patterns , str ):
        patterns = [ patterns ]
    for g in iter_file_exts ( patterns ):
        yield g . encode ()
        d += 1
        if size is not None and d > size :
            break

Jalankan Alur Kueri

python app.py -t query

Anda kemudian dapat membuka Jinabox dengan titik akhir khusus http://localhost:45678/api/search

Aliran kueri didefinisikan sebagai berikut:

 !Flow
with :
  logserver : true
  read_only : true  # better add this in the query time
pods :
  chunk_seg :
    uses : craft/index-craft.yml
    parallel : $PARALLEL
  tf_encode :
    uses : encode/encode.yml
    parallel : $PARALLEL
  chunk_idx :
    uses : index/chunk.yml
    shards : $SHARDS
    separated_workspace : true
    polling : all
    uses_reducing : _merge_all
    timeout_ready : 100000 # larger timeout as in query time will read all the data
  ranker :
    uses : BiMatchRanker
  doc_idx :
    uses : index/doc.yml

Alur kueri dipecah menjadi langkah-langkah berikut:

Lakukan langkah 1,2 dalam alur indeks untuk setiap kueri masuk;
Ambil potongan yang relevan dari database;
Gabungkan skor tingkat potongan kembali ke tingkat dokumen;
Kembalikan hasil teratas ke pengguna.

Perbaikan Lebih Lanjut

Kumpulkan lebih banyak data dengan berbagai strategi penambangan untuk mengambil sampel positif/negatif dari video pendek berukuran besar.
Latih Model pada data & evaluasi.
Pemeringkat Khusus

Kredit

Jina - Kerangka Pencarian Neural
Katna - Ekstraksi Bingkai Utama
Sistem Pengambilan Video Hampir Duplikat Berskala Jutaan
SVD: Kumpulan Data Video Pendek Berskala Besar untuk Pengambilan Video Hampir Duplikat

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2024-12-26
ukuran 257.94KB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua