PixelArtSearch下載 - PixelArtSearch原始碼下載

PixelArtSearch

其他源碼

1.0.0

下載

OpenGameArt 的像素藝術反向圖像搜索

最終的搜尋結果是什麼樣的？

可以在此處找到帶有範例的最終搜尋。

它看起來像這樣：

為什麼我想要對 OpenGameArt 進行反向影像搜尋？

我想為 OpenGameArt 建立一個反向圖像搜索，因為 Google 圖像搜索和 TinEye 沒有給出好的結果。我之前生成了一個巨大的圖塊地圖來概述 OpenGameArt 上的類似圖像，但它在網絡或圖像瀏覽器上的資源不是很友好，必須分成更小的文件，而且它無法以任何方式搜索，只是可滾動。因此，我想要一種方式讓人們探索 OpenGameArt 上提供了哪些類型的藝術，並最終使用相似性搜尋來瀏覽圖像空間。

我是如何進行爬行的？

我要做的第一件事是在 OpenGameArt 上檢索我感興趣的查詢的搜尋結果，主要是 2D 藝術。然後我必須檢索搜尋結果索引中的每個 HTML 頁面並解析 HTML 以獲取文件連結。 OpenGameArt 包含許多存檔文件，例如 zip 和 rar 文件，因此我必須解壓縮它們才能獲取映像。

例如，下面的程式碼片段顯示如何解析內容頁面並取得文件連結：

 responseBody = await Common . ReadURIOrCache ( blob , Common . BaseURI + page , client ) ;

var htmlDoc = new HtmlDocument ( ) ;
htmlDoc . LoadHtml ( responseBody ) ;
var htmlBody = htmlDoc . DocumentNode . SelectSingleNode ( " //body " ) ;

foreach ( var nNode in htmlBody . Descendants ( " a " ) )
{
    if ( nNode . NodeType == HtmlNodeType . Element &&
        nNode . Attributes [ " href " ] != null &&
        nNode . Attributes [ " href " ] . Value . Contains ( " /default/files/ " ) )
    {
        msg . Add ( HttpUtility . HtmlDecode ( nNode . Attributes [ " href " ] . Value . Replace ( Common . FileURI , " " ) ) ) ;
    }
}

我使用了哪種技術進行爬行？

我使用 Azure Functions 執行爬網步驟，並根據需要進行一些來回手動幹預來糾正問題。每個步驟都有自己的佇列，然後將下一步的作業放入下一個佇列中。最終，Azure 上的呼叫成本約為 50 美元，如果我沒記錯的話，假設有 1000-2000 萬次函數呼叫。

我調查了哪些替代方案？

我嘗試使用開源 Milvus 資料庫，但它在我的 DigitalOcean 伺服器上崩潰了，因為我沒有足夠的記憶體。然後，我偶然且幸運地在 Hacker News 評論部分發現了 Pinecone 的鏈接，並決定使用它，因為試用是免費的，而且我無需擴展服務器內存即可使用 Milvus。最終我還是擴展了我的伺服器，但我沒有再嘗試 Milvus（至少現在還沒有）。

每個影像需要哪些資料來建立反向影像搜尋？

為此，我在腳本中使用了 VGG16 特徵提取。有關更多信息，請參閱該文章，但本質上，每個圖像都是4096 個32 位浮點數，它們描述了圖像的各種特徵，例如以非常簡單的方式表示它有多少條紋或正方形，或者它的綠色程度。但這些特徵是基於VGG16神經網路中的神經元（通常用於影像分類），因此這些特徵可能比簡單特徵標籤描述的更複雜。我們需要這些向量的原因是，可以輕鬆使用歐幾里德距離或餘弦相似度或兩個向量的其他度量來查看它們是否相似，從而得出圖像相似。此外，還有針對這些向量的搜尋技術，可以對大量向量進行快速搜尋。

下面是一個簡化的 Python 腳本，用於展示如何進行特徵提取：

 #!/usr/bin/env python3
# -*- coding: utf-8 -*-
# vim: ft=python ts=4 sw=4 sts=4 et fenc=utf-8

from tensorflow . keras . applications . vgg16 import VGG16
from tensorflow . keras . preprocessing import image
from tensorflow . keras . applications . vgg16 import decode_predictions , preprocess_input
from tensorflow . keras . models import Model
from tensorflow . compiler import xla
import numpy as np
import time
import os
import sys
import PIL
import json
import math
import multiprocessing
from glob import glob
from PIL import Image
from io import BytesIO

model = VGG16 ( weights = 'imagenet' , include_top = True )
feat_extractor = Model ( inputs = model . input , outputs = model . get_layer ( "fc2" ). output )

def prepImage ( img ):
    x = np . array ( img . resize (( 224 , 224 )). convert ( 'RGB' ))
    x = np . expand_dims ( x , axis = 0 )
    x = preprocess_input ( x )
    return x

def main ():
    'entry point'
    fname = 'demo.jpg'
    dt = Image . open ( fname )
    pimg = prepImage ( dt )

    print ( "Computing feature vector" , fname )
    features = feat_extractor . predict ( pimg )
    print ( features )

if __name__ == '__main__' :
    main ()

這是腳本的輸出：

emh@frostpunk ~ /public_html/ogasearch 0% ./test.py                                                                                                                                                                                                                                                                                                                         (git)-[gh-pages]
2021-04-07 18:48:03.158023: W tensorflow/stream_executor/platform/default/dso_loader.cc:60] Could not load dynamic library ' libcudart.so.11.0 ' ; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2021-04-07 18:48:03.158082: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.
2021-04-07 18:48:07.783109: I tensorflow/compiler/jit/xla_cpu_device.cc:41] Not creating XLA devices, tf_xla_enable_xla_devices not set
2021-04-07 18:48:07.783485: W tensorflow/stream_executor/platform/default/dso_loader.cc:60] Could not load dynamic library ' libcuda.so.1 ' ; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
2021-04-07 18:48:07.783530: W tensorflow/stream_executor/cuda/cuda_driver.cc:326] failed call to cuInit: UNKNOWN ERROR (303)
2021-04-07 18:48:07.783580: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:156] kernel driver does not appear to be running on this host (frostpunk): /proc/driver/nvidia/version does not exist
2021-04-07 18:48:07.784058: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2021-04-07 18:48:07.784513: I tensorflow/compiler/jit/xla_gpu_device.cc:99] Not creating XLA devices, tf_xla_enable_xla_devices not set
2021-04-07 18:48:08.599925: W tensorflow/core/framework/cpu_allocator_impl.cc:80] Allocation of 411041792 exceeds 10% of free system memory.
2021-04-07 18:48:09.194634: W tensorflow/core/framework/cpu_allocator_impl.cc:80] Allocation of 411041792 exceeds 10% of free system memory.
2021-04-07 18:48:09.385612: W tensorflow/core/framework/cpu_allocator_impl.cc:80] Allocation of 411041792 exceeds 10% of free system memory.
2021-04-07 18:48:13.033066: W tensorflow/core/framework/cpu_allocator_impl.cc:80] Allocation of 411041792 exceeds 10% of free system memory.
Computing feature vector demo.jpg
2021-04-07 18:48:13.706621: I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:116] None of the MLIR optimization passes are enabled (registered 2)
2021-04-07 18:48:13.717564: I tensorflow/core/platform/profile_utils/cpu_utils.cc:112] CPU Frequency: 2199995000 Hz
[[0.        3.1128967 1.5611947 ... 1.2625191 0.7709812 0.       ]]
./test.py  12.20s user 4.66s system 132% cpu 12.731 total

如何維護圖像 URL 和向量資料庫特徵向量之間的連結？

我還想最後將所有圖像 URL 放入 SQL 資料庫中，並有一個標誌來指示我是否進行了 VGG16 特徵提取以及是否將其添加到向量資料庫（Milvus 或 Pinecone）中。主鍵和URL 以及可能屬於圖像的其他元資料之間來回映射，因為[Pinecone](https://www.pinecone.io/ 不存儲其他元資料最後，我將SQL 資料庫簡化為製表符分隔的文本文件，並在查詢伺服器啟動時加載它。

花了多久時間？

我想我總共花了一周的時間來運行所有程式碼來完成，每個步驟大約需要一兩天的時間，爬行，計算特徵向量。我不記得將向量插入 Pinecone 資料庫花了多少時間，但我認為這不是最耗時的步驟。

兩種搜尋方式：文字和圖像

有兩種搜尋方式，要嘛你可以輸入一個關鍵字，它只是簡單地（在 O(n) 上有點慢）線性地迭代 URL 來尋找字串匹配。我堅持使用線性搜索，因為它實現起來很簡單，而且所有 URL 都保存在記憶體中，所以速度並沒有那麼慢。我將所有 URL 轉儲到一個文字檔案中，並在查詢伺服器載入時將其載入到記憶體中，而不是每次都查詢 SQL 伺服器。
另一種搜尋方式是輸入圖像 URL，它將對圖像（在我的伺服器上）運行特徵提取，然後查詢 Pinecone 中的相似向量，這些向量將映射到主鍵，然後我在列表中查找主鍵網址。
我還維護一個「反向資料庫」文字文件，以便連結回 OpenGameArt 網站以查找找到的圖像（其中有一些錯誤我尚未修復，在這種情況下它僅連結到 OpenGameArt 主頁）。該文件也會在查詢伺服器啟動時載入。最後，每個圖像下面還有一個搜尋相似圖像的鏈接，它隱式地使用了第二種按圖查詢。

我遇到了哪些問題？

最後，我還添加了一個快速修復，以刪除具有相同分數的幾乎重複的圖像結果。我在使用「雙重」URL 編碼的搜尋頁面上遇到了一些麻煩，因為我在文件系統中使用URL 編碼儲存了文件，但是當瀏覽器對文件進行雙重編碼時，我在前端使用一些檢測代碼解決了這個問題。我建議儲存爬取的檔案而不進行 URL 編碼。我很遺憾我的腳本品質不夠高或不夠精緻，例如腳本中有多個步驟，我透過編輯腳本而不是採用命令列參數來更改內容。我不想發布腳本片段並進行解釋，因為它們有點混亂。此外，在處理特徵提取之前，我中途將檔案從 Azure 儲存體移至了 DigitalOcean 伺服器，因此存在一些不一致的資料位置處理。

最後的結論是什麼？

我建議在比 Azure Functions 和 Azure 儲存體更便宜的基礎上進行爬網，以節省一些錢，例如您自己的伺服器或固定價格的雲端伺服器。嗯，它只花費 50 美元，但我可以在我的 DigitalOcean 伺服器上免費完成它，所以這就是原因。
我建議建立一個更強大的爬蟲，冪等且可在任何時候終止或需要一些手動幹預時重新啟動（例如，在提取一些大型zip 檔案時，我超出了Azure Function 最大運行時間5 分鐘，因此我提取了他們在 VS Code 中本地運行函數）。
我很遺憾這次沒有完成的一件事是將所有圖塊從圖塊表中提取到單個圖像以進行搜尋。這將使搜尋變得更加有用。另一方面，太多幾乎相同的圖像可能會使相似性搜尋變得混亂。

結論和最後評論

使用一些內容對系統進行原型設計也可能很有用，然後一旦你讓它工作，就在所有內容上端到端地運行整個管道，而不是完成爬行的第一步，然後進行所有特徵提取，然後執行像我一樣進行所有資料庫插入。
總之，我所做的只是一個黑客，沒有那麼強大的腳本來更新新內容，但它作為原型運行良好，並提供了不錯的圖像搜索結果（並不總是那麼準確，但我將其歸咎於該功能提取並不是真正針對微小的像素藝術（儘管在特徵提取之前調整了大小/放大了））。
看看 Milvus 是否也能提供類似的結果，在速度和品質上進行某種形式的並排比較，這可能很有趣，但我發現使用 Pinecone 更容易，因為它已經作為服務啟動並運行，所以我沒有不必運行我自己的向量資料庫。