CIRR 다운로드 - CIRR 소스 코드 다운로드

CIRR

기타 소스코드

1.0.0

다운로드

실제 이미지에서 합성된 이미지 검색

이 저장소에는 CIRR ( 실제 이미지에 대한 합성 이미지 검색 ) 데이터 세트가 포함되어 있습니다.

자세한 내용은 ICCV 2021 논문 - 사전 훈련된 시각 및 언어 모델을 사용한 실제 이미지의 이미지 검색을 참조하세요.

^{현재 데이터세트 저장소를 보고 계십니다. 사이트 탐색 > 프로젝트 홈페이지 | 코드 저장소}

뉴스 및 향후 업데이트

2024년 10월 NLVR2의 원본 이미지에 액세스하는 데 문제가 있는 경우 당사에 문의하세요.
2024년 6월 다운로드 링크가 업데이트되었습니다.
우리 논문에 오타가 있다는 점에 유의하십시오(표 2). val의 쌍 수는 다음과 같습니다. ~~4,184~~ 4,181.

CIRR 데이터세트 다운로드

우리의 데이터세트는 이 작업에 대한 기존 데이터세트인 Fashion-IQ와 유사한 방식으로 구성되어 있습니다. 파일에는 주석, 원시 이미지 및 선택적인 사전 추출된 이미지 기능이 포함됩니다.

주석

다음을 통해 주석을 얻습니다.

 # create a `data` folder at your desired location
mkdir data
cd data

# clone the cirr_dataset branch to the local data/cirr folder
git clone -b cirr_dataset [email protected]:Cuberick-Orion/CIRR.git cirr

data/cirr 폴더에는 모든 관련 주석이 포함되어 있습니다. 파일 구조는 아래에 설명되어 있습니다.

원시 이미지

2024년 10월 업데이트 -- NLVR2의 원시 이미지에 액세스하는 데 문제가 있는 경우 당사에 문의하세요.

2023년 말부터 우리는 여러 연구 그룹으로부터 NLVR2 팀이 요청에 응답하지 않는다는 사실을 알게 되었습니다. 이를 위해 원시 이미지를 얻으려면 다음 단계를 참조하십시오.

먼저 NLVR 팀에 연락하여 서비스 약관에 동의하는 Google 양식을 작성하세요. 지침은 여기에 있습니다.
NLVR 팀으로부터 응답을 받지 못한 경우 이메일을 보내주세요.
당사에 문의하실 때 NLVR 팀의 서비스 약관에 동의하는 Google 양식을 작성하셨다고 명시적으로 알려주시기 바랍니다.

중요한

NLVR2 저장소는 이미지를 얻는 또 다른 방법, 즉 URL을 통해 이미지를 다운로드하는 방법을 제공합니다. 그러나 많은 링크가 깨져 있고 다운로드한 파일의 /train 폴더에 하위 폴더 구조가 없기 때문에 권장 하지 않습니다 .

대신 위의 지침에 따라 Raw 이미지를 직접 다운로드하시기 바랍니다.

사전 추출된 이미지 특징

사용 가능한 이미지 기능 유형은 다음과 같습니다.

ImageNet 사전 훈련된 ResNet152 기능
- 원시 이미지에서 추출 가능
- 또는 사전 추출된 기능을 다운로드하세요
F-RCNN 이미지 지역별 특징
- NLVR2에서 이미지를 소스로 제공하므로 OSCAR에서 제공
- CIRR에 사용된 기능의 하위 집합을 다운로드합니다(사용하지 않는 이미지를 필터링하고 당사에서 다시 압축함).
- 또는 OSCAR에서 직접 다운로드

우리가 제공하는 각 zip 파일에는 개별 이미지 기능 파일인 .pkl 폴더가 포함되어 있습니다.

다운로드가 완료되면 아래 파일 구조에 따라 data/cirr/ 에 압축을 풀어주세요.

데이터세트 파일 구조

다운로드한 데이터 세트는 다음과 같습니다(확대하려면 클릭).

 data
└─── cirr
    ├─── captions
    │        cap.VER.test1.json
    │        cap.VER.train.json
    │        cap.VER.val.json
    ├─── captions_ext
    │        cap.ext.VER.test1.json
    │        cap.ext.VER.train.json
    │        cap.ext.VER.val.json
    ├─── image_splits
    │        split.VER.test1.json
    │        split.VER.train.json
    │        split.VER.val.json
    ├─── img_raw  
    │    ├── train
    │    │    ├── 0 # sub-level folder structure inherited from NLVR2 (carries no special meaning in CIRR)
    │    │    │    <IMG0_ID>.png
    │    │    │    <IMG0_ID>.png
    │    │    │         ...
    │    │    ├── 1
    │    │    │    <IMG0_ID>.png
    │    │    │    <IMG0_ID>.png
    │    │    │         ...
    │    │    ├── 2
    │    │    │    <IMG0_ID>.png
    │    │    │    <IMG0_ID>.png
    │    │    └──       ...
    │    ├── dev         
    │    │      <IMG0_ID>.png
    │    │      <IMG1_ID>.png
    │    │           ...
    │    └── test1       
    │           <IMG0_ID>.png
    │           <IMG1_ID>.png
    │                ...
    ├─── img_feat_res152 
    │        <Same subfolder structure as above>
    └─── img_feat_frcnn         
             <Same subfolder structure as above>

데이터세트 파일 설명

captions/cap.VER.SPLIT.json

각 요소에는 쿼리 대상 쌍에 대한 핵심 정보가 포함된 요소 목록입니다.
각 항목에 대한 자세한 내용은 지원 항목에서 확인할 수 있습니다. 매트. 비서. 우리 신문의 G.

예시를 보려면 클릭하세요.

    { "pairid" : 12063 , 
    "reference" :   " test1-147-1-img1 " , 
    "target_hard" : " test1-83-0-img1 " , 
    "target_soft" : { "test1-83-0-img1" : 1.0 }, 
    "caption" : " remove all but one dog and add a woman hugging   it " , 
    "img_set" : { "id" : 1 , 
                "members" : [ " test1-147-1-img1 " , 
                            " test1-1001-2-img0 " ,  
                            " test1-83-1-img1 " ,           
                            " test1-359-0-img1 " ,  
                            " test1-906-0-img1 " , 
                            " test1-83-0-img1 " ],
                "reference_rank" : 3 , 
                "target_rank" : 4 }
    }

captions_ext/cap.ext.VER.SPLIT.json

각 요소에는 쿼리 대상 쌍에 대한 보조 주석이 포함된 요소 목록입니다.
보조 주석에 대한 자세한 내용은 지원 문서에서 확인할 수 있습니다. 매트. 비서. 우리 논문의 C.

예시를 보려면 클릭하세요.

    { "pairid" : 12063 , 
    "reference" :   " test1-147-1-img1 " , 
    "target_hard" : " test1-83-0-img1 " , 
    "caption_extend" : { "0" : " being a photo of dogs " , 
                      "1" : " add a big dog " , 
                      "2" : " more focused on the hugging " , 
                      "3" : " background should contain grass " }
    }

image_splits/split.VER.SPLIT.json
- 각 키:값 쌍이 이미지 파일 이름을 img 파일의 상대 경로에 매핑하는 사전입니다. 예:
```
 "test1-147-1-img1" : " ./test1/test1-147-1-img1.png " ,
# or
"train-11041-2-img0" : " ./train/34/train-11041-2-img0.png "
```
- 이미지 파일 이름 및 (열차 분할) 하위 수준 폴더 구조는 NLVR2 데이터세트에서 보존됩니다.
img_feat_<...>/
- 특정 유형의 사전 추출된 이미지 기능이 포함된 폴더로, 각 파일은 하나의 이미지 기능을 저장합니다.
- 파일 이름은 다음과 같이 생성됩니다.
```
 < IMG0_ID > = "test1-147-1-img1.png" . replace ( '.png' , '.pkl' )
```
  이 경우 test1-147-1-img1.pkl 이므로 각 파일을 이름으로 직접 색인화할 수 있습니다.

테스트 분할 평가 서버

우리는 CIRR의 테스트 분할에 대한 실제 정보를 게시하지 않습니다. 대신, 테스트 분할에 대한 결과를 게시하려는 경우 평가 서버가 여기에 호스팅됩니다. 테스트 분할 서버의 기능은 점진적으로 업데이트됩니다.

테스트 분할 서버 지침을 참조하세요.

서버는 CECS ANU에서 독립적으로 호스팅되므로 사이트가 다운되면 이메일을 보내주세요.

특허

우리는 MIT 라이센스에 따라 CIRR 주석에 대한 라이센스를 받았습니다. 자세한 내용은 LICENSE 파일을 참조하세요.
CIRR에 사용된 이미지는 NLVR2 데이터세트에서 가져온 것입니다. 사용자는 서비스 약관의 구속을 받습니다.

소환

귀하의 연구에 도움이 된다면 우리 논문을 인용해 주십시오.

 @InProceedings { Liu_2021_ICCV ,
    author    = { Liu, Zheyuan and Rodriguez-Opazo, Cristian and Teney, Damien and Gould, Stephen } ,
    title     = { Image Retrieval on Real-Life Images With Pre-Trained Vision-and-Language Models } ,
    booktitle = { Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) } ,
    month     = { October } ,
    year      = { 2021 } ,
    pages     = { 2125-2134 }
}