이 확장은 Wikimedia Commons 에서 미디어 파일 (이미지, 비디오, PDF ...)의 (이미지, 비디오, PDF ...)를 편집하려는 OpenRefine 사용자에게 유용한 기능을 제공합니다. Wikimedia Commons의 OpenRefine에 대한 자세한 정보, 문서 및 방법은 https://commons.wikimedia.org/wiki/commons:openrefine을 참조하십시오.
이 확장에 포함 된 기능 :
하나 이상의 Wikimedia Commons 카테고리 에서 파일 이름을로드하여 OpenRefine 프로젝트 시작 (범주 깊이 포함)
각 파일 이름의 Commons 카테고리 및/또는 M-ID가있는 열 추가
프로젝트를 시작할 때 파일 이름이 이미 조정 됩니다.
일부 전용 Grel 명령은 Wikitext의 기본 처리 및 추출을 허용합니다 : extractFromTemplate
및 value.extractCategories
(이 확장자의 0.1.1 릴리스 이상) 기존 Wikimedia Commons 파일의 파일 썸네일 미리보기 에 대한 기본 지원. 일부 (전부는 아님) 파일 유형/확장자에 대해 썸네일이 표시됩니다. 현재 JPEG, GIF, PNG, DJVU, PDF, SVG, Webm 및 OGV 파일에 대한 썸네일 지원이 있습니다.
OpenRefine 3.6.x 및 이후의 OpenRefine 버전 에서 작동합니다. OpenRefine 3.5.x 이상과 호환되지 않습니다. (OpenRefine은 버전 3.6의 Wikimedia Commons 편집을 지원합니다. 이전 버전에서는 불가능합니다.)
이 연장은 2022 년 10 월에 처음 출시되었으며 Wikimedia Project Grant가 자금을 지원했습니다.
이 확장자의 최신 릴리스의 .zip 파일을 다운로드하십시오. 이 파일을 압축하고 압축 된 폴더를 OpenRefine Extensions 폴더에 배치하십시오. OpenRefine의 사용자 설명서에 확장자 설치에 대해 자세히 알아보십시오.
이 확장이 올바르게 설치되면 OpenRefine에서 새 프로젝트를 시작할 때 추가 옵션 'Wikimedia Commons'가 표시됩니다.
이 확장을 설치 한 후 'Wikimedia Commons'옵션을 클릭하여 OpenRefine에서 새 프로젝트를 시작하십시오. 하나 이상의 Wikimedia Commons 카테고리를 추가하라는 메시지가 표시됩니다.
범주를 입력 할 필요가 없습니다 : 접두사.
각 범주 후 입력 필드에서 숫자를 입력하거나 선택하여 범주 깊이를 지정할 수 있습니다. 깊이 0
현재 범주 레벨의 파일만을 의미합니다. 깊이 1
하나의 하위 카테고리 레벨에서 파일을 검색합니다.
다음으로 프로젝트 미리보기 화면 ( Configure parsing options
)에서 각 파일의 M-ID (고유 한 MediaInfo 식별자) 및/또는 커먼즈 카테고리에 열을 포함하도록 선택할 수도 있습니다.
프로젝트가 시작될 때 파일 이름은 이미 조정됩니다.
새 프로젝트에 더 큰 카테고리 (수천 개의 파일)를로드하면 OpenRefine이 느리게 시작하여 메모리 경고를 제공합니다. 이것은 알려진 문제입니다. 조금 기다리십시오. 프로젝트는 결국 시작될 것입니다. 커먼즈 확장은 450,000 개가 넘는 파일 프로젝트로 테스트되었습니다.
Wikimedia Commons Extension은 또한 Wikimedia Commons 파일의 Wikitext에서 특정 정보를 추출하는 데 도움이되는 두 가지 전용 Grel 명령을 가능하게합니다. (Grel, General Refine Expression Langu
먼저 프로젝트의 커먼즈 파일 목록에서 wikitext를 검색하십시오. 조정 된 파일 이름 열의 열 메뉴에서 Edit column
Add column from reconciled values...
선택하고 결과 대화 창에서 Wikitext
선택하십시오.
Wikitext 의이 새로운 열에서 이제 아래에 설명 된대로 값과 범주를 추출 할 수 있습니다. 열 메뉴 에서이 Add column based on this column...
Edit column
> 열을 선택하여 시작하십시오. 다음 대화 상자에서 다양한 특정 GREL 명령을 사용할 수 있습니다.
extractFromTemplate
다음 구문을 사용하십시오.
extractFromTemplate(value, "BHL", "source")[0]
BHL
템플릿의 이름으로 바꾸고 (곱슬 괄호가없는) 값을 추출하려는 매개 변수로 source
. 이 grel 구문은 상기 매개 변수의 첫 번째 (일반적으로 유일한) 값 (예 : https://www.flickr.com/photos/biodivlibrary/10329116385
)을 반환합니다.
value.extractCategories
추출합니다다음 구문을 사용하십시오.
value.extractCategories().join('#')
이 grel 구문은 #
문자로 분리 된 wikitext에 언급 된 모든 범주를 반환 한 다음 필요에 따라 결과 셀을 더 분할하는 데 사용할 수 있습니다.
달리다
mvn package
target
폴더에 zip 파일을 생성 한 다음 OpenRefine에 설치할 수 있습니다.
테스트 할 때마다 해당 디렉토리의 확장을 풀지 않으려면 다른 설정을 사용할 수도 있습니다. OpenRefine의 확장자 폴더 에서이 리포지토리의 로컬 사본까지 상징적 링크를 작성하십시오. 이 설정을 사용하면 확장을 변경할 때 mvn package
실행할 필요가 없지만 Java 파일을 변경하는 경우 mvn compile
로 컴파일하고 파일을 변경하면 OpenRefine을 다시 시작합니다.
master
브랜치에 있는지 확인하고 최신 상태입니다 ( git pull
)
pom.xml
열고 <version>0.1.0</version>
과 같은 원하는 버전 번호로 버전을 설정하십시오.
이러한 변경 사항을 마스터에게 커밋하고 밀어 넣으십시오
git tag -a v0.1.0 -m "Version 0.1.0"
으로 해당 git 태그를 추가하십시오 (Github Desktop에서 작업 할 때이 프로세스를 따르고 설명 Version 0.1.0
으로 v0.1.0
태그를 수동으로 추가 할 수 있습니다).
태그를 github : git push --tags
로 푸시하십시오 (Github 데스크탑에서 다시 밀기)
https://github.com/openrefine/commonsextension/releases/new에서 github에서 새 릴리스를 작성하여 릴리스 제목 (예 : "Commons Extension 0.1.0")을 제공 하고이 릴리스의 기능에 대한 설명을 제공하십시오.
pom.xml
열고 버전을 예상 다음 버전 번호로 설정 한 다음 -SNAPSHOT
설정하십시오. 예를 들어, 0.1.0을 방금 출시 한 경우 <version>0.1.1-SNAPSHOT</version>
설정할 수 있습니다.
그 변화를 저지르고 밀어 넣으십시오.