이지데이터버스
v0.4.1
EasyDataverse는 Dataverse 설치를 인터페이스하고 Dataverse 설치 시 제공된 메타데이터 블록 구성과 호환되는 Python 개체를 동적으로 생성하는 데 사용되는 Python 라이브러리입니다. 또한 EasyDataverse를 사용하면 다양한 데이터 형식으로 데이터 세트를 내보내고 가져올 수 있습니다.
다음 명령을 실행하여 EasyDataverse를 시작하세요.
# Using PyPI
pip install easyDataverse
또는 소스별로 빌드
pip install git+https://github.com/gdcc/easyDataverse.git
EasyDataverse는 지정된 Dataverse 설치에 연결하고 모든 메타데이터 필드와 해당 속성을 가져올 수 있습니다. 이를 통해 Dataverse 설치 시 제공된 모든 메타데이터 필드와 해당 속성을 사용하여 데이터세트 개체를 생성할 수 있습니다.
from easyDataverse import Dataverse
# Connect to a Dataverse installation
dataverse = Dataverse (
server_url = "https://demo.dataverse.org" ,
api_token = "MY_API_TOKEN" ,
)
# Initialize a dataset
dataset = dataverse . create_dataset ()
# Fill metadata blocks
dataset . citation . title = "My dataset"
dataset . citation . subject = [ "Other" ]
dataset . citation . add_author ( name = "John Doe" )
dataset . citation . add_dataset_contact ( name = "John Doe" , email = "[email protected]" )
dataset . citation . add_ds_description ( value = "This is a description of the dataset" )
# Upload files or directories
dataset . add_file ( local_path = "./my.file" , dv_dir = "some/dir" )
dataset . add_directory ( dirpath = "./my_directory" , dv_dir = "some/dir" )
# Upload to the dataverse instance
dataset . upload ( "my_dataverse_id" )
EasyDataset을 사용하면 Dataverse 설치에서 데이터세트를 다운로드할 수 있습니다. 다운로드된 데이터 세트는 객체 지향 구조로 표시되며 메타데이터/파일을 업데이트하거나 데이터 세트를 다양한 형식으로 내보내거나 후속 애플리케이션에서 사용할 수 있습니다.
# Method 1: Download a dataset by its DOI
dataverse = Dataverse ( "https://demo.dataverse.org" )
dataset = dataverse . load_dataset (
pid = "doi:10.70122/FK2/W5AGKD" ,
version = "1" ,
filedir = "place/for/data" ,
)
# Method 2: Download via URL
dataset , dataverse = Dataverse . from_ds_url (
url = "https://demo.dataverse.org/dataset.xhtml?persistentId=doi:10.70122/XX/XXXXX&version=DRAFT" ,
api_token = "MY_API_TOKEN"
)
# Display the content of the dataset
print ( dataset )
# Update metadata
dataset . citation . title = "My even nicer dataset"
# Synchronize with the dataverse instance
dataset . update ()
예제 디렉터리에서 전체 예제 노트북을 찾을 수 있습니다. 이 노트북은 EasyDataverse의 기본 개념과 이를 실제로 사용하는 방법을 보여줍니다.
EasyDataverse
는 MIT 라이센스에 따라 라이센스가 부여된 무료 오픈 소스 소프트웨어입니다.