ontgpt 로고" style="최대 너비: 100%;">
ontogpt 는 LLM(대형 언어 모델), 명령 프롬프트 및 온톨로지 기반 기반을 사용하여 텍스트에서 구조화된 정보를 추출하기 위한 Python 패키지입니다.
자세한 내용은 전체 설명서를 참조하세요.
ontogpt 명령줄에서 실행되지만 최소한의 웹 앱 인터페이스도 있습니다(아래 Web Application
섹션 참조).
Python 3.9 이상이 설치되어 있는지 확인하세요.
pip
로 설치:
pip install ontogpt
OpenAI API 키를 설정합니다.
runoak set-apikey -e openai < your openai api key >
모든 ontogpt 명령 목록을 확인하세요.
ontogpt --help
정보 추출의 간단한 예를 시도해 보세요.
echo " One treatment for high blood pressure is carvedilol. " > example.txt
ontogpt extract -i example.txt -t drug
ontogpt 필요한 온톨로지를 검색하고 결과를 명령줄에 출력합니다. 출력은 extracted_object
제목 아래에 추출된 모든 객체를 제공합니다.
ontogpt 실행하고 결과를 보기 위한 기본 웹 애플리케이션이 있습니다.
먼저 다음 명령을 실행하여 pip
로 필요한 종속성을 설치합니다.
pip install ontogpt [web]
그런 다음 이 명령을 실행하여 웹 애플리케이션을 시작합니다.
web- ontogpt
참고: 인증 없이 이 웹앱을 공개적으로 호스팅하지 않는 것이 좋습니다.
ontogpt litellm
패키지(https://litellm.vercel.app/)를 사용하여 LLM과 인터페이스합니다.
이는 OpenAI, Azure, Anthropic, Mistral, Replicate 등을 포함한 대부분의 API가 지원된다는 것을 의미합니다.
사용할 모델 이름은 ontogpt list-models
명령에서 찾을 수 있습니다. --model
옵션과 함께 첫 번째 열의 이름을 사용하세요.
대부분의 경우 위와 같이 특정 서비스에 대한 API 키를 설정해야 합니다.
runoak set-apikey -e anthropic-key < your anthropic api key >
Azure를 통한 OpenAI 모델과 같은 일부 엔드포인트에는 추가 세부 정보를 설정해야 합니다. 다음과 같이 유사하게 설정할 수 있습니다.
runoak set-apikey -e azure-key < your azure api key >
runoak set-apikey -e azure-base < your azure endpoint url >
runoak set-apikey -e azure-version < your azure api version, e.g. " 2023-05-15 " >
이러한 세부 정보는 다음과 같이 환경 변수로 설정될 수도 있습니다.
export AZURE_API_KEY= " my-azure-api-key "
export AZURE_API_BASE= " https://example-endpoint.openai.azure.com "
export AZURE_API_VERSION= " 2023-05-15 "
개방형 LLM은 ollama
패키지(https://ollama.com/)를 통해 검색하고 실행할 수 있습니다.
ollama
설치해야 하며(GitHub 저장소 참조) ollama serve
또는 sudo systemctl start ollama
와 같은 명령을 사용하여 서비스로 시작해야 할 수도 있습니다.
그런 다음 ollama pull <modelname>
사용하여 모델을 검색합니다(예: ollama pull llama3
.
모델은 --model
옵션과 함께 ollama/
접두사(예: ollama/llama3
를 이름 앞에 붙여 ontogpt 에서 사용할 수 있습니다.
일부 ollama 모델은 ontogpt list-models
에 나열되지 않을 수 있지만 다운로드된 LLM의 전체 목록은 ollama list
명령을 사용하여 볼 수 있습니다.
ontogpt 의 기능은 테스트 데이터에서 평가되었습니다. 이러한 평가와 이를 재현하는 방법에 대한 자세한 내용은 전체 설명서를 참조하세요.
ontogpt , SPIRES에서 사용되는 정보 추출 접근 방식은 Caufield JH, Hegde H, Emonet V, Harris NL, Joachimiak MP, Matentzoglu N, et al에 자세히 설명되어 있습니다. SPIRES(Structured Prompt Interrogation and Recursive Extraction of Semantics): 제로샷 학습을 사용하여 지식 기반을 채우는 방법입니다. Bioinformatics , 40권, 3호, 2024년 3월, btae104, https://doi.org/10.1093/bioinformatics/btae104.
이 프로젝트는 Monarch Initiative의 일부입니다. 또한 이 연구 프로젝트를 지원해 주신 Bosch Research에 감사드립니다.