업데이트된 데모가 곧 공개됩니다!
ReVA(Reverse Engineering Assistant)는 리버스 엔지니어링 작업을 위한 디스어셈블러 불가지론 AI 도우미를 구축하는 프로젝트입니다. 여기에는 오프라인 및 온라인 추론과 간단한 아키텍처가 모두 포함됩니다.
ReVa는 도구 기반 접근 방식을 사용한다는 점에서 RE 작업을 위한 AI 보조자를 구축하려는 다른 노력과 다릅니다. REVa는 RE 환경이 일련의 작은 도구를 제공하는 것처럼 LLM에 다양한 작은 도구를 제공하는 것을 목표로 합니다. ReVa는 이러한 접근 방식을 일련의 추론 기술과 결합하여 LLM이 복잡한 작업을 완료할 수 있도록 지원합니다.
LLM에 제공되는 각 도구는 LLM이 사용하기 쉽고 다양한 입력을 허용하며 LLM의 환각을 줄일 수 있도록 구성되었습니다. 우리는 LLM에 스키마를 제공하지만 LLM을 안내하는 설명을 포함하여 다른 입력을 허용하고, 수정 가능한 실수를 다시 LLM으로 리디렉션하고, LLM의 다음 결정을 안내하는 추가 출력을 포함함으로써 이를 수행합니다.
예를 들어 LLM이 RE 도구에서 디컴파일을 요청하면 16진수로 된 원시 주소, 10진수로 된 원시 주소, 네임스페이스가 있는 기호 이름 또는 기호를 허용합니다. LLM이 잘못된 입력을 제공하는 경우 입력을 수정하라는 지침과 함께 이를 LLM에 보고합니다(예를 들어 함수 목록을 사용하도록 권장할 수도 있음). 인간이 탐색하는 것처럼 탐색을 장려하기 위해 우리는 디컴파일과 함께 네임스페이스 및 상호 참조와 같은 추가 컨텍스트를 보고합니다. 이는 LLM이 인간과 동일한 방식으로 바이너리를 탐색하도록 하는 작은 넛지입니다.
이 기술을 사용하면 일반적인 질문을 하고 관련 답변을 얻을 수 있습니다. 모델은 도구의 정보에 우선순위를 두지만, 정보가 없는 경우에도 훈련을 통해 얻은 일반적인 질문에 응답할 수 있습니다.
다음과 같은 질문을 할 수 있습니다:
__mod_init
세그먼트의 목적을 설명하십시오.mmap
무엇을 반환합니까?리버스 엔지니어링의 중요한 부분은 프로세스입니다. 다른 많은 도구는 단순히 LLM에 단일 질문을 하므로 어떤 일이 발생한 이유를 파악하기가 어렵습니다. ReVa에서는 모든 작업을 작은 부분으로 나누고 LLM의 생각을 출력에 포함합니다. 이를 통해 분석가는 LLM의 작업과 추론을 모니터링하고 필요한 경우 프롬프트를 중단하고 변경할 수 있습니다.
RevA는 다양한 모델을 지원하는 langchain을 기반으로 합니다.
내장된 지원은 다음에 대해 제공됩니다.
공급자 설정에 대한 자세한 내용은 구성을 참조하세요.
langchain에서 지원한다면 추가 추론 서버를 추가하는 것은 쉽습니다.
ReVa 구성은 CodeBrowser 도구 옵션에 있습니다. 프로그램을 열고 편집 -> 도구 옵션 -> ReVa로 이동합니다.
다음과 같은 옵션이 있습니다.
공급자를 위한 섹션이 있습니다.
기본적으로 OpenAI 키는 환경 변수 OPENAI_API_KEY
에서 로드됩니다. Ghidra 내부에서 키를 설정할 수도 있습니다. 키를 OPENAI_API_KEY
값으로 다시 설정하면 Ghidra 구성에서 키가 지워지고 환경에서 로드됩니다.
모델을 선택할 수도 있습니다. 기본적으로 gpt-4o
선택됩니다. 이 모델은 ReVa에서 제공하는 도구 및 프롬프트와 가장 잘 작동합니다.
gpt-4
도 잘 작동하지만 속도가 느리고 사용자가 바이너리를 탐색하라는 메시지가 더 많이 필요합니다.
Ollama는 로컬 추론 서버입니다. 기본 서버는 기본 Ollama 포트와 함께 localhost로 설정됩니다. 원격 시스템에서 추론을 수행하려는 경우 이를 원격 서버로 변경할 수 있습니다. 이는 자체 호스팅하는 조직에 유용합니다.
모델을 선택할 수도 있습니다. 모델이 서버에 이미 로드되어 있어야 합니다. 다음과 같은 경우 좋은 성능이 나타났습니다.
mixtral
llama3
phi
RevA에는 두 단계의 작업 흐름이 있습니다.
ReVa는 RE 도구의 확장을 사용하여 분석을 수행합니다. 아래의 Ghidra 지원을 참조하세요.
질문을 하고 추론을 실행하기 위해 명령줄 도구가 제공됩니다. reva-chat
실행하여 채팅 세션을 시작하세요. 이 명령은 열려 있는 Ghidra를 찾아 연결합니다. 새 채팅을 열려면 다른 터미널에서 명령을 다시 실행하세요.
하나 이상의 Ghidra가 열려 있는 경우 reva-chat --project ${project-name}
사용하여 올바른 것을 선택할 수 있습니다. 설정되어 있지 않으면 reva-chat
연결할 프로젝트를 묻습니다.
reva-server
와 확장 간 통신을 위해 gRPC가 사용됩니다. 이에 대한 자세한 내용은 여기(여기)[./DEVELOPER.md]에서 확인할 수 있습니다. 해당 프로토콜 정의에서 소스 파일을 빌드하는 것은 Makefile에서 구동됩니다. 프로토콜 소스 코드 파일을 빌드하려면 프로젝트 루트에서 다음 명령을 실행하세요.
make protocol
먼저 Python 구성요소를 설치합니다. 저는 pipx
사용하는 것을 좋아합니다. 다음과 같이 설치하십시오.
pip install pipx
reverse-engineering-assistant
폴더에서 다음을 실행합니다.
pipx install .
Python 프로젝트를 설치한 후 pipx는 PATH 환경 변수에 폴더를 추가해야 한다는 경고를 표시할 수 있습니다. 폴더(현재 reva-server
및 reva-chat
포함)가 PATH 변수에 있는지 확인하세요. pipx는 다음 명령을 사용하여 이를 수행할 수 있습니다.
pipx ensurepath
확장 프로그램은 reva-server
시작해야 하며 reva-chat
실행해야 합니다. PATH에 추가하지 않으려는 경우 실행 파일 경로를 설정하는 방법에 대한 구성 섹션을 참조하세요.
확장 프로그램에 의해 reva-server
시작되면 다음을 사용하여 채팅을 시작할 수 있습니다.
reva-chat
Ghidra 확장이 작동하려면 Python 패키지를 설치해야 합니다!
ghidra-assistant 플러그인의 지침을 따르세요.
설치 후 CodeBrowser 도구에서 ReVa Plugin
확장을 활성화합니다(파일을 열고 클릭: 파일 -> 구성 -> 기타).
ReVa를 기본적으로 활성화하려면 파일 -> 도구 저장을 클릭하여 구성을 저장하세요.
모든 것이 올바르게 작동하면 메뉴 표시줄에 ReVa 메뉴가 표시됩니다.
Edit -> Tool Options -> ReVa
에서 플러그인 구성을 수정할 수 있습니다.
ReVa가 작업을 수행할 때마다 각 작업에 대한 실행 취소 지점이 생성됩니다. ReVa가 5개의 변수 이름을 바꾸면 한 번의 실행 취소가 됩니다.
ReVa는 CodeBrowser 도구의 창 메뉴에 옵션을 추가합니다. 창 -> ReVa 작업 로그를 선택하여 ReVa 작업 로그 창을 엽니다.
이 창에는 ReVa가 수행한 작업과 수행하려는 작업이 표시됩니다. ✅ 또는 아이콘을 두 번 클릭하여 변경 사항을 수락하거나 거부할 수 있습니다. 주소를 두 번 클릭하면 작업이 수행될 위치로 이동할 수도 있습니다.
작업을 거부하면 ReVa에게 알림이 전달되고 계속 진행됩니다.
ReVa 옵션에서 "자동 허용"을 활성화할 수도 있습니다. 그러면 ReVa가 수행하려는 모든 작업이 자동으로 수락됩니다.
ReVa는 또한 Ghidra UI에 일부 요소를 추가합니다. ReVa에게 채팅 창에서 " main
에서 변수 사용법을 자세히 조사하고 변수 이름을 더 설명적인 이름으로 바꾸세요."라고 요청하거나 메뉴 시스템을 사용할 수 있습니다.
예를 들어 디컴파일에서 변수를 마우스 오른쪽 버튼으로 클릭하고 Reva -> 변수 이름 바꾸기를 선택하면 ReVa가 작업을 수행합니다.
내 작품이 마음에 드나요? 이 프로젝트와 다른 프로젝트를 지원하고 싶으십니까? 이 프로젝트가 어떻게 설계되고 구축되었는지 궁금하십니까? 이 프로젝트와 다른 많은 프로젝트는 https://twitch.tv/cyberkaida 내 스트림에서 실시간으로 제작되었습니다!