警告:这是一个学术概念验证原型,尚未经过仔细的代码审查。此实现尚未准备好用于生产使用。
点
该项目旨在创建一个平台,使用户能够对机器学习模型进行私人基准测试。该平台有助于根据模型所有者和数据集所有者之间的不同信任级别来评估模型。
该存储库提供了论文的随附代码 https://arxiv.org/abs/2403.00393
休战:私人基准测试以防止污染并改善法学硕士的比较评估
Tanmay Rajore、Nishanth Chandran、Sunayana Sitaram、Divya Gupta、Rahul Sharma、Kashish Mittal、Manohar Swaminathan
完整的构建和 EzPC LLM 支持
(In setup.sh)
line 42: export CUDA_VERSION=11.8
line 43: export GPU_ARCH=90
./setup.sh
Enter the Server IP address:
只有平台
pip install -r requirements.txt
cd eval_website/eval_website
python manage.py makemigrations
python manage.py migrate
python manage.py runserver 0.0.0.0:8000
安装后要使用该项目,请访问。
http://127.0.0.1:8000(在本地主机上)或 http://
某些端口预先分配如下:
cd utils/TTP_TEE_files
python ttp_server.py
openssl req -newkey rsa:2048 -nodes -keyout " ./server.key " -out server.csr -subj /CN=127.0.0.1
openssl x509 -req -in server.csr -CA path/ca.crt(generated by eval_website root) -CAkey /path/ca.key(generated by eval_website root) -CAcreateserial -out ./server.crt -days xxx
export ENCRYPTION_KEY="32 bytes key"
#generate a 32 bytes key using the following command
python -c 'import os, binascii; print(binascii.hexlify(os.urandom(32)).decode("utf-8"))'
目前EzPC支持以下机型
有关如何使用 EzPC LLM 的更多信息,请参阅 EzPC LLM。
生成表格的论文的工件评估可以在工件评估中找到。
如果您想为此项目做出贡献,请遵循contributing.md 文件中概述的指南。
该项目已获得 [MIT] 许可。请参阅许可证文件以获取更多信息。