Biarkan Taotie menjadi penolong Anda untuk mengekstraksi pengetahuan yang bermanfaat dari informasi berisik besar. Ini terdiri dari tiga komponen utama:
Berikut gambaran arsitektur Taotie:
Arsitektur Taotie
Berikut adalah contoh cara menggunakan Taotie untuk berlangganan sumber Twitter, GitHub, dan HTTP, merangkum informasi menggunakan agen LLM, dan menyimpan ringkasan dalam gagasan.
Kode contoh dapat ditemukan dalam contoh/ringkasan_to_notion/example.py.
Situs web yang didukung oleh Taotie dapat dilihat dari https://techtao.super.site/.
Situs web blog yang didukung oleh Taotie
Buat file .env dan tambahkan token API yang diperlukan:
OPENAI_API_KEY= < your OpenAI API key >
# Please follow https://developers.notion.com/docs/create-a-notion-integration.
NOTION_TOKEN= < your Notion API token >
# The id of the page where you want to dump the summary.
NOTION_ROOT_PAGE_ID= < the ID of the page where you want to store the summaries >
# (Optional) Please follow https://developer.twitter.com/en/portal.
TWITTER_BEARER_TOKEN= < your Twitter bearer token >
# (Optional) The list of authors whose papers you care about.
ARXIV_AUTHORS=Yann LeCun,Kaiming He,Ross Girshick,Piotr Dollár,Alec Radford,Ilya Sutskever,Dario Amodei,Geoffrey E. Hinton
Pada akar repositori, jalankan perintah berikut:
# Build the docker image via docker-compose
docker-compose -f examples/summarize_to_notion/docker-compose.yml up
Ketika program berjalan, itu akan berlangganan sumber Twitter, GitHub, dan HTTP, merangkum informasi menggunakan agen LLM, dan menyimpan ringkasan dalam gagasan. Ini juga akan mengatur server HTTP mendengarkan pada port 6543 untuk menerima permintaan ringkasan ad-hoc. Misalnya, Anda dapat menggunakan perintah CURL berikut untuk merangkum posting blog:
curl -X POST -H " Content-Type: application/json " -d ' {"url": "https://www.harmdevries.com/post/model-size-vs-compute-overhead"} ' http://localhost:6543/api/v1/url
Alat yang lebih ramah pengguna belum tersedia. Tetapi Anda dapat menggunakan tukang pos untuk mengirim permintaan.
Catatan: Harap ingat untuk menghentikan wadah setelah beberapa saat. Kalau tidak, tagihan openai Anda akan tumbuh terus menerus.
Output dari contoh Info Summarizer
Dalam gagasan Anda, Anda dapat melihat isinya ditambahkan.
Bookmark ad-hoc
Ringkas halaman web (pos sedang)
Tren GitHub Berlangganan
Klik entri dapat menampilkan detailnya, termasuk grafik pengetahuan yang dirangkum untuk informasi ini.
Ringkas GitHub-Repo (Tren GitHub) Bendera-Data-Sumber memungkinkan Anda untuk menentukan sumber data yang akan digunakan. Ia menerima daftar sumber data yang dipisahkan secara koma. Nilai yang mungkin adalah "http_service", "github", "arxiv", dan "twitter".
python taotie/tools.py report --date-lookback 2 --type-filter arxiv,blog
python taotie/tools.py report --date-lookback 2 --type-filter github-repo
Contoh Laporan
docker rm $(docker ps -a -q) ; docker images | grep '<none>' | awk '{print $3}' | xargs docker rmi