Kopilot AI Sumber Terbuka untuk Pembuatan Saluran Data yang Mudah
Fitur Utama
- Antarmuka bergaya notebook dengan kemampuan obrolan di UI web : Kerjakan saluran data Anda di antarmuka notebook Jupyter yang familier, sementara kopilot AI membantu dan memandu Anda dengan membuat, mengeksekusi, dan men-debug kode rekayasa data selama proses berlangsung.
- Tanpa vendor lock-in : Bangun jalur data Anda dengan tumpukan data apa pun pilihan Anda, dan pilih LLM yang Anda sukai untuk kopilot Anda, dengan fleksibilitas penuh.
- Dapat disesuaikan sepenuhnya : Bagi saluran Anda menjadi beberapa komponen—seperti pergerakan data, transformasi, dan lainnya—dan sesuaikan setiap komponen dengan kebutuhan spesifik Anda. Penyambungan kemudian dengan mulus merakit komponen-komponen ini menjadi saluran data yang lengkap dan fungsional.
- Aman dan mudah dikelola : Penyambungan Host pada infrastruktur Anda sendiri, dengan kontrol penuh atas data dan LLM Anda. Data dan kunci rahasia Anda tidak pernah dibagikan dengan penyedia LLM kapan pun.
Mulai Cepat
Cara termudah untuk menjalankan Splicing adalah di Docker:
Instal Docker.
Jalankan perintah berikut untuk menjalankan Splicing:
docker run -v $( pwd ) /.splicing:/app/.splicing
-p 3000:3000
-p 8000:8000
-it --rm splicingai/splicing:latest
Secara default, semua data aplikasi disimpan di folder ./.splicing
dalam direktori saat ini tempat Anda menjalankan perintah di atas. Jika Anda ingin menyimpan data, pastikan untuk membuat cadangan folder ini.
- Navigasikan ke http://localhost:3000/ untuk mengakses UI web.
Anda juga dapat menginstal Splicing tanpa Docker untuk pengembangan dengan mengikuti instruksi di panduan KONTRIBUSI.
Peta jalan
- Penerapan jalur pipa data : Mendukung penerapan jalur pipa data ke lingkungan produksi Anda dengan pengalaman push-to-deploy.
- Lebih banyak komponen saluran data : Dukungan untuk komponen yang lebih penting dalam saluran data, seperti pemeriksaan kualitas data dan silsilah data.
- Integrasi lainnya :
- Dukungan untuk berbagai integrasi data dalam saluran data (misalnya, berbagai sumber data dan gudang).
- Mendukung lebih banyak LLM sebagai kopilot (misalnya, Claude dan model lokal).
- Merampingkan struktur kode sumber, sehingga memudahkan komunitas untuk menambahkan integrasi.
- Kopilot yang lebih cerdas : Meningkatkan kopilot dengan lebih banyak kemampuan, seperti secara otomatis menghasilkan model semantik dan diagram ER untuk data di gudang, sehingga memudahkan pembuatan jalur data.
Sumber daya
- Dokumentasi
- Demo
- Masyarakat
Tumpukan Teknologi
- Bagian depan: Next.js, Tailwind CSS, dan Shadcn
- Bagian Belakang: FastAPI dan Redis
- Kerangka kerja agen: LangGraph
Berkontribusi
Silakan merujuk ke CONTRIBUTING.md untuk lebih jelasnya.
FAQ
Apa kasus penggunaan utama Penyambungan?
Penyambungan membantu dalam membangun alur data, termasuk tugas-tugas seperti penyerapan data, transformasi, dan orkestrasi, untuk mempersiapkan data Anda untuk proses hilir seperti analisis data dan pembelajaran mesin.
Untuk Siapa Penyambungan?
Penyambungan dirancang untuk teknisi data, ilmuwan data, dan siapa saja yang perlu membangun saluran data. Bahkan jika Anda memiliki pengalaman rekayasa data yang terbatas, AI Copilot Splicing akan memandu Anda langkah demi langkah, dan Anda dapat meminta bantuan kapan saja menggunakan bahasa alami.
Apa perbedaan Splicing dengan alat pembuat kode dan kopilot AI lainnya?
Penyambungan dirancang khusus untuk rekayasa data, bidang dengan banyak pilihan kompleks yang belum sepenuhnya mengadopsi AI generatif untuk produktivitas. Tidak seperti alat umum, Splicing berfokus pada pengoptimalan model bahasa untuk langkah-langkah tetap yang umum dalam saluran data. Ini juga sangat terintegrasi dengan sumber data dan alat, memungkinkan kopilot memahami konteks proyek Anda—konfigurasi, data, dan lainnya—menghasilkan pembuatan kode yang lebih akurat dan berguna dibandingkan dengan kopilot tujuan umum.
Seberapa amankah Penyambungan? Apakah data saya akan dibagikan?
Penyambungan bersifat open-source dan dapat dihosting di infrastruktur Anda sendiri. Data dan kunci rahasia Anda tidak pernah sengaja dibagikan kepada kami atau penyedia LLM mana pun. Selain itu, Splicing Copilot tidak secara otomatis mengeksekusi kode yang dihasilkan—Anda mengontrol kapan dan bagaimana kode tersebut dijalankan.
Bisakah saya menjalankan pipeline data yang dibuat dengan Splicing di tempat lain?
Ya! Penyambungan menghasilkan kode menggunakan integrasi dan alat data pilihan Anda. Anda dapat mengekspor kode dengan satu klik dan menjalankan atau menerapkannya di mana pun Anda suka. Tidak ada penguncian vendor.