สาธิตสด | วิดีโอสาธิต
ข่าว | คำอธิบาย |
---|---|
การเปิดตัว Kaggle Scenario | เราเปิดตัว Kaggle Agent ลองใช้คุณสมบัติใหม่! |
การเปิดตัวกลุ่ม WeChat อย่างเป็นทางการ | เราได้สร้างกลุ่ม WeChat ยินดีต้อนรับเข้าร่วม! (?คิวอาร์โค้ด) |
การเปิดตัว Discord อย่างเป็นทางการ | เราเปิดตัวช่องทางแชทแรกของเราใน Discord (?) |
เปิดตัวครั้งแรก | RDAgent เปิดตัวบน GitHub |
RDAgent มุ่งหวังที่จะทำให้กระบวนการ R&D ทางอุตสาหกรรมมีความสำคัญและมีคุณค่ามากที่สุดโดยอัตโนมัติ และเราเริ่มต้นด้วยการมุ่งเน้นไปที่สถานการณ์ที่ขับเคลื่อนด้วยข้อมูลเพื่อปรับปรุงการพัฒนาแบบจำลองและข้อมูล ในทางระเบียบวิธี เราได้ระบุกรอบการทำงานที่มีองค์ประกอบหลักสองส่วน: 'R' สำหรับการนำเสนอแนวคิดใหม่ๆ และ 'D' สำหรับการนำแนวคิดเหล่านั้นไปปฏิบัติ เราเชื่อว่าวิวัฒนาการอัตโนมัติของการวิจัยและพัฒนาจะนำไปสู่การแก้ปัญหาที่มีมูลค่าทางอุตสาหกรรมที่สำคัญ
การวิจัยและพัฒนาเป็นสถานการณ์ทั่วไป การถือกำเนิดของ RDAgent อาจเป็นของคุณ
Automatic Quant Factory (?วิดีโอสาธิต|
ยูทูบ)
Data Mining Agent: การนำเสนอข้อมูลและแบบจำลองซ้ำๆ (?วิดีโอสาธิต 1|
YouTube) (?วิดีโอสาธิต 2|
YouTube) และนำไปปฏิบัติโดยได้รับความรู้จากข้อมูล
Research Copilot: อ่านเอกสารวิจัยอัตโนมัติ (?วิดีโอสาธิต|
YouTube) / รายงานทางการเงิน (?วิดีโอสาธิต|
YouTube) และใช้โครงสร้างโมเดลหรือการสร้างชุดข้อมูล
Kaggle Agent: การปรับแต่งโมเดลรถยนต์และวิศวกรรมฟีเจอร์ (?วิดีโอสาธิตจะมาเร็วๆ นี้...) และนำไปใช้เพื่อให้บรรลุเป้าหมายมากขึ้นในการแข่งขัน
-
คุณสามารถคลิกลิงก์ด้านบนเพื่อดูการสาธิต เรากำลังเพิ่มวิธีการและสถานการณ์จำลองให้กับโครงการอย่างต่อเนื่องเพื่อปรับปรุงกระบวนการ R&D ของคุณและเพิ่มประสิทธิภาพการผลิต
นอกจากนี้ คุณสามารถดูตัวอย่างโดยละเอียดได้ใน ⁉️ การสาธิตสด ของเรา
คุณสามารถลองสาธิตข้างต้นได้โดยใช้คำสั่งต่อไปนี้:
ผู้ใช้จะต้องตรวจสอบให้แน่ใจว่าได้ติดตั้ง Docker ก่อนที่จะลองใช้สถานการณ์ส่วนใหญ่ โปรดดูที่หน้า ?Docker อย่างเป็นทางการสำหรับคำแนะนำในการติดตั้ง
สร้างสภาพแวดล้อม conda ใหม่ด้วย Python (3.10 และ 3.11 ได้รับการทดสอบอย่างดีใน CI ของเรา):
conda สร้าง -n rdagent python=3.10
เปิดใช้งานสภาพแวดล้อม:
conda เปิดใช้งาน rdagent
คุณสามารถติดตั้งแพ็คเกจ RDAgent ได้โดยตรงจาก PyPI:
pip ติดตั้ง rdagent
คุณต้องกำหนดค่าโมเดล GPT ของคุณใน .env
แมว << EOF > .envOPENAI_API_KEY=# EMBEDDING_MODEL=text-embedding-3-smallCHAT_MODEL=gpt-4-turboEOF
?️ Live Demo ถูกนำมาใช้โดยคำสั่งต่อไปนี้ (แต่ละรายการแสดงถึงหนึ่งการสาธิต คุณสามารถเลือกรายการที่คุณต้องการได้):
เรียกใช้ การซื้อขายเชิงปริมาณอัตโนมัติและการพัฒนาปัจจัยซ้ำ : ข้อเสนอปัจจัยลูปตัวเองของ Qlib และแอปพลิเคชันการใช้งาน
rdagent fin_factor
เรียกใช้ การซื้อขายเชิงปริมาณอัตโนมัติและวิวัฒนาการโมเดลซ้ำ : ข้อเสนอโมเดลลูปตัวเองของ Qlib และแอปพลิเคชันการใช้งาน
rdagent fin_model
เรียกใช้ วิวัฒนาการแบบจำลองการทำนายทางการแพทย์แบบอัตโนมัติ : ข้อเสนอแบบจำลองวงรอบตัวเองทางการแพทย์และแอปพลิเคชันการใช้งาน
(1) สมัครบัญชีที่ PhysioNet
(2) ขอเข้าถึงข้อมูลที่ประมวลผลล่วงหน้า FIDDLE: ชุดข้อมูล FIDDLE
(3) ใส่ชื่อผู้ใช้และรหัสผ่านของคุณใน.env
แมว << EOF >> .envDM_USERNAME=<ชื่อผู้ใช้ของคุณ>DM_PASSWORD=<รหัสผ่านของคุณ>EOF
rdagent med_model
เรียกใช้ การซื้อขายเชิงปริมาณอัตโนมัติและการแยกปัจจัยจากรายงานทางการเงิน : เรียกใช้แอปพลิเคชันการแยกปัจจัย Qlib และการใช้งานตามรายงานทางการเงิน
# 1 โดยทั่วไป คุณสามารถเรียกใช้สถานการณ์นี้ได้โดยใช้คำสั่งต่อไปนี้:rdagent fin_factor_report --report_folder=<เส้นทางโฟลเดอร์รายงานทางการเงินของคุณ># 2 โดยเฉพาะอย่างยิ่ง คุณจำเป็นต้องเตรียมรายงานทางการเงินบางส่วนก่อน คุณสามารถทำตามตัวอย่างที่เป็นรูปธรรมนี้:wget https://github.com/SunsetWolf/rdagent_resource/releases/download/reports/all_reports.zip คลายซิป all_reports.zip -d git_ignore_folder/reports rdagent fin_factor_report --report_folder=git_ignore_folder/รายงาน
เรียกใช้ Copilot การวิจัยและพัฒนาโมเดลอัตโนมัติ : การแยกโมเดลและแอปพลิเคชันการใช้งาน
# 1. โดยทั่วไป คุณสามารถเรียกใช้เอกสาร/รายงานของคุณเองได้ด้วยคำสั่งต่อไปนี้:rdagent General_model# 2 โดยเฉพาะอย่างยิ่ง คุณสามารถทำเช่นนี้ได้ สำหรับรายละเอียดเพิ่มเติมและตัวอย่างเอกสารเพิ่มเติม ให้ใช้ `rdagent General_model -h`:rdagent General_model "https://arxiv.org/pdf/2210.09789"
เรียกใช้ Automated Kaggle Model Tuning & Feature Engineering : ข้อเสนอโมเดล self-loop และแอปพลิเคชันการใช้งานด้านวิศวกรรมฟีเจอร์
หมายเหตุ : แอปพลิเคชันนี้จะดาวน์โหลดข้อมูลการแข่งขัน Kaggle โดยอัตโนมัติ เว้นแต่คุณจะเตรียมข้อมูลไว้ในเครื่อง หากคุณไม่มีข้อมูลในเครื่อง คุณจะต้องกำหนดค่า Kaggle API และยอมรับกฎการแข่งขันที่เกี่ยวข้องบนเว็บไซต์ Kaggle
# 1. ชื่อการแข่งขันจะต้องตรงกับชื่อที่ใช้กับ API บนแพลตฟอร์ม Kaggle.rdagent kaggle --competition [ชื่อการแข่งขันของคุณ]# 2. โดยเฉพาะคุณสามารถกรอกชื่อการแข่งขันได้ดังนี้:# ดาวน์โหลดการแข่งขัน ไฟล์คำอธิบายไปยังไดเร็กทอรีในเครื่องของคุณ wget https://github.com/SunsetWolf/rdagent_resource/releases/download/kaggle_data/kaggle_data.zip# คลายซิปไฟล์ลงในเครื่องของคุณ directoryunzip kaggle_data.zip -d /your/local/directory/kaggle_data# ตั้งค่าตัวแปรสภาพแวดล้อมexport LOCAL_DATA_PATH=/your/local/directory/kaggle_data/kaggle # เรียกใช้แอปพลิเคชันrdagent kaggle --competition sf-crime
รายชื่อการแข่งขันที่มีอยู่สามารถพบได้ที่นี่
สำหรับรายละเอียดเพิ่มเติม คุณสามารถดูคำแนะนำตัวอย่างได้
คุณสามารถให้บริการแอปสาธิตของเราเพื่อตรวจสอบลูป RD ได้โดยการรันคำสั่งต่อไปนี้:
rdagent ui --port 80 --log_dir <โฟลเดอร์บันทึกของคุณเช่น "log/">
เราได้ใช้ RD-Agent กับสถานการณ์ทางอุตสาหกรรมที่ขับเคลื่อนด้วยข้อมูลอันทรงคุณค่าหลายสถานการณ์
ในโครงการนี้ เรามีเป้าหมายที่จะสร้างตัวแทนเพื่อทำให้การวิจัยและพัฒนาที่ขับเคลื่อนด้วยข้อมูลเป็นแบบอัตโนมัติ
อ่านเนื้อหาจากโลกแห่งความเป็นจริง (รายงาน เอกสาร ฯลฯ) และ แยก สูตรสำคัญ คำอธิบาย คุณลักษณะ และ โมเดล ที่สนใจ ซึ่งเป็นองค์ประกอบสำคัญของ R&D ที่ขับเคลื่อนด้วยข้อมูล
ใช้ สูตรที่แยกออกมา (เช่น คุณลักษณะ ปัจจัย และแบบจำลอง) ในโค้ดที่รันได้
เนื่องจากความสามารถที่จำกัดของ LLM ในการดำเนินการในครั้งเดียว โปรดสร้างกระบวนการพัฒนาสำหรับตัวแทนเพื่อปรับปรุงประสิทธิภาพโดยการเรียนรู้จากคำติชมและความรู้
เสนอ แนวคิดใหม่ ตามความรู้และการสังเกตในปัจจุบัน
ในสองประเด็นสำคัญของสถานการณ์ที่ขับเคลื่อนด้วยข้อมูล การใช้แบบจำลองและการสร้างข้อมูล ระบบของเรามีเป้าหมายที่จะให้บริการสองบทบาทหลัก: ?ผู้ควบคุมและ ?ตัวแทน
?Copilot ปฏิบัติตามคำสั่งของมนุษย์เพื่อทำงานที่ซ้ำกันโดยอัตโนมัติ
?ตัวแทนมีความเป็นอิสระมากขึ้น จึงเสนอแนวคิดอย่างแข็งขันเพื่อผลลัพธ์ที่ดีกว่าในอนาคต
สถานการณ์ที่รองรับมีดังต่อไปนี้:
สถานการณ์/เป้าหมาย | การนำแบบจำลองไปใช้ | การสร้างข้อมูล |
---|---|---|
การเงิน | เสนอแนวคิดและพัฒนาอย่างต่อเนื่อง | เสนอแนวคิดและพัฒนาอย่างต่อเนื่อง การอ่านและการใช้งานรายงานอัตโนมัติ |
ทางการแพทย์ | เสนอแนวคิดและพัฒนาอย่างต่อเนื่อง | - |
ทั่วไป | การอ่านและการใช้งานกระดาษอัตโนมัติ การปรับแต่งโมเดล Kaggle อัตโนมัติ | Auto Kaggle มีคุณสมบัติทางวิศวกรรม |
RoadMap : ขณะนี้เรากำลังทำงานอย่างหนักเพื่อเพิ่มคุณสมบัติใหม่ให้กับสถานการณ์ Kaggle
สถานการณ์ที่แตกต่างกันจะแตกต่างกันไปในทางเข้าและการกำหนดค่า โปรดตรวจสอบบทช่วยสอนการตั้งค่าโดยละเอียดในเอกสารสถานการณ์
นี่คือแกลเลอรีของการสำรวจที่ประสบความสำเร็จ (5 ร่องรอยที่แสดงใน ?? Live Demo ) คุณสามารถดาวน์โหลดและดูการติดตามการดำเนินการได้โดยใช้คำสั่งด้านล่าง:
rdagent ui --พอร์ต 80 --log_dir ./demo_traces
โปรดดูที่ ?readthedocs_scen สำหรับรายละเอียดเพิ่มเติมของสถานการณ์
การทำให้กระบวนการ R&D เป็นอัตโนมัติในสาขาวิทยาศาสตร์ข้อมูลถือเป็นสาขาที่มีคุณค่าสูงแต่ยังไม่มีการสำรวจในอุตสาหกรรม เราเสนอกรอบการทำงานเพื่อผลักดันขอบเขตของสาขาการวิจัยที่สำคัญนี้
คำถามการวิจัยภายในกรอบนี้สามารถแบ่งออกเป็นสามประเภทหลัก:
พื้นที่วิจัย | กระดาษ/รายการงาน |
---|---|
เปรียบเทียบความสามารถในการวิจัยและพัฒนา | เกณฑ์มาตรฐาน |
ข้อเสนอแนวคิด: สำรวจแนวคิดใหม่หรือปรับแต่งแนวคิดที่มีอยู่ | วิจัย |
ความสามารถในการตระหนักถึงแนวคิด: นำไปใช้และดำเนินการตามแนวคิด | การพัฒนา |
เราเชื่อว่ากุญแจสำคัญในการนำเสนอโซลูชั่นคุณภาพสูงอยู่ที่ความสามารถในการพัฒนาขีดความสามารถด้านการวิจัยและพัฒนา เจ้าหน้าที่ควรเรียนรู้เหมือนผู้เชี่ยวชาญที่เป็นมนุษย์ โดยพัฒนาทักษะด้านการวิจัยและพัฒนาอย่างต่อเนื่อง
สามารถดูเอกสารเพิ่มเติมได้ที่ ? อ่านเอกสาร
สู่การวิจัยและพัฒนาอัตโนมัติที่เน้นข้อมูลเป็นศูนย์กลาง
@misc{chen2024datacentric,title={มุ่งสู่การวิจัยและพัฒนาอัตโนมัติที่เน้นข้อมูลเป็นหลัก},ผู้เขียน={Haotian Chen และ Xinjie Shen และ Zeqi Ye และ Wenjun Feng และ Haoxue Wang และ Xiao Yang และ Xu Yang และ Weiqing Liu และ Jiang Bian},year={2024},eprint={2404.11276},archivePrefix={arXiv},primaryClass={cs.AI}}
ในกระบวนการวิจัยและพัฒนารายวันของผู้เชี่ยวชาญด้านการทำเหมืองข้อมูล พวกเขาเสนอสมมติฐาน (เช่น โครงสร้างแบบจำลอง เช่น RNN สามารถจับรูปแบบในข้อมูลอนุกรมเวลา) การทดลองออกแบบ (เช่น ข้อมูลทางการเงินมีอนุกรมเวลา และเราสามารถตรวจสอบสมมติฐานได้ ในสถานการณ์นี้) ใช้งานการทดลองเป็นโค้ด (เช่น โครงสร้างโมเดล Pytorch) จากนั้นจึงรันโค้ดเพื่อรับผลตอบรับ (เช่น ตัวชี้วัด เส้นโค้งการสูญเสีย ฯลฯ) ผู้เชี่ยวชาญจะเรียนรู้จากความคิดเห็นและปรับปรุงในการทำซ้ำครั้งถัดไป
ตามหลักการข้างต้น เราได้กำหนดกรอบวิธีการพื้นฐานที่เสนอสมมติฐาน ยืนยัน และรับคำติชมจากการปฏิบัติในโลกแห่งความเป็นจริงอย่างต่อเนื่อง นี่เป็นกรอบการทำงานอัตโนมัติสำหรับการวิจัยทางวิทยาศาสตร์กรอบแรกที่รองรับการเชื่อมโยงกับการตรวจสอบในโลกแห่งความเป็นจริง
สำหรับรายละเอียดเพิ่มเติม โปรดดูที่ ⁉️ หน้าสาธิตสด ของเรา
กลยุทธ์การพัฒนาความร่วมมือเพื่อการพัฒนาที่เน้นข้อมูลเป็นศูนย์กลางโดยอัตโนมัติ
@misc{yang2024collaborative,title={กลยุทธ์การพัฒนาความร่วมมือเพื่อการพัฒนาที่เน้นข้อมูลเป็นศูนย์กลางโดยอัตโนมัติ},ผู้เขียน={Xu Yang และ Haotian Chen และ Wenjun Feng และ Haoxue Wang และ Zeqi Ye และ Xinjie Shen และ Xiao Yang และ Shizhao Sun และ Weiqing Liu และ Jiang Bian},year={2024},eprint={2407.18690},archivePrefix={arXiv},primaryClass={cs.AI}}
โครงการนี้ยินดีรับการสนับสนุนและข้อเสนอแนะ การมีส่วนร่วมในโครงการนี้ตรงไปตรงมาและคุ้มค่า ไม่ว่าจะเป็นการแก้ปัญหา การแก้ไขจุดบกพร่อง การปรับปรุงเอกสารประกอบ หรือแม้แต่การแก้ไขการพิมพ์ผิด ทุกการสนับสนุนล้วนมีคุณค่าและช่วยปรับปรุง RDAgent
ในการเริ่มต้น คุณสามารถสำรวจรายการปัญหาหรือค้นหา TODO:
ความคิดเห็นใน codebase โดยการรันคำสั่ง grep -r "TODO:"
ก่อนที่เราจะเปิดตัว RD-Agent เป็นโปรเจ็กต์โอเพ่นซอร์สบน GitHub มันเป็นโปรเจ็กต์ภายในภายในกลุ่มของเรา น่าเสียดายที่ประวัติการคอมมิตภายในไม่ได้ถูกเก็บรักษาไว้เมื่อเราลบโค้ดที่เป็นความลับบางส่วนออก ด้วยเหตุนี้ การมีส่วนร่วมบางส่วนจากสมาชิกในกลุ่มของเรา รวมถึง Haotian Chen, Wenjun Feng, Haoxue Wang, Zeqi Ye, Xinjie Shen และ Jinhui Li จึงไม่รวมอยู่ในข้อผูกพันสาธารณะ
ตัวแทน RD ได้รับการจัดเตรียมให้ "ตามสภาพ" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย รวมถึงแต่ไม่จำกัดเฉพาะการรับประกันความสามารถเชิงพาณิชย์ ความเหมาะสมสำหรับวัตถุประสงค์เฉพาะ และการไม่ละเมิด ตัวแทน RD มีวัตถุประสงค์เพื่ออำนวยความสะดวกในกระบวนการวิจัยและพัฒนาในอุตสาหกรรมการเงิน และไม่พร้อมใช้งานสำหรับการลงทุนหรือคำแนะนำทางการเงินใดๆ ผู้ใช้จะต้องประเมินและทดสอบความเสี่ยงของตัวแทน RD อย่างอิสระในสถานการณ์การใช้งานเฉพาะ ตรวจสอบให้แน่ใจว่ามีการใช้เทคโนโลยี AI อย่างมีความรับผิดชอบ รวมถึงแต่ไม่จำกัดเพียงการพัฒนาและบูรณาการมาตรการลดความเสี่ยง และปฏิบัติตามกฎหมายและข้อบังคับที่บังคับใช้ทั้งหมดในทุกที่ที่เกี่ยวข้อง เขตอำนาจศาล ตัวแทน RD ไม่ได้ให้ความเห็นทางการเงินหรือสะท้อนความคิดเห็นของ Microsoft และไม่ได้ออกแบบมาเพื่อแทนที่บทบาทของผู้เชี่ยวชาญด้านการเงินที่มีคุณสมบัติเหมาะสมในการกำหนด ประเมิน และอนุมัติผลิตภัณฑ์ทางการเงิน อินพุตและเอาท์พุตของตัวแทน RD เป็นของผู้ใช้และผู้ใช้จะต้องรับผิดทั้งหมดภายใต้ทฤษฎีความรับผิดใดๆ ไม่ว่าจะเป็นในสัญญา การละเมิด กฎระเบียบ ความประมาทเลินเล่อ ความรับผิดต่อผลิตภัณฑ์ หรืออื่นๆ ที่เกี่ยวข้องกับการใช้ตัวแทน RD และ อินพุตและเอาต์พุตใด ๆ ของมัน