ดาวน์โหลด candle - ดาวน์โหลดซอร์สโค้ด candle

candle

ซอร์สโค้ดอื่น ๆ

ดาวน์โหลด

เทียน

Candle เป็นเฟรมเวิร์ก ML ที่เรียบง่ายสำหรับ Rust โดยเน้นไปที่ประสิทธิภาพ (รวมถึงการรองรับ GPU) และความสะดวกในการใช้งาน ลองสาธิตออนไลน์ของเรา: กระซิบ, LLaMA2, T5, yolo, เซ็กเมนต์อะไรก็ได้

เริ่มต้นเลย

ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง candle-core อย่างถูกต้องตามที่อธิบายไว้ใน การติดตั้ง

มาดูวิธีการคูณเมทริกซ์อย่างง่ายกัน เขียนสิ่งต่อไปนี้ลงในไฟล์ myapp/src/main.rs ของคุณ:

 use candle_core :: { Device , Tensor } ;

fn main ( ) -> Result < ( ) , Box < dyn std :: error :: Error > > {
    let device = Device :: Cpu ;

    let a = Tensor :: randn ( 0f32 , 1. , ( 2 , 3 ) , & device ) ? ;
    let b = Tensor :: randn ( 0f32 , 1. , ( 3 , 4 ) , & device ) ? ;

    let c = a . matmul ( & b ) ? ;
    println ! ( "{c}" ) ;
    Ok ( ( ) )
}

cargo run ควรแสดงเทนเซอร์ของรูปร่าง Tensor[[2, 4], f32]

เมื่อติดตั้ง candle พร้อมรองรับ Cuda แล้ว เพียงกำหนด device ให้อยู่บน GPU:

 - let device = Device::Cpu;
+ let device = Device::new_cuda(0)?;

สำหรับตัวอย่างขั้นสูงเพิ่มเติม โปรดดูที่ส่วนต่อไปนี้

ลองดูตัวอย่างของเรา

การสาธิตออนไลน์เหล่านี้ทำงานในเบราว์เซอร์ของคุณทั้งหมด:

yolo: การประมาณค่าและการจดจำวัตถุ
กระซิบ: การรู้จำเสียงพูด
LLaMA2: การสร้างข้อความ
T5: การสร้างข้อความ
Phi-1.5 และ Phi-2: การสร้างข้อความ
แบ่งส่วนโมเดลอะไรก็ได้: การแบ่งส่วนรูปภาพ
BLIP: คำบรรยายภาพ

นอกจากนี้เรายังจัดเตรียมตัวอย่างตามบรรทัดคำสั่งโดยใช้โมเดลล้ำสมัย:

LLaMA v1, v2 และ v3: LLM ทั่วไป รวมถึงรุ่น SOLAR-10.7B
Falcon: LLM ทั่วไป
Codegeex4: การเติมโค้ดให้สมบูรณ์, ตัวแปลโค้ด, การค้นหาเว็บ, การเรียกฟังก์ชัน, ระดับพื้นที่เก็บข้อมูล
GLM4: เปิด LM แชทหลายภาษาหลายภาษาโดย THUDM
Gemma v1 และ v2: LLM ทั่วไป 2b และ 7b+/9b จาก Google Deepmind
RecurrentGemma: โมเดลที่ใช้ Griffin 2b และ 7b จาก Google ที่ผสมผสานความสนใจกับสถานะ RNN
Phi-1, Phi-1.5, Phi-2 และ Phi-3: 1.3b, 2.7b และ 3.8b LLM ทั่วไปที่มีประสิทธิภาพเทียบเท่ากับรุ่น 7b
StableLM-3B-4E1T: LLM ทั่วไป 3b ที่ได้รับการฝึกอบรมล่วงหน้าเกี่ยวกับโทเค็น 1T ของภาษาอังกฤษและชุดข้อมูลโค้ด ยังรองรับ StableLM-2 ซึ่งเป็น 1.6b LLM ที่ฝึกฝนบนโทเค็น 2T รวมถึงตัวแปรของโค้ดด้วย
Mamba: การอนุมานเฉพาะการดำเนินการของโมเดลพื้นที่รัฐ Mamba
Mistral7b-v0.1: LLM ทั่วไป 7b ที่มีประสิทธิภาพดีกว่ารุ่น 13b ที่เผยแพร่ต่อสาธารณะทั้งหมด ณ วันที่ 28-09-2023
Mixtral8x7b-v0.1: การผสมผสานที่เบาบางของผู้เชี่ยวชาญ 8x7b LLM ทั่วไป ที่มีประสิทธิภาพดีกว่ารุ่น Llama 2 70B ที่มีการอนุมานเร็วกว่ามาก
StarCoder และ StarCoder2: LLM เชี่ยวชาญด้านการสร้างโค้ด
Qwen1.5: LLM สองภาษา (อังกฤษ/จีน)
RWKV v5 และ v6: RNN พร้อมประสิทธิภาพ LLM ระดับหม้อแปลง
Replit-code-v1.5: 3.3b LLM ที่เชี่ยวชาญด้านการเติมโค้ดให้สมบูรณ์
Yi-6B / Yi-34B: LLM ทั่วไปสองภาษา (อังกฤษ/จีน) พร้อมพารามิเตอร์ 6b และ 34b
LLaMA เชิงปริมาณ: เวอร์ชันเชิงปริมาณของแบบจำลอง LLaMA โดยใช้เทคนิคการหาปริมาณแบบเดียวกับ llama.cpp

การแพร่กระจายที่เสถียร: โมเดลการสร้างข้อความเป็นรูปภาพ รองรับเวอร์ชัน 1.5, 2.1, SDXL 1.0 และ Turbo

Wuerstchen: แบบจำลองการสร้างข้อความอีกแบบหนึ่ง

yolo-v3 และ yolo-v8: การตรวจจับวัตถุและแบบจำลองการประมาณค่า

เซ็กเมนต์อะไรก็ได้: โมเดลการแบ่งเซ็กเมนต์รูปภาพพร้อมรับคำ

SegFormer: โมเดลการแบ่งส่วนความหมายตามหม้อแปลง
กระซิบ: โมเดลการรู้จำเสียงพูด
EnCodec: โมเดลการบีบอัดเสียงคุณภาพสูงโดยใช้การหาปริมาณเวกเตอร์ที่เหลือ
MetaVoice: โมเดลพื้นฐานสำหรับการอ่านออกเสียงข้อความ
Parler-TTS: รูปแบบการอ่านออกเสียงข้อความขนาดใหญ่
T5, Bert, JinaBert : มีประโยชน์สำหรับการฝังประโยค
DINOv2: โมเดลคอมพิวเตอร์วิทัศน์ที่ได้รับการฝึกโดยใช้การดูแลตนเอง (สามารถใช้สำหรับการจำแนกอิมเมจเน็ต การประเมินเชิงลึก การแบ่งส่วน)
VGG, RepVGG: โมเดลคอมพิวเตอร์วิทัศน์
BLIP: โมเดลรูปภาพเป็นข้อความ สามารถใช้สร้างคำบรรยายสำหรับรูปภาพได้
คลิป: โมเดลวิสัยทัศน์และภาษาหลายรูปแบบ
TroOCR: โมเดล OCR ของหม้อแปลง พร้อมรุ่นย่อยเฉพาะสำหรับการเขียนด้วยลายมือและการจดจำการพิมพ์
Marian-MT: โมเดลการแปลด้วยเครื่องประสาท สร้างข้อความที่แปลจากข้อความที่ป้อน
Moondream: โมเดลคอมพิวเตอร์วิทัศน์ขนาดเล็กที่สามารถตอบคำถามในโลกแห่งความเป็นจริงเกี่ยวกับรูปภาพได้

รันโดยใช้คำสั่งเช่น:

 cargo run --example quantized --release

เพื่อที่จะใช้ CUDA ให้เพิ่ม --features cuda ลงในบรรทัดคำสั่งตัวอย่าง หากคุณติดตั้ง cuDNN ไว้ ให้ใช้ --features cudnn เพื่อเพิ่มความเร็วให้มากยิ่งขึ้น

นอกจากนี้ยังมีตัวอย่าง wasm สำหรับกระซิบและ llama2.c คุณสามารถสร้างมันด้วย trunk หรือลองออนไลน์: กระซิบ, llama2, T5, Phi-1.5 และ Phi-2, Segment Anything Model

สำหรับ LLaMA2 ให้รันคำสั่งต่อไปนี้เพื่อดึงไฟล์น้ำหนักและเริ่มเซิร์ฟเวอร์ทดสอบ:

 cd candle-wasm-examples/llama2-c
wget https://huggingface.co/spaces/lmz/candle-llama2/resolve/main/model.bin
wget https://huggingface.co/spaces/lmz/candle-llama2/resolve/main/tokenizer.json
trunk serve --release --port 8081

จากนั้นตรงไปที่ http://localhost:8081/

ทรัพยากรภายนอกที่เป็นประโยชน์

candle-tutorial : บทช่วยสอนที่มีรายละเอียดมากซึ่งแสดงวิธีแปลงโมเดล PyTorch เป็น Candle
candle-lora : การใช้งาน LoRA ที่มีประสิทธิภาพและถูกหลักการยศาสตร์สำหรับ Candle candle-lora มี
รองรับ LoRA ทันทีที่แกะกล่องสำหรับหลายรุ่นจาก Candle ซึ่งสามารถพบได้ที่นี่
optimisers : ชุดเครื่องมือเพิ่มประสิทธิภาพรวมถึง SGD พร้อมโมเมนตัม, AdaGrad, AdaDelta, AdaMax, NAdam, RAdam และ RMSprop
candle-vllm : แพลตฟอร์มที่มีประสิทธิภาพสำหรับการอนุมานและให้บริการ LLM ในพื้นที่ รวมถึงเซิร์ฟเวอร์ API ที่เข้ากันได้กับ OpenAI
candle-ext : ไลบรารีส่วนขยายของ Candle ที่ให้ฟังก์ชัน PyTorch ที่ไม่สามารถใช้งานได้ใน Candle ในปัจจุบัน
candle-coursera-ml : การใช้อัลกอริธึม ML จากหลักสูตร Machine Learning Specialization ของ Coursera
kalosm : เมตาเฟรมเวิร์กแบบหลายโมดัลใน Rust สำหรับการเชื่อมต่อกับโมเดลที่ได้รับการฝึกอบรมล่วงหน้าในพื้นที่ พร้อมการสนับสนุนสำหรับการสร้างแบบควบคุม ตัวอย่างแบบกำหนดเอง ฐานข้อมูลเวกเตอร์ในหน่วยความจำ การถอดเสียง และอื่นๆ
candle-sampling : เทคนิคการสุ่มตัวอย่างเทียน
gpt-from-scratch-rs : พอร์ตของ Andrej Karpathy's มาสร้างบทช่วยสอน GPT บน YouTube เพื่อแสดง Candle API เกี่ยวกับปัญหาของเล่น
candle-einops : การใช้งานที่เป็นสนิมอย่างแท้จริงของไลบรารี python einops
atoma-infer : ไลบรารี Rust เพื่อการอนุมานอย่างรวดเร็วในวงกว้าง ใช้ประโยชน์จาก FlashAttention2 เพื่อการคำนวณความสนใจที่มีประสิทธิภาพ PagedAttention สำหรับการจัดการหน่วยความจำแคช KV ที่มีประสิทธิภาพ และการรองรับ multi-GPU รองรับ OpenAI API

หากคุณมีรายการเพิ่มเติม โปรดส่งคำขอดึง

คุณสมบัติ

ไวยากรณ์ง่ายๆ รูปลักษณ์และความรู้สึกเหมือน PyTorch
- การฝึกอบรมแบบจำลอง
- ฝัง ops/kernels ที่ผู้ใช้กำหนด เช่น flash-attention v2.
แบ็กเอนด์
- แบ็กเอนด์ CPU ที่ปรับให้เหมาะสมพร้อมการรองรับ MKL เพิ่มเติมสำหรับ x86 และ Accelerate สำหรับ Mac
- แบ็กเอนด์ CUDA เพื่อการทำงานอย่างมีประสิทธิภาพบน GPU, การกระจาย GPU หลายตัวผ่าน NCCL
- รองรับ WASM รันโมเดลของคุณในเบราว์เซอร์
รวมรุ่น.
- โมเดลภาษา
  - LLaMA v1, v2 และ v3 พร้อมตัวแปรต่างๆ เช่น SOLAR-10.7B
  - เหยี่ยว.
  - สตาร์โคเดอร์, สตาร์โคเดอร์2.
  - พี 1, 1.5, 2 และ 3
  - แมมบา มินิมอล แมมบา
  - เจมม่า v1 2b และ 7b+, v2 2b และ 9b.
  - มิสทรัล 7b เวอร์ชัน 0.1
  - มิกซ์ทรัล 8x7b v0.1.
  - เสถียรLM-3B-4E1T, เสถียรLM-2-1.6B, เสถียร-Code-3B
  - Replit-รหัส-v1.5-3B.
  - เบิร์ต.
  - ยี่-6B และยี่-34B
  - Qwen1.5, Qwen1.5 โมอี
  - RWKV เวอร์ชัน 5 และเวอร์ชัน 6
- LLM เชิงปริมาณ
  - Llama 7b, 13b, 70b ตลอดจนรูปแบบการแชทและรหัส
  - มิสทรัล 7b และ 7b สั่งสอน
  - มิกซ์ทรัล 8x7b.
  - Zephyr 7b a และ b (ใช้ Mistral-7b)
  - OpenChat 3.5 (ใช้ Mistral-7b)
- ข้อความเป็นข้อความ
  - T5 และรุ่นต่างๆ: FlanT5, UL2, MADLAD400 (การแปล), CoEdit (การแก้ไขไวยากรณ์)
  - Marian MT (การแปลด้วยเครื่อง)
- ข้อความเป็นรูปภาพ
  - การแพร่กระจายที่เสถียร v1.5, v2.1, XL v1.0
  - เวิร์สเชน วี2.
- รูปภาพเป็นข้อความ
  - บลิ๊พ.
  - โทรโอซีอาร์.
- เสียง
  - กระซิบคำพูดเป็นข้อความหลายภาษา
  - EnCodec รุ่นบีบอัดเสียง
  - MetaVoice-1B โมเดลการอ่านออกเสียงข้อความ
  - Parler-TTS รูปแบบการอ่านออกเสียงข้อความ
- โมเดลคอมพิวเตอร์วิทัศน์
  - DINOv2, ConvMixer, EfficientNet, ResNet, ViT, VGG, RepVGG, ConvNeXT, ConvNeXTv2, MobileOne, EfficientVit (MSRA), MobileNetv4, Hiera, FastViT
  - โยโล-v3, โยโล-v8
  - การแบ่งกลุ่ม-โมเดลอะไรก็ได้ (SAM)
  - SegFormer.
รูปแบบไฟล์: โหลดโมเดลจากไฟล์เซฟเทนเซอร์, npz, ggml หรือ PyTorch
ไร้เซิร์ฟเวอร์ (บน CPU) การปรับใช้ขนาดเล็กและรวดเร็ว
การสนับสนุนการกำหนดปริมาณโดยใช้ประเภทเชิงปริมาณ llama.cpp

วิธีใช้

สูตรโกง:

	การใช้ PyTorch	การใช้เทียน
การสร้าง	`torch.Tensor([[1, 2], [3, 4]])`	`Tensor::new(&[[1f32, 2.], [3., 4.]], &Device::Cpu)?`
การสร้าง	`torch.zeros((2, 2))`	`Tensor::zeros((2, 2), DType::F32, &Device::Cpu)?`
การจัดทำดัชนี	`tensor[:, :4]`	`tensor.i((.., ..4))?`
การดำเนินงาน	`tensor.view((2, 2))`	`tensor.reshape((2, 2))?`
การดำเนินงาน	`a.matmul(b)`	`a.matmul(&b)?`
เลขคณิต	`a + b`	`&a + &b`
อุปกรณ์	`tensor.to(device="cuda")`	`tensor.to_device(&Device::new_cuda(0)?)?`
ประเภทD	`tensor.to(dtype=torch.float16)`	`tensor.to_dtype(&DType::F16)?`
ประหยัด	`torch.save({"A": A}, "model.bin")`	`candle::safetensors::save(&HashMap::from([("A", A)]), "model.safetensors")?`
กำลังโหลด	`weights = torch.load("model.bin")`	`candle::safetensors::load("model.safetensors", &device)`

โครงสร้าง

แคนเดิลคอร์: การดำเนินการหลัก อุปกรณ์ และคำจำกัดความโครงสร้าง Tensor
Candle-nn: เครื่องมือสำหรับการสร้างแบบจำลองจริง
ตัวอย่างเทียน: ตัวอย่างการใช้ห้องสมุดในสภาพแวดล้อมที่สมจริง
เมล็ดเทียน: เคอร์เนลที่กำหนดเองของ CUDA
ชุดข้อมูลเทียน: ชุดข้อมูลและตัวโหลดข้อมูล
หม้อแปลงเทียน: ยูทิลิตี้ที่เกี่ยวข้องกับหม้อแปลง
เทียนแฟลช atn: เลเยอร์ความสนใจแฟลช v2
Candle-onnx: การประเมินแบบจำลอง ONNX

คำถามที่พบบ่อย

เหตุใดฉันจึงควรใช้เทียน?

เป้าหมายหลักของ Candle คือ ทำให้การอนุมานแบบไร้เซิร์ฟเวอร์เป็นไปได้ เฟรมเวิร์กแมชชีนเลิร์นนิงเต็มรูปแบบ เช่น PyTorch มีขนาดใหญ่มาก ซึ่งทำให้การสร้างอินสแตนซ์บนคลัสเตอร์ช้า Candle อนุญาตให้ปรับใช้ไบนารีน้ำหนักเบา

ประการที่สอง Candle ช่วยให้คุณสามารถ ลบ Python ออก จากปริมาณงานการผลิตได้ ค่าใช้จ่ายของ Python อาจส่งผลเสียต่อประสิทธิภาพการทำงานอย่างรุนแรง และ GIL ก็เป็นสาเหตุของอาการปวดหัวอย่างฉาวโฉ่

ในที่สุด Rust ก็เจ๋ง! ระบบนิเวศของ HF จำนวนมากมีลังแบบ Rust อยู่แล้ว เช่น ตัวเซฟเทนเซอร์และตัวโทเค็น

กรอบงาน ML อื่นๆ

dfdx เป็นลังที่น่าเกรงขาม โดยมีรูปร่างต่างๆ รวมอยู่ในประเภทต่างๆ วิธีนี้จะช่วยป้องกันอาการปวดหัวได้มากโดยให้คอมไพเลอร์บ่นเกี่ยวกับรูปร่างที่ไม่ตรงกันทันที อย่างไรก็ตาม เราพบว่าคุณสมบัติบางอย่างยังต้องใช้ทุกคืน และการเขียนโค้ดอาจเป็นเรื่องน่ากังวลเล็กน้อยสำหรับผู้เชี่ยวชาญที่ไม่เป็นสนิม
เรากำลังใช้ประโยชน์และสนับสนุนลังหลักอื่นๆ สำหรับรันไทม์ ดังนั้นหวังว่าทั้งสองลังจะได้รับประโยชน์จากกันและกัน
Burn เป็นลังทั่วไปที่สามารถใช้ประโยชน์จากแบ็กเอนด์ได้หลายตัว เพื่อให้คุณสามารถเลือกกลไกที่ดีที่สุดสำหรับปริมาณงานของคุณได้
tch-rs เชื่อมโยงกับไลบรารีคบเพลิงใน Rust มีความหลากหลายอย่างมาก แต่นำไลบรารีคบเพลิงทั้งหมดมาสู่รันไทม์ ผู้สนับสนุนหลักของ tch-rs ยังมีส่วนร่วมในการพัฒนา candle อีกด้วย

ข้อผิดพลาดทั่วไป

สัญลักษณ์หายไปเมื่อคอมไพล์ด้วยคุณสมบัติ mkl

หากคุณได้รับสัญลักษณ์ที่หายไปเมื่อรวบรวมไบนารี/การทดสอบโดยใช้คุณสมบัติ mkl หรือเร่งความเร็ว เช่น สำหรับ mkl คุณจะได้รับ:

  = note: /usr/bin/ld: (....o): in function `blas::sgemm':
          .../blas-0.22.0/src/lib.rs:1944: undefined reference to `sgemm_' collect2: error: ld returned 1 exit status

  = note: some `extern` functions couldn't be found; some native libraries may need to be installed or have their path specified
  = note: use the `-l` flag to specify native libraries to link
  = note: use the `cargo:rustc-link-lib` directive to specify the native libraries to link with Cargo

หรือเพื่อเร่งความเร็ว:

 Undefined symbols for architecture arm64:
            "_dgemm_", referenced from:
                candle_core::accelerate::dgemm::h1b71a038552bcabe in libcandle_core...
            "_sgemm_", referenced from:
                candle_core::accelerate::sgemm::h2cf21c592cba3c47 in libcandle_core...
          ld: symbol(s) not found for architecture arm64

อาจเป็นไปได้ว่าไม่มีแฟล็กตัวเชื่อมโยงที่จำเป็นในการเปิดใช้งานไลบรารี mkl คุณสามารถลองเพิ่มสิ่งต่อไปนี้สำหรับ mkl ที่ด้านบนของไบนารี่ของคุณ:

 extern crate intel_mkl_src ;

หรือเพื่อเร่งความเร็ว:

 extern crate accelerate_src ;

ไม่สามารถเรียกใช้ตัวอย่าง LLaMA ได้: การเข้าถึงแหล่งที่มาต้องใช้ข้อมูลรับรองการเข้าสู่ระบบ

 Error: request error: https://huggingface.co/meta-llama/Llama-2-7b-hf/resolve/main/tokenizer.json: status code 401

อาจเป็นเพราะคุณไม่ได้รับอนุญาตให้ใช้โมเดล LLaMA-v2 ในการแก้ไขปัญหานี้ คุณต้องลงทะเบียนบน Huggingface-hub ยอมรับเงื่อนไขโมเดล LLaMA-v2 และตั้งค่าโทเค็นการตรวจสอบสิทธิ์ของคุณ ดูปัญหา #350 สำหรับรายละเอียดเพิ่มเติม

ส่วนหัวน่ารัก/มีดสั้นหายไปเมื่อรวบรวม flash-attn

  In file included from kernels/flash_fwd_launch_template.h:11:0,
                   from kernels/flash_fwd_hdim224_fp16_sm80.cu:5:
  kernels/flash_fwd_kernel.h:8:10: fatal error: cute/algorithm/copy.hpp: No such file or directory
   #include <cute/algorithm/copy.hpp>
            ^~~~~~~~~~~~~~~~~~~~~~~~~
  compilation terminated.
  Error: nvcc error while compiling:

cutlass ถูกจัดเตรียมไว้เป็นโมดูลย่อยของ git ดังนั้นคุณอาจต้องการรันคำสั่งต่อไปนี้เพื่อตรวจสอบอย่างถูกต้อง

git submodule update --init

การคอมไพล์ด้วย Flash-Attention ล้มเหลว

 /usr/include/c++/11/bits/std_function.h:530:146: error: parameter packs not expanded with ‘...’:

นี่เป็นจุดบกพร่องใน gcc-11 ที่ถูกทริกเกอร์โดยคอมไพเลอร์ Cuda หากต้องการแก้ไขปัญหานี้ ให้ติดตั้ง gcc เวอร์ชันอื่นที่รองรับ เช่น gcc-10 และระบุเส้นทางไปยังคอมไพลเลอร์ในตัวแปรสภาพแวดล้อม NVCC_CCBIN

 env NVCC_CCBIN=/usr/lib/gcc/x86_64-linux-gnu/10 cargo ...

การเชื่อมโยงข้อผิดพลาดบน windows เมื่อรันการทดสอบrustdoc หรือ mdbook

 Couldn't compile the test.
---- .candle-booksrcinferencehub.md - Using_the_hub::Using_in_a_real_model_ (line 50) stdout ----
error: linking with `link.exe` failed: exit code: 1181
//very long chain of linking
 = note: LINK : fatal error LNK1181: cannot open input file 'windows.0.48.5.lib'

ตรวจสอบให้แน่ใจว่าคุณเชื่อมโยงไลบรารีดั้งเดิมทั้งหมดที่อาจตั้งอยู่นอกเป้าหมายของโปรเจ็กต์ เช่น หากต้องการรันการทดสอบ mdbook คุณควรรัน:

 mdbook test candle-book -L .targetdebugdeps `
-L native=$env:USERPROFILE.cargoregistrysrcindex.crates.io-6f17d22bba15001fwindows_x86_64_msvc-0.42.2lib `
-L native=$env:USERPROFILE.cargoregistrysrcindex.crates.io-6f17d22bba15001fwindows_x86_64_msvc-0.48.5lib

เวลาในการโหลดโมเดลช้ามากด้วย WSL

ปัญหานี้อาจเกิดจากการโหลดโมเดลจาก /mnt/c รายละเอียดเพิ่มเติมเกี่ยวกับ stackoverflow

การติดตามข้อผิดพลาด

คุณสามารถตั้งค่า RUST_BACKTRACE=1 ให้มี backtraces เมื่อมีการสร้างข้อผิดพลาดเทียน

ข้อผิดพลาด CudaRC

หากคุณพบข้อผิดพลาดลักษณะนี้ called Result::unwrap() on an value: LoadLibraryExW { source: Os { code: 126, kind: Uncategorized, message: "The specified module could not be found." } } บนหน้าต่าง เพื่อแก้ไขการคัดลอกและเปลี่ยนชื่อไฟล์ทั้ง 3 ไฟล์นี้ (ตรวจสอบให้แน่ใจว่าไฟล์เหล่านั้นอยู่ในเส้นทาง) เส้นทางขึ้นอยู่กับเวอร์ชัน cuda ของคุณ c:WindowsSystem32nvcuda.dll -> cuda.dll c:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.4bincublas64_12.dll -> cublas.dll c:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.4bincurand64_10.dll -> curand.dll

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2024-12-09
ขนาด 3.14MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด