Chuyển đến nội dung chính
Phiên bản: 2.0.0

Troubleshooting

Hệ thống không thể tìm thấy thư viện CUDA

Đôi khi, bộ công cụ CUDA được cài đặt ở một vị trí không chuẩn. Thông báo lỗi ở đây thường không thể tìm thấy Thiên Bình*12. Ví dụ, bạn có thể đã cài đặt CUDA với thiết lập Python của mình. Lệnh sau sẽ cài đặt CUDA vào môi trường Python.

sudo apt cài đặt python3-pip -y
pip3 cài đặt --nâng cấp fschat tăng tốc autoawq vllm

Cách dễ nhất để khắc phục chỉ đơn giản là liên kết các thư viện CUDA không chuẩn đó với vị trí tiêu chuẩn, như thế này.

ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublas.so.12 /usr/lib/libcublas.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cuda_runtime/lib/libcudart.so.12 /usr/lib/libcudart.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublasLt.so.12 /usr/lib/libcublasLt.so.12

Không thể khôi phục từ ảnh chụp nhanh bộ sưu tập trên Windows WSL

Trên Windows WSL, bạn có thể thấy lỗi này trong khi chạy Gaianet Init.

   * Import the Qdrant collection snapshot ...
The process may take a few minutes. Please wait ...
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Tokio task join error: task 1242 panicked"},"time":0.697784244}

Khi bạn nhìn vào ~ / gaianet / nhật ký / init-qdrant.log tập tin, bạn có thể thấy dòng lỗi này

2024-05-20T07:24:52.900895Z ERROR qdrant::startup: Panic occurred in file /home/runner/.cargo/registry/src/index.crates.io-6f17d22bba15001f/cgroups-rs-0.3.4/src/memory.rs at line 587: called `Result::unwrap()` on an `Err` value: Error { kind: ReadFailed("/sys/fs/cgroup/memory.high"), cause: Some(Os { code: 2, kind: NotFound, message: "No such file or directory" }) }  

Giải pháp là vô hiệu hóa autoMemoryReclaim tính năng trong WSL. Bước bật/tắt tính năng này:

  1. Biên tập C:\Users<Your user name>.wslconfig
  2. Xóa hoặc nhận xét autoMemoryReclaim trong [thử nghiệm] phần.

Cảm ơn RoggeOhta đã khám phá ra điều này. Bạn có thể tìm hiểu thêm về nó nhấn vào đây.

Không thể khởi động nút với thông báo lỗi Cổng 8080 đang được sử dụng. Thoát...

Bạn có thể thấy lỗi sau khi chạy Gaianet bắt đầu.

Gaianet bắt đầu
[+] Kiểm tra tệp config.json ...

Bạn đã có khóa riêng.
[+] Khởi động Máy chủ API LlamaEdge ...

Cổng 8080 đang được sử dụng. Thoát...

Giải pháp là chạy Điểm dừng Gaianet Đầu tiên để giết tất cả các quy trình, và sau đó chạy Gaianet bắt đầu để bắt đầu nút.

Tải thư viện không thành công: libgomp.so.1: không thể mở tệp đối tượng được chia sẻ: Không có tệp hoặc thư mục như vậy

Trên Windows WSL, bạn có thể thấy lỗi này khi chạy cuộn tròn -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | Bash

* Tạo nút IS
[2024-07-02 17:50:55.175] [lỗi] tải không thành công: đường dẫn không hợp lệ, Mã: 0x20
[2024-07-02 17:50:55.175] [lỗi] Tải thư viện không thành công: libgomp.so.1: không thể mở tệp đối tượng được chia sẻ: Không có tệp hoặc thư mục như vậy
[2024-07-02 17:50:55.176] [lỗi] tải không thành công: đường dẫn không hợp lệ, Mã: 0x20
[2024-07-02 17:50:55.176] [lỗi] Tải thư viện không thành công: libgomp.so.1: không thể mở tệp đối tượng được chia sẻ: Không có tệp hoặc thư mục như vậy

Lỗi là do thiếu libgomp.so.1, một thư viện sẽ được tự động cài đặt trên Ubuntu theo mặc định.

Để giải quyết vấn đề này, bạn phải cài đặt libgomp.so.1 thư viện.

sudo apt-get cập nhật
sudo apt-get cài đặt libgomp1

Nếu bạn đang sử dụng CentOS, bạn có thể sử dụng

yum cài đặt libgomp

Sự cố này đã được khắc phục trong Phiên bản 0.2.2.

Không thể xóa bộ sưu tập mặc định

Failed to remove the default collection. {"status":{"error":"Service internal error: No such file or directory (os error 2)"},"time":0.050924542}

Nguyên nhân thường là do phiên bản Qdrant không được tắt đúng cách trước khi bạn thử khởi tạo lại bằng bản kết xuất nhanh mới. Giải pháp là dừng nút GaiaNet trước.

Điểm dừng Gaianet

Ngoài ra, bạn có thể tắt thủ công các tiến trình từ thiết bị đầu cuối hoặc trong Trình giám sát hoạt động của hệ điều hành.

sudo pkill -9 QDRANT
sudo pkill -9 wasmedge
sudo pkill -9 frpc

Sau đó, bạn có thể chạy Gaianet Init và sau đó Gaianet bắt đầu lại.

Lỗi I/O tệp

    * Nhập ảnh chụp nhanh bộ sưu tập Qdrant ...
Quá trình này có thể mất vài phút. Hãy chờ...
* [Lỗi] Không thể khôi phục từ ảnh chụp nhanh bộ sưu tập. Đã xảy ra lỗi trường xử lý 'ảnh chụp nhanh': Lỗi I/O tệp: Hoạt động không được phép (lỗi os 1)

Nguyên nhân thường là do phiên bản Qdrant không được tắt đúng cách trước khi bạn thử khởi tạo lại bằng bản kết xuất nhanh mới. Giải pháp là dừng nút GaiaNet trước.

Điểm dừng Gaianet

Ngoài ra, bạn có thể tắt thủ công các tiến trình từ thiết bị đầu cuối hoặc trong Trình giám sát hoạt động của hệ điều hành.

sudo pkill -9 QDRANT
sudo pkill -9 wasmedge
sudo pkill -9 frpc

Sau đó, bạn có thể chạy Gaianet Init và sau đó Gaianet bắt đầu lại.

Lỗi "Không thể mở tệp"

Cảnh báo: Không thể mở tệp 
Cảnh báo: https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve
Cảnh báo: /main/consensus/consensus.snapshot: Không có tệp hoặc thư mục nào như vậy
curl: (23) Không viết đầu ra đến đích

Lý do cho loại lỗi này là do cấu hình sai config.json tệp. Giải pháp là xóa các bình luận trong config.json và chạy lại Gaianet Init lệnh.

Lỗi "Quá nhiều tệp đang mở" trên macOS

Khi chạy Gaianet Init Để khởi tạo một nút mới trên macOS, bạn có thể gặp lỗi liên quan đến khôi phục ảnh chụp nhanh nếu ảnh chụp nhanh của bạn chứa một lượng lớn văn bản. Thông báo lỗi có thể như sau:

 * [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}

Sự cố này là do giới hạn mô tả tệp mặc định (FD) trên macOS, được đặt thành giá trị tương đối thấp là 256.

Để giải quyết vấn đề này, bạn có thể tăng giới hạn FD mặc định trên hệ thống của bạn. Để làm như vậy, hãy chạy lệnh sau:

Ulimit -N 10000

Điều này sẽ tạm thời đặt giới hạn FD thành 10.000. Tiếp theo, sử dụng Gaianet InitGaianet bắt đầu các lệnh trong cùng một thiết bị đầu cuối.

Quyền bị từ chối khi sử dụng tập lệnh trình cài đặt để cài đặt WasmEdge

Khi chạy cuộn tròn -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | Bash để cài đặt phần mềm GaiaNet node, bạn có thể gặp lỗi từ chối cấp phép, đặc biệt là khi cài đặt WasmEdge runtime.

Lỗi này là do thiếu /Tmp Quyền ghi. Bạn có thể sử dụng --TMPDIR để chỉ định nơi bạn muốn cài đặt thời gian chạy WasmEdge. Xin lưu ý, bạn sẽ cần phải có sự cho phép bằng văn bản đối với <YOUR_PATH> thư mục.

cuộn tròn -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash -s -- --tmpdir YOUR_PATH

Sự cố này được khắc phục trong Phiên bản 0.2.3.