Troubleshooting
Hệ thống không thể tìm thấy thư viện CUDA
Đôi khi, bộ công cụ CUDA được cài đặt ở một vị trí không chuẩn. Thông báo lỗi ở đây thường không thể tìm thấy Thiên Bình*12
. Ví dụ, bạn có thể đã cài đặt CUDA với thiết lập Python của mình. Lệnh sau sẽ cài đặt CUDA vào môi trường Python.
sudo apt cài đặt python3-pip -y
pip3 cài đặt --nâng cấp fschat tăng tốc autoawq vllm
Cách dễ nhất để khắc phục chỉ đơn giản là liên kết các thư viện CUDA không chuẩn đó với vị trí tiêu chuẩn, như thế này.
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublas.so.12 /usr/lib/libcublas.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cuda_runtime/lib/libcudart.so.12 /usr/lib/libcudart.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublasLt.so.12 /usr/lib/libcublasLt.so.12
Không thể khôi phục từ ảnh chụp nhanh bộ sưu tập trên Windows WSL
Trên Windows WSL, bạn có thể thấy lỗi này trong khi chạy Gaianet Init
.
* Import the Qdrant collection snapshot ...
The process may take a few minutes. Please wait ...
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Tokio task join error: task 1242 panicked"},"time":0.697784244}
Khi bạn nhìn vào ~ / gaianet / nhật ký / init-qdrant.log
tập tin, bạn có thể thấy dòng lỗi này
2024-05-20T07:24:52.900895Z ERROR qdrant::startup: Panic occurred in file /home/runner/.cargo/registry/src/index.crates.io-6f17d22bba15001f/cgroups-rs-0.3.4/src/memory.rs at line 587: called `Result::unwrap()` on an `Err` value: Error { kind: ReadFailed("/sys/fs/cgroup/memory.high"), cause: Some(Os { code: 2, kind: NotFound, message: "No such file or directory" }) }
Giải pháp là vô hiệu hóa autoMemoryReclaim
tính năng trong WSL. Bước bật/tắt tính năng này:
- Biên tập
C:\Users<Your user name>.wslconfig
- Xóa hoặc nhận xét
autoMemoryReclaim
trong[thử nghiệm]
phần.
Cảm ơn RoggeOhta đã khám phá ra điều này. Bạn có thể tìm hiểu thêm về nó nhấn vào đây.
Không thể khởi động nút với thông báo lỗi Cổng 8080 đang được sử dụng. Thoát...
Bạn có thể thấy lỗi sau khi chạy Gaianet bắt đầu
.
Gaianet bắt đầu
[+] Kiểm tra tệp config.json ...
Bạn đã có khóa riêng.
[+] Khởi động Máy chủ API LlamaEdge ...
Cổng 8080 đang được sử dụng. Thoát...
Giải pháp là chạy Điểm dừng Gaianet
Đầu tiên để giết tất cả các quy trình, và sau đó chạy Gaianet bắt đầu
để bắt đầu nút.
Tải thư viện không thành công: libgomp.so.1: không thể mở tệp đối tượng được chia sẻ: Không có tệp hoặc thư mục như vậy
Trên Windows WSL, bạn có thể thấy lỗi này khi chạy cuộn tròn -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | Bash
* Tạo nút IS
[2024-07-02 17:50:55.175] [lỗi] tải không thành công: đường dẫn không hợp lệ, Mã: 0x20
[2024-07-02 17:50:55.175] [lỗi] Tải thư viện không thành công: libgomp.so.1: không thể mở tệp đối tượng được chia sẻ: Không có tệp hoặc thư mục như vậy
[2024-07-02 17:50:55.176] [lỗi] tải không thành công: đường dẫn không hợp lệ, Mã: 0x20
[2024-07-02 17:50:55.176] [lỗi] Tải thư viện không thành công: libgomp.so.1: không thể mở tệp đối tượng được chia sẻ: Không có tệp hoặc thư mục như vậy
Lỗi là do thiếu libgomp.so.1
, một thư viện sẽ được tự động cài đặt trên Ubuntu theo mặc định.
Để giải quyết vấn đề này, bạn phải cài đặt libgomp.so.1
thư viện.
sudo apt-get cập nhật
sudo apt-get cài đặt libgomp1
Nếu bạn đang sử dụng CentOS, bạn có thể sử dụng
yum cài đặt libgomp
Sự cố này đã được khắc phục trong Phiên bản 0.2.2
.
Không thể xóa bộ sưu tập mặc định
Failed to remove the default collection. {"status":{"error":"Service internal error: No such file or directory (os error 2)"},"time":0.050924542}
Nguyên nhân thường là do phiên bản Qdrant không được tắt đúng cách trước khi bạn thử khởi tạo lại bằng bản kết xuất nhanh mới. Giải pháp là dừng nút GaiaNet trước.
Điểm dừng Gaianet
Ngoài ra, bạn có thể tắt thủ công các tiến trình từ thiết bị đầu cuối hoặc trong Trình giám sát hoạt động của hệ điều hành.
sudo pkill -9 QDRANT
sudo pkill -9 wasmedge
sudo pkill -9 frpc
Sau đó, bạn có thể chạy Gaianet Init
và sau đó Gaianet bắt đầu
lại.
Lỗi I/O tệp
* Nhập ảnh chụp nhanh bộ sưu tập Qdrant ...
Quá trình này có thể mất vài phút. Hãy chờ...
* [Lỗi] Không thể khôi phục từ ảnh chụp nhanh bộ sưu tập. Đã xảy ra lỗi trường xử lý 'ảnh chụp nhanh': Lỗi I/O tệp: Hoạt động không được phép (lỗi os 1)
Nguyên nhân thường là do phiên bản Qdrant không được tắt đúng cách trước khi bạn thử khởi tạo lại bằng bản kết xuất nhanh mới. Giải pháp là dừng nút GaiaNet trước.
Điểm dừng Gaianet
Ngoài ra, bạn có thể tắt thủ công các tiến trình từ thiết bị đầu cuối hoặc trong Trình giám sát hoạt động của hệ điều hành.
sudo pkill -9 QDRANT
sudo pkill -9 wasmedge
sudo pkill -9 frpc
Sau đó, bạn có thể chạy Gaianet Init
và sau đó Gaianet bắt đầu
lại.
Lỗi "Không thể mở tệp"
Cảnh báo: Không thể mở tệp
Cảnh báo: https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve
Cảnh báo: /main/consensus/consensus.snapshot: Không có tệp hoặc thư mục nào như vậy
curl: (23) Không viết đầu ra đến đích
Lý do cho loại lỗi này là do cấu hình sai config.json
tệp. Giải pháp là xóa các bình luận trong config.json
và chạy lại Gaianet Init
lệnh.
Lỗi "Quá nhiều tệp đang mở" trên macOS
Khi chạy Gaianet Init
Để khởi tạo một nút mới trên macOS, bạn có thể gặp lỗi liên quan đến khôi phục ảnh chụp nhanh nếu ảnh chụp nhanh của bạn chứa một lượng lớn văn bản. Thông báo lỗi có thể như sau:
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
Sự cố này là do giới hạn mô tả tệp mặc định (FD) trên macOS, được đặt thành giá trị tương đối thấp là 256.
Để giải quyết vấn đề này, bạn có thể tăng giới hạn FD mặc định trên hệ thống của bạn. Để làm như vậy, hãy chạy lệnh sau:
Ulimit -N 10000
Điều này sẽ tạm thời đặt giới hạn FD thành 10.000. Tiếp theo, sử dụng Gaianet Init
và Gaianet bắt đầu
các lệnh trong cùng một thiết bị đầu cuối.
Quyền bị từ chối khi sử dụng tập lệnh trình cài đặt để cài đặt WasmEdge
Khi chạy cuộn tròn -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | Bash
để cài đặt phần mềm GaiaNet node, bạn có thể gặp lỗi từ chối cấp phép, đặc biệt là khi cài đặt WasmEdge runtime.
Lỗi này là do thiếu /Tmp
Quyền ghi. Bạn có thể sử dụng --TMPDIR
để chỉ định nơi bạn muốn cài đặt thời gian chạy WasmEdge. Xin lưu ý, bạn sẽ cần phải có sự cho phép bằng văn bản đối với <YOUR_PATH>
thư mục.
cuộn tròn -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash -s -- --tmpdir YOUR_PATH
Sự cố này được khắc phục trong Phiên bản 0.2.3
.