Chuyển đến nội dung chính
Phiên bản: 1.0.0

LlamaCloud

LlamaParse là một API được tạo bởi LlamaIndex để phân tích cú pháp và biểu diễn hiệu quả các tệp để truy xuất hiệu quả và tăng cường ngữ cảnh bằng cách sử dụng các khung LlamaIndex. LlamaParse có thể hỗ trợ các loại tệp khác nhau, như pdf, doc, .ppt và các định dạng khác.

Bạn có thể định cấu hình LlamaParse để sử dụng nút GaiaNet làm phụ trợ LLM, do đó bạn có thể tạo ứng dụng RAG dựa trên các tệp PDF của mình cục bộ.

Điều kiện tiên quyết

Bạn sẽ cần một nút Gaia sẵn sàng cung cấp dịch vụ LLM thông qua URL công khai. Bạn có thể

Trong hướng dẫn này, chúng tôi sẽ sử dụng các nút công khai để cung cấp năng lượng cho plugin Tiếp tục.

Loại mô hìnhURL cơ sở APITên model
Tán gẫuhttps://gemma.us.gaianet.network/v1Gemma
Nhúnghttps://gemma.us.gaianet.network/v1nhúng nomic

Bước

Chúng tôi sẽ sử dụng repo GitHub mã nguồn mở, được gọi là llamaparse-tích hợp, để làm cho LlamaPase dễ sử dụng. Các llamaparse-tích hợp Hỗ trợ ứng dụng

  • Nhiều định dạng tệp, như .Pdf.Doc,
  • Nhiều tệp

Chúng tôi sẽ cần lấy mã nguồn trong thiết bị đầu cuối của bạn trước.

https://github.com/alabulei1/llamaparse-integration.git sao chép Git
CD llamaparse-tích hợp

Tiếp theo, cài đặt các gói chế độ yêu cầu.

npm cài đặt llamaindex
npm cài đặt dotenv

Khởi động phiên bản Qdant. Phiên bản Qdrant là lưu trữ các embeddings.

MKDIR qdrant_storage
MKDIR qdrant_snapshots

Nohup Docker chạy -d -p 6333:6333 -p 6334:6334 \
-v $(pwd)/qdrant_storage:/qdrant/storage:z \
-v $(pwd)/qdrant_snapshots:/qdrant/snapshots:z \
QDRANT/QDRANT

Sau đó, chúng ta sẽ cần thiết lập cài đặt mô hình LLM. Chúng ta có thể định cấu hình cài đặt mô hình trong .env tệp.

OPENAI_BASE_URL=https://gemma.us.gaianet.network/v1/
OPENAI_API_KEY=Gaianet
LLAMAEDGE_CHAT_MODEL=gemma
LLAMAEDGE_EMBEDDING_MODEL=nomic
LLAMA_CLOUD_API_KEY=Your_Own_KEY
FILE_PATH=
FILE_DIR=./pdf_dir
COLLECTION_NAME=mặc định
QDRANT_URL=http://127.0.0.1:6333
SAVE_MARKDOWN_PATH=output.md

Dưới đây là một số lưu ý về .env khung cảnh:

  • Bạn có thể lấy khóa LlamaCloud từ https://cloud.llamaindex.ai
  • Bạn có thể cần thực hiện thay đổi theo cài đặt mô hình và đường dẫn tệp của mình.
  • Nếu bạn đặt tên tệp của mình vào FILE_PATH=, chương trình sẽ xây dựng một ứng dụng RAG với tệp pdf duy nhất này.
  • Nếu FILE_PATH= trống, chương trình sẽ xây dựng một ứng dụng RAG với các tệp trong FILE_DIR=./pdf_dir. Bạn có thể bao gồm nhiều tệp trong thư mục.

Tiếp theo, chúng ta có thể chạy chương trình để xây dựng một ứng dụng RAG dựa trên tệp PDF

pdfRender.ts NPX TSX

Sau khi nó chạy thành công, bạn có thể gửi một truy vấn thông qua dòng lệnh.