LlamaCloud
LlamaParse là một API được tạo bởi LlamaIndex để phân tích cú pháp và biểu diễn hiệu quả các tệp để truy xuất hiệu quả và tăng cường ngữ cảnh bằng cách sử dụng các khung LlamaIndex. LlamaParse có thể hỗ trợ các loại tệp khác nhau, như pdf, doc, .ppt và các định dạng khác.
Bạn có thể cấu hình LlamaParse để sử dụng nút Gaia làm nền tảng LLM, do đó bạn có thể tạo ứng dụng RAG dựa trên các tệp PDF của mình tại địa phương.
Điều kiện tiên quyết
Bạn sẽ cần một nút Gaia sẵn sàng cung cấp dịch vụ LLM thông qua URL công khai. Bạn có thể
Trong hướng dẫn này, chúng tôi sẽ sử dụng các nút công khai để cung cấp năng lượng cho plugin Tiếp tục.
Loại mô hình | URL cơ sở API | Tên model |
---|---|---|
Tán gẫu | https://llama8b.gaia.domains/v1 | lạc đà không bướu |
Nhúng | https://llama8b.gaia.domains/v1 | nhúng nomic |
Bước
Chúng tôi sẽ sử dụng repo GitHub mã nguồn mở, được gọi là llamaparse-tích hợp
, để làm cho LlamaPase dễ sử dụng. Các llamaparse-tích hợp
Hỗ trợ ứng dụng
- Nhiều định dạng tệp, như
.Pdf
và.Doc
, - Nhiều tệp
Chúng tôi sẽ cần lấy mã nguồn trong thiết bị đầu cuối của bạn trước.
https://github.com/alabulei1/llamaparse-integration.git sao chép Git
CD llamaparse-tích hợp
Tiếp theo, cài đặt các gói chế độ yêu cầu.
npm cài đặt llamaindex
npm cài đặt dotenv
Khởi động phiên bản Qdant. Phiên bản Qdrant là lưu trữ các embeddings.
MKDIR qdrant_storage
MKDIR qdrant_snapshots
Nohup Docker chạy -d -p 6333:6333 -p 6334:6334 \
-v $(pwd)/qdrant_storage:/qdrant/storage:z \
-v $(pwd)/qdrant_snapshots:/qdrant/snapshots:z \
QDRANT/QDRANT
Sau đó, chúng ta sẽ cần thiết lập cài đặt mô hình LLM. Chúng ta có thể định cấu hình cài đặt mô hình trong .env
tệp.
OPENAI_BASE_URL=https://llama8b.gaia.domains/v1/
OPENAI_API_KEY=gaianet
LLAMAEDGE_CHAT_MODEL=lạc đà không bướu
LLAMAEDGE_EMBEDDING_MODEL=nomic
LLAMA_CLOUD_API_KEY=KHÓA_Của_Bạn
ĐƯỜNG_DẪN_TẬP_TIN=
FILE_DIR=./pdf_dir
COLLECTION_NAME=mặc định
URL QDRANT=http://127.0.0.1:6333
SAVE_MARKDOWN_PATH=đầu ra.md
Dưới đây là một số lưu ý về .env
khung cảnh:
- Bạn có thể lấy khóa LlamaCloud từ https://cloud.llamaindex.ai
- Bạn có thể cần thực hiện thay đổi theo cài đặt mô hình và đường dẫn tệp của mình.
- Nếu bạn đặt tên tệp của mình vào
FILE_PATH=
, chương trình sẽ xây dựng một ứng dụng RAG với tệp pdf duy nhất này. - Nếu
FILE_PATH=
trống, chương trình sẽ xây dựng một ứng dụng RAG với các tệp trongFILE_DIR=./pdf_dir
. Bạn có thể bao gồm nhiều tệp trong thư mục.
Tiếp theo, chúng ta có thể chạy chương trình để xây dựng một ứng dụng RAG dựa trên tệp PDF
pdfRender.ts NPX TSX
Sau khi nó chạy thành công, bạn có thể gửi một truy vấn thông qua dòng lệnh.