Đại lý dịch thuật + Gaia
Translation Agent ban đầu được xây dựng bởi Giáo sư Andrew Ng, được thiết kế để hỗ trợ dịch thuật chính xác và hiệu quả trên nhiều ngôn ngữ. Nó sử dụng LLM (Mô hình ngôn ngữ lớn) nguồn mở để cung cấp bản dịch chất lượng cao. Bạn có thể sử dụng bất kỳ nút Gaia nào làm backend LLM.
Để biết các lệnh về khởi động và chạy tác nhân này, hãy tham khảo GitHub - Second State/translation-agent.
Bạn có thể chạy Translation Agent trên Gaia Node công khai như một backend và sau đó dịch nội dung sang ngôn ngữ đích của bạn. Nếu bạn muốn tìm hiểu thêm về Translation Agent và cách thức hoạt động của LLM nguồn mở, hãy xem bài viết Bản dịch Agentic trên Gaia .
Chuẩn bị môi trường
Ở đây, chúng ta sẽ sử dụng nút Gaia công khai với mô hình gemma-2-27b. https://gemma.us.gaianet.network/
.
Ngoài ra, bạn cũng có thể khởi động một nút Gaia cục bộ trên thiết bị của mình. Tham khảo hướng dẫn này .
Để bắt đầu, hãy sao chép Tác nhân dịch hỗ trợ LLM nguồn mở.
https://github.com/second-state/translation-agent.git sao chép Git
Đại lý dịch thuật CD
use_llamaedge Git Checkout
Đặt các biến môi trường và cài đặt các gói Python cần thiết nếu cần. Thay thế OPENAI_BASE_URL bằng https://gemma.us.gaianet.network/
export OPENAI_BASE_URL="https://gemma.us.gaianet.network/v1"
export PYTHONPATH=${PWD}/src
export OPENAI_API_KEY="GAIANET"
pip install python-dotenv
pip install openai tiktoken icecream langchain_text_splitters
Chuẩn bị nhiệm vụ dịch thuật của bạn
Tìm Ví dụ/mẫu-văn bản
thư mục trong repo nhân bản của bạn. Đặt tệp bạn muốn dịch vào thư mục này và lấy đường dẫn của nó. Ở đây bởi vì chúng tôi đặt tên cho chúng tôi văn bản nguồn bằng tiếng Trung forbiddencity.txt
vì nó là phần giới thiệu về cung điện hoàng gia Trung Quốc này, sau đó ghi lại đường dẫn tài liệu của nó, văn bản mẫu/forbiddencity.txt
. Đây sẽ là Đường dẫn tương đối
trong của chúng tôi example_script.py
tệp.
Tìm Ví dụ/example_script.py
nộp vào repo đại lý nhân bản của bạn và xem lại mã của nó. Nó cho đại lý biết nơi tìm tài liệu của bạn và cách dịch nó. Thay đổi đường dẫn tương đối ở trên. Thay đổi tên model thành tên bạn đang sử dụng; Ở đây, chúng tôi đang sử dụng Gemma
mẫu; Đồng thời thay đổi ngôn ngữ nguồn và ngôn ngữ đích bạn muốn (ở đây chúng tôi đặt Trung quốc
làm ngôn ngữ nguồn và Tiếng Anh
làm ngôn ngữ đích).
import os
import translation_agent as ta
if __name__ == "__main__":
source_lang, target_lang, country = "Chinese", "English", "Britain"
relative_path = "sample-texts/forbiddencity.txt"
script_dir = os.path.dirname(os.path.abspath(__file__))
full_path = os.path.join(script_dir, relative_path)
with open(full_path, encoding="utf-8") as file:
source_text = file.read()
print(f"Source text:\n\n{source_text}\n------------\n")
translation = ta.translate(
source_lang=source_lang,
target_lang=target_lang,
source_text=source_text,
country=country,
model="gemma",
)
print(f"Translation:\n\n{translation}")
Dịch
Chạy tập lệnh dịch python như sau.
Ví dụ về CD
example_script.py Python
Đợi vài phút và bản dịch tiếng Anh sẽ xuất hiện trên màn hình thiết bị đầu cuối của bạn.