Triển khai LoRA inference
Cách triển khai mô hình LoRA đã fine-tune?
Bạn có thể triển khai mô hình LoRA đã fine-tune để sử dụng ngay qua API mà không cần quản lý bất kỳ hạ tầng nào.
Các bước thực hiện
- Vào trang Deployment từ thanh điều hướng.
- Hoặc nhấp View deployment từ pop-up thành công sau khi fine-tune xong.
- Nhấp Deploy bên cạnh mô hình LoRA bạn muốn triển khai.
- Trạng thái sẽ chuyển sang Deploying.
- Sau khi triển khai thành công, trạng thái sẽ hiển thị Deployed.
Cách quản lý các mô hình đã triển khai?
Trên trang Deployment, bạn có thể:
- Get API Key — lấy key để gọi mô hình của bạn.
- View API request — mở pop-up với phản hồi JSON mẫu.
- Try in Playground — kiểm thử mô hình trực tiếp trên giao diện.
- Undeploy — dừng mô hình đã triển khai (yêu cầu xác nhận).
Trạng thái
- Deploying — mô hình đang được triển khai.
- Deployed — mô hình sẵn sàng cho inference.
- Stopped — mô hình đã được hủy triển khai.
- Failed — triển khai thất bại.
