Chuyển tới nội dung chính

Summary

Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), một trường đại học nghiên cứu quốc gia hàng đầu, cần một cơ sở hạ tầng mạnh mẽ và có khả năng mở rộng để xây dựng một Mô hình Ngôn ngữ Lớn (LLM) tiên tiến dành riêng cho tiếng Nhật. Mục tiêu của họ là tiến hành các thử nghiệm mở rộng, từ khám phá tổ hợp dữ liệu tối ưu đến continual pre-training quy mô lớn, đòi hỏi sức mạnh tính toán đáng kể và nền tảng MLOps hợp lý.

Hợp tác với FPT AI Factory, JAIST đã tận dụng bộ dịch vụ toàn diện bao gồm FPT AI Studio và FPT AI Inference để đẩy nhanh pipeline nghiên cứu và phát triển của họ. Sự hợp tác này cho phép JAIST xác định có hệ thống các tổ hợp dữ liệu tốt nhất, thực hiện nhiều giai đoạn continual pre-training quy mô lớn trên các dataset khổng lồ, và đánh giá hiệu suất model một cách hiệu quả. Bằng cách chuyển giao sự phức tạp của việc quản lý cơ sở hạ tầng GPU cho FPT AI Factory, đội ngũ nghiên cứu của JAIST có thể tập trung vào sứ mệnh cốt lõi của họ: thúc đẩy biên giới của xử lý ngôn ngữ tự nhiên cho tiếng Nhật.