まとめ

北陸先端科学技術大学院大学（JAIST） は、日本語に特化した最先端の大規模言語モデル（LLM）を構築するため、堅牢でスケーラブルなインフラを必要としていました。最適なデータ組み合わせの探索から大規模なcontinual pre-trainingまで、幅広い実験を行うため、大きな計算能力と効率的なMLOpsプラットフォームが求められました。

FPT AI Factoryとの協力のもと、JAISTは FPT AI StudioとFPT AI Inference を含む包括的なサービス群を活用し、研究開発パイプラインを加速 しました。この協力により、JAISTは最適なデータ混合を体系的に特定し、大規模データセットでの複数段階にわたる大規模continual pre-trainingを実行し、モデルの性能評価を効率的に行うことができました。GPUインフラ管理の複雑さをFPT AI Factoryに委ねることで、JAISTの研究チームはコアミッションである日本語の自然言語処理の最前線の開拓に集中できました。