llama.cpp

模型训练与部署

社区推荐

全国

C++

llama.cpp 是一个开源项目，专为高效推理设计，支持在 CPU、轻量级 GPU 和边缘设备上运行大规模语言模型。该项目主要使用 C/C++ 编写，适合开发人员和研究人员，满足不同场景下的嵌入式应用需求。

推荐语