AI新工具

blog-thum
bert.cpp

bert.cpp 是一个基于 ggml 实现的 BERT 嵌入架构库,支持在 CPU、CUDA 和 Metal 上使用多种量化方案进行推断,并提供了 Python 绑定用于批量推断。

read more