跳转到内容
欢迎抵达彼岸 彼岸花开 此处谁在 -彼岸论坛

[程序员] ollama 本地模型 GPU 跑不满

Featured Replies

发表于
在本地部署了 ollama 的 API 做生成任务,现在有 4 块 A800 的 GPU ,ollama 已经开启了并行任务。

现在的问题是,模型速度提不上去,GPU 也没有跑满,占用在 80%左右,显存也只用了 1/2 。

是其他什么硬件到了瓶颈吗?影响模型生成速度的内存带宽?如何能提升速度?

O9ZShf0.png

n5uSO8L.png