zhongdenny 最近的时间轴更新
zhongdenny

zhongdenny

V2EX 第 197175 号会员,加入于 2016-10-19 23:59:59 +08:00
zhongdenny 最近回复了
1 天前
回复了 mingtdlb 创建的主题 Local LLM LLM 私有化部署
@mingtdlb ollama 的默认 671b ,400G 大小,好像写着是 4 比特量化版本。官方版本 163 个 4G 的文件,合计大概 700G 。
@nagisaushio 你是用 ollama 还是 llama.cpp 来运行的?
我用了 2.22bit 的版本,llama.cpp ,8 卡 4090 ,跑到 3 token/s 。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2617 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 04:15 · PVG 12:15 · LAX 20:15 · JFK 23:15
Developed with CodeLauncher
♥ Do have faith in what you're doing.