首页
注册
登录
zhongdenny 最近的时间轴更新
zhongdenny
V2EX 第 197175 号会员,加入于 2016-10-19 23:59:59 +08:00
zhongdenny
提问
技术话题
好玩
工作信息
交易信息
城市相关
zhongdenny 最近回复了
1 天前
回复了
mingtdlb
创建的主题
›
Local LLM
›
LLM 私有化部署
@
mingtdlb
ollama 的默认 671b ,400G 大小,好像写着是 4 比特量化版本。官方版本 163 个 4G 的文件,合计大概 700G 。
1 天前
回复了
2067
创建的主题
›
Local LLM
›
有没有富哥实际部署了 671b 完全体 R1 的来说说跟 llama3.1:405b 的性能有多大进化
@
nagisaushio
你是用 ollama 还是 llama.cpp 来运行的?
我用了 2.22bit 的版本,llama.cpp ,8 卡 4090 ,跑到 3 token/s 。
»
zhongdenny 创建的更多回复
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
2617 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms ·
UTC 04:15
·
PVG 12:15
·
LAX 20:15
·
JFK 23:15
Developed with
CodeLauncher
♥ Do have faith in what you're doing.