首页
玩机折腾
网络技术
服务器运维
NAS
AI智能
关于
联系我
友情链接
三八零零 - NAS私有云、AI智能体部署与服务器运维技术博客
行动起来,活在当下
累计撰写
106
篇文章
累计创建
279
个标签
累计收到
0
条评论
栏目
首页
玩机折腾
网络技术
服务器运维
NAS
AI智能
关于
联系我
友情链接
目 录
CONTENT
以下是
AI智能
相关的文章
2026-05-19
Qwen 3.7 预览版空降!阿里大模型迭代再提速,文本视觉双领域国产第一
面向高难推理与长文场景,阿里推出 Qwen3.7 双预览版。Max 基于 MoE 架构,Arena 国产第一,支持 256K 上下文;Plus 支持百万 Token 上下文及自主编程。仅开放思考模式,专注核心推理,屏蔽外部工具。适用于开发、分析与企业部署。正式版登录阿里云峰会,全面提升推理与编码效率。
2026-05-19
8
0
0
AI智能
服务器运维
2026-05-16
16G 显卡能跑 Qwen3.6 吗?27B 和 35B-A3B 量化显存对照表,一张图看懂怎么选
本地部署 Qwen3.6 大模型时,需依据显存容量匹配模型架构与量化版本。对比 27B 稠密与 35B-A3B MoE 架构,梳理 GGUF 量化(Q2-Q8)显存占用。针对 16GB 至 24GB 显卡,建议优先选择 Q4 或 Q3,预留 KV Cache 空间支持长上下文。通过权衡推理速度、精度与余量,规避 OOM 风险,确保模型高效稳定运行。
2026-05-16
7
0
0
AI智能
服务器运维
2026-04-27
AI大模型本地部署深度解析:这个开源神器让我的效率提升了10倍
AI大模型本地部署深度解析:这个开源神器让我的效率提升了10倍 💡 写在前面 你是否遇到过:担心数据隐私泄露,想本地部署大模型但不懂配置? 别急,本文是纯干货技术指南,基于 2026 年最新实践,带你深入了解AI大模型本地部署的核心原理和实战操作。 适合人群:技术爱好者、运维工程师、开发者 预计阅
2026-04-27
0
0
0
AI智能
2026-04-26
折腾了一周AI大模型本地部署后,我总结出了这份避坑指南
折腾了一周AI大模型本地部署后,我总结出了这份避坑指南 💡 写在前面 你是否遇到过:担心数据隐私泄露,想本地部署大模型但不懂配置? 别急,本文是纯干货技术指南,基于 2026 年最新实践,带你深入了解AI大模型本地部署的核心原理和实战操作。 适合人群:技术爱好者、运维工程师、开发者 预计阅读时间:
2026-04-26
0
0
0
AI智能
2026-04-25
2026年04月25日 | AI大模型本地部署完全指南:从入门到精通,手把手教你部署
应对高成本、隐私及厂商锁定痛点,实施 AI 大模型本地部署方案。基于服务器构建 Docker 容器环境,集成 Ollama 等开源组件。优化网络与系统参数提升性能,配合 Git 管理保障运维稳定。该路径降低授权成本,支持定制,确保数据私有安全。适用于运维与开发,实现低成本、高可控模型私有化落地,兼顾技术自主与效益。
2026-04-25
12
0
0
AI智能
2026-04-24
llama.cpp TurboQuant 实测:RTX 3090 Ti 上 35B MoE 模型性能提升 64%
本地大模型部署常受限于显存不足与推理缓慢。实测 RTX 3090 Ti 环境,llama.cpp TurboQuant 优化 35B MoE 模型,启用 turbo3 参数,吞吐率提升 64%,延迟降低 23%,显存占用减少 13%。该方案无需更换硬件即可释放 VRAM,避免溢出,提升消费级显卡并发能力,适配长上下文本地部署。
2026-04-24
28
0
0
AI智能
服务器运维
2026-04-24
AI 早报 2026-04-24:GPT-5.5 重磅发布,国产模型集体爆发
针对 AI 资讯分散难追踪,今日聚焦行业核心动态。OpenAI 发布 GPT-5.5,上下文窗口扩至 200K,多模态能力增强。国产模型集中发布,腾讯混元及小米语音支持开源,适配私有服务器部署。OpenClaw 框架强化跨模型协作,结合 NVIDIA 企业级接入,完善生态闭环,满足开发者与企业算力及业务整合需求。
2026-04-24
6
0
0
AI智能
服务器运维
2026-04-24
告别繁琐配置!AI大模型本地部署一键部署方案,10分钟搞定
面对数据隐私挑战,提供基于 Linux 服务器的 AI 大模型本地部署方案。利用 Docker、Ollama 工具实现开源模型快速集成。涵盖依赖安装、配置、服务验证及故障排查。结合系统级性能优化,助力完成私有化 AI 架构搭建。相比商用方案,零授权成本,摆脱厂商锁定,确保算力自主可控且高度可定制,适用于开发者与运维。
2026-04-24
5
0
0
AI智能
2026-04-23
AI 圈又炸锅了!小米开源 MiMo-V2.5、Qwen3.6-27B 发布、OpenAI 30GW 算力规划...
AI 行业快速迭代致信息过载,从业者需获取关键动态。小米开源 MiMo-V2.5,阿里发布 Qwen3.6-27B,OpenAI 规划 2030 年 30GW 算力。硬件端 XAI 建 Terafab 工厂,Google 发布第八代 TPU。腾讯阿里拟投 DeepSeek。工具层 Zed 及 ChatGPT 功能更新。内容涵盖大模型、算力基建及商业布局,助开发者掌握趋势,优化架构选型与决策,紧随前沿创新。
2026-04-23
13
0
0
AI智能
服务器运维
2026-04-23
折腾了一周AI大模型本地部署后,我总结出了这份避坑指南
针对数据隐私与成本,本地部署 AI 大模型是优选方案。基于 Docker 容器化技术,采用 Ollama 等开源工具。服务器需 8 核 CPU、16GB 内存及 NVMe 存储。流程含环境安装、配置及验证。报错用 uv 修复,失效重启排查。优化内核参数提升网络性能。建议定期备份配置并监控日志,确保私有化模型稳定运行。
2026-04-23
3
0
0
AI智能
1
2
3
4
5
...
8