AI智能-三八零零 - NAS私有云、AI智能体部署与服务器运维技术博客

三八零零 - NAS私有云、AI智能体部署与服务器运维技术博客

行动起来，活在当下

累计撰写 106 篇文章
累计创建 279 个标签
累计收到 0 条评论

目录CONTENT

以下是 AI智能相关的文章

2026-05-19
Qwen 3.7 预览版空降！阿里大模型迭代再提速，文本视觉双领域国产第一面向高难推理与长文场景，阿里推出 Qwen3.7 双预览版。Max 基于 MoE 架构，Arena 国产第一，支持 256K 上下文；Plus 支持百万 Token 上下文及自主编程。仅开放思考模式，专注核心推理，屏蔽外部工具。适用于开发、分析与企业部署。正式版登录阿里云峰会，全面提升推理与编码效率。
- 2026-05-19
- 39
- 0
- 0
- AI智能
- 服务器运维
2026-05-16
16G 显卡能跑 Qwen3.6 吗？27B 和 35B-A3B 量化显存对照表，一张图看懂怎么选本地部署 Qwen3.6 大模型时，需依据显存容量匹配模型架构与量化版本。对比 27B 稠密与 35B-A3B MoE 架构，梳理 GGUF 量化（Q2-Q8）显存占用。针对 16GB 至 24GB 显卡，建议优先选择 Q4 或 Q3，预留 KV Cache 空间支持长上下文。通过权衡推理速度、精度与余量，规避 OOM 风险，确保模型高效稳定运行。
- 2026-05-16
- 72
- 0
- 0
- AI智能
- 服务器运维
2026-04-27
AI大模型本地部署深度解析：这个开源神器让我的效率提升了10倍 AI大模型本地部署深度解析：这个开源神器让我的效率提升了10倍 💡 写在前面你是否遇到过：担心数据隐私泄露，想本地部署大模型但不懂配置？别急，本文是纯干货技术指南，基于 2026 年最新实践，带你深入了解AI大模型本地部署的核心原理和实战操作。适合人群：技术爱好者、运维工程师、开发者预计阅
- 2026-04-27
- 0
- 0
- 0
- AI智能
2026-04-26
折腾了一周AI大模型本地部署后，我总结出了这份避坑指南折腾了一周AI大模型本地部署后，我总结出了这份避坑指南 💡 写在前面你是否遇到过：担心数据隐私泄露，想本地部署大模型但不懂配置？别急，本文是纯干货技术指南，基于 2026 年最新实践，带你深入了解AI大模型本地部署的核心原理和实战操作。适合人群：技术爱好者、运维工程师、开发者预计阅读时间：
- 2026-04-26
- 0
- 0
- 0
- AI智能
2026-04-25
2026年04月25日 | AI大模型本地部署完全指南：从入门到精通，手把手教你部署应对高成本、隐私及厂商锁定痛点，实施 AI 大模型本地部署方案。基于服务器构建 Docker 容器环境，集成 Ollama 等开源组件。优化网络与系统参数提升性能，配合 Git 管理保障运维稳定。该路径降低授权成本，支持定制，确保数据私有安全。适用于运维与开发，实现低成本、高可控模型私有化落地，兼顾技术自主与效益。
- 2026-04-25
- 16
- 0
- 0
- AI智能
2026-04-24
llama.cpp TurboQuant 实测：RTX 3090 Ti 上 35B MoE 模型性能提升 64% 本地大模型部署常受限于显存不足与推理缓慢。实测 RTX 3090 Ti 环境，llama.cpp TurboQuant 优化 35B MoE 模型，启用 turbo3 参数，吞吐率提升 64%，延迟降低 23%，显存占用减少 13%。该方案无需更换硬件即可释放 VRAM，避免溢出，提升消费级显卡并发能力，适配长上下文本地部署。
- 2026-04-24
- 69
- 0
- 0
- AI智能
- 服务器运维
2026-04-24
AI 早报 2026-04-24：GPT-5.5 重磅发布，国产模型集体爆发针对 AI 资讯分散难追踪，今日聚焦行业核心动态。OpenAI 发布 GPT-5.5，上下文窗口扩至 200K，多模态能力增强。国产模型集中发布，腾讯混元及小米语音支持开源，适配私有服务器部署。OpenClaw 框架强化跨模型协作，结合 NVIDIA 企业级接入，完善生态闭环，满足开发者与企业算力及业务整合需求。
- 2026-04-24
- 13
- 0
- 0
- AI智能
- 服务器运维
2026-04-24
告别繁琐配置！AI大模型本地部署一键部署方案，10分钟搞定面对数据隐私挑战，提供基于 Linux 服务器的 AI 大模型本地部署方案。利用 Docker、Ollama 工具实现开源模型快速集成。涵盖依赖安装、配置、服务验证及故障排查。结合系统级性能优化，助力完成私有化 AI 架构搭建。相比商用方案，零授权成本，摆脱厂商锁定，确保算力自主可控且高度可定制，适用于开发者与运维。
- 2026-04-24
- 9
- 0
- 0
- AI智能
2026-04-23
AI 圈又炸锅了！小米开源 MiMo-V2.5、Qwen3.6-27B 发布、OpenAI 30GW 算力规划... AI 行业快速迭代致信息过载，从业者需获取关键动态。小米开源 MiMo-V2.5，阿里发布 Qwen3.6-27B，OpenAI 规划 2030 年 30GW 算力。硬件端 XAI 建 Terafab 工厂，Google 发布第八代 TPU。腾讯阿里拟投 DeepSeek。工具层 Zed 及 ChatGPT 功能更新。内容涵盖大模型、算力基建及商业布局，助开发者掌握趋势，优化架构选型与决策，紧随前沿创新。
- 2026-04-23
- 17
- 0
- 0
- AI智能
- 服务器运维
2026-04-23
折腾了一周AI大模型本地部署后，我总结出了这份避坑指南针对数据隐私与成本，本地部署 AI 大模型是优选方案。基于 Docker 容器化技术，采用 Ollama 等开源工具。服务器需 8 核 CPU、16GB 内存及 NVMe 存储。流程含环境安装、配置及验证。报错用 uv 修复，失效重启排查。优化内核参数提升网络性能。建议定期备份配置并监控日志，确保私有化模型稳定运行。
- 2026-04-23
- 3
- 0
- 0
- AI智能

1
2
3
4
5
...
8