首页
玩机折腾
网络技术
服务器运维
NAS
AI智能
关于
联系我
友情链接
三八零零 - NAS私有云、AI智能体部署与服务器运维技术博客
行动起来,活在当下
累计撰写
106
篇文章
累计创建
279
个标签
累计收到
0
条评论
栏目
首页
玩机折腾
网络技术
服务器运维
NAS
AI智能
关于
联系我
友情链接
目 录
CONTENT
以下是
服务器运维
相关的文章
2026-05-19
Qwen 3.7 预览版空降!阿里大模型迭代再提速,文本视觉双领域国产第一
面向高难推理与长文场景,阿里推出 Qwen3.7 双预览版。Max 基于 MoE 架构,Arena 国产第一,支持 256K 上下文;Plus 支持百万 Token 上下文及自主编程。仅开放思考模式,专注核心推理,屏蔽外部工具。适用于开发、分析与企业部署。正式版登录阿里云峰会,全面提升推理与编码效率。
2026-05-19
8
0
0
AI智能
服务器运维
2026-05-16
16G 显卡能跑 Qwen3.6 吗?27B 和 35B-A3B 量化显存对照表,一张图看懂怎么选
本地部署 Qwen3.6 大模型时,需依据显存容量匹配模型架构与量化版本。对比 27B 稠密与 35B-A3B MoE 架构,梳理 GGUF 量化(Q2-Q8)显存占用。针对 16GB 至 24GB 显卡,建议优先选择 Q4 或 Q3,预留 KV Cache 空间支持长上下文。通过权衡推理速度、精度与余量,规避 OOM 风险,确保模型高效稳定运行。
2026-05-16
7
0
0
AI智能
服务器运维
2026-04-24
llama.cpp TurboQuant 实测:RTX 3090 Ti 上 35B MoE 模型性能提升 64%
本地大模型部署常受限于显存不足与推理缓慢。实测 RTX 3090 Ti 环境,llama.cpp TurboQuant 优化 35B MoE 模型,启用 turbo3 参数,吞吐率提升 64%,延迟降低 23%,显存占用减少 13%。该方案无需更换硬件即可释放 VRAM,避免溢出,提升消费级显卡并发能力,适配长上下文本地部署。
2026-04-24
28
0
0
AI智能
服务器运维
2026-04-24
AI 早报 2026-04-24:GPT-5.5 重磅发布,国产模型集体爆发
针对 AI 资讯分散难追踪,今日聚焦行业核心动态。OpenAI 发布 GPT-5.5,上下文窗口扩至 200K,多模态能力增强。国产模型集中发布,腾讯混元及小米语音支持开源,适配私有服务器部署。OpenClaw 框架强化跨模型协作,结合 NVIDIA 企业级接入,完善生态闭环,满足开发者与企业算力及业务整合需求。
2026-04-24
6
0
0
AI智能
服务器运维
2026-04-23
AI 圈又炸锅了!小米开源 MiMo-V2.5、Qwen3.6-27B 发布、OpenAI 30GW 算力规划...
AI 行业快速迭代致信息过载,从业者需获取关键动态。小米开源 MiMo-V2.5,阿里发布 Qwen3.6-27B,OpenAI 规划 2030 年 30GW 算力。硬件端 XAI 建 Terafab 工厂,Google 发布第八代 TPU。腾讯阿里拟投 DeepSeek。工具层 Zed 及 ChatGPT 功能更新。内容涵盖大模型、算力基建及商业布局,助开发者掌握趋势,优化架构选型与决策,紧随前沿创新。
2026-04-23
13
0
0
AI智能
服务器运维
2026-04-22
AI 编程订阅终极对比:火山引擎 vs 腾讯云 vs 阿里云,哪家最香?
AI 编程订阅成本高企,对比腾讯、阿里及火山引擎的 Coding Plan 与 Token Plan。涵盖月费、Token、模型(Doubao/DeepSeek)及 IDE 集成。火山引擎凭借高性价比与多模型切换优势胜出,承诺数据隐私。配置 API Key 接入,替换高价订阅,实现低成本高效编码,满足重度需求,节省开支。
2026-04-22
25
0
0
AI智能
服务器运维
2026-04-20
Serverless部署深度解析:这个开源神器让我的效率提升了10倍
Serverless部署深度解析:这个开源神器让我的效率提升了10倍 大家好,我是运维博主。最近在研究Serverless部署,折腾了好几天,踩了不少坑,也积累了一些经验。今天就把整个过程整理成一份详细的教程,希望能帮到有需要的朋友。 一、什么是Serverless部署? Serverless部署是
2026-04-20
0
0
0
服务器运维
AI智能
2026-04-19
AI 领域一周速递:Gemini 原生桌面应用、Windsurf 2.0 集成 Devin、Claude 身份验证等 15 大更新
面对 AI 迭代落地挑战,资讯整合至关重要。本期梳理 15 项重点,涵盖 Gemini 模型、Claude 安全验证、Lyra 2.0 3D 生成及 Windsurf 集成 Devin。OpenAI SDK 引入沙箱环境,Cloudflare Mesh 强化 AI Agent 私有网络访问。结合 TTS 与开源,为服务器调度、企业部署及网络优化提供决策,降本增效,满足需求。
2026-04-19
13
0
0
AI智能
服务器运维
2026-04-19
折腾了一周Serverless部署后,我总结出了这份避坑指南
传统设施面临成本高、厂商锁定挑战。面向中小团队,Serverless 部署提供开源方案。依托 Docker 容器化与 Linux 系统,实现一键自动化部署、版本管理及监控告警。结合 CI/CD 与云原生特性,保障服务高可用。该方案降低运维门槛,支持弹性扩展与快速原型验证,规避部署风险,满足性能需求。
2026-04-19
11
0
0
服务器运维
AI智能
2026-04-18
【干货】Serverless部署完全指南:我折腾了3天总结出的最佳方案
传统基础设施成本高、厂商锁定且灵活性不足。Serverless 部署结合 Docker 容器化,提供开源云原生方案。通过声明式配置,在服务器搭建高可用架构,支持一键部署与 CI/CD。含环境、配置及管理验证,内置监控告警。适用中小团队,降低资源占用确保数据可控,支持业务弹性扩展与稳定。
2026-04-18
7
0
0
服务器运维
AI智能
1
2
3