深信服 AI 算力网关产品正式上市通知_广州铭冠信息科技有限公司（铭冠网安）官网：网络安全,数据安全,云计算,信创产品,安全服务

上市产品：深信服 AI 算力网关软件（X86）、深信服 AI 算力网关软件（C86）、深信服 AI 算力网关软件（ARM）

正式上市时间：2026 年 6 月25 日

产品概述：随着 AI Aget 应用快速普及，企业对 AI 算力及 Toke 调用的需求呈指数级增长，但同时也面临看不清、管不住、成本高等多重挑战。为此，深信服发布 AI 算力网关——作为用户统一的混合算力与模型优化调度平台，通过 Toke 治理和成本治理，让每一份算力都看得清、管得住、省得下、用得稳、更安全。

【产品介绍】

模型接入：

支持 operouter、硅基流动、阿里云、火山引擎、自定义供应商等模型提供商接入

支持 opeai 协议、athropic 协议模型接入

支持大语言模型/多模态理解/多模态生成/嵌入模型/重排模型多种类型模型接入

模型路由：

支持语义路由策略，通过技术领先的智能路由引擎，可节省 AI Codig场景和数字员工应用 50%的 toke 成本。

支持聚合路由策略（轮询/权重/优先级），避免模型供应商的单点故障，保障生产 AI 业务稳定可靠运行

业务运营：

用量统计：支持查看多维 Toke 监控统计，包括业务组、模型提供商、 APIkey、模型路由 4 大纬度， 30 余项监控指标，满足各角色各场景观测需求

调用日志：支持审计调用请求，包括输入和输出内容、调用状态、错误码等等

访问管理

业务组管理：支持根据用户组织结构创建业务组，实现多层级 Toke 配额管理，支持月度费用配额管理，匹配企业内实际 AI 使用习惯和管理方式

APIkey 管理：支持 API 粒度的限流，支持按照请求频率、输入输出 Toke长度、并发连接数对普通业务进行流量控制，保障核心业务性能。

安全护栏对接：

支持平滑对接深信服 AI 安全护栏，实现 AI 业务无感的提示词注入、有害信息和敏感词防护

算力管理：

支持管理专属异构 GPU 资源，包括英伟达、昇腾、沐曦、海光、天数等，支持大小模型服务部署管理，提供简单易用的基础设施服务化和多APIkey 管理能力

算力调优：

提供性能探针（Trace 工具）与创新自研的自适应优化功能，支持对本地专属 GPU 资源、第三方平台 GPU 裸金属进行大模型推理性能优化（仅英伟达和昇腾），实现性能提升 2～5 倍，同样的 GPU 资源多服务 6～7倍的用户，成本节省数百万起步。

品牌定制：

支持按照用户的品牌要求更改平台logo 和平台介绍信息

平台高可靠：

AI 算力网关平台自身提供 3 实例部署模式，避免单点故障影响平台正常使用，同时提供更高的网关并发性能