News新闻中心
政策法规 热点信息 公司新闻 测试申请

深信服 AI 算力网关产品正式上市通知

TIME:2026-06-26   click: 59 次
 上市产品:深信服 AI 算力网关软件(X86)、深信服 AI 算力网关软件(C86)、深信服 AI 算力网关软件(ARM)
 正式上市时间:2026 年 6 月25 日
 产品概述:随着 AI Aget 应用快速普及 ,企业对 AI 算力及 Toke 调用的需求呈指数级增长,但同时也面临看不清、管不住、成本高等多重挑战。为此 ,深信服发布 AI 算力网关——作为用户统一的混合算力与模型优化调度平台,通过 Toke 治理和成本治理,让每一份算力都看得清、管得住、省得下、用得稳、更安全。
【产品介绍】
   模型接入:
 支持 operouter、硅基流动、阿里云、火山引擎、 自定义供应商等模型提供商接入
 支持 opeai 协议、athropic 协议模型接入
 支持大语言模型/多模态理解/多模态生成/嵌入模型/重排模型多种类型模型接入
   模型路由:
 支持语义路由策略 ,通过技术领先的智能路由引擎 ,可节省 AI Codig场景和数字员工应用 50%的 toke 成本。
 支持聚合路由策略(轮询/权重/优先级),避免模型供应商的单点故障,保障生产 AI 业务稳定可靠运行
   业务运营:
 用量统计:支持查看多维 Toke 监控统计 ,包括业务组、模型提供商、 APIkey、模型路由 4 大纬度, 30 余项监控指标,满足各角色各场景观测需求
 调用日志:支持审计调用请求,包括输入和输出内容、调用状态、错误码等等
   访问管理
 业务组管理:支持根据用户组织结构创建业务组,实现多层级 Toke 配额管理 ,支持月度费用配额管理, 匹配企业内实际 AI 使用习惯和管理方式
 APIkey 管理:支持 API 粒度的限流,支持按照请求频率、输入输出 Toke长度、并发连接数对普通业务进行流量控制 ,保障核心业务性能。
   安全护栏对接:
 支持平滑对接深信服 AI 安全护栏,实现 AI 业务无感的提示词注入、有害信息和敏感词防护
   算力管理:
 支持管理专属异构 GPU 资源 ,包括英伟达、昇腾、沐曦、海光、天数等,支持大小模型服务部署管理,提供简单易用的基础设施服务化和多APIkey 管理能力
   算力调优:
 提供性能探针(Trace 工具)与创新自研的自适应优化功能 ,支持对本地专属 GPU 资源、第三方平台 GPU 裸金属进行大模型推理性能优化(仅英伟达和昇腾),实现性能提升 2~5 倍,同样的 GPU 资源多服务 6~7倍的用户 ,成本节省数百万起步。
   品牌定制:
 支持按照用户的品牌要求更改平台logo 和平台介绍信息
   平台高可靠:
 AI 算力网关平台自身提供 3 实例部署模式,避免单点故障影响平台正常使用 ,同时提供更高的网关并发性能