招标详情
下文中****为隐藏内容,仅对千里马会员开放,如需查看完整内容请
「注册/登录」或 拨打咨询热线:
400-688-2000
项目名称 集群调度平台与人工智能实训平台 | 项目编号 **** |
公告开始日期 2025-01-14 17:02:35 | 公告截止日期 2025-01-17 18:00:00 |
采购单位 **** | 付款方式 进口设备: 甲方与****公司签订代理进口委托协议后,将进口项****公司****银行账户,项目货款仅用于本进口项目的信用证或TT付汇及进口相关费用等。****公司收到甲方合同货款后,按外贸合同要求及时履行与乙****公司的付款义务。 国产设备:甲方应在完成验收并建立固定资产后向乙方一次性支付本合同的总款项,乙方须向甲方出具合法有效完整的完税发票及凭证资料进行支付结算。 |
联系人 | 联系电话 |
签约时间要求 | 到货时间要求 合同签订后30个日历日内 |
预算总价 ¥56000.00 |
发票要求 |
含税要求 |
送货要求 |
安装要求 |
收货地址 ******南区 |
供应商资质要求 符合《政府采购法》第二十二条规定的供应商基本条件 |
公告说明 |
采购商品 采购数量 计量单位 所属分类
人工智能实训平台授权 | 16 | 个 | 应用软件 |
品牌 曙光 |
型号 人工智能管理平台SothisAI v2.0授权 |
预算单价 ¥ 3000.00 |
技术参数及配置要求 1.平台授权:配置一套人工智能AI服务平台,含16张卡许可授权。可通过管理调度软件统一调度管理,在同一平台界面可同时运行HPC作业和AI作业,提供国家版权局颁发的计算机软件著作权登记证书复印件加盖公章; 2.模型训练:支持基于docker容器的模型训练功能。对TensorFlow和Pytorch等框架下的训练任务提供Horovod训练模式,支持通过Horovod进行大规模Ring All Reduce训练。 3.参数调优:支持基于容器的分布式超参数自动调优功能。支持TPE自动搜索算法,多参数同时调优。用户可自定义调参任务的调优参数类型、调参范围,使用的框架版本、容器数量、CPU数量、内存、加速器类型等内容,验收时进行功能验证; 4.镜像:支持用户自定义镜像,包括镜像包,从DockerHub拉取,基于Dockerfile在线制作等模式。提供镜像制作进度和日志查询功能。支持用户将自定义镜像或订阅镜像推送至训练、调优、推理等图形化流程进行使用。 5.数据集管理支持按照应用场景和格式管理用户数据集,支持对数据集添加数据标注信息,并可按照版本进行管理。可将个人数据集共享至平台,可选择同步共享的标注版本,配置共享范围和共享模式。 6.容器:支持创建多容器实例任务,可通过页面对容器组提交批量执行脚本,以****服务部署;配置容器环境变量和启动脚本,在容器运行时默认执行,避免**闲置;支持自定义容器挂载路径。 7.兼容性:支持选择K8S等云原生调度器或者Slurm等先进计算调度器作为调度引擎,适配不同的业务场景。在同一调度器中,同时管理、调度和监控业界主流NVDIA GPU和DCU、MLU等国产加速器; 8.售后服务要求:由原厂工程师上门安装部署安装调试,提供售后服务承诺函。 |
参考链接 |
售后服务 服务年限:36月;电话支持:7x24小时;商品承诺:原厂全新未拆封正品;质保期:三年; |
采购商品 采购数量 计量单位 所属分类
集群调度平台授权 | 2 | 个 | 基础软件 |
品牌 曙光 |
型号 Gridview集群综合管理系统V5.0授权 |
预算单价 ¥ 4000.00 |
技术参数及配置要求 1.总体概述:提供2个原厂软件授权,兼容调度现有2个计算节点。激活原有一套商业版集群调度管理软件,包括系统软件、集群调度、集群监控、作业调度、流量计费、分布式文件系统等管理功能。提供国家版权局颁发的计算机软件著作权登记证书复印件加盖公章; 2.兼容性:提供标准二次开发接口RESTful API,满足进行个性化功能开发。支持linux、Windows、Redhat及国产**、方德、ubuntu等系列操作系统安装。支持CPU、GPU、国产加速器、寒武纪、海光等异构集群的调度。由原厂工程师上门安装; 3.提供本地软件仓库,集成 HPC 集群常用的各种开源和免费软件,包括集群基础软件(如编译器、MPI 数学库、Infiniband 驱动)和硬件诊断工具。 4.稳定性策略:可支持管理节点的双机热备,主节点出问题,备用节点自动接管并继续提供服务,确保业务服务稳定。支持对于宕机(或网络不通的)节点上作业的自动重新调度;支持对于因为系统临时错误导致的异常作业进行自动重新入队和调度;支持当作业返回特定退出码时进行自动重新调度。 5.集群预警:支持自定义通知策略,实现页面预警、邮件告警等通知方式;符合告警策略条件将会产生相应告警信息并通过邮件、短信方式通知负责人;支持多种告警信息显示方式:包括告警列表以及与机房物理视图、热图等监控视图结合展示等。 6.并发性能:调度性能:支持≥30000个计算节点调度支持大批量作业的实时调度,最大瞬时大规模作业(≥3000个)的同时提交;支持大批量作业的动态优先级调动并发瞬时吞吐率峰值(≥2000个)的**调度; 7.监控管理:提供作业热图,直观展现用户作业在集群的分布情况,以及集群**的整体使用状况。提供调度系统状态分析视图仪表,直观展示集群、队列、用户等不同视角的**使用信息和作业负载信息,为管理员的调整优化提供决策依据。 8.**管理策略:平台可设定作业优先级、**限额、**共享、**预留、作业回填、作业抢占、节点独占、负载均衡等调度策略。 9.**创建:支持对平台数据库用户和各类操作系统用户(如本地用户、NIS、LDAP等)的统一管理,支持用户的创建、修改、删除、冻结和激活操作,可对用户和用户组的磁盘作配额管理。 10.支持将作业均衡的分配到所有计算节点上,避免任务堆积在个别节点,因争抢 CPU、内存等**导致计算变慢。支持随机选择作业的计算节点,解决特定场景和固定调度算法下某些计算节点被频繁使用的问题。 11.允许作业独占计算节点,支持集群、队列、作业三级的的节点独占策略设置。支持灵活可配置的节点可用性判定策略。检查作业的可用节点时,需要考虑多种**请求(如处理器、内存、磁盘)进行判定,允许针对不同的**使用不同的判定算法(如按照实际使用量、按照调度分配量,或者综合两者进行判定)。 12.支持基于队列、用户、用户组等不同维度的**限额(即可用处理器数、内存数、节点 数、作业数、GPU 数等),方便管理员控制**分配; 13.支持基于队列、用户、用户组等多个维度的优先级定义策略,根据作业的静态(如** 请求、所属用户等)和动态指标(如入队时间、公平共享份额等),通过不同的权重设置,灵活控制作业优先级; 14.提供基于 Web 的文件管理功能,支持文件和文件夹的创建、删除、重命名、在线编辑、权限设置,支持文件的节点间同步,支持文件批量上传和打包下载,支持列表视图**铺视图的切换。 15.支持计算数据或计算结果极速上传下载,支持快传和断点续传,可一次性高速传输数百个文件以及 TB 级文件,支持大文件远程传输 16. 支持批处理作业、命令行交互式作业以及 GUI 图形交互作业,支持通过浏览器打开 VNC会话进行操作;支持设置多个专门的 VNC 服务节点,统一 VNC 会话的管理;支持作业 VNC会话在不同 VNC 服务节点上的负载均衡; 17. 提供调度系统状态分析视图 Dashboard,直观展示集群、队列、用户等不同视角的**使用信息和作业负载信息,为管理员的调整优化提供决策依据。 18. 支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群**,只有账号余额充足时才能运行作业。 19. 支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费;支持基于CPU、GPU、存储空间计费 20. 支持导出作业粒度的计费详表,供用户核对;支持 GPU、存储计费等功能; 21.售后服务要求:由原厂工程师上门安装部署安装调试,提供售后服务承诺函。 |
参考链接 |
售后服务 服务年限:36月;电话支持:7x24小时;商品承诺:原厂全新未拆封正品;质保期:三年; |