-
岗位职责
1、负责线上环境(主要基于 K8S)服务的稳定、高效运行;
2、参与监控系统开发,并及时响应各种故障报警,能够快速解决问题恢复业务;
3、及时响应研发
-
岗位职责:
1.参与高性能AI集群的运维和优化工作;
2.参与公司运维平台系统的开发迭代;
3.参与相关代码设计以及文档编写工作。
岗位要求
1.掌握Pyt
-
岗位职责:
* 负责智能运维相关产品的架构设计、核心功能研发及技术优化(预案管理、变更管理、容量管理、成本经营分析)
* 参与大语言模型在运维领域落地的相关研发
-
岗位职责:
* 负责研发通用的算法,应用于异常检测、根因分析、故障定位等运维场景
* 探索大模型在运维领域的应用落地,包括运维大模型训练、构建智能体等
* 跟进
-
1、计算机专业、有开发技术优先
2、表单流程搭建
3、小工具开发
-
工作职责:
1. 负责公司 平台业务 的架构设计、容量规划、日常运维、故障处理等,持续提升系统资源利用率和稳定性。
2. 参与公司产品服务的 架构梳理与风险评估
-
岗位职责:
一、云平台规划与运营
1.主导企业级云平台的架构设计、技术选型与落地部署,具有混合云部署经验者优先;
2.制定公司应用上云迁移策略,统筹业务系统向云
-
数犀科技是钉钉的核心伙伴,一家专注于企业数字化与AI场景的下一代智能集成平台提供商。基于统一的数字身份、应用、AI的集成与连接,致力于让企业实现更自动化、更智能
-
岗位职责:
1)根据业务需求,搭建并配置应用系统所需的软硬件环境及网络环境;
2)协助集成开发人员完成系统的上线部署与运行维护;
3)协助完成网络拓扑规划及实施
-
岗位职责:
1、负责华为、阿里、天翼云平台(包括存储系统、服务器系统、数据库系统等)的日常管理与运行维护,涵盖日常运行管理、记录、检查评价、现场巡检、系统及硬件
-
工作职责:
1、负责OpenStack虚拟化平台部署,监控与维护。
2、负责分布式存储系统Ceph进行深度性能调优。
3、处理系统突发事件,确保问题闭环。
-
1、职位信息
职位名称:KVM云平台运维专家
部门:运维专家团队
工作地点:北京市朝阳区紫月路18号院9号楼
职位类型:全职
2、公司简介
北京首都在线科技股
-
职位描述:
我们正在寻找一位对系统稳定性和数据可靠性有极致追求的运维工程师。您将负责维护我们核心的专利检索分析SaaS平台的稳定、高效与安全,确保全球用户能够
-
请注意,要求本科或以上学历且学信网可查。
岗位职责:
1、负责金融行业客户现场云平台日常运统工作,帮助指导客户正确使用云计算产品,包括IAAS 存储产品:
2、
-
【岗位职责】
1、保障登录支付、邮件聊天、大数据、AI工程、海外游戏等核心业务的高可用与稳定性,构建云原生稳定性保障平台,推动SLO达成。
2、主导大规模Kub
-
工作职责
- 云服务器管理:批量管理数十至上百台云服务器,高效完成软件部署、配置修改等操作。
- 基础服务维护:负责域名解析、内网搭建、账号管理及服务采购。
-
-
岗位职责:
1.负责云平台运维管理工作,使其达到99.999%的运维指标,以及平台运营管理工作。
2.负责云平台运维管理工作,包括运维业务梳理及优化、运维团队优
-
职位描述
1)负责阿里云AI人工智能平台(PAI)运维工作,建设超大规模GPU集群稳定性体系,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等
-
核心职责:
1. 平台监控与告警:
负责7x24小时PCDN平台监控(节点状态、服务质量、带宽、资源等),确保告警及时准确。
2. 故障应急响应:
-
岗位职责:
1. 负责日常的云平台运维工作,确保系统稳定运行。
2. 对云平台进行性能监控,及时发现并解决系统相关问题。
3. 参与云平台的配置管理,包括但不限
-
岗位职责:
1、部署运维AI/数据平台,管理K8s集群及GPU服务器(驱动/CUDA/监控);
2、搭建Prometheus+Grafana监控体系及ELK/L
-
学历要求:
大学本科
经验要求:
3年
岗位职责:
1.通过研发自动化、数据化、智能化工具或平台提升K8S集群、宿主机运维管理效率,避免低效重复劳动
参
-
岗位要求
1、具有1年以上视频监控系统的实施和运维经验,能独立完成视频监控系统及简单视频网络的技术调试工作。
2、熟悉常见网络设备的配置和管理,如思科(Cisc
-
1、大学本科以上学历,计算机或相关专业
2、3年以上云计算管理运维经验,精通Linux、Docker、K8S等技术,
3、熟悉git、maven、jekins、
-
相关大厂驻场运维
1、客户现场的云平台运维二线工单支持;
2、云平台健康检查;
3、云平台日常问题处理;
4、云平台容量评估;
5、云平台变更支持;
6、与用户
-
岗位职责:
1、负责制定中间件平台(含各类中间件软件和中间件组件)技术标准和规范,熟悉微服务架构,为业务系统上云部署提供技术支撑工作。
2、负责业务系统中间件选
-
任职要求:
1、本科及以上学历,计算机相关专业,有敏锐的安全意识,3年及以上IT运维经验;
2、熟悉AWS产品,包括但不限于EC2、ELB、IAM、⽹络以及安全
-
工作职责:
1,参与现场值班,包括 客户工单,告警工单处理;
2,参与配合产品升级迭代割接变更,测试工作;
3,负责领域划分产品日常维护工作
4,完成领导交代
-
岗位职责
安全技术服务方向:
1.统招本科及以上学历。
2.4年以上云网络安全运维经验经验,并具备4年以上大型企业云安全服务工作经历。
3.精通主流私有云平台,
-
About the Team
AI平台-SRE作为公司统一AI平台的运维团队,致力于确保公司所有的AI业务在平台中稳定、高效地运行,同时与AI平台研发团队共同推