-
职责:
1、负责公司Kubernetes容器多集群的架构设计,容量规划,性能优化,SLO指标设计及相关问题进行排查处理对SLO稳定性负责;
2、利用eBPF技术
-
***需要能独立设计/实现系统及解决方案
Description
▍ 工作内容:
设计、开发和维护高可靠性、可维护性和可扩展性的云原生系统、与平台及游戏开发团
-
1.负责抖音运维
要求:
1.有运维经验
-
职位描述
Site Reliability Engineer (SRE) 结合了软件和系统工程,致力于打造高扩展、高可用的分布式系统
1. 保障大数据/计算/云
-
职位描述
鹰角SRE团队,负责鹰角游戏和平台等业务的技术保障工作,负责整体基础设施的落地和演进。
1. 负责游戏业务的技术保障工作,包括但不限于日常变更、容
-
1. 精通私有云vmware等主流超融合计算存储虚拟化管理员3年+经验(vSphere, vSAN, NSX, vRealize)
2.熟练具备至少一个共有云平
-
岗位职责
1.负责云产品稳定性治理,保障业务高度稳定性;
2.负责云产品容灾架构的设计和落地,提升故障快速自愈的手段和能力;
3.负责云产品线上生产变更管理
-
工作职责:
1.负责构建和运维大型高可靠的自动化、智能化GPU调度 K8S 平台;
2.负责平台容量规划、配置管理及可用性保障,包括但不限于K8S集群、监控及日
-
岗位职责
1. 负责大数据集群和复杂业务场景的自动化及管控平台建设;
2. CI/CD系统建设,服务变更管理、灰度发布及对应工具平台建设。
任职要求
1.
-
1、负责海外产品的大规模集群的SRE和运维优化工作
2、负责服务的持续集成和交付,高效和自动化的运维优化,提升服务的稳定性和研发效率
3、负责大规模集群的云平台
-
彩云科技是一家致力于研究和应用人工智能技术服务大众的公司。
职位描述
1、负责基础设施架构设计、实施和维护,包括日常故障分析处理、容量规划等;
2、负责构建
-
【工作职责】
1. 负责大数据和AI产品测试、解决方案测试的设计和执行,提升产品测试质量和效率,支撑商业成功;
2. 负责大数据和AI产品现网交付;
3. 负责
-
小红书 SRE 负责通过技术,保障小红书线上业务的稳定性;我们的理念是通过技术解决运维问题,以业务的成功作为自己的成功。我们的职位中可能没有明确的运维开发职位,
-
职位职责:
1、负责上海汽车商业化的系统运维工作,工作涵盖规划、故障预案、架构优化、容量管理、服务灾备等,做到7*24快速响应;
2、与开发、产品等多部门紧密合
-
职位描述
运维研发工程师(SRE)是指用软件工程的方法来管理系统、解决问题并实现运维自动化,以减少琐事,提高服务的可用性。
包括但不限于如下工作内容:
1. 负
-
Key Qualifications
• Bachelor's degree in Computer Science or equivalent experie
-
职位介绍:
1. 面向业务构建连续性策略,为集团内部及外部客户提供行业绝对领先的可靠性技术服务。围绕业务持续安全、可用目标,构建多端智能预警、根因定位、动线分析
-
SRE岗位的JD:
工作内容:
1. 参与容器平台的持续交付,现有集群的管理,应急响应,效率提升等工作
2. 参与运维工作的标准化,自动化和智能化工作
3. 参
-
岗位职责
1.负责大数据套件的管理、优化、运营;
2.负责大数据平台日常运维管理、服务监控、故障处理、集群性能和资源利用率优化,集群常见问题迅速定位,为客户提供
-
工作职责:
1、负责线上环境的配置,维护,监控,调优,和故障排除,
2、保障业务7*24小时的持续运作能力,优化站点性能与可用性
3、负责Kubernetes和
-
阿里云-公共云互联网CRE,阿里云KA客户服务重地,数字化的技术服务育土,做既有业务挑战又有技术洞见追求的事儿。
岗位描述:
1. 作为阿里云KA客户服务顾问,
-
Java开发工程师
华为云计算扩招中,大量HC,机会难得,富有挑战的工作,欢迎咨询!
岗位描述:
1、负责华为云数据库管控系统,全链路监控,等基础平台的设计及
-
1、负责分布式数据库存储子系统的现网交付、应急保障、问题处理工作;
2、负责分布式数据库存储子系统运维平台和工具的设计、开发工作;
3、用自动化、智能化的方法解
-
华为云-运维解决方案工程师
岗位职责:
1、负责华为云关键站点、关键大客户的现网运维看护,队业务模型、容灾能力、容量、性能等能力进行分析及优化。
2、负责华为云
-
1、 负责蚂蚁金服所有应用的故障发现、故障应急、演练等技术风险领域的功能研发;
2、 负责蚂蚁金服所有变更的技术风险,对所有技术风险故障负责;
3、
-
岗位职责:
1、负责平台运维及运营过程中各种突发事件,并作出及时的计划与响应,推进SLA落地。
2、负责日常运维工作、包括不限于应用发布、系统升级等环节,可快速
-
职位描述:
我们是谁?
我们是欢乐互娱技术中心,承载公司中台化演进和研运一体的使命,沉淀对游戏最有价值的解决方案。
在这里你可以和一群公司最优秀的游戏客户端和服
-
职位描述
1. 负责刻行产品的公有云、混合云、以及私有云的部署方案开发、维护、和实施,保证线上服务的可用性、稳定性、和安全性;
2. 负责线上服务基础设施的维护
-
岗位职责:
1. 深入了解公司业务,参与技术方案的设计与评审,包括架构设计、系统开发与运维集成;
2. 推动业务系统云原生改造,实施降级、熔断等高可用方案,
-
工作职责
1、负责公共服务的日常运维。
2、负责运维工具的开发及优化。
3、负责服务的故障排查和问题解决。
4、持续优化服务的运维效率及规范。
任职要求
1、计