AI agent 部署工程师

苏州市 全职 RMB500,000 - RMB700,000 年薪 View Job Description
主导大模型Agent在金融风控、广告推荐、客服自动化等中后台场景的工程化落地,实现千亿参数模型在K8s集群的毫秒级响应
  • 上市互联网公司-美股港股
  • 细分领域独角兽

关于我们的客户

作为中国互联网行业的技术先驱,深耕AI领域十余年,已构建覆盖搜索、广告、金融、云服务的全场景AI体系。

职责描述



  1. 核心系统部署
    • 主导大模型Agent在金融风控、广告推荐、客服自动化等中后台场景的工程化落地,实现千亿参数模型在K8s集群的毫秒级响应
    • 设计基于Service Mesh的智能路由系统,动态调配CPU/GPU/NPU异构计算资源,达成95%以上资源利用率


  2. 全链路性能攻坚
    • 开发模型-数据-算力联合优化框架,突破传统蒸馏/量化技术限制(目标:同等效果下推理成本降低40%)
    • 构建多模态Agent的灰度发布体系,支持每日百万级策略AB测试流量无损切换


  3. 稳定性体系建设
    • 建立AI服务的混沌工程防护网,实现服务可用性99.99%的SLA保障
    • 研发智能熔断降级系统,基于强化学习预测业务流量异常波动

理想的求职者

硬性条件

  • 5年以上分布式系统开发经验,主导过至少2个日请求量过亿的AI服务部署项目
  • 精通PyTorch Serving/Triton Inference Server等工业级部署框架二次开发
  • 掌握K8s+Istio+Prometheus技术栈的深度调优,有万卡集群管理经验者优先
  • 熟悉模型压缩全栈工具链(TensorRT/OpenVINO/NVIDIA Triton)



加分项

  • 拥有大型推荐/风控系统服务化经验(如微信支付风控引擎架构)
  • 主导过FPGA/ASIC芯片的AI算子移植项目
  • 持有AI模型部署相关专利或顶会论文(AIOps/MLSys领域)



薪酬待遇

✅ ‌行业的技术生态‌:内部开源社区拥有200+AI部署核心组件(如凤凰调度系统、星尘监控平台)
✅ ‌规模化实战场景‌:支持微信支付/视频号/腾讯广告等核心业务,日均处理20PB级推理数据
✅ ‌工程师文化‌:技术职级晋升双通道,每年两次硅谷AI Lab技术轮岗机会
✅ ‌专属福利‌:AI算力自由(个人可申请单次千卡小时级实验资源)

联系
Dora Ren
职位编号
JN-032025-6689777
联系电话
+86 21 6062 3113

职位概要

职位类别
信息技术
子类别
IT架构设计
行业
信息技术/通信
地区
苏州市
工作类型
全职
顾问名字
Dora Ren
顾问电话号码
+86 21 6062 3113
职位编号
JN-032025-6689777

米高蒲志集团的多元与包容文化

在米高蒲志,我们不仅接受差异,更为之感到自豪。我们鼓励来自不同背景的求职者申请这个职位,并致力于建设包容、多样的工作场所,让所有员工都能绽放自我,成就精彩人生。如果您在招聘过程中需要任何支持或合理的调整,请告知我们