保存工作 返回搜索结果 职责描述 职位概要 类似职位 上市互联网公司-美股港股 细分领域独角兽 关于我们的客户 作为中国互联网行业的技术先驱,深耕AI领域十余年,已构建覆盖搜索、广告、金融、云服务的全场景AI体系。 职责描述 核心系统部署 主导大模型Agent在金融风控、广告推荐、客服自动化等中后台场景的工程化落地,实现千亿参数模型在K8s集群的毫秒级响应 设计基于Service Mesh的智能路由系统,动态调配CPU/GPU/NPU异构计算资源,达成95%以上资源利用率 全链路性能攻坚 开发模型-数据-算力联合优化框架,突破传统蒸馏/量化技术限制(目标:同等效果下推理成本降低40%) 构建多模态Agent的灰度发布体系,支持每日百万级策略AB测试流量无损切换 稳定性体系建设 建立AI服务的混沌工程防护网,实现服务可用性99.99%的SLA保障 研发智能熔断降级系统,基于强化学习预测业务流量异常波动 理想的求职者 硬性条件 5年以上分布式系统开发经验,主导过至少2个日请求量过亿的AI服务部署项目 精通PyTorch Serving/Triton Inference Server等工业级部署框架二次开发 掌握K8s+Istio+Prometheus技术栈的深度调优,有万卡集群管理经验者优先 熟悉模型压缩全栈工具链(TensorRT/OpenVINO/NVIDIA Triton) 加分项 拥有大型推荐/风控系统服务化经验(如微信支付风控引擎架构) 主导过FPGA/ASIC芯片的AI算子移植项目 持有AI模型部署相关专利或顶会论文(AIOps/MLSys领域) 薪酬待遇 ✅ 行业的技术生态:内部开源社区拥有200+AI部署核心组件(如凤凰调度系统、星尘监控平台)✅ 规模化实战场景:支持微信支付/视频号/腾讯广告等核心业务,日均处理20PB级推理数据✅ 工程师文化:技术职级晋升双通道,每年两次硅谷AI Lab技术轮岗机会✅ 专属福利:AI算力自由(个人可申请单次千卡小时级实验资源) 联系 Dora Ren 职位编号 JN-032025-6689777 联系电话 +86 21 6062 3113 职位概要 职位类别 信息技术 子类别 IT架构设计 行业 信息技术/通信 地区 苏州市 工作类型 全职 顾问名字 Dora Ren 顾问电话号码 +86 21 6062 3113 职位编号 JN-032025-6689777