职位描述
该职位已进行加V认证,请放心投递
1. 参与滴滴机器学习训练框架、推理框架的设计与研发,服务于内部各个产品线;
2. 参与机器学习分布式训练,多卡推理框架等底层组件的抽象与设计,包括训练框架优化,分布式网络优化等;
3. 支持大模型在滴滴内部场景的业务落地。
任职资格:
1. 熟练掌握linux环境下的c/c++与python语言;
2. 熟练掌握至少一种机器学习框架(tensorflow / pytorch / mxnet 或其他自研框架)并熟悉设计思路及工作原理;
3. 有以下至少一项的背景知识与经验:cuda编程,nccl,编译器,高性能网络,并行计算,集群调度;
4. 熟悉deepspeed、megatronlm等分布式训练框架者优先;
5. 有软硬件联合设计的经验,能使用数学工具分析深度学习训练中的优化算法优先;
6. 有大模型训练推理调优经验优先。
工作地点
地址:北京海淀区北京-海淀区弘源·新时代
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
北京小桔科技有限公司
- 交通·运输·物流
- 1000人以上
- 股份制企业
- 北京市海淀区东北旺西路8号院35号楼5层501室