【大模型專項(xiàng)】異構(gòu)大模型推理優(yōu)化工程師
30000-60000元
北京
應(yīng)屆畢業(yè)生
本科
北京
應(yīng)屆畢業(yè)生
本科
- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位已進(jìn)行加V認(rèn)證,請(qǐng)放心投遞
職位描述:參與內(nèi)部異構(gòu)大模型推理引擎優(yōu)化,支持大模型推理各種優(yōu)化技術(shù)在異構(gòu)硬件上的落地。包括但不限于:
1、參與日常推理引擎的優(yōu)化開發(fā),不斷優(yōu)化大模型業(yè)務(wù)在對(duì)應(yīng)硬件上的TTFT、TPOT等指標(biāo);關(guān)注業(yè)界最佳實(shí)踐,能將業(yè)界最佳實(shí)踐落地到內(nèi)部的引擎優(yōu)化中;
2、完成各種大模型推理所需的功能性開發(fā)任務(wù);
3、參與支持日常的大模型推理服務(wù)部署,參與內(nèi)部日常提效工具的研發(fā)。
任職要求:1、有扎實(shí)的C 工程基礎(chǔ);
2、有大模型相關(guān)訓(xùn)練或推理優(yōu)化經(jīng)驗(yàn);有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的實(shí)踐經(jīng)驗(yàn);熟悉LLM infer 相關(guān)技術(shù)棧,熟悉TP/PP/DP等分布式通信原理等;
3、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子開發(fā)經(jīng)驗(yàn);
4、了解AI infra 整體技術(shù)棧需求,有訓(xùn)練框架或推理框架實(shí)戰(zhàn)經(jīng)驗(yàn)、熟悉TensorRT、TVM 等框架的使用、有二次開發(fā)能力或開源社區(qū)貢獻(xiàn)經(jīng)歷更佳。
工作地點(diǎn)
地址:北京海淀區(qū)北京-海淀區(qū)上地西路6號(hào)快手總部
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請(qǐng)求職者務(wù)必提高警惕。
職位發(fā)布者
HR
北京快手科技有限公司
-
計(jì)算機(jī)軟件
-
1000人以上
-
私營(yíng)·民營(yíng)企業(yè)
-
北京市海淀區(qū)上地西路6號(hào)1幢1層101 D1-10
相似職位
-
交易專員 面議梁溪區(qū) 應(yīng)屆畢業(yè)生 不限上海鋼聯(lián)電子商務(wù)股份有限公司
-
戰(zhàn)略采購工程師 (工科專業(yè)優(yōu)先)無錫 8000-15000元無錫高新區(qū)(新吳區(qū)) 應(yīng)屆畢業(yè)生 本科西門子
-
物控工程師 面議錫山區(qū) 應(yīng)屆畢業(yè)生 不限健鼎(無錫)電子有限公司
-
無損檢測(cè)工程師 面議惠山區(qū) 應(yīng)屆畢業(yè)生 不限中航卓越鍛造(無錫)有限公司
-
管道檢測(cè)員 面議江陰市 應(yīng)屆畢業(yè)生 不限四川沃茲凱蘭科技有限公司
-
裝配接線員(電柜) 6000元以下應(yīng)屆畢業(yè)生 不限上海北羽自動(dòng)化科技有限公司

2026-03-04 18:53:12
3675人關(guān)注
注:聯(lián)系我時(shí),請(qǐng)說是在無錫人才網(wǎng)上看到的。
