|
|
| |
| |
职位描述 用小程序查看更多 |
|
1、算法研发与微调:负责大语言模型(LLM)的研发与深度优化,包括但不限于SFT(指令微调)、LoRA/QLoRA(高效微调)、RLHF(强化学习)等方案的实施。 2、应用架构落地:设计并实现基于RAG(检索增强生成)架构的AI应用,优化向量检索、重排序(Rerank)及PromptEngineering,提升业务场景下的回答精度。 3、工程化衔接:与后端工程团队深度协同,参与模型推理加速、高并发Serving架构设计,解决模型在生产环境中的首token延迟、吞吐量等性能难题。 4、Agent与工作流设计:基于LangChain、LangGraph或原生架构开发高度智能的AIAgent和复杂自动化工作流,构建具有反思、规划能力的AI原生应用。 |
|
| |
|
|
| |
|