|
|
| |
| |
职位描述 用小程序查看更多 |
|
岗位职责: 1.大模型应用研发 结合业务场景(对话、搜索、生成、推荐等)设计、实现并迭代基于LLM的应用或微服务。 2.模型集成与优化 调研并接入主流开源/商用模型(GPT-4o、Claude3、Gemini1.5、Llama3、Qwen-2等),完成推理链路封装、路由与A/B实验。 通过PromptEngineering、RAG、LoRA/Fine-tune等手段持续提升质量、降低时延与成本。 3.系统设计与工程质量 负责核心服务的架构设计、编码与重构,保障高可用、高并发、易维护。 编写自动化测试、监控告警、性能压测和安全加固脚本,推动持续交付。 4.跨团队协作 与产品、算法、前端、DevOps紧密合作,驱动需求落地,撰写技术方案并进行技术分享。
任职要求: 1.扎实的编程与计算机基础 -精通Python(必备)及至少一门高性能语言(Go/Rust/Java/C)。 -深入理解数据结构、算法、网络、操作系统与分布式系统原理。 2.LLM相关经验 -具备调用或微调大模型并将其落地的项目经验,对Prompt设计、上下文窗口管理、Token预算有实操。 -熟悉常见推理框架(vLLM、TG |
|
| |
|
|
| |
|