负责公司在大语言模型方面的行业应用产品的开发和售前技术支撑工作。熟悉大语言模型从数据准备、模型训练、调优到部署的全生命周期管理流程。
技术能力:
精通阿里通义千问、百度文心一言等主流大语言模型的技术架构、训练方法与应用场景,了解模型底层原理(如 Transformer 架构、预训练 - 微调范式等),能基于现有模型进行二次开发与优化;
熟练掌握 Python、C++ 等编程语言,熟悉 TensorFlow、PyTorch 等深度学习框架,具备大语言模型训练、推理相关的工程化实践能力
技术能力:
精通阿里通义千问、百度文心一言等主流大语言模型的技术架构、训练方法与应用场景,了解模型底层原理(如 Transformer 架构、预训练 - 微调范式等),能基于现有模型进行二次开发与优化;
熟练掌握 Python、C++ 等编程语言,熟悉 TensorFlow、PyTorch 等深度学习框架,具备大语言模型训练、推理相关的工程化实践能力
