多模态算法工程师

岗位描述

1、负责llm/mllm的建设和落地,不限于Pretrain、SFT、RLHF等,不限于Prompt、RAG、Tools等Agent技术,应用于短视频内容理解和AI玩法创新;
2、利用Diffusion类AIGC技术进行智能创作,如图像生成、视频生成、音乐生成,形成多样化高质量的智能创作内容;
3、负责短视频内容理解体系的建设和研发工作,包括类目/属性/安全/质量等标签理解;
4、跟踪AIGC和mllm方向的最新技术,跟进业界SOTA模型并迅速产品化落地,给出业界最佳解决方案并保持技术领先。

任职要求

1、全日制硕士研究生及以上学历,博士研究生优先;
2、对CV、多模态、AIGC等相关领域有深入的理解,在其中一个或多个方向有深入的研究经历,且有相关实际项目经验;
3、熟悉llm+Agent框架技术,如autogen、metaGPT、BabyAGI,并有落地经验者优先;熟悉Diffusion+ControlNet类生成技术优先;熟悉视频/音频处理技术;有语音算法经验者优先,如tts、asr、音频分类、歌曲生成等;
4、有责任心,乐于沟通,优秀的业务sense,对AI产品落地具有敏锐度;
5、有良好的数据敏感性,优秀的分析问题和解决问题的能力;有强烈的上进心,善于学习新事物。
申请职位
分享到:

提示

您的简历填写尚不完整,请填写完整再来投递。
填写简历
投递成功,请静候佳音!
您已投递过该职位!