职位描述
基于开源的 Diffusion 图像和视频生成模型,构建基础推理和训练引擎,探索前沿的 AIGC 技术,具体职责包括:
1、加入魔搭社区 DiffSynth-Studio 等开源项目的开发,接入先进的图像和视频生成模型,为业界提供领先的推理和训练引擎基建。
2、基于丰富的开源模型生态,探索 AIGC 技术的全新能力,开展多元化的科研项目,包括但不限于图像生成的思维链、跨模态模型的能力集成、理解-生成统一架构模型等,发表高水平学术论文。
3、参与魔搭社区的运营活动,为新模型的开源提供技术支持,推动 AI 技术的普及推广。
职位要求
1、扎实的工程能力,优良的编程风格,熟悉Python语言和PyTorch框架,具备复杂系统的设计开发调试能力。
2、优良的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的耐心。
3、熟悉主流扩散模型的原理,包括 Stable Diffusion、FLUX、LoRA、ControlNet、IP-Adapter 等。
4、硕士及以上学历。
加分项
1、热爱开源技术,在 GitHub 上有具有影响力的代码仓库。
2、有突出的学术背景和创新研究能力,发表过 CCF-A/B 会议论文。
3、具备扎实的代码能力,有程序设计竞赛获奖经历。
投递方式
简历可以通过以下链接投递:研究型实习生-跨模型生成能力融合技术研究
也可以直接发到邮箱:yuze.zyz@alibaba-inc.com