银河官方网站7163(股份)有限公司

多模态内容生成研究实习生

实习岗位

概述

2050研究院诚邀热情且具有前瞻性的小伙伴加入我们位于新加坡的天工2050研究实验室。作为研发团队的新成员，这是一个将理论付诸实践、同顶尖研究人员学习并为研发突破性技术的绝佳机会。

主要职责

在多模态内容生成（用于生成图像/音频/视频等的扩散模型）和内容理解（用于理解图像/视频/音频等的多模态大语言模型）方面进行前沿研究，确保研究成果发表在有影响力的会议和期刊上。
在专家导师的指导下，识别并解决多模态内容生成/理解中的复杂问题。
开发算法、洞察或数据集，解决高级研究目标的关键方面。
利用并贡献于多模态内容生成/理解的尖端工具和方法，并将这些进展应用于产品开发。

理想经验

能全职实习至少6个月。
计算机科学或相关 STEM 学科的在籍博士生，专注于图像/视频/音频生成（扩散模型等）或内容理解（LLM，多模态大语言模型等）。
在顶级会议或期刊（如 NeurIPS、ICLR、CVPR、ICCV、ECCV、ICML 或同等）上有研究发表，表现出卓越的研究能力。
具备生成模型的扎实理解，或图像生成专业知识的申请者将优先被考虑。
具有（多模态）大语言模型的扎实知识，具备大语言模型预训练经验者优先。
在深度学习框架（如 PyTorch 和 TensorFlow）中表现出熟练的编码技能。

申请方式

请将最新履历表和Cover Letter发送至 michelle@kunlun-inc.com。我们致力于促进多样性，欢迎所有背景的候选人申请。加入天工 2050 研究实验室，共同塑造 AGI 的未来。

其他岗位