👋 About Me
我是一名硕士研究生目前就读于中国科学技术大学人工智能与数据科学学院,预计2026年毕业,我本科毕业于中国科学技术大学少年班学院。研究方向包含 多任务学习,表征学习,多模态生成与理解,Agentic RL。
此前先后在 北京智源研究院(BAAI) 、 字节跳动 和 小红书 等公司实习,围绕多模态生成与理解、表征大模型、生成式搜推和AI搜方向深入实践,项目兼顾学术创新与工程落地。
如果你对我的研究方向、实习经历或项目感兴趣,或者有合作与交流的想法,可以通过以下方式联系我:
- Phone:+86 17362950656
- Email:yanruiran@mail.ustc.edu.cn
- GitHub:RuiranYan
- Google Scholar:Ruiran Yan
🎓 Education
- 硕士, 人工智能与数据科学学院, 中国科学技术大学 (在读)
- 学士, 少年班学院, 中国科学技术大学
🚀 Selected Projects & Publications
- OmniGen / OmniGen2 — 通用图像生成与理解模型
- OmniGen 系列项目核心贡献者之一,目标是构建统一的图像生成与理解模型,支持文本到图像生成、图像编辑以及多种视觉任务,并通过统一框架实现跨任务的知识迁移。负责从零搭建主体驱动多模态数据工作流(GroundingDINO + SAM / SAM2 + Outpaint),构建大规模主体驱动数据集 X2I / X2I2,并基于此训练 OmniGen V1 / V2,大幅提升主体一致性与生成自然度。
- Links: OmniGen Paper, OmniGen GitHub, OmniGen2 Paper, OmniGen2 GitHub
- Tags: Multimodal, Image Generation, BAAI
- Agent-R1 — 面向 Agent 系统的强化学习框架
- O1Embedder — 让检索模型先思考再检索
💼 Engineering & Internship experience
[2026.03 ~ 2026.05] - 小红书 · 国际化 - AI搜 / Agentic Search
[2025.05 ~ 2026.03] - 字节跳动 · 抖音搜索 - 个性化预训练大模型 / 生成式搜推 / LLM4REC
[2024.07 ~ 2025.05] - 北京智源研究院 · 研究实习 - 表征模型 / 多模态生成理解
[2022.10 ~ 2023.07] - OPPO · 应用商城 - 多任务推荐
🏆 Competitions & Awards
- Meta KDD Cup 2024 · CRAG: Comprehensive RAG Benchmark - 全球TOP4(共3000+参与者) / 复杂问题特别奖(500刀奖金)。
