👋 About Me

我是一名硕士研究生目前就读于中国科学技术大学人工智能与数据科学学院,预计2026年毕业,我本科毕业于中国科学技术大学少年班学院。研究方向包含 多任务学习,表征学习,多模态生成与理解,Agentic RL

此前先后在 北京智源研究院(BAAI)字节跳动小红书 等公司实习,围绕多模态生成与理解、表征大模型、生成式搜推和AI搜方向深入实践,项目兼顾学术创新与工程落地。

如果你对我的研究方向、实习经历或项目感兴趣,或者有合作与交流的想法,可以通过以下方式联系我:

  • Phone:+86 17362950656
  • Email:yanruiran@mail.ustc.edu.cn
  • GitHub:RuiranYan
  • Google Scholar:Ruiran Yan

🎓 Education

  • 硕士, 人工智能与数据科学学院, 中国科学技术大学 (在读)
  • 学士, 少年班学院, 中国科学技术大学

🚀 Selected Projects & Publications

  • OmniGen / OmniGen2 — 通用图像生成与理解模型
    • OmniGen 系列项目核心贡献者之一,目标是构建统一的图像生成与理解模型,支持文本到图像生成、图像编辑以及多种视觉任务,并通过统一框架实现跨任务的知识迁移。负责从零搭建主体驱动多模态数据工作流(GroundingDINO + SAM / SAM2 + Outpaint),构建大规模主体驱动数据集 X2I / X2I2,并基于此训练 OmniGen V1 / V2,大幅提升主体一致性与生成自然度。
    • Links: OmniGen Paper, OmniGen GitHub, OmniGen2 Paper, OmniGen2 GitHub
    • Tags: Multimodal, Image Generation, BAAI
  • Agent-R1 — 面向 Agent 系统的强化学习框架
    • 作为开源项目 Agent-R1 的核心贡献者之一,参与设计用于 agentic system 的端到端强化学习训练框架,支持多轮对话、多工具调用等复杂场景,并在 PPO / GRPO 等主流算法上做了适配和修正,推动大模型在真实任务上的强化学习训练实践。
    • Links: Paper, GitHub
    • Tags: Agent, RL, Open Source
  • O1Embedder — 让检索模型先思考再检索
    • 面对复杂多步推理任务,传统表征模型难以直接利用推理型大模型的能力。O1Embedder 通过构造长思维链数据,将大模型“思考过程”转化为监督信号,并用多任务学习统一推理与表征能力,使检索模型在复杂推理和 zero-shot 场景下具备更强的理解与泛化能力。
    • Links: Paper, GitHub
    • Tags: Representation Learning, Reasoning

💼 Engineering & Internship experience

  • [2026.03 ~ 2026.05] - 小红书 · 国际化 - AI搜 / Agentic Search

  • [2025.05 ~ 2026.03] - 字节跳动 · 抖音搜索 - 个性化预训练大模型 / 生成式搜推 / LLM4REC

  • [2024.07 ~ 2025.05] - 北京智源研究院 · 研究实习 - 表征模型 / 多模态生成理解

  • [2022.10 ~ 2023.07] - OPPO · 应用商城 - 多任务推荐

🏆 Competitions & Awards

  • Meta KDD Cup 2024 · CRAG: Comprehensive RAG Benchmark - 全球TOP4(共3000+参与者) / 复杂问题特别奖(500刀奖金)。