嗨 👋,我是

CoorDi

🎙️ 语音算法工程师

网易云音乐语音算法工程师 🎵,专注于TTS语音合成、声音转换与AI音乐生成。复旦大学电子信息硕士,在语音合成、声音克隆和前沿音频AI研究方面有丰富的实战经验 🚀

🙋 关于我

CoorDi's Homepage profile picture

🎵 现就职于网易云音乐,担任语音算法工程师,专注于TTS语音合成、声音转换、AI音乐生成与评估及MV视频自动化。复旦大学电子信息专业硕士毕业,在语音合成、声音克隆与音频生成领域有深厚积累。

💡 曾在字节跳动哔哩哔哩实习,深入研究扩散模型无训练加速、CV/NLP应用及ComfyUI插件开发。热衷于用AI技术赋能语音、音乐和音频——让研究成果真正落地为产品。

🏃 工作之余,热爱飞盘和跑步。音乐上是 YOASOBI周杰伦的粉丝,同时也是推理影视爱好者 🔍。

🛠️ 我最近使用的技术栈:
  • TTS
  • AI Music Generation
  • Diffusion Model
  • PyTorch
  • AI-MV
  • LCM & ADD

💼 工作经历

语音算法工程师 - 网易云音乐
2025年6月 - 至今

🎤 主导TTS与声音转换技术研发——持续提升语音合成的自然度与表现力。 🎶 构建AI音乐生成算法,探索生成式模型在音乐创作中的落地应用。 📊 搭建AI音乐评估体系,让生成音乐的质量更贴合人类审美。 🎬 设计端到端Agent,实现歌曲MV全自动化生成。

  • TTS语音合成与声音转换
  • AI音乐生成与评估
  • MV视频生成
AIGC算法优化实习生 - 字节跳动
2023年12月 - 2024年8月

⚡ 优化DDPM推理速度,改进蒸馏策略大幅提升生成效率。 🔬 深耕Classifier-Free Guidance (CFG)算法,紧跟RCFG、Limited Interval等前沿方案。 🚀 独立开发Training-free CFG加速算法——效果对齐下实现20%推理加速。 🧩 将自研加速算法集成为ComfyUI插件,面向社区开源交付。

  • 加速算法研究
  • CFG算法研究
CV/NLP算法实习生 - 哔哩哔哩
2023年8月 - 2023年11月

🎯 训练模型识别低质与引流视频,守护平台内容质量。 🤖 设计Prompt驱动的标题分析策略,基于BERT构建视频分类系统。 📹 探索AIGC智能视频制作——自动提取新闻资讯,配图配音一键生成。

  • 视频理解
  • AIGC智能视频制作

🎓 教育经历

2022年9月 - 2025年6月
电子信息硕士
复旦大学
GPA: 3.88/4.0 | 专业排名: 4/235

📡 在信息科学与工程学院研究扩散模型在SAR图像上的应用,发表3篇一作论文,在校期间屡获殊荣。

  • 🏅 国家奖学金
  • 🏅 三星奖学金
  • 🎖️ 上海市优秀毕业生
  • 📜 优秀学生奖学金
2018年9月 - 2022年6月
网络空间安全学士
中国科学技术大学
GPA: 3.56/4.3

🔐 主攻网络空间安全,研究方向为Image Captioning算法优化与加速,积极参与学生工作和学科竞赛。

  • 📜 优秀学生奖学金
  • 📜 王小谟网安优秀学生奖学金
  • 🎖️ 中科大优秀毕业生
  • 🎖️ 安徽省优秀毕业生
  • 👥 院学生会主席

🏆 学术与竞赛成果

Synergizing Large-Scale Music Representations and Metric-Based Meta-Learning for Few-Shot Song Aesthetics Evaluation
ICASSP 2026 Second Author Music Aesthetics Meta-Learning
📄 ICASSP 2026 (Poster) | 二作 | 2026
Accelerating Diffusion for SAR-to-Optical Image Translation via Adversarial Consistency Distillation
Arxiv First Author Diffusion Model
📄 Arxiv | 一作 | 2024
Conditional Diffusion for SAR to Optical Image Translation
IEEE GRSL Q2 First Author SAR
📄 IEEE GRSL (Q2期刊) | 一作 | 2024
SAR to Optical Image Translation with Color Supervised Diffusion Model
IGARSS First Author SAR
📄 IGARSS 国际会议 | 一作 | 2023
🥈 Kaggle 竞赛银牌 ×2
Kaggle Silver Computer Vision NLP
• CVPR Image Matching Challenge 2023 — Top 7%
• LLM AI文本检测 — Top 4%
🥉 Kaggle 竞赛铜牌 ×2
Kaggle Bronze Speech Recognition Computer Vision
• Bengali.AI 语音识别 — Top 9%
• Google Research Image Matching 2024 — Top 6%

📬 联系我

欢迎随时联系 ✉️ —— 无论是技术交流、合作邀约,还是单纯打个招呼,我都很乐意回复!