嗨 👋，我是

CoorDi

🎙️ 语音算法工程师

网易云音乐语音算法工程师 🎵，专注于TTS语音合成、声音转换与AI音乐生成。复旦大学电子信息硕士，在语音合成、声音克隆和前沿音频AI研究方面有丰富的实战经验 🚀

🙋 关于我

🎵 现就职于网易云音乐，担任语音算法工程师，专注于TTS语音合成、声音转换、AI音乐生成与评估及MV视频自动化。复旦大学电子信息专业硕士毕业，在语音合成、声音克隆与音频生成领域有深厚积累。

💡 曾在字节跳动和哔哩哔哩实习，深入研究扩散模型无训练加速、CV/NLP应用及ComfyUI插件开发。热衷于用AI技术赋能语音、音乐和音频——让研究成果真正落地为产品。

🏃 工作之余，热爱飞盘和跑步。音乐上是 YOASOBI 和周杰伦的粉丝，同时也是推理影视爱好者 🔍。

🛠️ 我最近使用的技术栈：

TTS
AI Music Generation
Diffusion Model
PyTorch
AI-MV
LCM & ADD

💼 工作经历

网易云音乐
字节跳动
哔哩哔哩

语音算法工程师 - 网易云音乐

2025年6月 - 至今

🎤 主导TTS与声音转换技术研发——持续提升语音合成的自然度与表现力。 🎶 构建AI音乐生成算法，探索生成式模型在音乐创作中的落地应用。 📊 搭建AI音乐评估体系，让生成音乐的质量更贴合人类审美。 🎬 设计端到端Agent，实现歌曲MV全自动化生成。

TTS语音合成与声音转换
AI音乐生成与评估
MV视频生成

AIGC算法优化实习生 - 字节跳动

2023年12月 - 2024年8月

⚡ 优化DDPM推理速度，改进蒸馏策略大幅提升生成效率。 🔬 深耕Classifier-Free Guidance (CFG)算法，紧跟RCFG、Limited Interval等前沿方案。 🚀 独立开发Training-free CFG加速算法——效果对齐下实现20%推理加速。 🧩 将自研加速算法集成为ComfyUI插件，面向社区开源交付。

加速算法研究
CFG算法研究

CV/NLP算法实习生 - 哔哩哔哩

2023年8月 - 2023年11月

🎯 训练模型识别低质与引流视频，守护平台内容质量。 🤖 设计Prompt驱动的标题分析策略，基于BERT构建视频分类系统。 📹 探索AIGC智能视频制作——自动提取新闻资讯，配图配音一键生成。

视频理解
AIGC智能视频制作

🎓 教育经历

2022年9月 - 2025年6月

电子信息硕士

复旦大学

GPA: 3.88/4.0 | 专业排名: 4/235

📡 在信息科学与工程学院研究扩散模型在SAR图像上的应用，发表3篇一作论文，在校期间屡获殊荣。

🏅 国家奖学金
🏅 三星奖学金
🎖️ 上海市优秀毕业生
📜 优秀学生奖学金

2018年9月 - 2022年6月

网络空间安全学士

中国科学技术大学

GPA: 3.56/4.3

🔐 主攻网络空间安全，研究方向为Image Captioning算法优化与加速，积极参与学生工作和学科竞赛。

📜 优秀学生奖学金
📜 王小谟网安优秀学生奖学金
🎖️ 中科大优秀毕业生
🎖️ 安徽省优秀毕业生
👥 院学生会主席

🏆 学术与竞赛成果

Synergizing Large-Scale Music Representations and Metric-Based Meta-Learning for Few-Shot Song Aesthetics Evaluation

ICASSP 2026 Second Author Music Aesthetics Meta-Learning

📄 ICASSP 2026 (Poster) | 二作 | 2026

Accelerating Diffusion for SAR-to-Optical Image Translation via Adversarial Consistency Distillation

Arxiv First Author Diffusion Model

📄 Arxiv | 一作 | 2024

Conditional Diffusion for SAR to Optical Image Translation

IEEE GRSL Q2 First Author SAR

📄 IEEE GRSL (Q2期刊) | 一作 | 2024

SAR to Optical Image Translation with Color Supervised Diffusion Model

IGARSS First Author SAR

📄 IGARSS 国际会议 | 一作 | 2023

🥈 Kaggle 竞赛银牌 ×2

Kaggle Silver Computer Vision NLP

• CVPR Image Matching Challenge 2023 — Top 7%
• LLM AI文本检测 — Top 4%

🥉 Kaggle 竞赛铜牌 ×2

Kaggle Bronze Speech Recognition Computer Vision

• Bengali.AI 语音识别 — Top 9%
• Google Research Image Matching 2024 — Top 6%

📬 联系我

欢迎随时联系 ✉️ —— 无论是技术交流、合作邀约，还是单纯打个招呼，我都很乐意回复！

📧 发送邮件