CoorDi
🎙️ 语音算法工程师
网易云音乐语音算法工程师 🎵,专注于TTS语音合成、声音转换与AI音乐生成。复旦大学电子信息硕士,在语音合成、声音克隆和前沿音频AI研究方面有丰富的实战经验 🚀

🎵 现就职于网易云音乐,担任语音算法工程师,专注于TTS语音合成、声音转换、AI音乐生成与评估及MV视频自动化。复旦大学电子信息专业硕士毕业,在语音合成、声音克隆与音频生成领域有深厚积累。
💡 曾在字节跳动和哔哩哔哩实习,深入研究扩散模型无训练加速、CV/NLP应用及ComfyUI插件开发。热衷于用AI技术赋能语音、音乐和音频——让研究成果真正落地为产品。
🏃 工作之余,热爱飞盘和跑步。音乐上是 YOASOBI 和周杰伦的粉丝,同时也是推理影视爱好者 🔍。
🛠️ 我最近使用的技术栈:🎤 主导TTS与声音转换技术研发——持续提升语音合成的自然度与表现力。 🎶 构建AI音乐生成算法,探索生成式模型在音乐创作中的落地应用。 📊 搭建AI音乐评估体系,让生成音乐的质量更贴合人类审美。 🎬 设计端到端Agent,实现歌曲MV全自动化生成。
⚡ 优化DDPM推理速度,改进蒸馏策略大幅提升生成效率。 🔬 深耕Classifier-Free Guidance (CFG)算法,紧跟RCFG、Limited Interval等前沿方案。 🚀 独立开发Training-free CFG加速算法——效果对齐下实现20%推理加速。 🧩 将自研加速算法集成为ComfyUI插件,面向社区开源交付。
🎯 训练模型识别低质与引流视频,守护平台内容质量。 🤖 设计Prompt驱动的标题分析策略,基于BERT构建视频分类系统。 📹 探索AIGC智能视频制作——自动提取新闻资讯,配图配音一键生成。