技术解读声悦研究院 · 第 002 期
批量质检:用聆川把听感变成可复核的指标
当一个项目有上百条音频,逐条人工审听不可持续。本文介绍 Vocalune 的批量质检流水线,以及它在召回率与误报之间的权衡。
Vocalune 技术团队 11 分钟 2026-05-22
一条音频靠耳朵,一百条音频靠系统。
规模化之后,质检从"听感"问题变成了"工程"问题。这篇文章记录聆川(Luna Agent)批量质检流水线的设计。
自动召回,人工复核
我们不追求全自动判定,而是让系统先召回"疑似有问题"的片段,再交给人复核。关键指标是召回率——宁可多报,不能漏报。
误报的代价
误报会消耗人的信任:如果系统标了 50 条结果只有 5 条真有问题,人就会开始忽略它。我们用创作者的复核反馈持续校准阈值。
当前局限
对爆音、断句这类硬错误召回稳定;但对"情绪不到位"这种软错误,系统仍然力不从心。