所有参赛者都应遵守以下规则:
允许在原始训练数据集上进行数据增强,包括但不限于添加噪声或混响、速度扰动和音调变化。
允许参赛者使用Eval集进行模型训练,但Test集仅能用于调参和模型选择,严禁以任何形式使用Test-2023数据集,包括但不限于使用测试数据集微调或训练模型。
如果两个系统的测试cpCER相同,则计算复杂度较低的系统将被认定为更优。
如果使用强制对齐模型获得了逐帧分类标签,则必须使用相应子赛道允许的数据对强制对齐模型进行训练。
端到端方法中允许使用浅层融合语言模型,模型可以选择LAS、RNNT和Transformer等,但浅层融合语言模型的训练数据只能来自于允许的训练数据集的转录抄本。
最终解释权属于主办方。如遇特殊情况,主办方将协调解释。