是将听到的音频内容转换成相应的文字,并严格按照要求进行相应的标注。

简单来说就是将听到的音频转化为文字并准确的记录下来。