3 rokov pred · b2acffedd4
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-minnan-16k-common-vocab3825/README.md
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-minnan-16k-common-vocab3825/README.md
@@ -1,6 +1,6 @@
 
				 # ModelScope Model
			
 
				 
			
 
				-## How to finetune and infer using a pretrained Paraformer-large Model
			
 
				+## How to finetune and infer using a pretrained UniASR Model
			
 
				 
			
 
				 ### Finetune
			
 
				 
			
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-minnan-16k-common-vocab3825/infer.py
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-minnan-16k-common-vocab3825/infer.py
@@ -23,7 +23,7 @@ def modelscope_infer_core(output_dir, split_dir, njob, idx):
 
				         batch_size=1
			
 
				     )
			
 
				     audio_in = os.path.join(split_dir, "wav.{}.scp".format(idx))
			
 
				-    inference_pipline(audio_in=audio_in)
			
 
				+    inference_pipline(audio_in=audio_in, param_dict={"decoding_model": "normal"})
			
 
				 
			
 
				 
			
 
				 def modelscope_infer(params):
			
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-minnan-16k-common-vocab3825/infer_after_finetune.py
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-minnan-16k-common-vocab3825/infer_after_finetune.py
@@ -34,7 +34,7 @@ def modelscope_infer_after_finetune(params):
 
				         batch_size=1
			
 
				     )
			
 
				     audio_in = os.path.join(params["data_dir"], "wav.scp")
			
 
				-    inference_pipeline(audio_in=audio_in)
			
 
				+    inference_pipeline(audio_in=audio_in, param_dict={"decoding_model": "normal"})
			
 
				 
			
 
				     # computer CER if GT text is set
			
 
				     text_in = os.path.join(params["data_dir"], "text")
			
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-offline/infer.py
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-offline/infer.py
@@ -23,7 +23,7 @@ def modelscope_infer_core(output_dir, split_dir, njob, idx):
 
				         batch_size=1
			
 
				     )
			
 
				     audio_in = os.path.join(split_dir, "wav.{}.scp".format(idx))
			
 
				-    inference_pipline(audio_in=audio_in)
			
 
				+    inference_pipline(audio_in=audio_in, param_dict={"decoding_model": "offline"})
			
 
				 
			
 
				 
			
 
				 def modelscope_infer(params):
			
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-offline/infer_after_finetune.py
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-offline/infer_after_finetune.py
@@ -34,7 +34,7 @@ def modelscope_infer_after_finetune(params):
 
				         batch_size=1
			
 
				     )
			
 
				     audio_in = os.path.join(params["data_dir"], "wav.scp")
			
 
				-    inference_pipeline(audio_in=audio_in)
			
 
				+    inference_pipeline(audio_in=audio_in, param_dict={"decoding_model": "offline"})
			
 
				 
			
 
				     # computer CER if GT text is set
			
 
				     text_in = os.path.join(params["data_dir"], "text")
			
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-online/infer.py
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-online/infer.py
@@ -23,7 +23,7 @@ def modelscope_infer_core(output_dir, split_dir, njob, idx):
 
				         batch_size=1
			
 
				     )
			
 
				     audio_in = os.path.join(split_dir, "wav.{}.scp".format(idx))
			
 
				-    inference_pipline(audio_in=audio_in)
			
 
				+    inference_pipline(audio_in=audio_in, param_dict={"decoding_model": "normal"})
			
 
				 
			
 
				 
			
 
				 def modelscope_infer(params):
			
--- a/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-online/infer_after_finetune.py
+++ b/egs_modelscope/asr/uniasr/speech_UniASR_asr_2pass-zh-cn-8k-common-vocab3445-pytorch-online/infer_after_finetune.py
@@ -34,7 +34,7 @@ def modelscope_infer_after_finetune(params):
 
				         batch_size=1
			
 
				     )
			
 
				     audio_in = os.path.join(params["data_dir"], "wav.scp")
			
 
				-    inference_pipeline(audio_in=audio_in)
			
 
				+    inference_pipeline(audio_in=audio_in, param_dict={"decoding_model": "normal"})
			
 
				 
			
 
				     # computer CER if GT text is set
			
 
				     text_in = os.path.join(params["data_dir"], "text")