3 年之前 · 4e7a8283be
--- a/funasr/datasets/large_datasets/utils/tokenize.py
+++ b/funasr/datasets/large_datasets/utils/tokenize.py
@@ -37,7 +37,7 @@ def tokenize(data,
 
				     vad = -2
			
 
				 
			
 
				     if bpe_tokenizer is not None:
			
 
				-        text = bpe_tokenizer.text2tokens(text)
			
 
				+        text = bpe_tokenizer.text2tokens("".join(text))
			
 
				 
			
 
				     if seg_dict is not None:
			
 
				         assert isinstance(seg_dict, dict)