将所有连字符类型替换为ascii连字符-“
有没有一种方法可以用简单的ascii "-“替换所有类型的连字符?我正在寻找这样的东西,可以在空间中工作:
txt = re.sub(r'[\s]+',' ',txt)
我认为一些非ascii "-“连字符避免了删除某些特定停用词(由连字符连接的项目名称)的正确过程:
例如,我想将这个AR-L1003‘替换为AR-L1003,但我想对整个文本执行此操作。
转载请注明出处:http://www.jlgayy.com/article/20230526/1398273.html