问题描述
我想从我的单词中删除某些特殊字符和一些垃圾,例如“'”(但我想保留一些特殊字符,例如“é”,“á”等)。 如何匹配EXACT模式的'''(或'quot',因为我可以分别删除'&')?
word = re.sub('[,|;|?|!|(|)|{|}|.|&|\bquot\b]+', '', word)
我正在尝试,但是它删除了所有'q'u'o't'字符。
编辑要求的测试字符串:
'"természet"' should be 'természet'
'data,' should be 'data'
1楼
在方括号内时,不需要| 分隔器
尝试使用此正则表达式
re.sub(r'[,;?!(){}.]|\"', '', word)
2楼
你的意思是这样的吗?
re.sub('"', '', "abc"def")