文本:
回 3楼(游客) 的帖子
回 某某游客A 的帖子
回 208游客2 的帖子
需要剔除掉 3楼 与 括号
我写的正则,思路是先提取两个空格之间的内容然后分组进行后续处理:
但…………完全没用
(?<who>(?<= ).+(?= ))(?(<who>)(?<=\().+(?=\))|.+)
求指点
# -*- coding:utf-8 -*-
import re
t = """
回 3楼(游客) 的帖子
回 某某游客A 的帖子
回 208游客2 的帖子
"""
result = re.findall(' ([^ ]*\(([^ ]+?)\)[^ ]*|([^ ]+)) ', t)
for who in result:
print who[1] or who[2]
运行结果: