test_reg.py 1.2 KB

12345678910111213141516171819202122232425262728293031
  1. import re
  2. regstr = """
  3. ^(?!.*(贷款|借款|融资|采购|销售|建设|工程|制造|生产|养殖|捕捞|贸易|物流|运输|旅游|酒店|餐饮|房地产|个人消费)).*(海洋.{0,100}(协会|学会|商会|联盟|联合会|促进会|研究会|俱乐部|公益组织|基金会|社会组织|非营利组织|NGO)|(协会|学会|商会|联盟|联合会|促进会|研究会|俱乐部|公益组织|基金会|社会组织|非营利组织|NGO).{0,100}海洋)
  4. """
  5. test_cases = [
  6. "防腐材料",
  7. "海洋防污涂层",
  8. "船舶防腐",
  9. "职业:水产养殖人员 投向:内陆养殖 用途:养殖鲍鱼",
  10. "材料",
  11. "医疗防护服",
  12. "职业:艺术从业者;投向:环保投资;用途:海洋垃圾清理公益组织"
  13. ]
  14. pattern = re.compile(regstr, re.VERBOSE)
  15. for t in test_cases:
  16. print(f"{t!r}: {'✓' if pattern.match(t) else '✗'}")
  17. a = False
  18. b = False
  19. print(a == b)
  20. text = "职业:水产养殖人员 投向:内陆养殖 用途:其他海洋服务,老年人"
  21. # 匹配从“职业”开始,直到“投向”之前的所有内容,并将其替换为空字符串
  22. result = re.sub(r'职业:.*?(?=投向)', '', text)
  23. print(result)