txt_char_find.py 755 B

123456789101112131415161718192021222324252627
  1. # 输入文件,包含URL的内容
  2. input_file = 'output9.txt'
  3. # 输出文件,用于存放提取出的URL
  4. output_file = 'extracted_urls.txt'
  5. # 存放提取出的URL的列表
  6. extracted_urls = []
  7. # 读取输入文件并提取URL
  8. with open(input_file, 'r') as file:
  9. # 读取整个文件内容
  10. data = file.read()
  11. # 使用正则表达式提取URL
  12. import re
  13. urls = re.findall(
  14. r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', data)
  15. extracted_urls.extend(urls)
  16. # 将提取出的URL写入输出文件
  17. with open(output_file, 'w') as file:
  18. for url in extracted_urls:
  19. # 每个URL单独一行
  20. file.write(url + '\n')
  21. print("提取出的URL已保存到输出文件中。")