txt_unique.py 555 B

123456789101112131415161718192021
  1. # 输入文件,包含URL的内容
  2. input_file = 'extracted_urls1.txt'
  3. # 输出文件,用于存放去重后的URL
  4. output_file = 'unique_urls1.txt'
  5. # 存放URL的集合
  6. urls_set = set()
  7. # 读取输入文件中的URL并去除重复项
  8. with open(input_file, 'r') as file:
  9. for line in file:
  10. urls_set.add(line.strip())
  11. # 将去重后的URL写入输出文件
  12. with open(output_file, 'w') as file:
  13. for url in urls_set:
  14. # 每个URL单独一行
  15. file.write(url + '\n')
  16. print("去除重复的URL并保存到输出文件中。")