当前位置:云好站网站目录 » 文章资讯 » 程序教程 » 文章详细

python批量提取txt文档指定位置的链接

程序教程 176

可以使用Python中的正则表达式模块(re)来提取标签中的链接。以下是一个简单的示例代码:

import re
def extract_links_from_txt(filename):
    with open(filename, 'r', encoding='utf-8') as file:
        data = file.read()
    # 使用正则表达式匹配<loc>标签中的链接
    links = re.findall(r'<loc>(.*?)</loc>', data)
    return links
# 使用示例
filename = 'xml.txt'
links = extract_links_from_txt(filename)
for link in links:
    print(link)

这段代码会打开指定的文本文件,读取其中的内容,然后使用正则表达式匹配标签中的链接,最后将匹配到的链接以列表的形式返回。你只需要将your_text_file.txt替换为你要提取链接的文本文件名。