请问怎样用Replace Pioneer从txt文件中提取想要的特殊字符(如网址)啊?

来源:百度知道 编辑:UC知道 时间:2024/07/05 08:12:30
已知一个txt文件有很多行。如:
.....
onclick="document.location='http://www.palacemoon.com/pm/forum/60'"></center><br />
<br />
<center><img onload='javascript:if(this.width>850) this.width=850' src='http://i076.radikal.ru/0906/e3/54d9e535deef.jpg' onclick="document.location='http://www.palacemoon.com/pm/forum/60'"></center><br />
<br />
<center><img onload='javascript:if(this.width>850) this.width=850' src='http://s61.radikal.ru/i172/0906/7b/84a89c6506bf.jpg

首先要找到你要提取的文字的特征,用正则表达式表示出来,以你的为例是Replace Pioneer提取的详细步骤:

1. ctrl-o打开文件
2. ctrl-h打开replace窗口
* 在Search for pattern输入:
scr=(.*?).jpg
* 在Replace with pattern输入:
\1\n
* 把Print Unmatched Unit前面的勾去掉
3. 点击Replace,完成! ctrl-s存盘。

首先要找到你要提取的文字的特征,用正则表达式表示出来,以你的为例是http://[\w\d\./]+.jpg,用Replace Pioneer提取的详细步骤:

1. ctrl-o打开文件
2. ctrl-h打开replace窗口
* 在Search for pattern输入:
"http://[\w\d\./]+.jpg"(不带双引号)
* 在Replace with pattern输入:
"$match\n"(不带双引号)
* 把Print Unmatched Unit前面的勾去掉
3. 点击Replace,完成! ctrl-s存盘。