TXT文本内容提取高手请进.....

来源:百度知道 编辑:UC知道 时间:2024/09/22 03:48:42
先来一段短点的内容
301633----33343243666----138.88.111.88..
300233----33553566666----138.88.111.88....
300233----33553563366----138.88.111.88...
320633----33443566666----138.88.111.88fdg
302233----33553566626----138.88.111.88dgfdgfd
304633----33553566266----138.88.111.88fgfdg
366633----33553566666----138.88.111.88fdgfdg
307833----33553566266----138.88.111.88fdgfd
300533----33553366666----138.88.111.88daadsfasd
350633----33553523e66----138.88.111.88sfas
305633----335535e6666----138.88.111.88safsdfa
399633----33553d6d666----138.88.111.88sdafsd
309633----33553566666----138.88.111.88sfadf
312633----33553566666----138.88.111.88sdfsda
323633----3355356d666----138.88.111.88sdfa
334633----3355dsf6666----138.88.111.88sdfa
344633----3355356dd66----138.88.111.88sdfa
355633----3355356df66----138.88.111.88dsaf
356633----335535s6666----138.88.111.88sdf
388633----33ddff66666----138.88.111.88sdf
333633----3

批处理可以实现,不过文件很大的话,提取速度比较慢:

@echo off
type nul>op.txt
for /f "tokens=1-2 delims=-" %%i in ('type a.txt') do (
echo %%i----%%j
)>>op.txt
exit

输入a.txt,输出op.txt。保存为BAT文件双击执行。

将----替换成Tab 然后导入到excel,取第一第二列保存成文本,然后把tab替换回----。

几百兆的文本可能这个也不可行,我再想想
================================================
用notepad++
(你的第二个----后面好像有数字加点号的形式)
勾选“正则表达式”
替换 ----\d\d\d\..* 为空
替换 ----\d\d\..* 为空
替换 ----\d\..* 为空

你最好把几百兆的文件分成几十个小于10兆的文件,这样会快一点(可以用notepad++全部打开一起替换)

如果还嫌就写个小程序