求助,VB做一个程序,自动识别文本文件中的有用数据。

来源:百度知道 编辑:UC知道 时间:2024/09/22 17:41:35
我和几个同学正在做一个科学计算的程序(我们的作业),用来用插值,微分,拟合等。用VB做。因为要考虑实用的关系,散点原始数据不

能只从键盘输入,而要从文本文件中读取。文本文件是实验设备采集的数据生成的,倒霉就在这里了。
我们实验设备生成的文本文件不是很规范,而且不同的实验有很多不同格式的数据,这样不同的文本每行不一边长,数据个数也不一样。所

以要想办法能识别出有用的数据来。我就负责这里,把文本文件的数据读出来,建立ACCESS数据库,方便计算方法编程的同学调用。
举个例子,下面文本:

这行字在数据分析是应该被忽略。
text line,wo kao wo kao wo wo kao.
以下是数据部分。

BL1 BL2 BL3 BL4 BL5
1 1 0 1 1
2.25 1.5 0.35218 2.25 5.0625
4 2 0.30103 4 16
4.84 2.2 0.684845 4.84 23.4265
6.25 2.5 0.79588 6.25 39.0625
7.29 2.7 0.8627275 7.29 53.1441
9 3 0.9542425 9 81

上面的这个文本如果转成数据库的话,前四行都要被忽略,第5行是字段名,下面的是各条记录。人一看就能猜到从哪开始是数据记录,如果让计

算机也能识别呢?特别是在数据不是很工整的情况下(上面的文本就是。)
上面的文本是我临时编的特例,我们的实验数据有的前面有多达四行的实验条件说明和各种废话,有的可能从首行起就是记录,连字段名都没有

。有的一行10个数据以上(力学实验很变态呀),有的只有两个(外型线的点,插出图形来。)我希望可以用一个程序都可以识别。<

数据实在太杂乱的话不好识别的,希望不要是乱码,如果还是有点规律的话(比如说整行整行的忽略或者不合法的数据忽略),那还容易点.
然后就要看你是怎么读放数据的了,如果是一个一个变量读入的话,你就根据数据格式规定哪种格式的数据读入,不合法的忽略掉.(按你上面所说,最好用这种办法)
如果是一行一行的过滤的话,那就建立关键字表或过滤规则,如一行中出现了关键字表中的一个则忽略整行,或者过滤包含字母的整行
如果一个文件很乱,但只有合法数据和字母的话,可以提取数字与空格输入到另一个文件中,再从中读取变量.
还有好多办法
对于一些特殊的文件,自己手动改一下吧
你贴一个文件上来看看