VC 读写大文件

来源:百度知道 编辑:UC知道 时间:2024/07/07 11:09:06
我有一个数百兆大的文件,类似图型文件,要把文件中指定的字串包含的内容取出存到另一文件中.请问有什么好的方法.谢谢!
例如:
begin
............
end
把begin和end之间的所有内容写入另一文件中.
请各位大侠具体点.谢谢.5楼的方法我试过.但有时取值会把特征串取出一部份.这样就找不到特征串了.

先读一段比如100K,然后在这个100K的内存总查找"begin",如果查不到,再读下一个100K,直到找到为止,如果相应的"end"不在这个段中,那么再继续读下面的段,直到找到结束标签为止。

----------------------------------------------------- 补充1
这个问题不难解决,在读数据的时候,需要多读一点,但是下次再读取的时候,不能仅接着上次的尾部读取了,而是应该倒退几个字符,倒退的数目应该是:最大特征字符长度 - 1。
下面是个简单的图解:
------------------|xxx 3 xxx|
---------|xxx 2 xxx|
|xxx 1 xxx|
################################################
一次性的new出一个特别巨大的内存,是一个愚蠢的做法,如果是一个大于4G的文件,那么你就会更加困难。虽然系统会自动的申请虚拟内存,但是这将极大的影响函数处理的速度,这也是我们国家软件行业所存在的通病,虽然很多程序也能够运行,但是效率与速度都相当的落后,我们应该把软件做的尽可能的快、智能、便捷、清丽。

不好意思看错了。。。先写个查找子串的程序,记录每个子串的文件指针位置。如果第一个字符是b那么查第二个是否是g然受第三个是否i,第四个是否是n如果是查找下一个关联子串end。如果不是继续往下。确定这个关联子串在文件中的位置,然后读取,并写入第二个文件中。用c语言或c++写函数应该很快的。分块的思路不怎么好,反而把程序搞复杂了

用Windows的文件映射吧。。。CreateFile(),CreateFileMapping,MapViewOfFile,楼主可以去查下这几个的API。。。

还是按照5楼的方法读,不过每次读 “100k+特征码的最大长度”,搜索完毕之后,从100k出开始读,再读 “100k+特征码的最大长度”个字节 ,这样就可以解决你说的那个问题了。

我也做过集中文件格式的解析,其中包括chm,chm也有用字符串作为数据段的起始位置,但是该字符串的位置都是在