EXCEL 中怎样进行字段取字节的处理呢(200分+)

来源:百度知道 编辑:UC知道 时间:2024/07/14 11:20:19
我有个问题:
怎样在一列中找出类似的数据,但又不是完全一样.
比如:一列内容有两万行.其中一些是这样出现的:北京科丰农业有限公司.在某一单元格有.科丰(北京)农业有限责任公司.因为数据很多,怎样方便的把两万多条这种相类似的数据找出来呢?其它有什么办法吗?
再举个例子:北京成信电子设备厂,北京成信电子设备有限公司.因为这种数据很多呀.用什么办法解决?自动筛选是不可以的.我压根就不知道哪些公司名称是这样的.

答:操作起来有点困难,原理是你可能存在什么样的差异都要考虑到,可以用字段取字节来处理,层层往下。
1、如前两位相同,再取前四位,四位相同再取六位,这个是解决单位名称前面相同时而长度不一致的情况;
2、如名称颠倒的情况,可以取3-4位与另一单元的1-2位相比较,也可以从5-6位与1-2位相比较,以此类推,直到找到有四个相同或更多,再去区分;
3、上述两种情况都是加工后排序再加工得到。

请问这个回答中所说的用字段取字节怎么操作呢?.

我不能赞同flx0710的办法,2万多条数据,可能你要替换的是1万5千多种关键字,有这个时间我不如排序后手工改还快些,呵呵。
那些提议用筛选/替换的大侠,你们试想一下,要进行筛选或替换就必须知道所有关键字,1万5千左右,筛选替换个球啊!!

jenny9795,关键字由字段前4个字决定??!!我想楼主都不知道所有的字段里面有没有内蒙古/浙江义乌等等这样的字段,你认为还行得通吗??

yxstone,支持,用VB可能也很麻烦,但一定要看到源文件,找到规律才行,看来楼主不会给你我解决了.

你的这个问题在excel中很难解决,因为这个关键字段中的内容可能成千上万,excel需要判别的条件无法预料,主要是因为当时输入时没有规范输入造成的,但我估计不是没办法,本人对excel算是有一点心得的(你可以看我对别人的关于excel的回答中了解),如果你信任我,把你的文件发给我,levi_wzh@163.com 我会仔细研究一下看看有没有什么其他规律可循.

至于楼主题目中的第二个问题:
答:操作起来有点困难,原理是你可能存在什么样的差异都要考虑到,可以用字段取字节来处理,层层往下。
1、如前两位相同,再取前四位,四位相同再取六位,这个是解决单位名称前面相同时而长度不一致的情况;
2、如名称颠倒的情况,可以取3-4位与另一单元的1-2位相比较,也可以从5-6位与1-2位相比较,以此类推,直到找到有四个相同或更多,再去区分;
3、上述两种情况都是加工后排序再加工得到。

请问这个回答中所说的用字段取字节怎么操作呢?
答:字段取节函数有MID(),MIDB(),LEFT(),LEFTB(),RIGHT(),RIGHTB(),查看excel帮助就可以了解这几个函数的用法了.

依我看这个方法也很困难,为什么?因为北京利丰和利丰北京在排序时位置相差十万八千里,无法进行回答中所说的比较法.

大家都希望能够帮到你.

至于你说的那个我不太懂!

不过我感觉这个可以先用替换的方法把相类似的数据转换成相同的,然后在进行筛选就可以很快的完成了!