对于重复行删除的问题,网上很难找到合适的答案,问问题的不少,但在搜索引擎中草草地看了一下前面的记录都没有解决方案。 其实这个问题可以很华丽的解决。 1、如果这张表没有主键(或者相同的行并没有不相同的内容列),则需要新建一个自增列,用来区分不同列。例如 <div class="codetitle"><a style="CURSOR: pointer" data="82487" class="copybut" id="copybut82487" onclick="doCopy('code82487')"> 代码如下:<div class="codebody" id="code82487"> alter table [tablename] add [TID] int IDENTITY(1,1) 就是增加一个自增量的临时列TID。 为啥要用SQL语句?如果超过几十万行的话用SQL SERVER企业管理器的设计界面修改通常会超时。 2、然后就是关键了。给个例子就是我手上正要处理的IP地址所在地清单。近40万条数据,有SIP和EIP(开始IP和结束IP)记录重复,重复条数大概占1/5左右。对此情况用简单的一条SQL命令就搞定: <div class="codetitle"><a style="CURSOR: pointer" data="74201" class="copybut" id="copybut74201" onclick="doCopy('code74201')"> 代码如下:<div class="codebody" id="code74201"> delete from query_IP where TID not in (select max(TID) from query_IP group by SIP,EIP) 就是将SIP和EIP分组,取得同样分组的最大的TID值。然后将原表中不在其中的内容(也就是同样分组的重复内容中更小的ID内容)删除即可。 用这种思路可以延伸出很多SQL解题的方式。比如说某个用户登陆表,要查看每个用户最近的登陆记录。 很优雅的一条查询语句: <div class="codetitle"><a style="CURSOR: pointer" data="52174" class="copybut" id="copybut52174" onclick="doCopy('code52174')"> 代码如下:<div class="codebody" id="code52174"> Select from LoginLog where ID in (select max(ID) from LoginLog group by UserID) SQL强大之极,许多复杂的需求往往可以合并到一条SQL语句查询中实现。因此在我的程序中除了UPDATE/INSERT等操作需要事务支持,或是记录量实在太大需要分页或临时表。通常都用一条SQL语句来实现。比如说select ,(select count(*) from xxx where xxx=t.ID) from t where...。这样就可以在SELECT语句中获取关联的统计项,对于中小型系统尤其实用。 (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|