加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

wolfram-mathematica – 时间有效的部分倒置指数建设

发布时间:2020-12-13 20:24:11 所属栏目:百科 来源:网络整理
导读:我需要构建一个部分 Inverted Index .这样的东西: l = {{x,{h,a,b,c}},{y,{c,d,e}}}iI[l](*- {{a,{x}},{b,{x,y}},{d,{y}},{e,{x}}}*) 我觉得这是很清楚的.在输入列表中,y …}是唯一的,而{a,c,..}不是.输出应该由#[[1]]排序. 现在,我这样做: iI[list_List]
我需要构建一个部分 Inverted Index.这样的东西:
l = {{x,{h,a,b,c}},{y,{c,d,e}}}
iI[l]
(*
-> {{a,{x}},{b,{x,y}},{d,{y}},{e,{x}}}
*)

我觉得这是很清楚的.在输入列表中,y …}是唯一的,而{a,c,..}不是.输出应该由#[[1]]排序.

现在,我这样做:

iI[list_List] := {#,list[[Position[list,#][[All,1]]]][[All,1]]} & /@ 
                     (Union@Flatten@Last@Transpose@list)

但是看起来太慢了,我应该能够应付军团,这看起来太复杂了.

比较你的结果的测试驱动:

words = DictionaryLookup[];
abWords = DictionaryLookup["ab" ~~ ___];
l = {#,RandomChoice[abWords,RandomInteger[{1,30}]]} & /@ words[[1 ;; 3000]];
First@Timing@iI[l]
(*
-> 5.312
*)

那么,加速的任何想法?

似乎是Reap-Sow的经典任务(由于@Heike在最终版本的改进):
iI[list_] := Sort[Reap[Sow @@@ list,_,List][[2]]]

然后,

iI[l]

{{a,{x}}}

In[22]:= 
words=DictionaryLookup[];
abWords=DictionaryLookup["ab"~~___];
l={#,30}]]}&/@words[[1;;3000]];
First@Timing@iI[l]
Out[25]= 0.047

编辑

这是一个具有类似(稍差)性能的替代版本:

iIAlt[list_] :=
   Sort@Transpose[{#[[All,1,2]],#[[All,All,1]]}] &@
           GatherBy[Flatten[Thread /@ list,1],Last];

有趣的是,Reap – Sow这里给出了比基于结构操作更快的解决方案.

编辑2

只是为了说明 – 对于喜欢基于规则的解决方案的人来说,这是一个基于Dispatch和ReplaceList的组合:

iIAlt1[list_] :=
   With[{disp = Dispatch@Flatten[Thread[Rule[#2,#]] & @@@ list]},Map[{#,ReplaceList[#,disp]} &,Union @@ list[[All,2]]]]

但是,它比其他两个慢约2-3倍.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读