wolfram-mathematica – 时间有效的部分倒置指数建设
发布时间:2020-12-13 20:24:11 所属栏目:百科 来源:网络整理
导读:我需要构建一个部分 Inverted Index .这样的东西: l = {{x,{h,a,b,c}},{y,{c,d,e}}}iI[l](*- {{a,{x}},{b,{x,y}},{d,{y}},{e,{x}}}*) 我觉得这是很清楚的.在输入列表中,y …}是唯一的,而{a,c,..}不是.输出应该由#[[1]]排序. 现在,我这样做: iI[list_List]
我需要构建一个部分
Inverted Index .这样的东西:
l = {{x,{h,a,b,c}},{y,{c,d,e}}} iI[l] (* -> {{a,{x}},{b,{x,y}},{d,{y}},{e,{x}}} *) 我觉得这是很清楚的.在输入列表中,y …}是唯一的,而{a,c,..}不是.输出应该由#[[1]]排序. 现在,我这样做: iI[list_List] := {#,list[[Position[list,#][[All,1]]]][[All,1]]} & /@ (Union@Flatten@Last@Transpose@list) 但是看起来太慢了,我应该能够应付军团,这看起来太复杂了. 比较你的结果的测试驱动: words = DictionaryLookup[]; abWords = DictionaryLookup["ab" ~~ ___]; l = {#,RandomChoice[abWords,RandomInteger[{1,30}]]} & /@ words[[1 ;; 3000]]; First@Timing@iI[l] (* -> 5.312 *) 那么,加速的任何想法?
似乎是Reap-Sow的经典任务(由于@Heike在最终版本的改进):
iI[list_] := Sort[Reap[Sow @@@ list,_,List][[2]]] 然后, iI[l] {{a,{x}}} 和 In[22]:= words=DictionaryLookup[]; abWords=DictionaryLookup["ab"~~___]; l={#,30}]]}&/@words[[1;;3000]]; First@Timing@iI[l] Out[25]= 0.047 编辑 这是一个具有类似(稍差)性能的替代版本: iIAlt[list_] := Sort@Transpose[{#[[All,1,2]],#[[All,All,1]]}] &@ GatherBy[Flatten[Thread /@ list,1],Last]; 有趣的是,Reap – Sow这里给出了比基于结构操作更快的解决方案. 编辑2 只是为了说明 – 对于喜欢基于规则的解决方案的人来说,这是一个基于Dispatch和ReplaceList的组合: iIAlt1[list_] := With[{disp = Dispatch@Flatten[Thread[Rule[#2,#]] & @@@ list]},Map[{#,ReplaceList[#,disp]} &,Union @@ list[[All,2]]]] 但是,它比其他两个慢约2-3倍. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |