微信聊天记录词云
发布时间:2020-12-14 19:45:04 所属栏目:资源 来源:网络整理
导读:table class="python" tr class="li1" td class="ln"pre class="de1"1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 6
<table class="python"> |
<tr class="li1">
<td class="ln"><pre class="de1">1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
requests
numpy np
pandas
lxml etree
jieba
wordcloud WordCloud
matplotlib. plt
%matplotlib inline
?
.u
html.
.
?
item_pattern .
? ? r'
? ? .
?
?
parse_askitempage:
? ? info .item_pattern page
? ? info
?
items_list parse_askitemhtml
?
对进行处理,取出文字类型的数据并汇总到一个content中
content_list
item items_list:
? ?
? ? item& item:
? ? ? ? content_list.item
?
content
con content_list:
? ? content content + con
?
?
segment
segs jieba.content
seg segs:
? ? seg seg':
? ? ? ? segment.seg
?
words_dfpandas.:segment
words_df.
ancient_chinese_stopwordspandas.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
words_dfwords_dfwords_df..ancient_chinese_stopwords
?
words_statwords_df.by.:np.
words_statwords_stat..byascending
?
scipy. imread
matplotlib. plt
wordcloud WordCloudImageColorGenerator
bimgimread
wordcloudWordCloudbackground_colormaskbimgfont_path
wordcloudwordcloud.words_stat..index
bimgColorsImageColorGeneratorbimg
plt.figsize
plt.
plt.wordcloud.color_funcbimgColors
plt.
?
?
matplotlib
zhfont1 matplotlib..fname