爬取豆瓣电影top250,存到excel表格中
发布时间:2020-12-15 00:35:40 所属栏目:C语言 来源:网络整理
导读:table class="python" tr class="li1" td class="ln"pre class="de1"1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 6
<table class="python"> |
<tr class="li1">
<td class="ln"><pre class="de1">1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
requests
bs4 BeautifulSoup
openpyxl Workbook
wb Workbook
dest_filename
ws1 wb. ?
ws1.
?
DOWNLOAD_URL
?
download_pageurl:
? ?
? ? headers
? ? ? ? :
? ?
? ? data requests.url headersheaders.
? ? data
?
?
get_lidoc:
? ? soup BeautifulSoupdoc
? ? ol soup. class_
? ? name
? ? star_con
? ? score ?
? ? info_list ?
? ? i ol.:
? ? ? ? detail i. attrs:
? ? ? ? movie_name detail. attrs: .
? ? ? ? level_star i.attrs:.
? ? ? ? star i.attrs:
? ? ? ? star_num star.text. ?
?
? ? ? ? info i.attrs: ?
? ? ? ? info: ? ?
? ? ? ? ? ? info_list.info.
? ? ? ? :
? ? ? ? ? ? info_list.
? ? ? ? score.level_star
? ? ? ?
?
? ? ? ? name.movie_name
? ? ? ? star_con.star_num
? ? page soup. attrs: .
? ? page:
? ? ? ? namestar_conscoreinfo_listDOWNLOAD_URL + page
? ? name
?
?
main:
? ? url DOWNLOAD_URL
? ? name
? ? star_con
? ? score
? ? info
? ? url:
? ? ? ? doc download_pageurl
? ? ? ? moviestarlevel_numurl get_lidoc
? ? ? ? name name + movie
? ? ? ? star_con star_con + star
? ? ? ? score score+level_num
? ? ? ? info info+ info_list
? ? imop nameinfo:
? ? ? ? col_A %name.i+