Python之路,Day21 - 常用算法学习
本节内容
一个算法应该具有以下七个重要的特征: ①有穷性(Finiteness):算法的有穷性是指算法必须能在执行有限个步骤之后终止; ②确切性(Definiteness):算法的每一步骤必须有确切的定义; ③输入项(Input):一个算法有0个或多个输入,以刻画运算对象的初始情况,所谓0个输 ? ? 入是指算法本身定出了初始条件; ④输出项(Output):一个算法有一个或多个输出,以反映对输入数据加工后的结果。没 ? ? ? 有输出的算法是毫无意义的; ⑤可行性(Effectiveness):算法中执行的任何计算步骤都是可以被分解为基本的可执行 ? ? ? 的操作步,即每个计算步都可以在有限时间内完成(也称之为有效性); ⑥高效性(High efficiency):执行速度快,占用资源少; ⑦健壮性(Robustness):对数据响应正确。 2. 时间复杂度
<pre name="code" class="reply-text mb10">一、计算方法 <table> |
for j in range(len(data_set)):
for i in range(len(data_set) - j- 1): # -1 是因为每次比对的都 是i 与i +1,不减1的话,最后一次对比会超出list 获取范围,-j是因为,每一次大loop就代表排序好了一个最大值,放在了列表最后面,下次loop就不用再运算已经排序好了的值 了
if data_set[i] > data_set[i+1]: #switch
tmp = data_set[i]
data_set[i] = data_set[i+1]
data_set[i+1] = tmp
loop_count +=1
print(data_set)
print(data_set)
print("loop times",loop_count)
选择排序
The algorithm works by selecting the smallest unsorted item and then swapping it with the item in the next position to be filled.
The selection sort works as follows: you look through the entire array for the smallest element,once you find it you swap it (the smallest element) with the first element of the array. Then you look for the smallest element in the remaining array (an array without the first element) and swap it with the second element. Then you look for the smallest element in the remaining array (an array without first and second elements) and swap it with the third element,and so on. Here is an example,
loop_count = 0
for j in range(len(data_set)):
for i in range(j,len(data_set)):
if data_set[i] < data_set[smallest_num_index]: #当前值 比之前选出来的最小值 还要小,那就把它换成最小值
smallest_num_index = i
loop_count +=1
else:
print("smallest num is ",data_set[smallest_num_index])
tmp = data_set[smallest_num_index]
data_set[smallest_num_index] = data_set[j]
data_set[j] = tmp
print(data_set)
print("loop times",loop_count)
插入排序(Insertion Sort)
插入排序(Insertion Sort)的基本思想是:将列表分为2部分,左边为排序好的部分,右边为未排序的部分,循环整个列表,每次将一个待排序的记录,按其关键字大小插入到前面已经排好序的子序列中的适当位置,直到全部记录插入完成为止。
插入排序非常类似于整扑克牌。
在开始摸牌时,左手是空的,牌面朝下放在桌上。接着,一次从桌上摸起一张牌,并将它插入到左手一把牌中的正确位置上。为了找到这张牌的正确位置,要将它与手中已有的牌从右到左地进行比较。无论什么时候,左手中的牌都是排好序的。
<div class="cnblogs_Highlighter">
<pre class="brush:python;gutter:true;">source = [92,77,67,8,84,55,85,43,67]
?
?
for index in range(1,len(source)):
????current_val = source[index] #先记下来每次大循环走到的第几个元素的值
????position = index
?
????while position > 0 and source[position-1] > current_val: #当前元素的左边的紧靠的元素比它大,要把左边的元素一个一个的往右移一位,给当前这个值插入到左边挪一个位置出来
????????source[position] = source[position-1] #把左边的一个元素往右移一位
????????position -= 1 #只一次左移只能把当前元素一个位置,还得继续左移只到此元素放到排序好的列表的适当位置 为止
?
????source[position] = current_val #已经找到了左边排序好的列表里不小于current_val的元素的位置,把current_val放在这里
????print(source)
结果:
[77,92,67][67,67][8,67][6,92]
#更容易理解的版本
快速排序(quick sort)
设要排序的是A[0]……A[N-1],首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。值得注意的是,快速排序不是一种稳定的,也就是说,多个相同的值的相对位置也许会在算法结束时产生变动
注:在待排序的文件中,若存在多个关键字相同的记录,经过排序后这些具有相同关键字的记录之间的相对次序保持不变,该排序方法是稳定的;若具有相同关键字的记录之间的相对次序发生改变,则称这种排序方法是不稳定的。要注意的是,排序算法的稳定性是针对所有输入实例而言的。即在所有可能的输入实例中,只要有一个实例使得算法不满足稳定性要求,则该排序算法就是不稳定的。?
示例
</td>
<td align="left" valign="top" width="78">
<div class="para">0
</td>
<td align="left" valign="top" width="78">
<div class="para">1
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">4
</td>
<td align="left" valign="top" width="78">
<div class="para">5
</td>
</tr>
<tr>
<td align="left" valign="top" width="78">
<div class="para">数据
</td>
<td align="left" valign="top" width="78">
<div class="para">6
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">7
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">8
</td>
<td align="left" valign="top" width="78">
<div class="para">9
</td>
</tr>
</td>
<td align="left" valign="top" width="78">
<div class="para">0
</td>
<td align="left" valign="top" width="78">
<div class="para">1
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">3</td>
<td align="left" valign="top" width="78">
<div class="para">4
</td>
<td align="left" valign="top" width="78">
<div class="para">5
</td>
</tr>
<tr>
<td align="left" valign="top" width="78">
<div class="para">数据
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">7
</td>
<td align="left" valign="top" width="78">
<div class="para">6
</td>
<td align="left" valign="top" width="78">
<div class="para">8
</td>
<td align="left" valign="top" width="78">
<div class="para">9
</td>
</tr>
</td>
<td align="left" valign="top" width="78">
<div class="para">0
</td>
<td align="left" valign="top" width="78">
<div class="para">1
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">4
</td>
<td align="left" valign="top" width="78">
<div class="para">5
</td>
</tr>
<tr>
<td align="left" valign="top" width="78">
<div class="para">数据
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">6
</td>
<td align="left" valign="top" width="78">
<div class="para">7
</td>
<td align="left" valign="top" width="78">
<div class="para">8
</td>
<td align="left" valign="top" width="78">
<div class="para">9
</td>
</tr>
</td>
<td align="left" valign="top" width="78">
<div class="para">0
</td>
<td align="left" valign="top" width="78">
<div class="para">1
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">4
</td>
<td align="left" valign="top" width="78">
<div class="para">5
</td>
</tr>
<tr>
<td align="left" valign="top" width="78">
<div class="para">数据
</td>
<td align="left" valign="top" width="78">
<div class="para">3
</td>
<td align="left" valign="top" width="78">
<div class="para">2
</td>
<td align="left" valign="top" width="78">
<div class="para">6
</td>
<td align="left" valign="top" width="78">
<div class="para">7
</td>
<td align="left" valign="top" width="78">
<div class="para">8
</td>
<td align="left" valign="top" width="78">
<div class="para">9
</td>
</tr>
def quick_sort(array,left,right):
'''
:param array:
:param left: 列表的第一个索引
:param right: 列表最后一个元素的索引
:return:
'''
if left >=right:
return
low = left
high = right
key = array[low] #第一个值
while low < high:#只要左右未遇见
while low < high and array[high] > key: #找到列表右边比key大的值 为止
high -= 1
#此时直接 把key(array[low]) 跟 比它大的array[high]进行交换
array[low] = array[high]
array[high] = key
while low < high and array[low] <= key : #找到key左边比key大的值,这里为何是<=而不是<呢?你要思考。。。
low += 1
#array[low] =
#找到了左边比k大的值,把array[high](此时应该刚存成了key) 跟这个比key大的array[low]进行调换
array[high] = array[low]
array[low] = key
quick_sort(array,low-1) #最后用同样的方式对分出来的左边的小组进行同上的做法
quick_sort(array,low+1,right)#用同样的方式对分出来的右边的小组进行同上的做法
if name == 'main':
array = [96,14,10,99,16,5,4,13,26,18,34,23,7,19,2]
#array = [8,12]
print("before sort:",array)
quick_sort(array,len(array)-1)
print("-------final -------")
print(array)
二叉树
树的特征和定义
树(Tree)是元素的集合。我们先以比较直观的方式介绍树。下面的数据结构是一个树:

树有多个节点(node),用以储存元素。某些节点之间存在一定的关系,用连线表示,连线称为边(edge)。边的上端节点称为父节点,下端称为子节点。树像是一个不断分叉的树根。
每个节点可以有多个子节点(children),而该节点是相应子节点的父节点(parent)。比如说,3,5是6的子节点,6是3,5的父节点;1,7是3的子节点,3是1,7的父节点。树有一个没有父节点的节点,称为根节点(root),如图中的6。没有子节点的节点称为叶节点(leaf),比如图中的1,5节点。从图中还可以看到,上面的树总共有4个层次,6位于第一层,9位于第四层。树中节点的最大层次被称为深度。也就是说,该树的深度(depth)为4。
如果我们从节点3开始向下看,而忽略其它部分。那么我们看到的是一个以节点3为根节点的树:

三角形代表一棵树
再进一步,如果我们定义孤立的一个节点也是一棵树的话,原来的树就可以表示为根节点和子树(subtree)的关系:

上述观察实际上给了我们一种严格的定义树的方法:
1. 树是元素的集合。
2. 该集合可以为空。这时树中没有元素,我们称树为空树 (empty tree)。
3. 如果该集合不为空,那么该集合有一个根节点,以及0个或者多个子树。根节点与它的子树的根节点用一个边(edge)相连。
上面的第三点是以递归的方式来定义树,也就是在定义树的过程中使用了树自身(子树)。由于树的递归特征,许多树相关的操作也可以方便的使用递归实现。我们将在后面看到。
树的实现
树的示意图已经给出了树的一种内存实现方式: 每个节点储存元素和多个指向子节点的指针。然而,子节点数目是不确定的。一个父节点可能有大量的子节点,而另一个父节点可能只有一个子节点,而树的增删节点操作会让子节点的数目发生进一步的变化。这种不确定性就可能带来大量的内存相关操作,并且容易造成内存的浪费。
一种经典的实现方式如下:

树的内存实现
拥有同一父节点的两个节点互为兄弟节点(sibling)。上图的实现方式中,每个节点包含有一个指针指向第一个子节点,并有另一个指针指向它的下一个兄弟节点。这样,我们就可以用统一的、确定的结构来表示每个节点。
计算机的文件系统是树的结构,比如中所介绍的。在UNIX的文件系统中,每个文件(文件夹同样是一种文件),都可以看做是一个节点。非文件夹的文件被储存在叶节点。文件夹中有指向父节点和子节点的指针(在UNIX中,文件夹还包含一个指向自身的指针,这与我们上面见到的树有所区别)。在git中,也有类似的树状结构,用以表达整个文件系统的版本变化 (参考)。

?二叉树:
二叉树是由n(n≥0)个结点组成的有限集合、每个结点最多有两个子树的有序树。它或者是空集,或者是由一个根和称为左、右子树的两个不相交的二叉树组成。
特点:
(1)二叉树是有序树,即使只有一个子树,也必须区分左、右子树;
(2)二叉树的每个结点的度不能大于2,只能取0、1、2三者之一;
(3)二叉树中所有结点的形态有5种:空结点、无左右子树的结点、只有左子树的结点、只有右子树的结点和具有左右子树的结点。

二叉树(binary)是一种特殊的树。二叉树的每个节点最多只能有2个子节点:

二叉树
由于二叉树的子节点数目确定,所以可以直接采用上图方式在内存中实现。每个节点有一个左子节点(left children)和右子节点(right children)。左子节点是左子树的根节点,右子节点是右子树的根节点。
如果我们给二叉树加一个额外的条件,就可以得到一种被称作二叉搜索树(binary search tree)的特殊二叉树。二叉搜索树要求:每个节点都不比它左子树的任意元素小,而且不比它的右子树的任意元素大。
(如果我们假设树中没有重复的元素,那么上述要求可以写成:每个节点比它左子树的任意节点大,而且比它右子树的任意节点小)

二叉搜索树,注意树中元素的大小
二叉搜索树可以方便的实现搜索算法。在搜索元素x的时候,我们可以将x和根节点比较:
1. 如果x等于根节点,那么找到x,停止搜索 (终止条件)
2. 如果x小于根节点,那么搜索左子树
3. 如果x大于根节点,那么搜索右子树
二叉搜索树所需要进行的操作次数最多与树的深度相等。n个节点的二叉搜索树的深度最多为n,最少为log(n)。
<h3 dir="ltr">二叉树的遍历
<blockquote dir="ltr">
<p dir="ltr">遍历即将树的所有结点访问且仅访问一次。按照根节点位置的不同分为前序遍历,中序遍历,后序遍历。
<blockquote dir="ltr">
<p dir="ltr">前序遍历:根节点->左子树->右子树
<p dir="ltr">中序遍历:左子树->根节点->右子树
<p dir="ltr">后序遍历:左子树->右子树->根节点

?二叉树的类型
如何判断一棵树是完全二叉树?按照定义,
教材上的说法:一个深度为k,节点个数为 2^k - 1 的二叉树为满二叉树。这个概念很好理解,
就是一棵树,深度为k,并且没有空位。
首先对满二叉树按照广度优先遍历(从左到右)的顺序进行编号。
一颗深度为k二叉树,有n个节点,然后,也对这棵树进行编号,如果所有的编号都和满二叉树对应,那么这棵树是完全二叉树。

(b)左边的图 左子数的高度为3,右子树的高度为1,相差超过1
(b)右边的图 -2的左子树高度为0? 右子树的高度为2,相差超过1
二叉树遍历实现?
class BTree(object):
def init(self,root=0):
self.root = root
def preOrder(self,treenode):
if treenode is 0:
return
print(treenode.data)
self.preOrder(treenode.left)
self.preOrder(treenode.right)
def inOrder(self,treenode):
if treenode is 0:
return
self.inOrder(treenode.left)
print(treenode.data)
self.inOrder(treenode.right)
def postOrder(self,treenode):
if treenode is 0:
return
self.postOrder(treenode.left)
self.postOrder(treenode.right)
print(treenode.data)
if name == 'main':
n1 = TreeNode(data=1)
n2 = TreeNode(2,n1,0)
n3 = TreeNode(3)
n4 = TreeNode(4)
n5 = TreeNode(5,n3,n4)
n6 = TreeNode(6,n2,n5)
n7 = TreeNode(7,n6,0)
n8 = TreeNode(8)
root = TreeNode('root',n7,n8)
bt = BTree(root)
print("preOrder".center(50,'-'))
print(bt.preOrder(bt.root))
print("inOrder".center(50,'-'))
print (bt.inOrder(bt.root))
print("postOrder".center(50,'-'))
print (bt.postOrder(bt.root))
堆排序
堆排序,顾名思义,就是基于堆。因此先来介绍一下堆的概念。堆分为最大堆和最小堆,其实就是完全二叉树。最大堆要求节点的元素都要大于其孩子,最小堆要求节点元素都小于其左右孩子,两者对左右孩子的大小关系不做任何要求,其实很好理解。有了上面的定义,我们可以得知,处于最大堆的根节点的元素一定是这个堆中的最大值。其实我们的堆排序算法就是抓住了堆的这一特点,每次都取堆顶的元素,将其放在序列最后面,然后将剩余的元素重新调整为最大堆,依次类推,最终得到排序的序列。
堆排序就是把堆顶的最大数取出,
将剩余的堆继续调整为最大堆,具体过程在第二块有介绍,以递归实现
剩余部分调整为最大堆后,再次将堆顶的最大数取出,再将剩余部分调整为最大堆,这个过程持续到剩余数只有一个时结束

<div class="cnblogsHighlighter">
<pre class="brush:python;collapse:true;;gutter:true;">#coding:utf-8_
author = 'Alex Li'
import time,random
def sift_down(arr,node,end):
root = node
print(root,2*root+1,end)
while True:
# 从root开始对最大堆调整
child = 2 * root +1 #left child
if child > end:
#print('break',)
break
print("v:",root,arr[root],child,arr[child])
print(arr)
# 找出两个child中交大的一个
if child + 1 <= end and arr[child] < arr[child + 1]: #如果左边小于右边
child += 1 #设置右边为大
if arr[root] < arr[child]:
# 最大堆小于较大的child,交换顺序
tmp = arr[root]
arr[root] = arr[child]
arr[child]= tmp
# 正在调整的节点设置为root
#print("less1:",arr[child],child)
root = child #
#[3,11,15,21,29]
#print("less2:",child)
else:
# 无需调整的时候,退出
break
#print(arr)
print('-------------')
def heap_sort(arr):
从最后一个有子节点的孩子还是调整最大堆
first = len(arr) // 2 -1
for i in range(first,-1,-1):
sift_down(arr,i,len(arr) - 1)
#[29,11]
print('--------end---',arr)
# 将最大的放到堆的最后一个,堆-1,继续调整排序
for end in range(len(arr) -1,-1):
arr[0],arr[end] = arr[end],arr[0]
sift_down(arr,end - 1)
#print(arr)
def main():
[7,95,73,65,60,28,62,43]
# [3,10]
#l = [3,10]
#l = [16,27,0]
array = [16,29]
#array = []
#for i in range(2,5000):
# #print(i)
# array.append(random.randrange(1,i))
print(array)
start_t = time.time()
heap_sort(array)
end_t = time.time()
print("cost:",end_t -start_t)
print(array)
#print(l)
#heap_sort(l)
#print(l)
if name == "main":
main()
dataset = [16,22
i range(len(dataset)-1,-1 (,dataset[0:i+1
index range(int((i+1)/2),-1 p_index =
l_child_index = p_index *2 - 1
r_child_index = p_index *2
(,l_child_index, p_node = dataset[p_index-1 left_child =
p_node < left_child:
dataset[p_index - 1],dataset[l_child_index] =
p_node = dataset[p_index - 1
r_child_index < len(dataset[0:i+1]):
right_child =
p_node < right_child:
dataset[p_index - 1],dataset[r_child_index] =
p_node = dataset[p_index - 1
( %
( (,dataset[0:i+1 dataset[0],dataset[i] = (dataset)
希尔排序(shell sort)
希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本,该方法的基本思想是:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的,因此希尔排序在时间效率比直接插入排序有较大提高

首先要明确一下增量的取法:
? ? ? 第一次增量的取法为: d=count/2;
? ? ? 第二次增量的取法为: ?d=(count/2)/2;
? ? ? 最后一直到: d=1;
看上图观测的现象为:
? ? ? ? d=3时:将40跟50比,因50大,不交换。
? ? ? ? ? ? ? ? ? ?将20跟30比,因30大,不交换。
? ? ? ? ? ? ? ? ? ?将80跟60比,因60小,交换。
? ? ? ? d=2时:将40跟60比,不交换,拿60跟30比交换,此时交换后的30又比前面的40小,又要将40和30交换,如上图。
? ? ? ? ? ? ? ? ? ?将20跟50比,不交换,继续将50跟80比,不交换。
? ? ? ? d=1时:这时就是前面讲的插入排序了,不过此时的序列已经差不多有序了,所以给插入排序带来了很大的性能提高。
<div class="cnblogs_code" onclick="cnblogs_code_show('0c0db794-98b3-47cf-aa59-a0f259546ba1')">
<img id="code_img_closed_0c0db794-98b3-47cf-aa59-a0f259546ba1" class="code_img_closed" src="https://www.52php.cn/res/2019/02-10/23/1c53668bcee393edac0d7b3b3daff1ae.gif" alt=""><img id="code_img_opened_0c0db794-98b3-47cf-aa59-a0f259546ba1" class="code_img_opened" style="display: none;" onclick="cnblogs_code_hide('0c0db794-98b3-47cf-aa59-a0f259546ba1',event)" src="https://www.52php.cn/res/2019/02-10/23/405b18b4b6584ae338e0f6ecaf736533.gif" alt=""><div id="cnblogs_code_open_0c0db794-98b3-47cf-aa59-a0f259546ba1" class="cnblogs_code_hide">
<span style="color: #008000;">#<span style="color: #008000;">source = [8,-4,-100,99]<span style="color: #008000;">
<span style="color: #008000;">source = [92,67]
<span style="color: #000000;">
source = [ random.randrange(10000+i) <span style="color: #0000ff;">for i <span style="color: #0000ff;">in range(10000<span style="color: #000000;">)]
<span style="color: #008000;">#<span style="color: #008000;">print(source)
<span style="color: #000000;">
step = int(len(source)/2) <span style="color: #008000;">#<span style="color: #008000;">分组步长
<span style="color: #000000;">
t_start =<span style="color: #000000;"> time.time()
<span style="color: #0000ff;">while step ><span style="color: #000000;">0:
<span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">---step ---<span style="color: #800000;">"<span style="color: #000000;">,step)
<span style="color: #008000;">#<span style="color: #008000;">对分组数据进行插入排序
<span style="color: #0000ff;">for</span> index <span style="color: #0000ff;">in</span><span style="color: #000000;"> range(0,len(source)):
</span><span style="color: #0000ff;">if</span> index + step <<span style="color: #000000;"> len(source):
current_val </span>= source[index] <span style="color: #008000;">#</span><span style="color: #008000;">先记下来每次大循环走到的第几个元素的值</span>
<span style="color: #0000ff;">if</span> current_val > source[index+step]: <span style="color: #008000;">#</span><span style="color: #008000;">switch</span>
source[index],source[index+step] = source[index+<span style="color: #000000;">step],source[index]
step </span>= int(step/2<span style="color: #000000;">)
<span style="color: #0000ff;">else: <span style="color: #008000;">#<span style="color: #008000;">把基本排序好的数据再进行一次插入排序就好了
<span style="color: #0000ff;">for index <span style="color: #0000ff;">in range(1<span style="color: #000000;">,len(source)):
current_val = source[index] <span style="color: #008000;">#<span style="color: #008000;"> 先记下来每次大循环走到的第几个元素的值
position =<span style="color: #000000;"> index
</span><span style="color: #0000ff;">while</span> position > 0 <span style="color: #0000ff;">and</span><span style="color: #000000;"> source[
position </span>- 1] > current_val: <span style="color: #008000;">#</span><span style="color: #008000;"> 当前元素的左边的紧靠的元素比它大,给当前这个值插入到左边挪一个位置出来</span>
source[position] = source[position - 1] <span style="color: #008000;">#</span><span style="color: #008000;"> 把左边的一个元素往右移一位</span>
position -= 1 <span style="color: #008000;">#</span><span style="color: #008000;"> 只一次左移只能把当前元素一个位置,还得继续左移只到此元素放到排序好的列表的适当位置 为止</span>
<span style="color: #000000;">
source[position] = current_val <span style="color: #008000;">#<span style="color: #008000;"> 已经找到了左边排序好的列表里不小于current_val的元素的位置,把current_val放在这里
<span style="color: #0000ff;">print<span style="color: #000000;">(source)
t_end = time.time() -<span style="color: #000000;"> t_start
<span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">cost:<span style="color: #800000;">",t_end)
(编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
'''
:param array:
:param left: 列表的第一个索引
:param right: 列表最后一个元素的索引
:return:
'''
if left >=right:
return
low = left
high = right
key = array[low] #第一个值
while low < high:#只要左右未遇见
while low < high and array[high] > key: #找到列表右边比key大的值 为止
high -= 1
#此时直接 把key(array[low]) 跟 比它大的array[high]进行交换
array[low] = array[high]
array[high] = key
while low < high and array[low] <= key : #找到key左边比key大的值,这里为何是<=而不是<呢?你要思考。。。
low += 1
#array[low] =
#找到了左边比k大的值,把array[high](此时应该刚存成了key) 跟这个比key大的array[low]进行调换
array[high] = array[low]
array[low] = key
quick_sort(array,low-1) #最后用同样的方式对分出来的左边的小组进行同上的做法
quick_sort(array,low+1,right)#用同样的方式对分出来的右边的小组进行同上的做法
if name == 'main':
array = [96,14,10,99,16,5,4,13,26,18,34,23,7,19,2]
#array = [8,12]
print("before sort:",array)
quick_sort(array,len(array)-1)
print("-------final -------")
print(array)
二叉树
树(Tree)是元素的集合。我们先以比较直观的方式介绍树。下面的数据结构是一个树:
树有多个节点(node),用以储存元素。某些节点之间存在一定的关系,用连线表示,连线称为边(edge)。边的上端节点称为父节点,下端称为子节点。树像是一个不断分叉的树根。
每个节点可以有多个子节点(children),而该节点是相应子节点的父节点(parent)。比如说,3,5是6的子节点,6是3,5的父节点;1,7是3的子节点,3是1,7的父节点。树有一个没有父节点的节点,称为根节点(root),如图中的6。没有子节点的节点称为叶节点(leaf),比如图中的1,5节点。从图中还可以看到,上面的树总共有4个层次,6位于第一层,9位于第四层。树中节点的最大层次被称为深度。也就是说,该树的深度(depth)为4。
如果我们从节点3开始向下看,而忽略其它部分。那么我们看到的是一个以节点3为根节点的树:
三角形代表一棵树
再进一步,如果我们定义孤立的一个节点也是一棵树的话,原来的树就可以表示为根节点和子树(subtree)的关系:
上述观察实际上给了我们一种严格的定义树的方法:
1. 树是元素的集合。
2. 该集合可以为空。这时树中没有元素,我们称树为空树 (empty tree)。
3. 如果该集合不为空,那么该集合有一个根节点,以及0个或者多个子树。根节点与它的子树的根节点用一个边(edge)相连。
上面的第三点是以递归的方式来定义树,也就是在定义树的过程中使用了树自身(子树)。由于树的递归特征,许多树相关的操作也可以方便的使用递归实现。我们将在后面看到。
树的实现
树的示意图已经给出了树的一种内存实现方式: 每个节点储存元素和多个指向子节点的指针。然而,子节点数目是不确定的。一个父节点可能有大量的子节点,而另一个父节点可能只有一个子节点,而树的增删节点操作会让子节点的数目发生进一步的变化。这种不确定性就可能带来大量的内存相关操作,并且容易造成内存的浪费。
一种经典的实现方式如下:
树的内存实现
拥有同一父节点的两个节点互为兄弟节点(sibling)。上图的实现方式中,每个节点包含有一个指针指向第一个子节点,并有另一个指针指向它的下一个兄弟节点。这样,我们就可以用统一的、确定的结构来表示每个节点。
计算机的文件系统是树的结构,比如中所介绍的。在UNIX的文件系统中,每个文件(文件夹同样是一种文件),都可以看做是一个节点。非文件夹的文件被储存在叶节点。文件夹中有指向父节点和子节点的指针(在UNIX中,文件夹还包含一个指向自身的指针,这与我们上面见到的树有所区别)。在git中,也有类似的树状结构,用以表达整个文件系统的版本变化 (参考)。
?二叉树:
特点:
(1)二叉树是有序树,即使只有一个子树,也必须区分左、右子树;
(2)二叉树的每个结点的度不能大于2,只能取0、1、2三者之一;
(3)二叉树中所有结点的形态有5种:空结点、无左右子树的结点、只有左子树的结点、只有右子树的结点和具有左右子树的结点。
二叉树(binary)是一种特殊的树。二叉树的每个节点最多只能有2个子节点:
二叉树
由于二叉树的子节点数目确定,所以可以直接采用上图方式在内存中实现。每个节点有一个左子节点(left children)和右子节点(right children)。左子节点是左子树的根节点,右子节点是右子树的根节点。
如果我们给二叉树加一个额外的条件,就可以得到一种被称作二叉搜索树(binary search tree)的特殊二叉树。二叉搜索树要求:每个节点都不比它左子树的任意元素小,而且不比它的右子树的任意元素大。
(如果我们假设树中没有重复的元素,那么上述要求可以写成:每个节点比它左子树的任意节点大,而且比它右子树的任意节点小)
二叉搜索树,注意树中元素的大小
二叉搜索树可以方便的实现搜索算法。在搜索元素x的时候,我们可以将x和根节点比较:
1. 如果x等于根节点,那么找到x,停止搜索 (终止条件)
2. 如果x小于根节点,那么搜索左子树
3. 如果x大于根节点,那么搜索右子树
二叉搜索树所需要进行的操作次数最多与树的深度相等。n个节点的二叉搜索树的深度最多为n,最少为log(n)。
<h3 dir="ltr">二叉树的遍历
<blockquote dir="ltr">
<p dir="ltr">遍历即将树的所有结点访问且仅访问一次。按照根节点位置的不同分为前序遍历,中序遍历,后序遍历。
<blockquote dir="ltr">
<p dir="ltr">前序遍历:根节点->左子树->右子树
<p dir="ltr">中序遍历:左子树->根节点->右子树
<p dir="ltr">后序遍历:左子树->右子树->根节点
?二叉树的类型
教材上的说法:一个深度为k,节点个数为 2^k - 1 的二叉树为满二叉树。这个概念很好理解,
就是一棵树,深度为k,并且没有空位。
首先对满二叉树按照广度优先遍历(从左到右)的顺序进行编号。
一颗深度为k二叉树,有n个节点,然后,也对这棵树进行编号,如果所有的编号都和满二叉树对应,那么这棵树是完全二叉树。
(b)左边的图 左子数的高度为3,右子树的高度为1,相差超过1
(b)右边的图 -2的左子树高度为0? 右子树的高度为2,相差超过1
二叉树遍历实现?
class BTree(object):
def init(self,root=0):
self.root = root
def preOrder(self,treenode):
if treenode is 0:
return
print(treenode.data)
self.preOrder(treenode.left)
self.preOrder(treenode.right)
def inOrder(self,treenode):
if treenode is 0:
return
self.inOrder(treenode.left)
print(treenode.data)
self.inOrder(treenode.right)
def postOrder(self,treenode):
if treenode is 0:
return
self.postOrder(treenode.left)
self.postOrder(treenode.right)
print(treenode.data)
if name == 'main':
n1 = TreeNode(data=1)
n2 = TreeNode(2,n1,0)
n3 = TreeNode(3)
n4 = TreeNode(4)
n5 = TreeNode(5,n3,n4)
n6 = TreeNode(6,n2,n5)
n7 = TreeNode(7,n6,0)
n8 = TreeNode(8)
root = TreeNode('root',n7,n8)
bt = BTree(root)
print("preOrder".center(50,'-'))
print(bt.preOrder(bt.root))
print("inOrder".center(50,'-'))
print (bt.inOrder(bt.root))
print("postOrder".center(50,'-'))
print (bt.postOrder(bt.root))
堆排序
堆排序,顾名思义,就是基于堆。因此先来介绍一下堆的概念。堆分为最大堆和最小堆,其实就是完全二叉树。最大堆要求节点的元素都要大于其孩子,最小堆要求节点元素都小于其左右孩子,两者对左右孩子的大小关系不做任何要求,其实很好理解。有了上面的定义,我们可以得知,处于最大堆的根节点的元素一定是这个堆中的最大值。其实我们的堆排序算法就是抓住了堆的这一特点,每次都取堆顶的元素,将其放在序列最后面,然后将剩余的元素重新调整为最大堆,依次类推,最终得到排序的序列。
堆排序就是把堆顶的最大数取出,
将剩余的堆继续调整为最大堆,具体过程在第二块有介绍,以递归实现
剩余部分调整为最大堆后,再次将堆顶的最大数取出,再将剩余部分调整为最大堆,这个过程持续到剩余数只有一个时结束

<div class="cnblogsHighlighter">
<pre class="brush:python;collapse:true;;gutter:true;">#coding:utf-8_
author = 'Alex Li'
import time,random
def sift_down(arr,node,end):
root = node
print(root,2*root+1,end)
while True:
# 从root开始对最大堆调整
child = 2 * root +1 #left child
if child > end:
#print('break',)
break
print("v:",root,arr[root],child,arr[child])
print(arr)
# 找出两个child中交大的一个
if child + 1 <= end and arr[child] < arr[child + 1]: #如果左边小于右边
child += 1 #设置右边为大
if arr[root] < arr[child]:
# 最大堆小于较大的child,交换顺序
tmp = arr[root]
arr[root] = arr[child]
arr[child]= tmp
# 正在调整的节点设置为root
#print("less1:",arr[child],child)
root = child #
#[3,11,15,21,29]
#print("less2:",child)
else:
# 无需调整的时候,退出
break
#print(arr)
print('-------------')
def heap_sort(arr):
从最后一个有子节点的孩子还是调整最大堆
first = len(arr) // 2 -1
for i in range(first,-1,-1):
sift_down(arr,i,len(arr) - 1)
#[29,11]
print('--------end---',arr)
# 将最大的放到堆的最后一个,堆-1,继续调整排序
for end in range(len(arr) -1,-1):
arr[0],arr[end] = arr[end],arr[0]
sift_down(arr,end - 1)
#print(arr)
def main():
[7,95,73,65,60,28,62,43]
# [3,10]
#l = [3,10]
#l = [16,27,0]
array = [16,29]
#array = []
#for i in range(2,5000):
# #print(i)
# array.append(random.randrange(1,i))
print(array)
start_t = time.time()
heap_sort(array)
end_t = time.time()
print("cost:",end_t -start_t)
print(array)
#print(l)
#heap_sort(l)
#print(l)
if name == "main":
main()

(b)左边的图 左子数的高度为3,右子树的高度为1,相差超过1
(b)右边的图 -2的左子树高度为0? 右子树的高度为2,相差超过1
二叉树遍历实现?
def init(self,root=0):
self.root = root
def preOrder(self,treenode):
if treenode is 0:
return
print(treenode.data)
self.preOrder(treenode.left)
self.preOrder(treenode.right)
def inOrder(self,treenode):
if treenode is 0:
return
self.inOrder(treenode.left)
print(treenode.data)
self.inOrder(treenode.right)
def postOrder(self,treenode):
if treenode is 0:
return
self.postOrder(treenode.left)
self.postOrder(treenode.right)
print(treenode.data)
if name == 'main':
n1 = TreeNode(data=1)
n2 = TreeNode(2,n1,0)
n3 = TreeNode(3)
n4 = TreeNode(4)
n5 = TreeNode(5,n3,n4)
n6 = TreeNode(6,n2,n5)
n7 = TreeNode(7,n6,0)
n8 = TreeNode(8)
root = TreeNode('root',n7,n8)
bt = BTree(root)
print("preOrder".center(50,'-'))
print(bt.preOrder(bt.root))
print("inOrder".center(50,'-'))
print (bt.inOrder(bt.root))
print("postOrder".center(50,'-'))
print (bt.postOrder(bt.root))
堆排序
堆排序,顾名思义,就是基于堆。因此先来介绍一下堆的概念。堆分为最大堆和最小堆,其实就是完全二叉树。最大堆要求节点的元素都要大于其孩子,最小堆要求节点元素都小于其左右孩子,两者对左右孩子的大小关系不做任何要求,其实很好理解。有了上面的定义,我们可以得知,处于最大堆的根节点的元素一定是这个堆中的最大值。其实我们的堆排序算法就是抓住了堆的这一特点,每次都取堆顶的元素,将其放在序列最后面,然后将剩余的元素重新调整为最大堆,依次类推,最终得到排序的序列。
堆排序就是把堆顶的最大数取出,
将剩余的堆继续调整为最大堆,具体过程在第二块有介绍,以递归实现
剩余部分调整为最大堆后,再次将堆顶的最大数取出,再将剩余部分调整为最大堆,这个过程持续到剩余数只有一个时结束
<div class="cnblogsHighlighter">
<pre class="brush:python;collapse:true;;gutter:true;">#coding:utf-8_
author = 'Alex Li'
import time,random
def sift_down(arr,node,end):
root = node
print(root,2*root+1,end)
while True:
# 从root开始对最大堆调整
child = 2 * root +1 #left child
if child > end:
#print('break',)
break
print("v:",root,arr[root],child,arr[child])
print(arr)
# 找出两个child中交大的一个
if child + 1 <= end and arr[child] < arr[child + 1]: #如果左边小于右边
child += 1 #设置右边为大
if arr[root] < arr[child]:
# 最大堆小于较大的child,交换顺序
tmp = arr[root]
arr[root] = arr[child]
arr[child]= tmp
# 正在调整的节点设置为root
#print("less1:",arr[child],child)
root = child #
#[3,11,15,21,29]
#print("less2:",child)
else:
# 无需调整的时候,退出
break
#print(arr)
print('-------------')
def heap_sort(arr):
从最后一个有子节点的孩子还是调整最大堆
first = len(arr) // 2 -1
for i in range(first,-1,-1):
sift_down(arr,i,len(arr) - 1)
#[29,11]
print('--------end---',arr)
# 将最大的放到堆的最后一个,堆-1,继续调整排序
for end in range(len(arr) -1,-1):
arr[0],arr[end] = arr[end],arr[0]
sift_down(arr,end - 1)
#print(arr)
def main():
[7,95,73,65,60,28,62,43]
# [3,10]
#l = [3,10]
#l = [16,27,0]
array = [16,29]
#array = []
#for i in range(2,5000):
# #print(i)
# array.append(random.randrange(1,i))
print(array)
start_t = time.time()
heap_sort(array)
end_t = time.time()
print("cost:",end_t -start_t)
print(array)
#print(l)
#heap_sort(l)
#print(l)
if name == "main":
main()
希尔排序(shell sort)
希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本,该方法的基本思想是:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的,因此希尔排序在时间效率比直接插入排序有较大提高
首先要明确一下增量的取法:
? ? ? 第一次增量的取法为: d=count/2;
? ? ? 第二次增量的取法为: ?d=(count/2)/2;
? ? ? 最后一直到: d=1;
看上图观测的现象为:
? ? ? ? d=3时:将40跟50比,因50大,不交换。
? ? ? ? ? ? ? ? ? ?将20跟30比,因30大,不交换。
? ? ? ? ? ? ? ? ? ?将80跟60比,因60小,交换。
? ? ? ? d=2时:将40跟60比,不交换,拿60跟30比交换,此时交换后的30又比前面的40小,又要将40和30交换,如上图。
? ? ? ? ? ? ? ? ? ?将20跟50比,不交换,继续将50跟80比,不交换。
? ? ? ? d=1时:这时就是前面讲的插入排序了,不过此时的序列已经差不多有序了,所以给插入排序带来了很大的性能提高。
<div class="cnblogs_code" onclick="cnblogs_code_show('0c0db794-98b3-47cf-aa59-a0f259546ba1')">
<img id="code_img_closed_0c0db794-98b3-47cf-aa59-a0f259546ba1" class="code_img_closed" src="https://www.52php.cn/res/2019/02-10/23/1c53668bcee393edac0d7b3b3daff1ae.gif" alt=""><img id="code_img_opened_0c0db794-98b3-47cf-aa59-a0f259546ba1" class="code_img_opened" style="display: none;" onclick="cnblogs_code_hide('0c0db794-98b3-47cf-aa59-a0f259546ba1',event)" src="https://www.52php.cn/res/2019/02-10/23/405b18b4b6584ae338e0f6ecaf736533.gif" alt=""><div id="cnblogs_code_open_0c0db794-98b3-47cf-aa59-a0f259546ba1" class="cnblogs_code_hide">
<span style="color: #008000;">#<span style="color: #008000;">source = [8,-4,-100,99]<span style="color: #008000;"><span style="color: #008000;">source = [92,67]
<span style="color: #000000;">
source = [ random.randrange(10000+i) <span style="color: #0000ff;">for i <span style="color: #0000ff;">in range(10000<span style="color: #000000;">)]
<span style="color: #008000;">#<span style="color: #008000;">print(source)
<span style="color: #000000;">step = int(len(source)/2) <span style="color: #008000;">#<span style="color: #008000;">分组步长
<span style="color: #000000;">
t_start =<span style="color: #000000;"> time.time()<span style="color: #0000ff;">while step ><span style="color: #000000;">0:
<span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">---step ---<span style="color: #800000;">"<span style="color: #000000;">,step)
<span style="color: #008000;">#<span style="color: #008000;">对分组数据进行插入排序<span style="color: #0000ff;">for</span> index <span style="color: #0000ff;">in</span><span style="color: #000000;"> range(0,len(source)): </span><span style="color: #0000ff;">if</span> index + step <<span style="color: #000000;"> len(source): current_val </span>= source[index] <span style="color: #008000;">#</span><span style="color: #008000;">先记下来每次大循环走到的第几个元素的值</span> <span style="color: #0000ff;">if</span> current_val > source[index+step]: <span style="color: #008000;">#</span><span style="color: #008000;">switch</span> source[index],source[index+step] = source[index+<span style="color: #000000;">step],source[index] step </span>= int(step/2<span style="color: #000000;">)
<span style="color: #0000ff;">else: <span style="color: #008000;">#<span style="color: #008000;">把基本排序好的数据再进行一次插入排序就好了
<span style="color: #0000ff;">for index <span style="color: #0000ff;">in range(1<span style="color: #000000;">,len(source)):
current_val = source[index] <span style="color: #008000;">#<span style="color: #008000;"> 先记下来每次大循环走到的第几个元素的值
position =<span style="color: #000000;"> index</span><span style="color: #0000ff;">while</span> position > 0 <span style="color: #0000ff;">and</span><span style="color: #000000;"> source[ position </span>- 1] > current_val: <span style="color: #008000;">#</span><span style="color: #008000;"> 当前元素的左边的紧靠的元素比它大,给当前这个值插入到左边挪一个位置出来</span> source[position] = source[position - 1] <span style="color: #008000;">#</span><span style="color: #008000;"> 把左边的一个元素往右移一位</span> position -= 1 <span style="color: #008000;">#</span><span style="color: #008000;"> 只一次左移只能把当前元素一个位置,还得继续左移只到此元素放到排序好的列表的适当位置 为止</span>
<span style="color: #000000;">
source[position] = current_val <span style="color: #008000;">#<span style="color: #008000;"> 已经找到了左边排序好的列表里不小于current_val的元素的位置,把current_val放在这里
<span style="color: #0000ff;">print<span style="color: #000000;">(source)t_end = time.time() -<span style="color: #000000;"> t_start
<span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">cost:<span style="color: #800000;">",t_end)
(编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!