[bigdata-121] python科学计算
python科学计算,目前用的比较多的库,列一下。用的人多,也就意味着坑少,该踩的坑都被踩完了 1. 数值计算 1.1 numpy http://www.numpy.org/ 1.2 scipy https://www.scipy.org/ 1.3 pandas http://pandas.pydata.org/ 2. 符号计算 sympy 3.绘图 matplot -------- 关于numpy 1. 2.3 诸多运算函数 3.numpy 基础 强制类型转换,x=np.float32(1.0) ? x=np.int_([1.1,2.2,3.3]) broadcasting: 这个表示,numpy如何处理计算时的shape问题。比如说,在计算中,小的数据要broadcast到更大的数据,以适配shape。比如说,a = np.array([1.,2.,3.]),b = np.array([2.,3.,4.]),那么a*b的结果就是np.array([2.,6.,12.])。对 a = np.array([1.,3.]),b=2.,a*b就是np.array[2.,4.,6.],broadcast将b拉伸成跟a一样的尺寸然后进行计算。 byte-swapping,在存储上,可能会遇到不同的数,在python和c或者操作系统上的存储方式不同,比如大端法或者小端法。 结构数据类型,也就是创建一个包涵不同数据类型的数组,比如: x=np.array([(1,'hello'),(2,'world') ],dtype=[('foo','i4'),('bar','f4'),('bza','s10')]) 更多的细节,可以参考num-ref ----------------------------------------------------- 关于 scipy scipy的namespace只包含numpy里的函数。scipy是基于numpy的数学算法和便用函数库,比numpy的应用层面更高一些。主要包括,聚类,数学物理方法,快速复立叶变换,积分,插值,线代,图像处理,回归,优化,信号处理,稀疏矩阵,空间数据,统计等等。 ----------------------------------------------------- 关于pandas 主要解决如下问题:有标记的数据,多种索引方式,数据集变换,输入数据,高效的内存稀疏数据,移动窗统计。 创建时序数据 s = pd.Series([1,np.nan,6,8]) 创建DataFrame dates = pd.date_range('20130101',periods=6) df = pd.DataFrame(np.random.randn(6,index=dates,columns=list('ABCD')) 这就是创建了一个label是日期的6行4列的随机数矩阵。 在基于DataFrame上,出现了一大批算法操作函数。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |