Python_站长网

python – 设置pandas Dataframe Boxplot()的y轴刻度,3个偏差？

所属栏目：[Python] 日期：2020-12-20 热度：84

我正在尝试每月制作一个箱线图表区域,不同的箱形图按行业分组(并标记),然后让Y轴使用我指定的比例. 在一个完美的世界中,这将是动态的,我可以将轴设置为与整体平均值的一定数量的标准偏差.我可以使用其他类型的动态设置y轴,但我希望它是所有创建的“月度”分[详细]
python – 在seaborn中绘制两列dataFrame

所属栏目：[Python] 日期：2020-12-20 热度：144

我正在尝试在seaborn中创建一个条形图,显示数据框中每行(因子)的两个变量(权重,方差)的值.这是我的数据： Factor Weight Variance Growth 10% 0.15 Value 20% 0.35 这是我的代码： fig=plt.figure(figsize=(10,10)) ax1=fig.add_subplot(221) sns.barplot(x=[详细]
python – Jupyter：安装新模块

所属栏目：[Python] 日期：2020-12-20 热度：200

我最近安装了带有 Python 3.5的Anaconda以及其他所有功能.我来自R,我习惯于动态安装包.我试图通过jupyter笔记本安装一个名为scitools的模块.我想在jupyter中重新创建它.但是,我不知道如何动态安装包(如果可能的话).非常感谢你的帮助.谢谢！编辑：我正在尝试[详细]
python – PYQT如何编辑在MainWindow中标记的QDockWidget的标题

所属栏目：[Python] 日期：2020-12-20 热度：128

from PyQt4 import QtCore,QtGuiclass Window(QtGui.QMainWindow): def __init__(self): QtGui.QMainWindow.__init__(self) self.centralContent = QtGui.QMainWindow() self.setCentralWidget(self.centralContent) self.centralContent.firstTabWidget = Q[详细]
没有结果的Celery任务写入结果后端

所属栏目：[Python] 日期：2020-12-20 热度：193

我有一些应该返回结果的任务,而有些任务则没有. 我想强制不应返回结果的任务不在结果后端写入任何内容(例如None).我怎样才能在芹菜中实现这一目标？例如,这是我的任务： @app.taskdef taskWithResult(): # ...code... return res@app.taskdef taskWithNoRes[详细]
Python Numpy TypeError：输入类型不支持ufunc’isfinite’

所属栏目：[Python] 日期：2020-12-20 热度：134

这是我的代码： def topK(dataMat,sensitivity): meanVals = np.mean(dataMat,axis=0) meanRemoved = dataMat - meanVals covMat = np.cov(meanRemoved,rowvar=0) eigVals,eigVects = np.linalg.eig(np.mat(covMat)) 我在上面最后一行的标题中得到了错误.我[详细]
Python3,Boost-Python和Cpp链接器错误

所属栏目：[Python] 日期：2020-12-20 热度：66

所以我准备把笔记本电脑从窗户里扔出窗外,去烧掉Apple HQ. 请参阅下面的更新：我无法让python3,boost-python和clang互相合作.我遇到的错误正在运行： clang++ FLAGS/INCLUDES -o hello.so hello.cpp 调用响应： Undefined symbols for architecture x86_64:[详细]
创建一个新变量,它是Python中两个变量的最小值

所属栏目：[Python] 日期：2020-12-20 热度：127

我有一个pd数据帧.我想要做的是生成一个新变量,其值是另外两个变量之间的最小值. 例如,假设我有： a b 0 1 0 1 5 1 2 7 3 3 3 5 我想创建一个如下所示的新变量C： a b c 0 1 0 01 5 1 12 7 3 33 3 5 3 我试着写一个循环去做,但由于我有超过30k的观察,它需要[详细]
如何将不同的函数应用于pandas数据帧上的不同列

所属栏目：[Python] 日期：2020-12-20 热度：111

我想在pandas数据帧上使用groupby,但我希望得到一些列的平均值和其他列的总和.假设我们有以下数据帧： ID A B C1 1 1 01 2 3 11 3 6 14 3 2 14 4 1 06 5 1 06 6 6 16 7 2 0 我想分组ID并获得列“A”的平均值和其他列的总和(实际上我有超过40列). 我希望结果[详细]
python – 在函数内部复制dataframe而不更改原始数据

所属栏目：[Python] 日期：2020-12-20 热度：87

我正在尝试创建一个可以在不更改原始数据帧的情况下更改数据帧副本值的函数.这是我到目前为止： def home_undervalued(df): local_df = df local_df['total_games'] = 0 local_df['total_wins'] = 0 cond_1 = local_df['predicted_spread'] local_df['vegas_[详细]
python – Pandas Pivot和Merge无法正常工作

所属栏目：[Python] 日期：2020-12-20 热度：110

我的意见是： Col1 Col2 Col3 Col4 Col50 1 Y A PQR 561 1 Y A XYZ 22 1 Y A DEF 203 2 Y B PQR 184 2 Y B XYZ 245 2 Y B DEF 116 3 Y C PQR 207 3 Y C XYZ 48 3 Y C DEF 189 3 Y C HHH 23 我想要的输出是： Col1 Col2 Col3 PQR XYZ DEF HHH0 1 Y A 56 2 20[详细]
python – 包含2个值的拆分列到pandas df中的不同列中

所属栏目：[Python] 日期：2020-12-20 热度：150

我有一张pandas df的桌子 bigram frequency(123,3245) 2(676,35346) 84(93,32) 9 等等,直到50行. 我正在寻找的是,将bigram列分成两个不同的列,删除括号和逗号, col1 col2 frequency123 3245 2676 35346 8493 32 9 是否有任何方法可以在逗号之后拆分,并删除括[详细]
python – 使用OpenCV和SIFT / SURF校正扫描图像以匹配原始图像

所属栏目：[Python] 日期：2020-12-20 热度：61

我有一个数字形式的原始页面和同一页面的几个扫描版本.我的目标是对扫描的页面进行校正,使其尽可能与原始页面匹配.我知道我可以使用 here所述的概率霍夫变换来固定旋转但扫描的纸张尺寸也不同,因为有些人将页面缩放到不同的纸张格式.我认为OpenCV中的findHom[详细]
python – 一种更快的方法来删除熊猫中未使用的类别？

所属栏目：[Python] 日期：2020-12-20 热度：108

我在 Python中运行一些模型,在类别上使用数据子集. 对于内存使用和预处理,所有分类变量都存储为类别数据类型. 对于我的“分组依据”列中的分类变量的每个级别,我正在运行回归,我需要将所有分类变量重置为该子集中存在的变量. 我目前正在使用.cat.remove_unus[详细]
Python格式和熊猫

所属栏目：[Python] 日期：2020-12-20 热度：187

我想使用格式删除一些列.(想要删除列：new_cost0,new_0_quantity,new_2_cost和new_2_quantity)但不是每个列都被删除.以下是数据框和代码. 数据帧 |new_0_cost|new_0_quantity|new_2_cost|new_2_quantity|quality|weights| 0| 10 | 20 | 10 | 20 | good | 40[详细]
python – 检查另一个数据帧中是否存在多行

所属栏目：[Python] 日期：2020-12-20 热度：66

我有两个数据帧.我想看看另一个数据帧中是否存在特定的行(完整的).来自df_subset的示例行： id category value date1 A 10 01-01-153 C 10 03-01-15 另一个df_full： id category value date1 A 10 01-01-152 B 10 02-01-153 C 10 03-01-154 D 16 04-01-15[详细]
python – List comprehension – 将一个列表中的字符串转换为另

所属栏目：[Python] 日期：2020-12-20 热度：101

基本上,我有一个字符串给出如下：“56 65 74 100 99 68 86 180 90”. 我需要以这样一种方式转换它,以便我能够将构成上述数字的每个单独数字相加,即56将变为5 6将变为11. 到目前为止,我采取了以下方法： l = string.split()new_l = []# the below creates a l[详细]
python – 将模块列为字符串并导入它们

所属栏目：[Python] 日期：2020-12-20 热度：196

我有一堆我需要导入的模块.由于我不允许解释模块名称的原因必须作为字符串存储在列表中.换句话说,我需要做以下事情： modules_to_import = ['module1','module2','module3']import modules_to_import 有人知道我是否可以在python中使用它？解决方法使用imp[详细]
python – 将字典分成较小的字典

所属栏目：[Python] 日期：2020-12-20 热度：108

我有一本字典,想把它分成更小的字典,例如： dic = {1:(2,6),3:(4,5)} 我想循环它并在第一次迭代时使用“当前”字典current = {1：2,3：4},并在第二次迭代时使用当前{1：6,3：5}.这是我尝试过的(并且不起作用)： dic = {1:(2,5)}for i in range (0,1): for ke[详细]
python – matplotlib图例标签与LaTeX数学的垂直对齐

所属栏目：[Python] 日期：2020-12-20 热度：108

将具有下标的标签与没有它们的标签混合时,它们不会在图例中垂直对齐.由于matplotlib在内部根据打印字符确定边界框,因此使用vphantom字符无法对齐这些图例标签,我也没有运气改变标签与set_va的垂直对齐方式. 下面是一个MWE,它说明了我试图解决的问题.我希望标[详细]
python – PySpark 2：KMeans输入数据不直接缓存

所属栏目：[Python] 日期：2020-12-20 热度：63

我不知道为什么收到这条消息 WARN KMeans: The input data is not directly cached,which may hurt performance if its parent RDDs are also uncached. 当我尝试使用Spark KMeans时 df_Part = assembler.transform(df_Part) df_Part.cache()while (k=max_cl[详细]
python – 通过删除groupby之后的nan来合并DataFrame中的行

所属栏目：[Python] 日期：2020-12-20 热度：63

提供如下的DataFrame： import numpy as npimport pandas as pdfrom pandas import DataFrameidx = pd.MultiIndex.from_product([["Project 1","Project 2"],range(1,3)],names=['Project','Ord'])df = DataFrame({'a': ["foo",np.nan,"bar"],'b': [np.nan,"[详细]
Python：在数据帧中将字符串数组转换为int数组

所属栏目：[Python] 日期：2020-12-20 热度：92

我有一个数据框,持续时间是其中一个属性.持续时间的内容如下： array(['487','346',...,'227','17']). 而df.info(),我得到：数据列(共22列)： duration 2999 non-null object campaign 2999 non-null object ... 现在我想将持续时间转换为int.有什么解决方案[详细]
在python中为什么它不会没有换行打印

所属栏目：[Python] 日期：2020-12-20 热度：119

我是学习 python的新手.我不明白为什么print命令会在屏幕上输出所有变量,但是写入命令只能写入2个前两个变量. print "Opening the file..."target = open(filename,'a+')line1 = raw_input("line 1: ")line2 = raw_input("line 2: ")line3 = raw_input("line[详细]
python – 将一列的值分成两列

所属栏目：[Python] 日期：2020-12-20 热度：112

我有一个数据框,其列为“last_updated”,类型为datetime64 [ns]： df = pd.DataFrame({'last_updated': ['11/12/14 2:44 PM','5/18/15 11:36 AM','11/12/14 3:09 PM']}) 我想在这一列中创建两列 – “last_updated_date”和“last_updated_time”.此外,时间[详细]

24045

首页

189