-
python-如何在m??atplotlib和seaborn的不同图表中为相同的索引设
所属栏目:[Python] 日期:2020-12-17 热度:146
我正在尝试在两个图中绘制一个熊猫数据框.一个带有matplotlib pyplot饼图,另一个带有seaborn barchart.在每个图表上,我都根据不同的列对数据框进行了排序.同样,每个图表代表数据帧排序所依据的各个值.因此,两个图表中的行顺序不同.这样,数据框中相同的索引([详细]
-
python-在Pandas中将包含年和周数的字符串转换为日期时间
所属栏目:[Python] 日期:2020-12-17 热度:95
我在Pandas数据框中有一个列,其中以一种字符串的形式包含年份和星期数(1到52),格式为“ 2017_03”(表示2017年的3d周). 我想将列转换为日期时间,并且正在使用pd.to_datetime()函数.但是我得到一个例外: pd.to_datetime('2017_01',format = '%Y_%W')ValueErro[详细]
-
python-如何在熊猫数据框中设置某个字段的值?
所属栏目:[Python] 日期:2020-12-17 热度:70
可以说我有一个像这样的熊猫数据框: d = {'col1': [1,2,3,4],'col2': ['','','']}df = pd.DataFrame(data=d) 出于某种原因,我必须遍历其所有行,并为col2赋予一定的值.我的循环现在在i = 1,并且col2应该是“检查[详细]
-
如何通过随机选择2×2子数组中的元素来对2D数组进行下采样?
所属栏目:[Python] 日期:2020-12-17 热度:124
我有一个2n x 2m的numpy数组.我想通过在2 x 2个不重叠的子数组中随机选择一个元素来构成一个n x m数组,这些子数组对我的初始数组进行分区.最好的方法是什么?有没有办法避免两个for循环(每个维度一个)? 例如,如果我的数组是 1 2 3 45 6 7 89 0 1 28 5 7 0[详细]
-
python-按列标题排列DataFrame列
所属栏目:[Python] 日期:2020-12-17 热度:53
我有两个熊猫数据框,每个都有不同的大小,每个记录超过100万条. 我希望比较这两个数据框并找出差异. 数据框 ID Name Age Sex1A1 Cling 21 M1B2 Roger 22 M1C3 Stew 23 M 数据框 ID FullName Gender Age1B2 Roger M 211C3 Rick M 231D4 Ash F 21 DataFrameB将[详细]
-
达斯克:延迟vs期货和任务图生成
所属栏目:[Python] 日期:2020-12-17 热度:69
关于Dask,我有几个基本问??题: 当我想使用dask进行分布式计算时(即在集群上),必须使用Futures是否正确? 在那种情况下,即在使用期货时,任务图仍然是推理计算的方法.如果是,我如何创建它们. 我通常如何才能获得与任务图相关的字典? 作为编辑: 我的应用程序[详细]
-
python-在agg函数具有一个属性的多列上聚合
所属栏目:[Python] 日期:2020-12-17 热度:86
假设我有一个类似于以下内容的pandas dataFrame(data_stores): store| item1 | item2 | item3------------------------------1 | 45 | 50 | 53 1 | 200 | 300 | 2502 | 20 | 17 | 21 2 | 300 | 350 | 400 假设我想在均值的列item1上以及在总和的列item2和it[详细]
-
加拿大的Scattergeo在python中使用plotly
所属栏目:[Python] 日期:2020-12-17 热度:196
我想在地图上形象化加拿大商店的策略.我已经为美国商店做到了.我只想将其复制到加拿大.我认为位置模式,范围和投影应该改变,但我不知道该用哪个值.我将不胜感激任何帮助. def visualize_geo_store_canada(stores_info_df,fig_name='store_strategy_Canada_map[详细]
-
Python 3非阻塞同步行为
所属栏目:[Python] 日期:2020-12-17 热度:146
我正在使用Pygame在python3中制作经典的atari蛇游戏.我想产生一个子进程来监听按键,以便每当玩家输入键(上,下,左或右)时,该子进程就会发送父进程钥匙.但是该管道不应阻塞,以便蛇可以沿其行进的方向行进,直到收到钥匙为止. 我在multi-processes上找到了Python[详细]
-
python-AttributeError:图层没有入站节点,或者AttributeError:
所属栏目:[Python] 日期:2020-12-17 热度:83
我需要一种方法来获取TensorFlow中任何类型的层(即Dense,Conv2D等)的输出张量的形状.根据文档,有output_shape属性可以解决此问题.但是,每次我访问它都会得到AttributedError. 这是显示问题的代码示例: import numpy as npimport tensorflow as tfx = np.ara[详细]
-
python-当切片有一行结果时返回pandas.DataFrame
所属栏目:[Python] 日期:2020-12-17 热度:52
考虑以下: import numpy as np import pandas as pd df = pd.DataFrame(np.random.randn(5,2),index=[100,101,102,103]) idx = set(df.index) for id_ in idx:... slice = df.loc[id_]... # stuff with slice 我需要在for循环中对slice进行处理,但是该操作[详细]
-
python-用新的数据框替换一行
所属栏目:[Python] 日期:2020-12-17 热度:126
我正在寻找一种更优雅的方法来从字典的值替换另一个数据帧中的一个数据帧. 这是我必须使用的数据类型的示例 d = {1 : {'name' : 'bob','age' : 22,'Data' : {}},4 : {'name' : 'sam','age' : 30,2 : {'name' : 'tom','age' : 20,'Data' : [{'Mail':'B','Mail[详细]
-
python-工程数据结构/信息检索和存储
所属栏目:[Python] 日期:2020-12-17 热度:176
我有一个包含不同子区域的数据框.我所希望的是能够将它们组合在一起,并在另一个数据框中对其进行计数.这就是我称为数据的数据框的样子: Area0 TEX0011 TEX0022 TEX0033 ARZ0044 ARZ0155 MSS0346 NWY0017 NWY003 我已经尝试过使用循环来检索需要的信息的循环[详细]
-
scikit-learn包中的CountVectorizer问题
所属栏目:[Python] 日期:2020-12-17 热度:157
我有电影评论的数据集.它有两列:“类”和“评论”.我已经完成了大多数常规的预处理工作,例如:降低字符,删除停用词,删除标点符号.在预处理结束时,每个原始评论看起来都像是由空格分隔符分隔的单词. 我想先使用CountVectorizer,然后再使用TF-IDF,以创建数据[详细]
-
为什么在函数外时pylint需要大写的变量名?
所属栏目:[Python] 日期:2020-12-17 热度:117
为什么pylint在函数外部时接受大写变量,而在函数内部拒绝它们?相反,为什么pylint拒绝camelCase ouside函数并在函数内部接受它? 我刚刚安装了pylint(版本2.2.2)来检查我的Python3.一定错过了某些东西.我相关的Python /软件包版本是: pylint 2.2.2astroid 2[详细]
-
python-为什么Matplotlib底图不显示岛?
所属栏目:[Python] 日期:2020-12-17 热度:81
我一直在使用matplotlib和底图来显示有关纽约市的一些信息.到目前为止,我一直在关注this guide,但遇到了一个问题.我试图在可视化中显示曼哈顿岛,但我不知道为什么底图没有将其显示为岛. 这是底图为我提供的可视化效果: 这是我正在使用的边界框的屏幕截图:[详细]
-
如何在脚本python3中递归重命名子目录和文件名?
所属栏目:[Python] 日期:2020-12-17 热度:109
我有一个递归目录.子目录和文件名均包含非法字符.我有一个清理名称的功能,例如它用名称中的下划线替换了空格.必须有一种更简单的方法,但我找不到重命名文件夹和文件的方法.因此,我想先重命名文件夹. for path,subdirs,files in os.walk(root): for name in s[详细]
-
python-tkinter按钮不显示
所属栏目:[Python] 日期:2020-12-17 热度:112
当我执行脚本时,背景图像可以正常工作,它将与窗口的大小匹配,但是,我无法显示按钮(它们尚无功能).我对python相当陌生,所以不确定是否将按钮用作事件是一个好主意.任何帮助表示赞赏. import turtleimport tkinter as tkfrom tkinter import *from PIL import[详细]
-
小于numpy数组中的(
所属栏目:[Python] 日期:2020-12-17 热度:74
我现在正在学习Python,而我却在网上找到了这行代码.我不明白这行代码的实际作用. 假设我有这个数组: import numpy as npx = np.array ([[1,5],[8,1],[10,0.5]]y = x[np.sqrt(x[:,0]**2+x[:,1]**2) 1]print (y) 结果是一个空数组.我想知道y实际上是做什么的[详细]
-
python-浮动到百分比样式错误的Pandas dataframe列
所属栏目:[Python] 日期:2020-12-17 热度:194
我正在尝试将浮点数的熊猫数据框列转换为百分比样式 C0.99770.12341.000.. 至 C99.77%12.34%100%... 为此,我正在做: df['C'] = df['C'].map(lambda n: '{:.2%}'.format(n)) 但我收到以下错误: ValueError: Unknown format code '%' for object of type 'st[详细]
-
python-气流DAG-如何首先检查BQ(如有必要,请删除),然后运行数据
所属栏目:[Python] 日期:2020-12-17 热度:124
我正在使用云编写器来协调ETL,以获取到达BigCS的GCS中到达的文件.我有一个云函数,当文件到达时会触发dag,而云函数会将文件名/位置传递给DAG.在我的DAG中,我有2个任务: 1)使用DataflowPythonOperator运行一个数据流作业,该作业从GCS中的文本读取数据并将其转[详细]
-
python-将excel中的某些列读取到数据框
所属栏目:[Python] 日期:2020-12-17 热度:156
我想将某些列从excel文件读入数据帧,但是我想用其列标题名称指定该列. 例如,我有一个excel文件,在工作表2中有两列:A列为“ number”,B列为“ ForeignKey”.我想将“ ForeignKey”导入数据框.我使用以下脚本进行了此操作: xl_file = pd.read_excel('D:/Snap[详细]
-
Python将轴上的年日期转换为月
所属栏目:[Python] 日期:2020-12-17 热度:121
我有一个想逐年绘制的时间序列.我希望数据是每日的,但轴将每个月显示为“ Jan”,“ Feb”等. 目前,我可以获取每日数据,但轴为1-366(一年中的一天). 或者我可以将月度轴设置为1、2、3等(通过将索引更改为df.index.month),但是数据为月度. 如何将一年中的日轴[详细]
-
我如何阻止特定单元格在Google Colab中运行?
所属栏目:[Python] 日期:2020-12-17 热度:161
如果某个单元的运行时间太长(例如,如果它具有用于在深度学习中训练模型的代码),那么如何阻止它在Google Colab中运行. 最佳答案 按下停止按钮,或从运行系统菜单中选择“中断执行”项. 请记住,某些代码不能被中断. (例如,如果您使用的是被系统调用卡住的C库.)[详细]
-
如何从异步方法/线程传递/交换数据?
所属栏目:[Python] 日期:2020-12-17 热度:195
有人可以解释一下如何在python中的异步调用之间传递数据的概念吗? 我有这种情况: 我有一个主过程(mainthread),然后运行另一个异步调用,该调用将两个numbers()相加并休眠一段时间.期望让主线程等到calc和sleeping完成.在伪代码方面,这可能看起来像这样: de[详细]
