-
如何使用python pandas删除每行中的某些单元格?
所属栏目:[Python] 日期:2020-12-20 热度:191
我有一个这样的数据帧,每行代表一个人做的一些旅行: IndividualID Ifmarried Sex Trip1 Trip2 Trip3 Trip4 Trip5 Trip6 Trip7 Trip8 Trip9200100001 1 2 23 1 2 4 4 4 1 5 5200100002 1 1 21 2 12 3 1 55 7 7200100003 2 1 12 3 1 6 3 200100004 1 2 1 2001[详细]
-
python – dataframe使列代表向量
所属栏目:[Python] 日期:2020-12-20 热度:179
我有流派的数据框 df = pd.DataFrame({'genres': [['Drama'],['Music','Drama','Romance'],['Action','Adventure','Comedy'],['Thriller','Romance','Drama'],['Adventure','Family']] })print(df)genres = ['Action','Comedy','Family','Music','Thriller'][详细]
-
python – 这些机器学习输出文件的目的和意义是什么?
所属栏目:[Python] 日期:2020-12-20 热度:185
我设法成功运行了这个机器学习教程(我的第一个).它使用卷积神经网络进行分类. https://github.com/bhimmetoglu/time-series-medicine/blob/master/HAR/HAR-CNN.ipynb 在使用tensor-flow完成此机器学习python脚本之后,会在文件夹checkpoints-cnn中生成一些文[详细]
-
python – 通过Pandas DataFrame搜索子字符串的最有效方法是什么
所属栏目:[Python] 日期:2020-12-20 热度:66
我有一个包含75k行文本的Pandas Dataframe(每行大约350个字符).我需要搜索该数据帧中45k子串列表的出现. 预期输出是authors_data dict,其中包含作者列表和出现次数.下面的代码假设我有一个dataframe [‘text’]列和一个名为authors_list的子字符串列表. auth[详细]
-
使用Python中的字典理解将3个列表唯一地组合成1个列表
所属栏目:[Python] 日期:2020-12-20 热度:119
我是学习 Python的新手,我是几百行的代码! start = ['12','08','07','16','04']middle = ['01','01','01']end = ['13','15','05'] 期望的输出(按顺序): [('1201': '13'),('0801': '07'),('0701': '08'),('1601': '15'),('0401','05')] 下面的代码将无法保[详细]
-
如何在sklearn中获取预测值和误差度量
所属栏目:[Python] 日期:2020-12-20 热度:180
我有两个单独的 python函数,其中一个使用cross_val_predict返回数据集的预测值,另一个使用cross_validate返回多个错误度量值.下面显示的是用于获取度量值的方法(我已经实现了类似的方法来获取预测). def metric_val(folds):...scoring = {'r_score': 'r2','a[详细]
-
python – 不同大小的数组的元素操作
所属栏目:[Python] 日期:2020-12-20 热度:175
什么是最快和最 pythonic的方式来执行不同大小的数组的元素操作而不过度采样较小的数组? 例如: 我有一个大型数组,一个1000×1000和一个小数组B 10×10我希望B中的每个元素响应数组B中的100×100个元素.不需要任何插值,只需在B中使用相同的元素进行所有1000[详细]
-
python – 如何在类中将字典值作为变量返回
所属栏目:[Python] 日期:2020-12-20 热度:117
我有以下类,它返回给定kwargs作为输入的字典. class Emp_Constant: def __init__(self,**kwargs): for key,value in kwargs.items(): setattr(self,key,value) 但是,在某些情况下,我想将字典作为此类的输入传递,并将键值作为变量进行访问. 例如,如果我的字典[详细]
-
带有负值的Python sort()问题
所属栏目:[Python] 日期:2020-12-20 热度:180
今天是个好日子, 我在使用sorted()函数对dict中的百分比值进行排序时遇到了问题.当我得到负数时,它会排序最大的负数,然后是第二大的负数.我希望最小的负数首先出现.有没有办法修改我的sorted()来实现这个目的?干杯! yoy_dict = sorted(yoy_dict.items(),key[详细]
-
Python,pandas:如何将一个系列附加到数据帧
所属栏目:[Python] 日期:2020-12-20 热度:146
我有以下数据帧df1: import pandas as pddata = {'name': ['Jason','Molly','Tina','Jake','Amy','Lisa','Fred'],'gender': ['m','f','m','m'],}df1 = pd.DataFrame(data,index = [1,2,3,4,5,6,7,8,9,10]) 我想创建一个包含一些标准和一些自定义汇总统计信[详细]
-
python – 更改数据框中多个loc的最快方法
所属栏目:[Python] 日期:2020-12-20 热度:72
我有一个包含100万行的pandas数据帧.我想用另一组值替换列中900,000行的值.有没有for循环(我需要两天才能完成)的快速方法吗? 例如,查看此示例数据框,其中我已将100万行压缩为8行 import numpy as npimport pandas as pddf = pd.DataFrame()df['a'] = [-1,-3[详细]
-
python – 索引在2D列表中的位置,以从同一列表中获取子返回值
所属栏目:[Python] 日期:2020-12-20 热度:138
所以基本上我已经制作了两个不同的列表,并且它们的位置彼此相应. 用户输入项目名称.程序在预定义列表中搜索其索引,然后从第二个列表中提供其各自的值. 我想要的是第一个评论(2d列表)上的列表.是否有可能使用该列表,用户输入:’面包’. 程序获取其索引,然后[详细]
-
在python中的pandas中的DataFrame的dropna中的thresh
所属栏目:[Python] 日期:2020-12-20 热度:88
df1 = pd.DataFrame(np.arange(15).reshape(5,3))df1.iloc[:4,1] = np.nandf1.iloc[:2,2] = np.nandf1.dropna(thresh=1,axis=1) 似乎没有删除任何nan值. 0 1 20 0 NaN NaN1 3 NaN NaN2 6 NaN 8.03 9 NaN 11.04 12 13.0 14.0 如果我跑 df1.dropna(thresh=2,ax[详细]
-
python – 在列表推导中使用就地列表方法的替代方法?
所属栏目:[Python] 日期:2020-12-20 热度:98
我知道就地列表方法返回None而不是变异列表.据我所知,这使得不可能将这些方法用作列表理解的内部逻辑的一部分. 什么是创建列表理解的最pythonic方法,其成员来自变异其他列表?换句话说:这个(无功能)线的最佳替代方案是什么: new_list = [old_list.insert(0[详细]
-
当python的`in`函数通过`__getitem __()`’触发时,它是如何工作
所属栏目:[Python] 日期:2020-12-20 热度:66
The official documentation表示python首先尝试通过__contains __(),然后__iter __(),最后__getitem __()进行检查,具体取决于定义的函数,以便解析调用. 例如: if y in x: print("y present in x")else: print("y not present in x") 链接的文档表明,如果存[详细]
-
python – 包含数组条目的列的pandas查询
所属栏目:[Python] 日期:2020-12-20 热度:93
ykp.dataOut[182]: state action reward 0 [41] 5 59 1 [5] 52 48 2 [46] 35 59 3 [42] 16 12 4 [43] 37 48 5 [36] 5 59 6 [49] 52 48 7 [39] 11 23 我想在状态条目中找到匹配[42]的行,所以我跑了 ykp.data.query('state == [42]') 但我明白了 Empty DataFra[详细]
-
python – 计算成对产品,三元产品等的总和
所属栏目:[Python] 日期:2020-12-20 热度:112
1)问题表述: 给定长度为n的向量:a = [a1,a2,..,an],我需要计算向量b = [b1,b2,… bn],这样: b1=a1+a2+...+anb2=a1a2+a1a3+...+a1an+a2a3+...+a2an+...+a{n-1}anb3=a1a2a3+a1a2a4+...+a1a2an+a1a3a4+......bn=a1a2a3...an b的每个连续条目包含a,成对产品的[详细]
-
python – 将多个字符串值合并到一个df列中
所属栏目:[Python] 日期:2020-12-20 热度:197
道歉我多次尝试透过SO一直都是徒劳的.我需要以下方面的帮助: 我的df如下: import pandas as pddf = pd.DataFrame({'subject' : ['Eng','Math','Science'],'role' : ['Teacher','','Dr'],'ID' : ['123','444','NaN'] }) print(df) ID role subject0 123 Tea[详细]
-
如何在Pandas中的groupsBy中保留没有分组列
所属栏目:[Python] 日期:2020-12-20 热度:82
我有一个大熊猫的数据框,我想通过电子邮件分组,获取日期的最大值并保留状态列.但是在groupby上没有使用状态. 示例:给出以下数据帧df +-------------------------------+| email | status | date |+-------------------------------+| test1 | viewed | 01/0[详细]
-
在Python中查找具有相同属性的列表中的两个元素
所属栏目:[Python] 日期:2020-12-20 热度:131
我想在列表中找到具有相同属性的任何元素对.例如, class X: def __init__(self,param): self.param = parammy_list = [X(1),X(2),X(3),X(3)] 因此,如果在x.param上进行比较,我会寻找my_list [1],my_list [3]或my_list [2],my_list [4]或my_list [2],my_list[详细]
-
Django过滤器按相关字段过滤
所属栏目:[Python] 日期:2020-12-20 热度:92
我有两张桌子. class Writer(models.Model) name = model.CharField() ...class Article(models.Model) name = model.CharField() writer = model.ForeignKey('Writer',related_name="relationship") ... 我想构建一些获取编写器列表的API端点,但这应该可以[详细]
-
python – 带有列表的子集pandas数据帧
所属栏目:[Python] 日期:2020-12-20 热度:141
我想根据几个变量列表对我的数据帧进行子集化,即: list1=[var1,var2,var3] list2=[var4,var5,var6] data_final = data[list1,list2] 产生了这个错误: TypeError: unhashable type: 'list' 如果我提供一个列表,一切正常: data_final = data[list1] 以下是[详细]
-
在python中熔化不完整的数据而不丢弃所有NaN
所属栏目:[Python] 日期:2020-12-20 热度:120
我正在尝试使用pd.melt将3列熔化为一个分类列.目前,数据框看起来像这样. id1 Plane Car Boat0 123 None None None1 124 Plane None None2 125 None None Boat 在某些时候,我用NaN代替None,但我不确定在融化前是否有必要.我的目标是有一个类别列,列出它的车辆[详细]
-
在python中等效于grep -B的代码是什么?
所属栏目:[Python] 日期:2020-12-20 热度:173
参见英文答案 cat,grep and cut – translated to python????????????????????????????????????5个 如何使用python从文件中的匹配字符串之前打印n行? man grep -B NUM,–before-context=NUM Print NUM lines of leading context before matching lines. Pla[详细]
-
Zigzag Iterator的Pythonic方式?
所属栏目:[Python] 日期:2020-12-20 热度:159
我正在编写Zigzag Iterator,它是以下列方式迭代2D列表: [1,4,7][2,5,8,9][3,6] 至 [1,2,3,6,7,9] 我实现了一个算法: class ZigzagIterator: def __init__(self,vecs): self.vecs = [] self.turns = 0 for vec in vecs: vec and self.vecs.append(iter(vec)[详细]
