python – 如何确定在Pandas DataFrame中将哪些列设置为索引?
发布时间:2020-12-20 13:15:31 所属栏目:Python 来源:网络整理
导读:假设我有一个金融证券的数据框架,它通常有多个标识符: 我应该只选择一列作为索引吗?我应该将所有潜在标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?什么是最佳做法? 解决方法 这更多是关于数据库设计而不是熊猫. 决策
假设我有一个金融证券的数据框架,它通常有多个标识符:
我应该只选择一列作为索引吗?我应该将所有潜在标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?什么是最佳做法? 解决方法
这更多是关于数据库设计而不是熊猫.
决策应基于数据框(关系数据库中的表)及其列的业务含义.例如,如果“内部安全ID”用于识别其业务中的此类数据,则应将其设置为索引. 但是,如果您不确定,请坚持使用默认的整数索引. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |