加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 如何确定在Pandas DataFrame中将哪些列设置为索引?

发布时间:2020-12-20 13:15:31 所属栏目:Python 来源:网络整理
导读:假设我有一个金融证券的数据框架,它通常有多个标识符: 我应该只选择一列作为索引吗?我应该将所有潜在标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?什么是最佳做法? 解决方法 这更多是关于数据库设计而不是熊猫. 决策
假设我有一个金融证券的数据框架,它通常有多个标识符:

enter image description here

我应该只选择一列作为索引吗?我应该将所有潜在标识符设置为索引吗?我应该将所有文本数据设置为索引,并将所有数字数据保留为列吗?什么是最佳做法?

解决方法

这更多是关于数据库设计而不是熊猫.

决策应基于数据框(关系数据库中的表)及其列的业务含义.例如,如果“内部安全ID”用于识别其业务中的此类数据,则应将其设置为索引.

但是,如果您不确定,请坚持使用默认的整数索引.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读