加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php – 使用WHERE子句或使用应用程序代码过滤结果集是否更好?

发布时间:2020-12-13 17:36:38 所属栏目:PHP教程 来源:网络整理
导读:好的,这里是一个简单的抽象问题: 2个变量(male_users和female_users)来存储2组用户,即男性和女性 1种方法是使用两个查询来选择它们: 从gender =’male’的用户中选择*,然后将结果存储在male_users中 从gender =’female’的用户中选择*,然后将结果存储在fe
好的,这里是一个简单的抽象问题:

2个变量(male_users和female_users)来存储2组用户,即男性和女性

> 1种方法是使用两个查询来选择它们:

从gender =’male’的用户中选择*,然后将结果存储在male_users中

从gender =’female’的用户中选择*,然后将结果存储在female_user中

>另一种方法是只运行一个查询:

‘select * from users’,然后循环结果集过滤程序中的男性用户
php代码片段将是这样的:

$result = mysql_query('select * from users');

while (($row=mysql_fetch_assoc(result)) != null) {
  if ($row['gender'] == 'male'){// add to male_users}
  else if ($row['gender'] == 'female'){// add to female_users}
}

哪一个更有效率并被认为是更好的方法?

这只是一个简单的说明问题.真正的项目可能有更多的查询表和更多的过滤选项.

提前致谢!

任何应用程序的经验法则是让数据库做好它所做的工作:过滤,排序和加入.

将查询分成自己的函数或类方法:

$men = $foo->fetchMaleUsers();
$women = $foo->fetchFemaleUsers();

更新

我采用史蒂文的PostgreSQL演示了一个完整的表扫描查询,执行两个独立的索引查询两倍,并使用MySQL(在实际问题中使用)来模拟它:

架构

CREATE TABLE `gender_test` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,`gender` enum('male','female') NOT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=26017396 DEFAULT CHARSET=utf8

我将性别类型更改为不是VARCHAR(20),因为它对于这个列的目的更为现实,我还提供了一个主键,而不是任意的DOUBLE值.

无索引的结果

mysql> select sql_no_cache * from gender_test WHERE gender = 'male';

12995993 rows in set (31.72 sec)

mysql> select sql_no_cache * from gender_test WHERE gender = 'female';

13004007 rows in set (31.52 sec)

mysql> select sql_no_cache * from gender_test;

26000000 rows in set (32.95 sec)

我相信这不需要解释.

索引结果

ALTER TABLE gender_test ADD INDEX (gender);

mysql> select sql_no_cache * from gender_test WHERE gender = 'male';

12995993 rows in set (15.97 sec)

mysql> select sql_no_cache * from gender_test WHERE gender = 'female';

13004007 rows in set (15.65 sec)

mysql> select sql_no_cache * from gender_test;

26000000 rows in set (27.80 sec)

这里显示的结果与Steven的数据截然不同.索引查询的执行速度几乎是全表扫描的两倍.这是使用常规列定义的正确索引表.我根本不知道PostgreSQL,但是在Steven的例子中必须有一些重大的错误配置,因为没有显示类似的结果.

鉴于PostgreSQL的声誉比MySQL好,至少和我一样好,我敢说PostgreSql会表现出类似的性能,如果正确使用.

还要注意,在同一台机器上,过度简化的循环执行5200万次比较需要额外的7.3秒才能执行.

<?php
$N = 52000000;
for($i = 0; $i < $N; $i++) {
    if (true == true) {
    }
}

我认为这个数据更好的方法是很明显的.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读