写SQL要注意的地方,如何写出高效的SQL语句

博客很久没更新了,因为上段时间在换工作,从石家庄换到了北京,跨省市搬家,还要找工作面试等等,现在终于稳定点了,可以写点东西分享给大家了。

这次换工作呢,工作内容还比较符合我的期望,比较特殊的岗位,开发2部,开发的第二梯队,虽然不是开发主要产品,但也开发点周边的系统模块,而且还有运维任务,运维任务,就更好玩了,不但能看到整个系统的源代码,还可以接触数据库甚至服务器,学到了很多之前没考虑过的问题,今天也跟大家分享一下我最近学到或者体会到的一些经验,就是写SQL查询时的一些注意和经验。

在之前我写SQL呢,就比较随意,没什么在乎的,能实现就可以了,但接触运维以后,赵老师呢告诉了我很多,而且强调了SQL中不能用 IN 或者 NOT IN,在其他公司面试时也问到了数据库建立索引的问题,所以今天了解一下索引和写SQL时的注意。

主要的思想的尽量利用索引加快查询速度,但某些写法会让数据引擎放弃使用索引,所以要注意一下写法:

1、应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描
2、应尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num=10 or num=20 可以这样查询: select id from t where num=10 union all select id from t where num=20
3、in 和 not in 也要慎用,否则会导致全表扫描,如: select id from t where num in(1,2,3) 对于连续的数值,能用 between 就不要用 in 了: select id from t where num between 1 and 3
4、下面的查询也将导致全表扫描: select id from t where name like ‘%abc%’
5、如果在 where 子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时;它必须在编译时进行选择。然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句将进行全表扫描: select id from t where num=@num 可以改为强制查询使用索引: select id from t with(index(索引名)) where num=@num
6、应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如: select id from t where num/2=100 应改为: select id from t where num=100*2
7、应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。如: select id from t where substring(name,1,3)=’abc’–name以abc开头的id select id from t where datediff(day,createdate,’2005-11-30′)=0–‘2005-11-30’生成的id 应改为: select id from t where name like ‘abc%’ select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′
8、不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。
9、任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。
10、应尽量避免在 where 子句中对字段进行 null 值判断,因为要知道是不是 null ,就得扫描全表才知道,所以数据库引擎会自动放弃索引,进行全扫
11、先应考虑在 where 及 order by 涉及的列上建立索引
12、并不是所有索引对查询都有效,SQL是根据表中数据来进行查询优化的,当索引列有大量数据重复时,查询可能不会去利用索引,比如性别列,不是男就是女,那索引还有什么意义呢?
13、索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,因为 insert 或 update 时有可能会重建索引,所以最多 6个字段建立索引就足够了,再多就会适得其反。
14、应尽可能的避免更新索引数据列,因为索引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将导致整个表记录的顺序的调整,会耗费相当大的资源
15、尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了
16、在新建临时表时,如果一次性插入数据量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果数据量不大,为了缓和系统表的资源,应先create table,然后insert