北大青鸟光谷校区

北大青鸟光谷校区

  • 北大青鸟徐东校区
  • 北大青鸟光谷校区
  • 北大青鸟高新校区
  • 荆州青鸟之家
  • 襄阳青鸟之家

17740513250

百日千才

如何理解数据索引的结构

发布日期:2023-03-31来源:武汉北大青鸟武汉校区作者:admin

  Mysql 执行优化 认识数据索引 为什么使用数据索引能提高效率 数据索引的存储是有序的 在有序的情况下,通过索引查询一个数据是无需遍历索引记录的 端情况下,数据索引的查询效率为二分法查询效率,趋近于 log2(N) 如何理解数据索引的结构 数据索引通常默认

  认识数据索引为什么使用数据索引能提高效率

  数据索引的存储是有序的

  在有序的情况下,通过索引查询一个数据是无需遍历索引记录的

  端情况下,数据索引的查询效率为二分法查询效率,趋近于 log2(N)

  如何理解数据索引的结构

  数据索引通常默认采用btree索引,(内存表也使用了hash索引)。

  单一有序排序序列是查找效率高的(二分查找,或者说折半查找),使用树形索引的目的是为了达到快速的更新和增删操作。

  在端情况下(比如数据查询需求量非常大,而数据更新需求少,实时性要求不高,数据规模有限),直接使用单一排序序列,折半查找速度快。

  实战范例 : ip地址反查

  资源: Ip地址对应表,源数据格式为 startip, endip, area

  源数据条数为 10万条左右,呈很大的分散性

  目标: 需要通过任意ip查询该ip所属地区

  性能要求达到每秒1000次以上的查询效率

  挑战: 如使用 between … and 数据库操作,无法有效使用索引。

  如果每次查询请求需要遍历10万条记录,根本不行。

  方法: 一次性排序(只在数据准备中进行,数据可存储在内存序列)

  折半查找(每次请求以折半查找方式进行)

  在进行索引分析和SQL优化时,可以将数据索引字段想象为单一有序序列,并以此作为分析的基础。

  实战范例:复合索引查询优化实战,同城异性列表

  资源: 用户表user,字段 sex性别;area 地区;lastlogin 后登录时间;其他略

  目标: 查找同一地区的异性,按照后登录时间逆序

  高访问量社区的高频查询,如何优化。

  查询SQL: select * from user where area=’$area’ and sex=’$sex’ order by lastlogin desc limit 0,30;

  挑战: 建立复合索引并不难, area+sex+lastlogin 三个字段的复合索引,如何理解?

  先,忘掉btree,将索引字段理解为一个排序序列。

  如果只使用area会怎样?搜索会把符合area的结果部找出来,然后在这里面遍历,选择命中sex的并排序。 遍历所有 area=’$area’数据!

  如果使用了area+sex,略好,仍然要遍历所有area=’$area’ and sex=’$sex’数据,然后在这个基础上排序!!

  Area+sex+lastlogin复合索引时(切记lastlogin在后),该索引基于area+sex+lastlogin 三个字段合并的结果排序,该列表可以想象如下。

  广州女$时间1

  广州女$时间2

  广州女$时间3

  …

  广州男

  ….

  深圳女

  ….

  数据库很容易命中到 area+sex的边界,并且基于下边界向上追溯30条记录,搞定!在索引中迅速命中所有结果,无需二次遍历!

关闭

只为了方便您就学 北大青鸟光谷校区 北大青鸟武汉校区

武汉市洪山区珞喻路724号(地铁二号线光谷广场站F口出

Copyright (c) 2006-2023 武汉宏鹏教育咨询有限公司 版权所有 All Rights Reserved.