吐血整理!这200道阿里P6必备Java面试题,我简直太爱了( 十 )

  • 水平分区 , 保持表结构不变 , 通过某种策略将数据分散到不同的表或库中 , 例如根据年、月 , 一年一张表 , 一月一张表 , 水平分区可以支持非常大的数据量 。水平分区的分表只能解决单张表的存储数据量过大问题 , 但由于数据还是在一台机器上 , 对于提供并发能力并没有什么意义 , 所以水平拆分最好分库 。
  • 分库分表后 , 主键id如何处理分库分表后 , 每个表的id都是从1开始累加 , 这样是不对的 , 我们需要一个全局唯一id来支持 。
    • UUID , 太长了 , 并且无序 , 查询效率低 , 比较用于生成文件名等 。
    • 数据自增Id , 每台数据库分别设置不同的步长 , 生成不重复的ID , 这种方式生成ID有序 , 但是需要独立部署数据库实例 , 成本高 , 还有性能瓶颈 。
    • 利用redis生成id , 性能好 , 灵活方便 , 不依赖于数据库 , 但引入了新的组件造成系统更复杂 , 可用性降低 , 编码更加复杂 , 增加了系统成本 。
    • Twitter的snow?ake雪花算法 。
    • 美团的Leaf分布式ID生成系统 , Leaf 是美团开源的分布式ID生成器 , 能保证全局唯一性、趋势递增、单调递增、信息安全 , 但也依赖关系数据库 , Zookeeper等中间件 。
    MySQL中有哪几种锁?
    • 表级锁:开销小 , 加锁快;不会出现死锁;锁定粒度大 , 发生锁冲突的概率最高 , 并发度最低 。
    • 页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间 , 并发度一般
    • 行级锁:开销大 , 加锁慢;会出现死锁;锁定粒度最小 , 发生锁冲突的概率最低 , 并发度也最高 。
    NOW() 和 CURRENT_DATE() 有什么区别?
    • NOW() 命令用于显示当前年份 , 月份 , 日期 , 小时 , 分钟和秒 。
    • CURRENT_DATE() 仅显示当前年份 , 月份和日期 。
    锁的优化策略
    • 读写分离
    • 分段加锁
    • 减少锁持有的时间
    • 多个线程尽量以相同的顺序去获取资源不能将锁的粒度过于细化 , 不然可能会出现线程的加锁和释放次数过多 , 反而效率不如一次加一把大锁 。
    索引的底层实现原理和优化
    • 底层是B+树 , 经过优化的 B+树 。
    • 主要是在所有的叶子结点中增加了指向下一个叶子节点的指针 , 因此 InnoDB 建议为大部分表使用默认自增的主键作为主索引 。
    索引的目的是什么?
    • 快速访问数据表中的特定信息 , 提高检索速度 。
    • 加速表和表之间的连接 , 使用分组和排序子句进行数据检索时 , 可以显著减少查询中分组和排序的时间 。
    • 创建唯一性索引 , 保证数据库表中每一行数据的唯一性 。
    索引对数据库系统的负面影响是什么?
    • 创建索引和维护索引需要耗费时间 , 这个时间随着数据量的增加而增加;索引需要占用物理空间 , 不光是表需要占用数据空间 , 每个索引也需要占用物理空间;当对表进行增、删、改、的时候索引也要动态维护 , 这样就降低了数据的维护速度 。
    为数据表建立索引的原则有哪些?
    • 在最频繁使用的、用以缩小查询范围的字段上建立索引 。
    • 在频繁使用的、需要排序的字段上建立索引 。
    什么情况下不宜建立索引?
    • 对于查询中很少涉及的列或者重复值比较多的列 , 不宜建立索引 。
    • 对于一些特殊的数据类型 , 不宜建立索引 , 比如文本字段(text)等 。
    什么情况索引会失效
    • 以“%”开头的 LIKE 语句 , 模糊匹配
    • OR 语句前后没有同时使用索引
    • 数据类型出现隐式转化(如 varchar 不加单引号的话可能会自动转换为 int 型)
    实践中如何优化 MySQL
    • SQL 语句及索引的优化
    • 数据库表结构的优化
    • 系统配置的优化
    • 硬件的优化
    优化数据库的方法