中国统计网 | 新手速进！，SQL大厂面试常考知识点( 二 ) -点击上方“中国统计网”订阅我吧！-前

文章图片
1.去重distinct
--罗列不同的idselectdistinctidfromtable_1--统计不同的id的个数selectcount(distinctid)fromtable_1--优化版本的countdistinctselectcount(*)from(selectdistinctidfromtable_1)tbdistinct会对结果集去重，对全部选择字段进行去重，并不能针对其中部分字段进行去重。使用countdistinct进行去重统计会将reducer数量强制限定为1 ，而影响效率，因此适合改写为子查询。
2.聚合函数和groupby
--统计不同性别（F、M）中，不同的id个数groupbysex--其它的聚合函数例如：max/min/avg/sum--统计最大/最小/平均年龄selectmax(age),min(age),avg(age)fromtable_1groupbyid聚合函数帮助我们进行基本的数据统计，例如计算最大值、最小值、平均值、总数、求和。
3.筛选where/having
--统计A公司的男女人数wherecompany='A'--统计各公司的男性平均年龄，并且仅保留平均年龄30岁以上的公司selectcompany,avg(age)fromtable_1wheresex='M'groupbycompanyhavingavg(age)>30;4.排序orderby
--按年龄全局倒序排序取最年迈的10个人selectid,agefromtable_1orderbyageDESClimit105.casewhen条件函数
--收入区间分组selectid,(casewhenCAST(salaryasfloat)<50000Then'0-5万'whenCAST(salaryasfloat)>=50000andCAST(salaryasfloat)<100000then'5-10万'whenCAST(salaryasfloat)>=100000andCAST(salaryasfloat)<200000then'10-20万'whenCAST(salaryasfloat)>200000then'20万以上'elseNULLendfromtable_1;case函数的格式为（casewhen条件1thenvalue1elsenullend）,其中else可以省，但是end不可以省。
在这个例子里也穿插了一个CAST的用法，它常用于string/int/double型的转换。
6.字符串
1)concat(A,B...)返回将A和B按顺序连接在一起的字符串，如：concat('foo','bar')返回'foobar' 。
selectconcat('www','.iteblog','.com')fromiteblog;2)split(str,regex)用于将string类型数据按regex提取，分隔后转换为array 。
--以","为分隔符分割字符串，并转化为arraySelectsplit("1,2,3",",")asvalue_arrayfromtable_1;--结合arrayindex,将原始字符串分割为3列selectvalue_array[0],value_array[1],value_array[2]from(selectsplit("1,2,3",",")asvalue_arrayfromtable_1)t3)substr（str,0,len)截取字符串从0位开始的长度为len个字符。
selectsubstr('abcde',3,2)fromiteblog;--得到cd三.基础进阶
1.row_number
--按照字段salary倒序编号select*,row_numberover(orderbysalarydesc)asrow_numfromtable_1;--按照字段deptid分组后再按照salary倒序编号select*,row_numberover(partitionbydeptidorderbysalarydesc)asrankfromtable_1;

文章图片
按照depid分组，对salary进行排序（倒序）
除了row_number函数之外，还有两个分组排序函数，分别是rank和dense_rank 。
rank排序相同时会重复，总数不会变，意思是会出现1、1、3这样的排序结果；
dense_rank排序相同时会重复，总数会减少，意思是会出现1、1、2这样的排序结果。
row_number则在排序相同时不重复，会根据顺序排序。
2.percentile百分位函数
--获取income字段的top10%的阈值selectpercentile(CAST(salaryASint),0.9))asincome_top10p_thresholdfromtable_1;--获取income字段的10个百分位点selectpercentile(CAST(salaryASint),array(0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0))asincome_percentilesfromtable_1;3.时间函数

中国统计网 | 新手速进！，SQL大厂面试常考知识点( 二 )

推荐阅读

全球变暖|太平洋海温正在降低，拉尼娜或已确定，地球将迎来寒冬期！

2020世界杯在哪举行个城市 2020世界杯在哪举行

徐静营养师：菌菇的食用价值

奔腾B70|再等17天就上市！和雅阁同级，爆169马力，不足11万迷倒一片！

「型男笔记」Air Force Max，能否代替雨鞋？，Nike

「起亚汽车」起亚智跑，性价比最高的紧凑型SUV，这个价格哈弗H6都眼红

结晶|[路演]诚益通：美国项目CBD结晶产品已开始实验生产

春和景丽|《孔雀东南飞》:再美好的婚姻都会毁在多事婆婆手上

三件|第三十届中国人大新闻奖揭晓人民网三件作品获奖

如何挑选优质的电卷棒

[创作者来直播]国联股份多多电商首播带货：订单超2.3亿元！观众达5.1万次

央视新闻客户端|北京纪事｜三张面孔——看北京如何控制了疫情

冬瓜|看老公大显身手冬瓜烧肉不难做

制作|武侠小说中的“鹤顶红”, 和砒霜比起来谁更毒? 是用何物制作的?

豆瓣@“以为是烂片，结果被打脸”的五部电影：你若都看过，大佬无疑！

自卑导致的社交能力差怎样克服

特斯拉|当特斯拉的屠刀真实落下

二十五岁的男生应有那些品质

人数攀升！斯里兰卡爆炸已致125死，160人受伤

选车中心|为啥摄像头总要闪一下？，开车经过路口