[轉(zhuǎn)帖]SQL常用函數(shù)整理（帶示例）

當(dāng)前位置：點(diǎn)晴教程→知識(shí)管理交流 →『技術(shù)文檔交流』

liguoquan

2023年6月2日 15:23 本文熱度 1845

：[轉(zhuǎn)帖]SQL常用函數(shù)整理（帶示例）

SQL 常用函數(shù) 整理

Terry

只要思想不滑坡，方法總比困難多.

本文主要記錄日常使用的函數(shù)，以筆記的形式不斷補(bǔ)充sql常用函數(shù)，部分內(nèi)容會(huì)借鑒大佬的內(nèi)容，因本文為日常小積累，就不作引用記錄。如有不妥之處請(qǐng)留言，作者會(huì)對(duì)相應(yīng)內(nèi)容進(jìn)行調(diào)整，提前跟各位大佬說聲sorry。同時(shí)本文希望可以給有需者帶去幫助。文章中如有錯(cuò)誤，希望大家多多指導(dǎo)，謝謝···

什么是SQL數(shù)據(jù)庫(kù)？

結(jié)構(gòu)化查詢語言(Structured Query Language)簡(jiǎn)稱SQL，是一種數(shù)據(jù)庫(kù)查詢語言。
作用：用于數(shù)據(jù)存取、查詢、更新和管理關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)。

···Let's Go···

Directory List:

一、數(shù)據(jù)表創(chuàng)建/插入/修改/刪除
二、窗口函數(shù)
三、日期函數(shù)
四、字符串函數(shù)
五、其他常用函數(shù)
六、性能優(yōu)化
七：案例題（面試高頻精選題）

一、數(shù)據(jù)表創(chuàng)建/插入/修改/刪除

1、創(chuàng)建

--創(chuàng)建數(shù)據(jù)表
create TABLE Persons(
P_Id int NOT NULL,
LastName varchar(255) NOT NULL,
FirstName varchar(255),
Address varchar(255),
City varchar(255),
PRIMARY KEY (P_Id)
);
create TABLE Persons(
P_Id int NOT NULL,
LastName varchar(255) NOT NULL,
FirstName varchar(255),
Address varchar(255),
City varchar(255),
CONSTRAINT pk_PersonID PRIMARY KEY (P_Id,LastName)
)；
--添加主鍵
alter TABLE Persons
ADD PRIMARY KEY (P_Id);
--添加主鍵【pk_PersonID的值是由兩個(gè)列（P_Id和LastName）組成的】
alter TABLE Persons
ADD CONSTRAINT pk_PersonID PRIMARY KEY (P_Id,LastName)
--撤銷主鍵
alter TABLE Persons
drop PRIMARY KEY；
alter TABLE Persons
drop CONSTRAINT pk_PersonID
--添加外鍵
create TABLE Orders(
O_Id int NOT NULL,
OrderNo int NOT NULL,
P_Id int,
PRIMARY KEY (O_Id),
FOREIGN KEY (P_Id) REFERENCES Persons(P_Id)
)；

2、插入

insert INTO Websites (name, url, alexa, country)
VALUES ('百度','https://www.baidu.com/','4','CN');
insert INTO Websites (name, url, country)
VALUES ('stackoverflow', 'http://stackoverflow.com/', 'IND');

3、修改/更新

update salaries
set salary = case when salary >= 10000 then salary * 0.9
                         else salary * 1.2
                         end
;
update Websites 
SET alexa='5000', country='USA' 
where name='菜鳥教程';

4、刪除

delete from Websites
where name='Facebook' AND country='USA';
--刪除所有數(shù)據(jù)
delete from table_name;
--或
delete * from table_name;

二、窗口函數(shù)

1、排序函數(shù) row_number / rank / dense_rank

row_number() 則在排序相同時(shí)不重復(fù)，會(huì)根據(jù)順序排序。
rank() 排序相同時(shí)會(huì)重復(fù)，總數(shù)不會(huì)變，意思是會(huì)出現(xiàn)1、1、3這樣的排序結(jié)果；
dense_rank() 排序相同時(shí)會(huì)重復(fù)，總數(shù)會(huì)減少，意思是會(huì)出現(xiàn)1、1、2這樣的排序結(jié)果。

select
    *
    ,row_number() over ( partition by department order by cost desc ) as row_number_result
    ,rank() over ( partition by department order by cost desc) as rank_result
    ,dense_rank() over (partition by department order by cost desc) as dense_rank_result
from table;

2、分組最大值 / 最小值 firs_tvalue / last_value

取的是分組內(nèi)排序后，截止到當(dāng)前行第一個(gè)/最后一個(gè)值

select
    *,
    first_value(name) over (PARTITION BY department ORDER BY cost) as min_cost_user, ## 分組取每個(gè)組的最小值對(duì)應(yīng)的人    last_value(name) over (PARTITION BY department ORDER BY cost) as max_cost_user ## 分組取每個(gè)組的最大值對(duì)應(yīng)的人from table；

3、累積百分比 cum_dist() over / sum() over

--cume_dist() over 返回的是小于等于當(dāng)前值的行數(shù)/分組內(nèi)總行數(shù)，但我倒序排的話，也就是大于等于了;
--sum() over 是算的累積值的占比;

select
    *,
    cume_dist() OVER (PARTITION BY department ORDER BY cost desc ) as cum_dist,
    sum(cost) OVER (PARTITION BY department ORDER BY cost desc )/sum(cost) OVER (PARTITION BY department) as s
from table
where department = 'A';
--注：當(dāng)組內(nèi)出現(xiàn)重復(fù)時(shí)，累積計(jì)算會(huì)有所問題，待核驗(yàn)；

4、錯(cuò)位函數(shù) lead / lag

lead和lag函數(shù)，這兩個(gè)函數(shù)一般用于計(jì)算差值，最適用的場(chǎng)景是計(jì)算花費(fèi)時(shí)間。舉個(gè)例子，有數(shù)據(jù)是每個(gè)用戶瀏覽網(wǎng)頁(yè)的時(shí)間記錄，將記錄的時(shí)間錯(cuò)位之后，進(jìn) 行兩列相減就可以得到每個(gè)用戶瀏覽每個(gè)網(wǎng)頁(yè)實(shí)際花費(fèi)的時(shí)間。
lead是用于統(tǒng)計(jì)窗口內(nèi)往下第n行值，
lag是用于統(tǒng)計(jì)窗口內(nèi)往上第n行值。
雖然目前我們這個(gè)數(shù)據(jù)不是時(shí)間數(shù)據(jù)，也可以使用這個(gè)函數(shù)操作一下。例如說，現(xiàn)在計(jì)算按cost排序后，每個(gè)department的人他們的花費(fèi)，以及和比他們花費(fèi)排名更高一名的人的值，可以計(jì)算差值。

select *,
    lead(cost) over(partition by department order by cost) next_cost
from table;

三、日期函數(shù)

1、日期轉(zhuǎn)換：

日期與時(shí)間戳之間的轉(zhuǎn)換

--當(dāng)你存儲(chǔ)的是日期，希望轉(zhuǎn)化為UNIX時(shí)間戳?xí)r，使用unix_timestamp函數(shù)，命令格式：unix_timestamp(string date, string pattern) ，表示轉(zhuǎn)換pattern格式的日期到時(shí)間戳；--當(dāng)你存儲(chǔ)的是時(shí)間戳，希望轉(zhuǎn)化為日期，使用from_unixtime函數(shù)，命令格式：from_unixtime(bigint unixtime, [string format])；## 日期轉(zhuǎn)化為時(shí)間戳 ##select unix_timestamp('2020-03-21 17:13:39')：得到 1584782019select unix_timestamp('20200321 13:01:03','yyyyMMdd HH:mm:ss') 得到 1584766863select unix_timestamp('20200321','yyyyMMdd') 得到 1584720000## 時(shí)間戳轉(zhuǎn)化為日期 ## 
select from_unixtime (1584782175) 得到 2020-03-21 17:16:15select from_unixtime (1584782175,'yyyyMMdd') 得到 20200321select from_unixtime (1584782175,'yyyy-MM-dd')得到 2020-03-21## 日期和日期之間，也可以通過時(shí)間戳來進(jìn)行轉(zhuǎn)換 ##select from_unixtime(unix_timestamp('20200321','yyyymmdd'),'yyyy-mm-dd') 得到 2020-03-21select from_unixtime(unix_timestamp('2020-03-21','yyyy-mm-dd'),'yyyymmdd')得到 20200321--注：注意轉(zhuǎn)換的時(shí)間格式要求；

2、日期加減

天--維度計(jì)算

--date_sub(string startdate, int days)
## 使用date_sub (string startdate, int days)得到開始日期startdate減少days天后的日期## 
select date_sub('2012-12-08', 10) 得到 2012-11-28
--date_add(string start date, int days)
## 使用date_add(string startdate, int days)得到開始日期startdate增加days天后的日期 ##
select date_add('2012-12-08', 10) 得到 2012-12-18
--datediff(string enddate, string startdate)
## 使用datediff(string enddate, string startdate)得到 結(jié)束日期減去開始日期的天數(shù) ## 
select datediff('2012-12-08','2012-05-09') 得到 213

月--維度計(jì)算

--add_months(d,n); 
--在某一個(gè)日期d上,加上指定的月數(shù)n,返回計(jì)算后的新日期。d表示日期,n表示要加的月數(shù)（n可以為負(fù)值）
select add_months(sys date,1) from student;

時(shí)間差函數(shù)timestampdiff--綜合維度計(jì)算

--timestampdiff( interval, datetime_1, datetime_2)
interval:
--毫秒：frac_second
--秒   ：second
--分鐘：minuter
--小時(shí)：hour
--天   ：day
--星期：week
--月   ：month
--季度：quarter
--年   ：year
--相差1天
select TIMESTAMPDIFF(DAY, '2018-03-20 23:59:00', '2015-03-22 00:00:00');
--相差49小時(shí)
select TIMESTAMPDIFF(HOUR, '2018-03-20 09:00:00', '2018-03-22 10:00:00');
--相差2940分鐘
select TIMESTAMPDIFF(MINUTE, '2018-03-20 09:00:00', '2018-03-22 10:00:00');
--相差176400秒
select TIMESTAMPDIFF(SECOND, '2018-03-20 09:00:00', '2018-03-22 10:00:00');

3、日期提取

日期（2020-03-21 17:13:39）怎么轉(zhuǎn)換為想要的格式（2020-03-21）

--方法：可以直接使用to_date函數(shù)，也可以使用字符串提取函數(shù)。
select to_date('2020-03-21 17:13:39') 得到 2020-03-21 
select substr('2020-03-21 17:13:39',1,10) 得到 2020-03-21

獲取日期年份/月份/幾號(hào)/當(dāng)前日期

year()    --獲取日期年份
month() --獲取日期月份
day()     --獲取日期幾號(hào)
now()    --獲取當(dāng)前日期

last_day(datetime)

--返回指定日期當(dāng)前月的最后一天；
select last_day(create_time) from student;

extract(unit from date)

select EXTRACT(YEAR from OrderDate) AS OrderYear,
EXTRACT(MONTH from OrderDate) AS OrderMonth,
EXTRACT(DAY from OrderDate) AS OrderDay
from Orders；
--date 參數(shù)是合法的日期表達(dá)式。unit 參數(shù)可以是下列的值：
--Unit 值:
MICROSECOND
SECOND
MINUTE
HOUR
DAY
WEEK
MONTH
QUARTER
YEAR
SECOND_MICROSECOND
MINUTE_MICROSECOND
MINUTE_SECOND
HOUR_MICROSECOND
HOUR_SECOND
HOUR_MINUTE
DAY_MICROSECOND
DAY_SECOND
DAY_MINUTE
DAY_HOUR
YEAR_MONTH

也可以通過日期命令格式date_format()提取

4、日期命令格式

date_format(string datetime, interval)

---interval:
%y：表示年(兩位數(shù))，例如: 17 年。
%Y：表示4位數(shù)中的年，例如: 2017年
%m：表示月(1-12)
%d: 表示月中的天
%H: 小時(shí)(0-23)
%i: 分鐘 (0-59)
%s: 秒 (0-59)
--常用格式：'%Y-%m-%d %H:%i:%s'

5、mysql 獲取日期

（1）獲取當(dāng)前日期select curdate();（2）獲取本月最后一天select last_day(curdate());（3）獲取本月第一天select date_add(curdate(), interval - day(curdate()) + 1 day);（4）獲取下個(gè)月的第一天select date_add(curdate() - day(curdate()) + 1, interval 1 month);（5）獲取當(dāng)前月的天數(shù)select datediff(date_add(curdate() - day(curdate()) + 1, interval 1 month), date_add(curdate(), interval - day(curdate()) + 1 day));

四、字符串函數(shù)

1、字符串提取

substr/substring函數(shù)

--使用substr/substring (string A, int start)返回字符串A從start位置到結(jié)尾的字符串##
select substring('abcde', 3) 得到 cde 
--使用substring(string A, int start, int len)返回字符串A從start位置開始，長(zhǎng)度為len的字符串
select substring('abcde', 3,2) 得到 cd

2、字符串拼接

concat/concat_ws函數(shù)

--使用concat(string A, string B) 返回字符串AB的拼接結(jié)果,可以多個(gè)字符串進(jìn)行拼接
select concat('abc', 'def','gh') 得到abcdefgh
--使用concat_ws(string X, stringA, string B) 返回字符串A和B由X拼接的結(jié)果
select concat_ws(',', 'abc', 'def', 'gh') 得到 abc,def,gh

3、字符串常見處理函數(shù)：length/trim/lower/upper

--使用length(string A)返回字符串A的長(zhǎng)度
select length('abcedfg') 得到 7 
--使用trim(string A) 去除字符串兩邊的空格
select trim(' abc ') 得到 'abc'
--使用lower(string A)/ lcase(string A)返回字符串的小寫形式，常用于不確定原始字段是否統(tǒng)一為大小寫
select lower('abSEd') 得到 absed
--使用upper(string A)/ ucase(string A)返回字符串的大寫形式，常用于不確定原始字段是否統(tǒng)一為大小寫
select upper('abSEd') 得到 ABSED

4、不同格式數(shù)據(jù)的轉(zhuǎn)換：cast

--bigint轉(zhuǎn)換為字符串
select cast(A as string) as A；

5、正則表達(dá)式

regexp_extract 提取 / regexp_replace 替換

--regexp_extract(string subject, string pattern, int index)
--將字符串subject按照pattern正則表達(dá)式的規(guī)則拆分，返回index指定的字符
select regexp_extract('foothebar', 'foo(.*?)(bar)', 1) 得到 the
--regexp_replace(string A, string B, string C)
--將字符串A中的符合java正則表達(dá)式B的部分替換為C
select regexp_replace('foobar', 'oo|ar', '') 得到 fb

6、字符串解析

get_json_object

--get_json_object(string json_string, string path)
--解析json的字符串json_string,返回path指定的內(nèi)容
select get_json_object(
                  	{"from_remain_count":420,"reason":"collect","to_remain_count":0},
                    '$.from_remain_count'
                ) 得到 420

五、sql實(shí)現(xiàn)歸遞累加

目標(biāo)：由下表1的到表2

⚠️ 使用時(shí)注意sql類型，選擇合適方案實(shí)現(xiàn)目標(biāo)結(jié)果！-- 方案一：支持mysqlset @sum := 0;select p1.ship_day as '日期'
	,p1.order_cnt as '訂單數(shù)'
	,(@sum := @sum + p1.order_cnt) as  '累計(jì)訂單數(shù)'from(
	select left(a.ship_day, 10) as ship_day
		,count(a.order_no) as order_cnt 
	from order_table as a
	GROUP BY left(a.ship_day, 10)
	ORDER BY left(a.ship_day, 10) asc
	) as p1;-- 方案二：（子查詢）select a.date,
  (select sum(a.num) summary
   from test b
   where b.date <=a.date) as summaryfrom test a group by date;-- 方案三：（笛卡爾積）【推薦使用】select b.date
   ,sum(a.num) from test a,test b where a.date<=b.date group by b.date;-- 方案四：（窗口函數(shù)）【不支持mysql】select date
   ,sum(num) over(partition by [group] order by date) summary from test；

六、其他常用函數(shù)

1、coalesce函數(shù)

用途：
（1）：將空值替換成其他值；
（2）：返回第一個(gè)非空值
表達(dá)式：
COALESCE是一個(gè)函數(shù)， (expression_1, expression_2, ...,expression_n)依次參考各參數(shù)表達(dá)式，遇到非null值即停止并返回該值。如果所有的表達(dá)式都是空值，最終將返回一個(gè)空值。使用COALESCE在于大部分包含空值的表達(dá)式最終將返回空值。

--當(dāng)success_cnt 為null值的時(shí)候，將返回1，否則將返回success_cnt的真實(shí)值。
select coalesce(success_cnt, 1) from tableA；
--當(dāng)success_cnt不為null，那么無論period是否為null，都將返回success_cnt的真實(shí)值（因?yàn)閟uccess_cnt是第一個(gè)參數(shù)），
--當(dāng)success_cnt為null，而period不為null的時(shí)候，返回period的真實(shí)值。
--只有當(dāng)success_cnt和period均為null的時(shí)候，將返回1。
select coalesce(success_cnt,period,1) from tableA；

2、規(guī)定返回條數(shù)

top/limit

---top
select TOP 50 PERCENT * from Websites;
--前5行
select top 5 * from table
--后5行
select top 5 * from table order by id desc  --desc 表示降序排列 asc 表示升序
---limit
select * from Websites LIMIT 2;
select * from Websites LIMIT 2,5;

3、通配符

4、行列轉(zhuǎn)換

行轉(zhuǎn)列函數(shù) pivot / case when

--pivot
select *
from student
PIVOT (SUM(score) FOR subject IN (語文, 數(shù)學(xué), 英語)
)；
--case when
select name,
  MAX( CASE WHEN subject='語文' THEN score  ELSE 0 END) AS "語文",
  MAX( CASE WHEN subject='數(shù)學(xué)' THEN score ELSE 0 END) AS "數(shù)學(xué)",
  MAX( CASE WHEN subject='英語' THEN score ELSE 0 END) AS "英語"
from student
GROUP BY name;

列轉(zhuǎn)行 unpivot / case when

--unpivot
select *
from student1
UNPIVOT (score FOR subject IN ("語文","數(shù)學(xué)","英語")
);
--case when
select
    NAME,
    '語文' AS subject ,
    MAX("語文") AS score
from student1 GROUP BY NAME
union
select
    NAME,
    '數(shù)學(xué)' AS subject ,
    MAX("數(shù)學(xué)") AS score
from student1 GROUP BY NAME
union
select
    NAME,
    '英語' AS subject ,
    MAX("英語") AS score
from student1 GROUP BY NAME

注：考慮了下，本文主要記錄有“價(jià)值型”函數(shù)為主，其他函數(shù)可查看以下鏈接：

SQL 教程 | 菜鳥教程www.runoob.com/sql/sql-tutorial.html

七、性能優(yōu)化

1、能寫在 where 子句里的條件不要寫在 HAVING 子句里

--下列 SQL 語句返回的結(jié)果是一樣的:
-- 聚合后使用 HAVING 子句過濾
select sale_date, SUM(quantity)
from SalesHistory 
GROUP BY sale_date
HAVING sale_date = '2007-10-01';
-- 聚合前使用 where 子句過濾
select sale_date, SUM(quantity)
from SalesHistory
where sale_date = '2007-10-01' 
GROUP BY sale_date;
--使用第二條語句效率更高，原因主要有兩點(diǎn)
--1、使用 GROUP BY 子句進(jìn)行聚合時(shí)會(huì)進(jìn)行排序，如果事先通過 where 子句能篩選出一部分行，能減輕排序的負(fù)擔(dān)；
--2、在 where 子句中可以使用索引，而 HAVING 子句是針對(duì)聚合后生成的視頻進(jìn)行篩選的，但很多時(shí)候聚合后生成的視圖并沒有保留原表的索引結(jié)構(gòu)；

2、EXISTS 代替 IN

-- 慢
select * 
from Class_A
where id IN (select id 
                    from  CLASS_B);
-- 快
select *
 from Class_A A 
 where EXISTS (select * 
                         from Class_B  B
                         where A.id = B.id);
--為啥使用 EXISTS 的 SQL 運(yùn)行更快呢，有兩個(gè)原因：
--1、可以`用到索引，如果連接列 (id) 上建立了索引，那么查詢 Class_B 時(shí)不用查實(shí)際的表，只需查索引就可以了。
--2、如果使用 EXISTS，那么只要查到一行數(shù)據(jù)滿足條件就會(huì)終止查詢， 不用像使用 IN 時(shí)一樣掃描全表。在這一點(diǎn)上 NOT EXISTS 也一樣。
--另外如果 IN 后面如果跟著的是子查詢，由于 SQL 會(huì)先執(zhí)行 IN 后面的子查詢，會(huì)將子查詢的結(jié)果保存在一張臨時(shí)的工作表里（內(nèi)聯(lián)視圖），
--然后掃描整個(gè)視圖，顯然掃描整個(gè)視圖這個(gè)工作很多時(shí)候是非常耗時(shí)的，而用 EXISTS 不會(huì)生成臨時(shí)表。

3、盡量避免使用否定形式

否定形式有哪些？

<>
!=
NOT IN

為什么要避免使用否定形式

--否定形式語句會(huì)導(dǎo)致對(duì)全表掃描
--錯(cuò)誤寫法
select *
from student
where price <>100;
--正確寫法
select *
from student
where price < 100 or price > 100;

4、通過having減少使用中間表

--復(fù)雜寫法：以下寫法會(huì)產(chǎn)生臨時(shí)表 a；
select *
from( select sale_date
                  ,max(price) as max_price
         from sale_table
         group by sale_date) as a
where a.max_price >= 10;
--優(yōu)化寫法
select sale_date
         ,max(price) as max_prcie
from sale_table
group by sale_date
having max(price) >= 10;

5、多字段使用in謂詞，可匯總一處

--【此處有點(diǎn)高級(jí)，作者本人也沒有徹底吸收】
select id
            ,state
            ,city 
from Addresses1 as A1
where state IN (select state
                         from Addresses2 as A2
                         where A1.id = A2.id) 
            AND city IN (select city
                              from Addresses2 as A2 
                              where A1.id = A2.id);
--優(yōu)化寫法：以上寫法產(chǎn)生了兩張臨時(shí)表
select *
from Addresses1 as A1
where id || state || city
           IN (select id || state|| city
                from Addresses2 A2);

七、案例題：

題目1: 查找重復(fù)數(shù)據(jù)學(xué)生名字【or 查找重復(fù)出現(xiàn)n次的數(shù)據(jù)】

select a.name
from student as a
group by a.name
having count(a.name) > 1;

題目2: 找出語文課中成績(jī)第二高的學(xué)生成績(jī)。如果不存在第二高成績(jī)的學(xué)生，那么查詢應(yīng)返回 null

知識(shí)點(diǎn)：

1、limit x,y: 分句表示查詢結(jié)果跳過 x 條數(shù)據(jù)，讀取前 y 條數(shù)據(jù);
2、ifnull (a,b): 如果a不是空，結(jié)果返回a; 如果a是空，結(jié)果返回b;

select ifnull(
     (select distinct 成績(jī)  
     from 成績(jī)表
     where 課程='語文'
     order by 課程,成績(jī) desc
     limit 1,1),null
     ) as '第二高的學(xué)生成績(jī)';

題目3: 改變相鄰兩個(gè)學(xué)生的座位號(hào)

1、當(dāng)總?cè)藬?shù)為偶數(shù)時(shí)：

case
       when mod(座位號(hào), 2) != 0  then 座位號(hào) + 1
       when mod(座位號(hào), 2)  = 0  then 座位號(hào) - 1
end  as  '交換后座位號(hào)'

2、當(dāng)座位號(hào)是奇數(shù)時(shí)：

select
    (case
      # 當(dāng)座位號(hào)是奇數(shù)并且不是不是最后一個(gè)座位號(hào)時(shí)        when mod(id, 2) != 0 and counts!= id then id + 1
       # 當(dāng)座位號(hào)是奇數(shù)并且是最后一個(gè)座位號(hào)時(shí)，座位號(hào)不變        when mod(id, 2) != 0 and counts = id then id
       # 當(dāng)座位號(hào)是偶數(shù)時(shí)        else id - 1
    end) as id2,studentfrom seat,(select count(*) as counts from seat);

題目4：如何查詢不在表里的數(shù)據(jù)

select a.姓名 as 不近視的學(xué)生名單
from 學(xué)生表 as a
     left join 近視學(xué)生表 as b on a.學(xué)號(hào)=b.學(xué)生學(xué)號(hào)
where b.序號(hào) is null;

題目5：用戶訪問次數(shù)表，列名包括用戶編號(hào)、用戶類型、訪問量。要求在剔除訪問次數(shù)前20%的用戶后，每類用戶的平均訪問次數(shù)

【解題思路】使用邏輯樹分析方法可以把這個(gè)復(fù)雜的問題拆解為3個(gè)子問題：
1）找出訪問次數(shù)前20%的用戶
2）剔除訪問次數(shù)前20%的用戶
3）每類用戶的平均訪問次數(shù)

select 用戶類型,avg(訪問量)
from 
      (select * 
      from 
            (select *,
                     row_number() over(order by 訪問量 desc) as 排名
            from 用戶訪問次數(shù)表) as a
      where 排名 > (select max(排名) from a) * 0.2) as b
group by 用戶類型;

題目6：連續(xù)N天登陸

解題思路:
1、因?yàn)槊刻煊脩舻卿洿螖?shù)可能不止一次，所以需要先將用戶每天的登錄日期(to_date)去重。
2、再用row_number() over(partition by _ order by )函數(shù)將用戶id分組，按照登陸時(shí)間進(jìn)行排序。
3、計(jì)算登錄日期減去排序值（date_sub 類似于日期減去天數(shù)），用戶連續(xù)登陸情況下，每次相減的日期都相同。
4、按照id和日期分組并求和，篩選大于等于N的即為連續(xù)N天登陸的用戶。

案例：
根據(jù)B表計(jì)算：10月25日起到當(dāng)前時(shí)間連續(xù)7日于8-22點(diǎn)登陸汽車之家的用戶明細(xì)。表B：其中包含如下字段：

字段示例

select 
	  # 第四步
	  # 1、計(jì)算根據(jù)用戶id和新的日期，進(jìn)行計(jì)算，如果計(jì)數(shù)結(jié)果大于等于N，則N天連續(xù)登陸
		d.user_id
	   ,d.user_name
	   ,d.cal_date
from(
	# 第三步
	# 1、日期 減去 排序結(jié)果【邏輯：日期減去天數(shù)得到新的日期，對(duì)新的日期計(jì)數(shù)，如果計(jì)數(shù)結(jié)果大于等于N，則N天連續(xù)登陸】
	select c.user_id
		   ,c.user_name
		   ,date_sub(c.log_data, c.rank) as cal_date
	from(
		# 第二步
		# 1、對(duì)每個(gè)用戶根據(jù)日期進(jìn)行排序
		select b.user_id
			   ,b.user_name
			   ,b.log_data
			   ,row_number() over (PARTITION by b.user_id order by b.log_data) as rank
		from(
			# 第一步
			# 1、提取時(shí)間段在8-22點(diǎn)之間的數(shù)據(jù)；
			# 2、日期從 2020-10-25 開始；
			# 3、數(shù)據(jù)去重，根據(jù)用戶對(duì)日期去重
			select DISTINCT user_id, user_name, to_date(log_time) as log_data
			from B as a
			where extract(HOUR from a.log_time) between 8 and 22
				  and to_date(a.log_time) > '2020-10-24'
			) as b
		) as c 
	) as d 
group by d.user_id, d.cal_date
having count(*) >= 7;

題目7：有一場(chǎng)籃球賽，參賽雙方是A隊(duì)和B隊(duì)，場(chǎng)邊記錄員記錄下了每次得分的詳細(xì)信息：

team：隊(duì)名
number：球衣號(hào),
name：球員姓名,
score_time：得分時(shí)間，
score：當(dāng)次得分
問（用sql表達(dá)）：
1）輸出每一次的比分的反超時(shí)刻，以及對(duì)應(yīng)的完成反超的球員姓名；
2）輸出連續(xù)三次或以上得分的球員姓名，以及那一撥連續(xù)得分的數(shù)值；

1）輸出每一次的比分的反超時(shí)刻，以及對(duì)應(yīng)的完成反超的球員姓名

#第一步：計(jì)算每個(gè)時(shí)間點(diǎn)A、B兩支隊(duì)伍的得分情況，如果沒有得分，就顯示為0；【考點(diǎn)：coalesce函數(shù)】
#第二步：計(jì)算每個(gè)時(shí)間點(diǎn)A、B兩隊(duì)分別累計(jì)得分；【考點(diǎn)：sum() over (partition ```order by ```)】
#第三步：計(jì)算每個(gè)時(shí)刻兩隊(duì)的分差；【考點(diǎn)：lead函數(shù)】
#第四步：當(dāng)前時(shí)刻的 累計(jì)分差 與 下一個(gè)時(shí)刻的 累積分差 相乘，相等結(jié)果小于等于0時(shí)，則為比分反超時(shí)刻；同時(shí)通過兩隊(duì)的累積比分相同時(shí)刻；【考點(diǎn)：篩選思路】
select z.score_time
	 ,z.name
from(
	#第三步：計(jì)算每個(gè)時(shí)刻兩隊(duì)的分差；
	select *
		 ,a_sum_score2-b_sum_score2 as score_gap
		 ,lead(a_sum_score2-b_sum_score2)over(order by score_time) as last_score_gap
	from(
		#第二步：計(jì)算每個(gè)時(shí)間點(diǎn)A、B兩隊(duì)分別累計(jì)得分
		select team
			 ,number
			 ,name
			 ,score_time
			 ,A_score
			 ,B_score
			 ,sum(A_score) over (order by score_time) a_sum_score2 --計(jì)算每個(gè)時(shí)點(diǎn)A隊(duì)的累計(jì)得分
			 ,sum(b_score) over (order by score_time) b_sum_score2 --計(jì)算每個(gè)時(shí)點(diǎn)B隊(duì)的累計(jì)得分
		from(
			#第一步：計(jì)算每個(gè)時(shí)間點(diǎn)A、B兩支隊(duì)伍的得分情況，如果沒有得分，就顯示為0；
			select team
				    ,number
				    ,name
				    ,score_time
				    ,coalesce(case when team='A' then score end,0) as A_score --如果某個(gè)得分時(shí)點(diǎn)B隊(duì)得分了，A隊(duì)沒有得分，那么A對(duì)在這個(gè)時(shí)點(diǎn)的得分置為0
				    ,coalesce(case when team='B' then score end,0) as B_score --如果某個(gè)得分時(shí)點(diǎn)A隊(duì)得分了，B隊(duì)沒有得分，那么B對(duì)在這個(gè)時(shí)點(diǎn)的得分置為0
			from test.basketball_game_score_detail
			ORDER BY score_time
			) as x
		) as y
	) as z
where z.score_gap*last_score_gap<=0
	 and a_sum_score2<>b_sum_score2； --排除得分相等的時(shí)點(diǎn)，這些時(shí)點(diǎn)肯定不考慮

2）輸出連續(xù)三次或以上得分的球員姓名，以及那一撥連續(xù)得分的數(shù)值

【以下方案?jìng)€(gè)人覺得復(fù)雜了，期望有梗簡(jiǎn)單解析思路輸出的朋友給予建議】
#第一步：根據(jù)時(shí)間進(jìn)行所有人排序
#第二步：
#（1）對(duì)每個(gè)球員根據(jù)時(shí)間進(jìn)行排序
#（2）所有人排序結(jié)果 減去 每個(gè)球員根據(jù)時(shí)間排序結(jié)果 得到兩者排序差，如果排序差結(jié)果相同，則說明是連續(xù)的，通過having count() >= N，計(jì)算得到連續(xù)N次得分的球員
#第三步：通過內(nèi)連接篩選相關(guān)信息
select b.name
	 ,b.score
from(
	#第三步：通過內(nèi)連接篩選相關(guān)信息
	select *
		 ,(rank - row_number() over(partition by a.name order by a.score_time)) as rank_diff
	from(
		#第一步：根據(jù)時(shí)間進(jìn)行所有人排序
		select *
			 ,row_number() over(order by score_time) as 'rank'
		from test.basketball_game_score_detail
		) as a
	) as b inner join(
				select b.name
				         ,b.rank_diff
				from(
					#第二步：
					#（1）對(duì)每個(gè)球員根據(jù)時(shí)間進(jìn)行排序
					#（2）所有人排序結(jié)果 減去 每個(gè)球員根據(jù)時(shí)間排序結(jié)果 得到兩者排序差
					select *
						  ,(rank - row_number() over(partition by a.name order by a.score_time)) as rank_diff
					from(
						#第一步：根據(jù)時(shí)間進(jìn)行所有人排序
						select *
							 ,row_number() over(order by score_time) as 'rank'
						from test.basketball_game_score_detail
						) as a
					) as b 
				group by b.name, b.rank_diff
				having count(b.rank_diff) >= 3
	                       ) as c on b.name = c.name and b.rank_diff = c.rank_diff;

注：本文未對(duì)mysql、sql sever、hive sql、odps sql等進(jìn)行歸納！

該文章在 2023/6/2 15:23:34 編輯過

關(guān)鍵字查詢

常用

SQL

函數(shù)

相關(guān)文章

正在查詢...

點(diǎn)晴ERP是一款針對(duì)中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國(guó)內(nèi)大量中小企業(yè)的青睞。

點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對(duì)港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場(chǎng)、車隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報(bào)表等業(yè)務(wù)管理，結(jié)合碼頭的業(yè)務(wù)特點(diǎn)，圍繞調(diào)度、堆場(chǎng)作業(yè)而開發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體，是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。

點(diǎn)晴WMS倉(cāng)儲(chǔ)管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購(gòu)管理,倉(cāng)儲(chǔ)管理,倉(cāng)庫(kù)管理,保質(zhì)期管理,貨位管理,庫(kù)位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號(hào)管理軟件。

點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi)，不限功能、不限時(shí)間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。

亚洲乱色熟女一区二区三区丝袜,天堂√中文最新版在线,亚洲精品乱码久久久久久蜜桃图片,香蕉久久久久久av成人,欧美丰满熟妇bbb久久久

[轉(zhuǎn)帖]SQL常用函數(shù)整理（帶示例）

什么是SQL數(shù)據(jù)庫(kù)？

···Let's Go···

Directory List:

一、數(shù)據(jù)表創(chuàng)建/插入/修改/刪除

二、窗口函數(shù)

三、日期函數(shù)

四、字符串函數(shù)

五、sql實(shí)現(xiàn)歸遞累加

六、其他常用函數(shù)