摘要
某些場景會有這樣的需求:無記錄則插入,有記錄則更新。例如:新增用戶,以身份證號碼作為唯一身份標識,插入時若先查詢是否存在記錄再決定插入還是更新,在高并發情況下必然存在問題。本文提供三種解決方案。
方案一 加鎖
無論通過synchronized鎖、ReentranLock鎖還是分布式鎖,都可以解決該問題。缺點是,加鎖會影響性能。方法二和三都是數據庫層面解決方案,個人感覺比方法一好一些。
方案二 Unique和Replace Into … SELECT …
首先對唯一性的字段添加唯一索引ALTER TABLE tb_name ADD UNIQUE (col1、col2...),,通過唯一索引即可保證數據的唯一性。
加入唯一索引后,通過INSERT INTO插入相同數據就會報錯,此時需要使用REPLACE INTO插入數據,用法是一樣的。通過REPLACE INTO插入數據時,若存在相同數據,會將之前的記錄刪除,再重新插入數據。缺點是,存在先刪除再插入的過程,sql需要考慮全部數據列,不然會丟失部分列的數據。缺點是,建立唯一索引會影響插入效率。下面是具體的例子。
# 建立索引
ALTER TABLE user ADD UNIQUE (id_card);
# 假設user表只有id,name,id_card三個字段,且id字段自增。
# 現在需要插入name=ly,id_card=142733的記錄。
# 但是,若之前存在id_card=142733的記錄,修改name=ly即可。
REPLACE INTO user (id,name,id_card)
SELECT id,'ly',142733 FROM user RIGHT JOIN (SELECT 1) AS tab
ON user.id_card = 142733;
通過RIGHT JOIN (SELECT 1),若存在id_card=142733的記錄,執行sql后會將原始id保存在臨時的結果集中,隨name和id_card一同插入。若不存在該記錄,則將null作為id隨name和id_card一同插入。最終實現
方案三 通過預插入語句判斷是否存在記錄
通過預插入語句,嘗試插入,判斷修改的記錄是否大于0,若大于0表示插入成功,若為0則表示記錄已存在,需要執行更新操作。
# 預插入
INSERT INTO user (name,id_card)
SELECT 'ly',142733 FROM DUAL
WHERE NOT EXISTE (SELECT id_card FROM user WHERE id_card = 142733) ;
# 若預插入語句插入成功(修改記錄數=1),則無需后續操作。否則執行更新操作。
UPDATE user SET name = 'ly' WHERE id_card = 142733;
通過NOT EXISTE條件,若存在id_card=142733的記錄則偽表DUAL記錄為空,預插入語句修改記錄為0,此時需要執行更新操作。
若不存在id_card=142733的記錄,則偽表DUAL記錄為一行且內容是'ly',142733,預插入語句修改記錄為1,此時不必執行更新語句。
Mysql批量插入更新性能優化
對于數據量較大的插入和更新,因io/cpu等性能瓶頸,會產生大量的時間消耗,目前主流的優化主要包括預編譯、單條sql插入多條數據、事務插入等,下面詳細介紹一下:
單條插入(Mybatis)
INSERT INTO SYS_CITY (CITY_CODE, CITY_NAME, PROVINCE_NAME, ALIAS, ABBRE_PY) VALUES
(${cityCode}, ${cityName}, ${provinceName}, ${alias}, ${abbrePy})
單條預編譯插入(Mybatis)
采用預編譯可以節約mysql服務的解析時間,mytatis中就是采用#變量
INSERT INTO SYS_CITY (CITY_CODE, CITY_NAME, PROVINCE_NAME, ALIAS, ABBRE_PY) VALUES
(#{cityCode}, #{cityName}, #{provinceName}, #{alias}, #{abbrePy})
單條sql插入多條數據
即是拼接sql,在一個sql中插入多條或更新多條數據。
INSERT INTO SYS_CITY (CITY_CODE, CITY_NAME, PROVINCE_NAME, ALIAS, ABBRE_PY) VALUES
("cityCode1", "cityName1", "provinceName1" "alias1", "abbrePy1"),("cityCode2", "cityName2", "provinceName2" "alias2", "abbrePy2")
快的原因
1、合并后日志量(MySQL的binlog和innodb的事務讓日志)減少了,降低日志刷盤的數據量和頻率,從而提高效率;
2、通過合并SQL語句,減少網絡傳輸的IO;
3、通過合并SQL語句,減少SQL語句解析的次數;
注意事項
1、數據庫sql長度是有限制,sql長度別溢出,會報錯;
2、亂序插入時候速度超過innodb_buffer的容量,每次定位索引涉及較多的磁盤讀寫操作,性能下降較快;
事務插入
事務插入即在插入前開啟事務,插入結束關閉事務進行提交即可。
快的原因
1、進行一個INSERT操作時,MySQL內部會建立一個事務,在事務內才進行真正插入處理操作。通過使用事務可以減少創建事務的消耗;
注意事項
1、事務不能過大,MySQL有innodb_log_buffer_size配置項,事務超出這個時,會刷磁盤,導致性能下降;
2、亂序插入時候速度超過innodb_buffer的容量,每次定位索引涉及較多的磁盤讀寫操作,性能下降較快;
測試結果
環境:i5-4200U 1.6GHZ,12G內存,固態硬盤
\ |
:單條插入: |
:單條預編譯: |
:單條插入多條: |
:事務插入: |
1000 |
4600毫秒 |
3334毫秒 |
8毫秒 |
704毫秒 |
10000 |
27204毫秒 |
26249毫秒 |
2959毫秒 |
2959毫秒 |
100000 |
240954毫秒 |
254716毫秒 |
17286毫秒 |
20539毫秒 |
總結
采用合并sql+事務插入組合,效率最高,亂序插入時候速度超過innodb_buffer的容量,每次定位索引涉及較多的磁盤讀寫操作,性能下降較快;盡量采用非亂序方式即可。以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
您可能感興趣的文章:- mysql如果數據不存在,則插入新數據,否則更新的實現方法
- mysql 記錄不存在時插入 記錄存在則更新的實現方法
- mysql 存在該記錄則更新,不存在則插入記錄的sql