背景
最近在开发小伙伴的需求,遇到了一个数据库统计的问题,
is not null 结果正确
!=null 结果就不对,然后就激发了获取真理的想法,那必须的查查
咋回事嘞?
开整
在用MySQL的过程中,你是否存在过如下的几个疑问?
- 我的字段类型明明指定的是NOT NULL,但是为什么还是可以插入空值呢?
- 为什么NOT NULL的效率比NULL更高?
- 在查询空字段的记录时是用"select * from table where col <> ‘’ “还是用"select * from table where col is not null”?
带着疑问,我们来看看NOT NULL和NULL有什么不一样呢?要搞清楚这两个的区别。首先,我们先要理解"空值"和"NULL"的含义:
- 空值是不占用空间的。
- NULL是会占用空间的,我们来看看官方对这个NULL的描述。MySQL的官方描述如下:
“NULL columns require additional space in the row to record whether their values are NULL. For MyISAM tables, each NULL column takes one bit extra, rounded up to the nearest byte.”
怎么理解呢?简单举个栗子:
假设有一个瓶子,空值表示的是瓶子里什么都没有,NULL表示的是瓶子里面状态的是空气。可以理解为什么NULL也会占用空间了吧。
下面来通过一个实例例子来测试一下。首先建一个表,表引擎使用InnoDB,建表语句如下:
create table test(
c1 varchar(10) not null,
c2 varchar(10) default null
) engine = InnoDB;
验证插入数据和查询:
mysql> insert into test(c1, c2) values(null, 0);
ERROR 1048 (23000): Column 'c1' cannot be null
mysql> insert into test(c1, c2) values('', 0);
Query OK, 1 row affected (0.00 sec)
# null字符串
mysql> insert into test(c1, c2) values('null', 0);
Query OK, 1 row affected (0.00 sec)
mysql> insert into test(c1, c2) values('', null);
Query OK, 1 row affected (0.00 sec)
mysql> select * from test;
+------+------+
| c1 | c2 |
+------+------+
| | 0 |
| null | 0 |
| | NULL |
+------+------+
3 rows in set (0.00 sec)
从上述结果中可以看到,NOT NULL的字段是没办法插入NULL值的,只能插入空值’'。上面第三个SQL插入的NULL是个字符串格式的NULL,对于MyISAM的存储引擎,测试的结果和上述结果是一样的。所以第1个疑问也就了解了吧。
对于第2个问题,因为NULL值是占了一定空间的,所以在MySQL进行字段比较的时候,值为NULL的字段也是会参与比较的,所以是会对性能有一定的影响。
当字段上包含有索引时,由于B树索引是不会存储NULL值的,所以在使用这个字段做为查询条件时,对性能的影响还是比较大的,在平时创建索引的时候,应该尽量保证列的值不为NULL。
针对上述的结论,有几个针对NULL和NOT NULL的常见优化建议:
- MySQL如果不指定列的约束,默认就是允许NULL,TIMESTAMP类型的字段除外。所以在非必要情况下,尽量设置列的约束为NOT NULL。
- 如果列的值为NULL,通过这个为NULL的列进行条件查询时,MySQL更难做优化,因为为NULL的列会让索引的统计和值的比较更加复杂。
- 如果计划在某个列上创建索引,那么需要尽量避免这个列中的字段值为NULL。在优化的过程中,把NULL改为NOT NULL对性能的提升并不是很明显。所以如果在使用过程中没有问题的话,没有必要首先去做NULL到NOT NULL的优化。
来通过实际例子看看最后一个问题。假如需要查询上述test表中c1不为空的所有数据,应该使用"<> ‘’"呢?还是使用"IS NOT NULL"呢?测试结果如下:
mysql> select * from test where c1 is not null;
+------+------+
| c1 | c2 |
+------+------+
| | 1 |
| null | 1 |
| | NULL |
+------+------+
3 rows in set (0.00 sec)
mysql> select * from test where c1 <> '';
+------+------+
| c1 | c2 |
+------+------+
| null | 1 |
+------+------+
1 row in set (0.00 sec)
可以看到,不同的查询条件,对于查询的结果区别还是特别大的。所以在使用过程中需要根据业务场景,选择不同的查询条件。
附录
附录1:MySQL索引失效的常见情况
- 最左前缀原则。例如:存在联合索引
idx_a_b(a, b)
,查询条件使用where b = 1
则无法使用索引 - LIKE 前置模糊查询。例如:
col_name like '%test'
或col_name like '%test%'
- 索引列使用函数或存在计算。例如:存在索引
idx_col(col)
,查询条件使用where left(col, 2) = 'te'
- 查询条件使用
is not null
。设计表结构时尽量设置not null
约束 - 字段类型出现隐式转换。例如:存在字段
test_col
为varchar
类型,查询时使用了where test_col = 1
,隐式转为了int
类型导致索引失效 - 条件中有 or 存在可能不会使用索引。例如:查询条件为
where a = 'testa' or b = 'testb'
,存在索引idx_a(a)
,此时也不会使用索引,除非为b字段也添加索引 - 查询结果超过整体结果的25%或三分之一,或者表数据量比较少时,MySQL认为全表扫描代价更小,会导致索引失效
附录2:MySQL关键字列表
R 表示为 MySQL 预留关键字
关键字关键字关键字ACCESSIBLE(R)ACCOUNTACTIONADD(R)AFTERAGAINSTAGGREGATEALGORITHMALL(R)ALTER(R)ALWAYSANALYSEANALYZE(R)AND(R)ANYAS(R)ASC(R)ASCIIASENSITIVE(R)ATAUTOEXTEND_SIZEAUTO_INCREMENTAVGAVG_ROW_LENGTHBACKUPBEFORE(R)BEGINBETWEEN(R)BIGINT(R)BINARY(R)BINLOGBITBLOB(R)BLOCKBOOLBOOLEANBOTH(R)BTREEBY(R)BYTECACHECALL ®CASCADE ®CASCADEDCASE ®CATALOG_NAMECHAINCHANGE ®CHANGEDCHANNELCHAR ®CHARACTER ®CHARSETCHECK ®CHECKSUMCIPHERCLASS_ORIGINCLIENTCLOSECOALESCECODECOLLATE ®COLLATIONCOLUMN ®COLUMNSCOLUMN_FORMATCOLUMN_NAMECOMMENTCOMMITCOMMITTEDCOMPACTCOMPLETIONCOMPRESSEDCOMPRESSIONCONCURRENTCONDITION ®CONNECTIONCONSISTENTCONSTRAINT ®CONSTRAINT_CATALOGCONSTRAINT_NAMECONSTRAINT_SCHEMACONTAINSCONTEXTCONTINUE ®CONVERT ®CPUCREATE ®CROSS ®CUBECURRENTCURRENT_DATE ®CURRENT_TIME ®CURRENT_TIMESTAMP ®CURRENT_USER ®CURSOR ®CURSOR_NAMEDATADATABASE ®DATABASES ®DATAFILEDATEDATETIMEDAYDAY_HOUR ®DAY_MICROSECOND ®DAY_MINUTE ®DAY_SECOND ®DEALLOCATEDEC ®DECIMAL ®DECLARE ®DEFAULT ®DEFAULT_AUTHDEFINERDELAYED ®DELAY_KEY_WRITEDELETE ®DESC ®DESCRIBE ®DES_KEY_FILEDETERMINISTIC ®DIAGNOSTICSDIRECTORYDISABLEDISCARDDISKDISTINCT ®DISTINCTROW ®DIV ®DODOUBLE ®DROP ®DUAL ®DUMPFILEDUPLICATEDYNAMICEACH ®ELSE ®ELSEIF ®ENABLEENCLOSED ®ENCRYPTIONENDENDSENGINEENGINESENUMERRORERRORSESCAPEESCAPED ®EVENTEVENTSEVERYEXCHANGEEXECUTEEXISTS ®EXIT ®EXPANSIONEXPIREEXPLAIN ®EXPORTEXTENDEDEXTENT_SIZEFALSE ®FASTFAULTSFETCH ®FIELDSFILEFILE_BLOCK_SIZEFILTERFIRSTFIXEDFLOAT(R)FLOAT4(R)FLOAT8(R)FLUSHFOLLOWSFOR(R)FORCE(R)FOREIGN(R)FORMATFOUNDFROM(R)FULLFULLTEXT(R)FUNCTIONGENERALGENERATED(R)GEOMETRYGEOMETRYCOLLECTIONGET(R)GET_FORMATGLOBALGRANT(R)GRANTSGROUP(R)GROUP_REPLICATIONHANDLERHASHHAVING(R)HELPHIGH_PRIORITY(R)HOSTHOSTSHOURHOUR_MICROSECOND(R)HOUR_MINUTE(R)HOUR_SECOND(R)IDENTIFIEDIF(R)IGNORE(R)IGNORE_SERVER_IDSIMPORTIN(R)INDEX(R)INDEXESINFILE(R)INITIAL_SIZEINNER(R)INOUT(R)INSENSITIVE(R)INSERT(R)INSERT_METHODINSTALLINSTANCEINT(R)INT1(R)INT2(R)INT3(R)INT4(R)INT8(R)INTEGER(R)INTERVAL(R)INTO(R)INVOKERIOIO_AFTER_GTIDS(R)IO_BEFORE_GTIDS(R)IO_THREADIPCIS(R)ISOLATIONISSUERITERATE(R)JOIN(R)JSONKEY(R)KEYS(R)KEY_BLOCK_SIZEKILL(R)LANGUAGELASTLEADING(R)LEAVE ®LEAVESLEFT ®LESSLEVELLIKE ®LIMIT ®LINEAR(R)LINES(R)LINESTRINGLISTLOAD(R)LOCALLOCALTIME(R)LOCALTIMESTAMP(R)LOCK(R)LOCKSLOGFILELOGSLONG(R)LONGBLOB(R)LONGTEXT(R)LOOP(R)LOW_PRIORITY(R)MASTERMASTER_AUTO_POSITIONMASTER_BIND(R)MASTER_CONNECT_RETRYMASTER_DELAYMASTER_HEARTBEAT_PERIODMASTER_HOSTMASTER_LOG_FILEMASTER_LOG_POSMASTER_PASSWORDMASTER_PORTMASTER_RETRY_COUNTMASTER_SERVER_IDMASTER_SSLMASTER_SSL_CAMASTER_SSL_CAPATHMASTER_SSL_CERTMASTER_SSL_CIPHERMASTER_SSL_CRLMASTER_SSL_CRLPATHMASTER_SSL_KEYMASTER_SSL_VERIFY_SERVER_CERT(R)MASTER_TLS_VERSIONMASTER_USERMATCH(R)MAXVALUE(R)MAX_CONNECTIONS_PER_HOURMAX_QUERIES_PER_HOURMAX_ROWSMAX_SIZEMAX_STATEMENT_TIMEMAX_UPDATES_PER_HOURMAX_USER_CONNECTIONSMEDIUMMEDIUMBLOB(R)MEDIUMINT(R)MEDIUMTEXT(R)MEMORYMERGEMESSAGE_TEXTMICROSECONDMIDDLEINT(R)MIGRATEMINUTEMINUTE_MICROSECOND(R)MINUTE_SECOND(R)MIN_ROWSMOD(R)MODEMODIFIES(R)MODIFYMONTHMULTILINESTRINGMULTIPOINTMULTIPOLYGONMUTEXMYSQL_ERRNONAMENAMESNATIONALNATURAL(R)NCHARNDBNDBCLUSTERNEVERNEWNEXTNONODEGROUPNONBLOCKINGNONENOT(R)NO_WAITNO_WRITE_TO_BINLOG(R)NULL(R)NUMBERNUMERIC(R)NVARCHAROFFSETOLD_PASSWORDON(R)ONEONLYOPENOPTIMIZE(R)OPTIMIZER_COSTS(R)OPTION(R)OPTIONALLY(R)OPTIONSOR(R)ORDER(R)OUT(R)OUTER(R)OUTFILE(R)OWNERPACK_KEYSPAGEPARSERPARSE_GCOL_EXPRPARTIALPARTITION(R)PARTITIONINGPARTITIONSPASSWORDPHASEPLUGINPLUGINSPLUGIN_DIRPOINTPOLYGONPORTPRECEDESPRECISION(R)PREPAREPRESERVEPREVPRIMARY(R)PRIVILEGESPROCEDURE(R)PROCESSLISTPROFILEPROFILESPROXYPURGE(R)QUARTERQUERYQUICKRANGE(R)READ(R)READS(R)READ_ONLYREAD_WRITE(R)REAL(R)REBUILDRECOVERREDOFILEREDO_BUFFER_SIZEREDUNDANTREFERENCES(R)REGEXP(R)RELAYRELAYLOGRELAY_LOG_FILERELAY_LOG_POSRELAY_THREADRELEASE(R)RELOADREMOVERENAME(R)REORGANIZEREPAIRREPEAT(R)REPEATABLEREPLACE(R)REPLICATE_DO_DBREPLICATE_DO_TABLEREPLICATE_IGNORE_DBREPLICATE_IGNORE_TABLEREPLICATE_REWRITE_DBREPLICATE_WILD_DO_TABLEREPLICATE_WILD_IGNORE_TABLEREPLICATIONREQUIRE(R)RESETRESIGNAL(R)RESTORERESTRICT(R)RESUMERETURN(R)RETURNED_SQLSTATERETURNSREVERSEREVOKE(R)RIGHT(R)RLIKE(R)ROLLBACKROLLUPROTATEROUTINEROWROWSROW_COUNTROW_FORMATRTREESAVEPOINTSCHEDULESCHEMA(R)SCHEMAS(R)SCHEMA_NAMESECONDSECOND_MICROSECOND(R)SECURITYSELECT(R)SENSITIVE(R)SEPARATOR(R)SERIALSERIALIZABLESERVERSESSIONSET(R)SHARESHOW(R)SHUTDOWNSIGNAL(R)SIGNEDSIMPLESLAVESLOWSMALLINT(R)SNAPSHOTSOCKETSOMESONAMESOUNDSSOURCESPATIAL ®SPECIFIC ®SQL ®SQLEXCEPTION ®SQLSTATE ®SQLWARNING ®SQL_AFTER_GTIDSSQL_AFTER_MTS_GAPSSQL_BEFORE_GTIDSSQL_BIG_RESULT(R)SQL_BUFFER_RESULTSQL_CACHESQL_CALC_FOUND_ROWS(R)SQL_NO_CACHESQL_SMALL_RESULT(R)SQL_THREADSQL_TSI_DAYSQL_TSI_HOURSQL_TSI_MINUTESQL_TSI_MONTHSQL_TSI_QUARTERSQL_TSI_SECONDSQL_TSI_WEEKSQL_TSI_YEARSSL(R)STACKEDSTARTSTARTING(R)STARTSSTATS_AUTO_RECALCSTATS_PERSISTENTSTATS_SAMPLE_PAGESSTATUSSTOPSTORAGESTORED(R)STRAIGHT_JOIN(R)STRINGSUBCLASS_ORIGINSUBJECTSUBPARTITIONSUBPARTITIONSSUPERSUSPENDSWAPSSWITCHESTABLE(R)TABLESTABLESPACETABLE_CHECKSUMTABLE_NAMETEMPORARYTEMPTABLETERMINATED(R)TEXTTHANTHEN(R)TIMETIMESTAMPTIMESTAMPADDTIMESTAMPDIFFTINYBLOB(R)TINYINT(R)TINYTEXT(R)TO(R)TRAILING(R)TRANSACTIONTRIGGER ®TRIGGERSTRUE ®TRUNCATETYPETYPESUNCOMMITTEDUNDEFINEDUNDO(R)UNDOFILEUNDO_BUFFER_SIZEUNICODEUNINSTALLUNION(R)UNIQUE(R)UNKNOWNUNLOCK(R)UNSIGNED(R)UNTILUPDATE(R)UPGRADEUSAGE(R)USE(R)USERUSER_RESOURCESUSE_FRMUSING(R)UTC_DATE(R)UTC_TIME(R)UTC_TIMESTAMP(R)VALIDATIONVALUEVALUES(R)VARBINARY(R)VARCHAR(R)VARCHARACTER(R)VARIABLESVARYING(R)VIEWVIRTUAL(R)WAITWARNINGSWEEKWEIGHT_STRINGWHEN(R)WHERE(R)WHILE(R)WITH(R)WITHOUTWORKWRAPPERWRITE(R)X509XAXIDXMLXOR(R)YEARYEAR_MONTH(R)ZEROFILL(R)
版权归原作者 青柠编程 所有, 如有侵权,请联系我们删除。