什么是Java内存模型？为什么会引发线程安全问题？

近日，有热心市民就 "Java内存模型 " 提出质疑：线程是否会把所有需要操作的数据全加载到内存
在这里插入图片描述
根据《我是憨包》可以看出，当事人蛋蛋(化名)目前情绪稳定，并且似乎已经意识到问题所在

是的，聪明的蛋蛋已经找到了答案（答案后面再说）

此事件发生后，群内大佬高度重视，立即召开线上会议，成立Java内存模型专家小组作出响应，要求组织迅速，妥善处理，迅速查清问题根源，立即组织开展在线答疑，进一步做好指导工作，防止同样问题再次出现，阻挠兄弟们拿到心仪offer

一想到很多朋友还没搞懂Java内存模型，我就饭吃不饱觉睡不着，就连看到黑丝也无动于衷

于是

又花了几天时间又花了几根头发，来尝试帮大家理解一波~

关于Java内存模型，能扯好多好多、能聊好远好远，但是不要慌，我们整理下问题先：

什么是Java内存模型？
为什么会有Java内存模型？
Java内存模型引发了什么问题？
线程是否会把所有需要操作的数据全加载到内存？

据当事人陈述：

线程在操作数据时，会从主内存中拷贝一份数据副本到自己的工作内存，操作完再写回主内存，那如果这个数据超级大，也会拷贝到工作内存中吗？

要想弄清这个问题，我们必须先研究下什么是Java内存模型

很多同学会把 Java内存模型和 JVM内存模型搞混，这是两种截然不同的东西

Java内存模型：全称Java Memory Model，简称JMM，是一种虚拟机规范，下面会详细讲；
JVM内存模型：全称Java Virtual Machine，简称JVM，也是一种虚拟机规范，关于jvm本文不会展开讲；

如果想开发一款能运行Java程序的虚拟机，就必须遵循这两个规范（当然需要遵循的规范远不止这两种），只有这样，java程序才能在你的虚拟机上开开心心的run，我们最最最最常见的hotspot vm就遵循了这些规范；

Java内存模型的由来

在这里插入图片描述

说来话长
在这里插入图片描述
我长话短说吧

问题起源

这牵涉到CPU厂商和内存厂商的发展史。。。

我们鸡道，cpu在执行指令的时候，经常需要操作内存中的数据

为了方便理解，我举个栗子，拿 i = i + 1来讲

cpu先要从内存中读取到 i 当前的值，进行 +1 ，再将计算结果写回内存
在这里插入图片描述

最开始一切安好，但随着技术的发展，cpu执行效率远远超过了内存的读写效率，所以出现了一个现象

cpu执行 +1 操作耗时很短，假设只需要1ms，而从内存中读取 i ，再写回内存，耗时很长，假设是10ms

cpu明明只需要1ms，活生生被内存拖到11ms，这哪儿顶得住啊

于是，机智的cpu厂想了个办法

解决办法

这个办法在《深入理解Java虚拟机》书中也有提到
在这里插入图片描述

简单来说就在cpu和内存中间加一层 高速缓存，也就是我们平时说的L1、L2、L3缓存，这一块缓存一般比较小，但嗷嗷快，你懂我意思吧

注意：知识点来了，一定要把cpu的高速缓存和内存条的内存区分开

这是内存条的内存（系统属性中可以查看）
在这里插入图片描述

这是cpu的高速缓存（任务管理器-性能一栏可以查看到）
在这里插入图片描述

所以现在操作流程变成了：

cpu会事先将需要用到的数据从主内存中复制一份到高速缓存，cpu在执行计算操作时，依次从L1、L2、L3级缓存中查找，如果有需要的数据，直接操作，计算结束后再flush到主内存中；如果没有，再去主内存中查找

在这里插入图片描述

cpu被内存拉低效率的问题得以解决

时间又过了很久。。。

cpu厂商推出了多核处理器，又引出了另一个问题：线程安全

多核处理器的每个核心都有自己的高速缓存（每个cpu架构都不同，要具体看cpu厂商怎么做，目前市面上的cpu一般都是L1、L2独立，L3共享）

上面可以看到我cpu的L1缓存是384k，这384k并不是六个核共享，而是 6 * 32 * 2，如下图
在这里插入图片描述

现在，架构变成了
在这里插入图片描述
（这个图是简化版，实际的架构图比这复杂得多，那些细节我懒的画了）

所以，现在问题来了，如果不同核心上的线程同时操作同一个数据，会出现什么问题？

我们假设一下

核心a有个线程t1，核心b有个线程t2
开始计算前，内存中 i 的值是0，两线程对应高速缓存中 i 的值也都是0
某一时刻，两线程同时执行 i + 1
t1执行完 i = 1，吭呲吭呲写回内存，此时内存中 i 的值已经由0变为了1
t2执行完 i 也 = 1，也吭呲吭呲把i = 1写回内存，这就把t1写回的新 i 值覆盖了

本来 i 经过两次+1应该等于2，实际结果却等于1，懂我意思吗，大多数并发编程中的数据异常问题都是这么来的

所以，并发编程中，只要涉及到写的操作，我们都应该保证同步，从而得到可靠的最终数据

到这里，我们可以总结下什么内存模型