0


脑电EEG代码开源分享 【6. 分类模型-深度学习篇】

往期文章

希望了解更多的道友点这里
0. 分享【脑机接口 + 人工智能】的学习之路
1.1 . 脑电EEG代码开源分享 【1.前置准备-静息态篇】
1.2 . 脑电EEG代码开源分享 【1.前置准备-任务态篇】
2.1 . 脑电EEG代码开源分享 【2.预处理-静息态篇】
2.2 . 脑电EEG代码开源分享 【2.预处理-任务态篇】
3.1 . 脑电EEG代码开源分享 【3.可视化分析-静息态篇】
3.2 . 脑电EEG代码开源分享 【3.可视化分析-任务态篇】
4.1 . 脑电EEG代码开源分享 【4.特征提取-时域篇】
4.2 . 脑电EEG代码开源分享 【4.特征提取-频域篇】
4.3 . 脑电EEG代码开源分享 【4.特征提取-时频域篇】
4.4 . 脑电EEG代码开源分享 【4.特征提取-空域篇】
5 . 脑电EEG代码开源分享 【5.特征选择】
6.1 . 脑电EEG代码开源分享 【6.分类模型-机器学习篇】
6.2 . 脑电EEG代码开源分享 【6.分类模型-深度学习篇】
汇总. 专栏:脑电EEG代码开源分享【文档+代码+经验】

0 . 【深度学习】常用网络总结


脑电EEG代码开源分享 【6. 分类模型-深度学习篇】

一、前言

本文档旨在归纳BCI-EEG-matlab的数据处理代码,作为EEG数据处理的总结,方便快速搭建处理框架的Baseline,实现自动化、模块插拔化、快速化。本文以任务态(锁时刺激,如快速序列视觉呈现)为例,分享脑电EEG的分析处理方法。
脑电数据分析系列。分为以下6个模块

  1. 前置准备
  2. 数据预处理
  3. 数据可视化
  4. 特征提取(特征候选集)
  5. 特征选择(量化特征择优)
  6. 分类模型

本文内容:【6. 分类模型-深度学习篇】】

提示:以下为各功能代码详细介绍,若节约阅读时间,请下滑至文末的整合代码

二、分类模型 框架介绍

分类模型-深度学习篇主要介绍了 基础网络结构框架 ,将深度学习解决脑电领域问题,形成【BCI + AI】的处理框架,为脑机接口的科研开辟了新赛道、新领域

如果深入介绍 EEG+深度网络,恐怕3个系列都包含不了,本文作为 脑电+AI 的科普,和大家一起探讨深度网络的应用模式。本文介绍了3种经典模型架构,分别是:图像领域的卷积神经网络(CNN),语音领域的长短时记忆网络(LSTM),社交领域的图神经网络(GNN)。展示了目前神经网络在脑电领域的常用方法,在此框架上优化改进的结构层出不穷,大家可以根据自己的任务需要数据特点,神经网络的灵活性和模块化方便广大学者尝试和探索。

本文中的3种框架提供了3种思路,为最长程度发挥各神经网络结构自身长处,建议根据每种网络结构特长选择适用的脑电表征形式。例如, CNN 卷积核擅长捕捉图像轮廓和色彩信息,我们可以将脑电输入格式改为 雨谱图脑地形图可视化图像呈现方式。例如,LSTM能有效提取时序信号的前后语义特征,脑电信号输入格式应倾向保留原始时序信息。GNN图卷积关注拓补结构,应将脑电数据处理为导联间连接关系

前文我们花了4篇文章讲完了时域、频域、时频域、空域的特征提取,并应用特征选择方法筛选出了优质特征,终于迎来尾声的分类模型,打通了从原始数据到分类结果的全流程。

分类模型的代码框图、流程如下所示:
在这里插入图片描述

分类模型的主要功能,分为以下7部分:

  • CNN 卷积神经网络
  • LSTM 长短时记忆网络
  • GNN 图神经网络
  1. CNN 卷积神经网络卷积核(滤波器)在图片上方滑动,对相应感受野内的图像信息进行加权求和,经过卷积核处理后的输出为特征图(feature map)。多个不同卷积核分别对图像进行特征提取运算,获得多种角度的特征输出层。一般认为底层的卷积核提取明暗、色彩、轮廓等低级特征高层的卷积核获得语义、整体的高级特征。大家了解CNN基础后会发现,卷积核一般为方形,尤其适用于计算机视觉的图像处理,因此CNN多应用于图像分析领域。若想将脑电信号也转换为相应的图像形式,推荐大家尝试将各导联脑电数据转换成时频雨谱图,再将雨谱图纵向拼接起来形成格式为 雨谱图 * 导联数,这样卷积核正面扫过的区域就有了脑电的时频图像特征。或者大家希望保留脑电时空特征,可以绘制不同时刻的脑地形图,并将脑电图纵向排列,形成脑地形图 * 时间的格式。总之,卷积核面向的脑电数据尽量具有图像结构。 脑电转换为图片形式输入:在这里插入图片描述 CNN框架举例:在这里插入图片描述
  2. LSTM 长短时记忆网络:LSTM提出后称霸语音领域多年,其中心思想保留了RNN(循环神经网络)的前后语义关联性:本输出作为下一阶段输入,特色在于其三扇门:遗忘门,输入门,输出门,可以更长跨距的保留先前输入的信息不被遗忘。本人亲测过LSTM简单结构,在脑电原始信号处理中就很好使。个人经验在脑电领域的LSTM优于CNN,从脑电高分辨率的时序优势也可以理解,推荐大家尝试。注:建议大家入门LSTM时不要苦读代码或者原文,搜索CSDN上的LSTM动图讲解等关键词,极其方便理解。 LSTM原理示意图:在这里插入图片描述
  3. GNN 图神经网络:脑电信号是由分布在大脑各个区域的电极采集而来,脑电信号的各个通道之间存在空间关系或者是拓扑信息。图的构造需要3个部分:节点、特征和边集。脑电数据是由许多个电极采集,将分布在大脑不同位置的电极通道作为图的节点。不同的采集设备有不同的通道数,目前常用的有16通道、32通道、64通道和128通道。特征就是每个通道采集的数据,可以是原始采集的数据,也可以是手工提取的特征如PSD、DE特征等。 GNN网络框架举例:在这里插入图片描述

三、脑电特征选择 代码

提示:Python3.8,torch1.9.1
提示:入门级框架介绍,之后会出专栏介绍【脑电 + 深度学习】

3.0 参数设置

主要参数设置:
LR学习率:0.0001
Batch_size :128
Epoch :30
Loss损失函数:CrossEntropyLoss
optim优化器:Adam
网络初始化:kaiming_uniform_
运算设备:GPU

3.1 深度网络-基础代码

3.1.1 CNN 卷积网络

重要参数:卷积层数、卷积核尺寸,池化层、激活函数


class my_cnn(nn.Module):
    def __init__(self):super(my_cnn, self).__init__()  # 继承__init__功能
        # 第一层卷积
        self.feature = nn.Sequential(
#1                
            nn.Conv2d(
                in_channels=16,
                out_channels=24,#kernel_size=(param[para_loop][0],param[para_loop][1]),
                kernel_size=(9,7),
                stride=1,
                padding =(0,0),),
            nn.ReLU(),                                            
            nn.MaxPool2d(kernel_size=(2,2)),            
#2            
            nn.Conv2d(
                in_channels=24,
                out_channels=28,
                kernel_size=(12,8),
                stride=1,
                padding =(0,0),),  
            nn.ReLU(),                  
            nn.MaxPool2d(kernel_size=(4,4)),            

#3            
            nn.Conv2d(
                in_channels=28,
                out_channels=32,
                kernel_size=(6,4),
                stride=1,
                padding =(0,0),),  
            nn.ReLU(),#nn.MaxPool2d(kernel_size=(2,2)),)

        self.classification = nn.Sequential(#nn.Dropout(p=0.5),#nn.Linear(in_features=16* param[para_loop][2]* param[para_loop][3], out_features=64),
            nn.Linear(in_features=32*3*2, out_features=32),            # nn.Dropout(p=0.5),#nn.Dropout(p=0.5),
            nn.Linear(in_features=32, out_features=2),)
       
    def forward(self, x):
        x = self.feature(x)
        temp = x.view(x.shape[0],-1)
        output = self.classification(temp)return output, x

#device= torch.device("cuda:0"if torch.cuda.is_available()else"cpu")
device ="cpu"
cnn_model =my_cnn().to(device)print(cnn_model)

3.1.2 LSTM 长短时记忆网络

LSTM网络-网络框架核心代码:


# 定义LSTM网络模型
class my_lstm(nn.Module):
    def __init__(self):super(my_lstm, self).__init__()
 
        self.rnn = nn.LSTM(         # if use nn.RNN(), it hardly learns
            input_size=INPUT_SIZE,  # 输入维度
            hidden_size=50,         # 隐藏层神经元节点个数
            num_layers=2,           # 神经元层数
            batch_first=True,       # input & output will has batch size as 1s dimension. e.g.(batch, time_step, input_size)
            bidirectional = True,)
 
        self.out =nn.Sequential(
            nn.Dropout(p=0.5),
            nn.Linear(100,2),)
        
    def forward(self, x):#xshape(batch, time_step, input_size)#r_out shape(batch, time_step, output_size)#h_n shape(n_layers, batch, hidden_size)#h_c shape(n_layers, batch, hidden_size)
        r_out,(h_n, h_c)= self.rnn(x, None)   # h_n就是h状态,h_c就是细胞的状态
 
        #chooser_out at the last time step
        out = self.out(r_out[:,-1,:]) # 我们只要每一个time_step里的最后的一个。比如64个矩阵,每个28*28,我们只要每一个的第28次的那个数据。
        return out
            
device = torch.device("cuda:3"if torch.cuda.is_available()else"cpu")    

lstm_model =my_lstm().to(device)print(lstm_model)

3.1.3 GNN-图卷积网络

GCN图卷积神经网络-网络框架核心代码:


import numpy as np

class Graph():""" The Graph to model the skeletons extracted by the openpose

    Args:strategy(string): must be one of the follow candidates
        - uniform: Uniform Labeling
        - distance: Distance Partitioning
        - spatial: Spatial Configuration
        For more information, please refer to the section 'Partition Strategies'
            in our paper(https://arxiv.org/abs/1801.07455).layout(string): must be one of the follow candidates
        - openpose: Is consists of 18 joints. For more information, please
            refer to https://github.com/CMU-Perceptual-Computing-Lab/openpose#output- ntu-rgb+d: Is consists of 25 joints. For more information, please
            refer to https://github.com/shahroudy/NTURGB-Dmax_hop(int): the maximal distance between two connected nodes
        dilation(int): controls the spacing between the kernel points

    """

    def __init__(self,
                 layout='openpose',
                 strategy='uniform',
                 max_hop=1,
                 dilation=1):
        self.max_hop = max_hop
        self.dilation = dilation

        self.get_edge(layout)
        self.hop_dis =get_hop_distance(
            self.num_node, self.edge, max_hop=max_hop)
        self.get_adjacency(strategy)

    def __str__(self):return self.A

    def get_edge(self, layout):if layout =='openpose':
            self.num_node =18
            self_link =[(i, i)for i in range(self.num_node)]
            neighbor_link =[(4,3),(3,2),(7,6),(6,5),(13,12),(12,11),(10,9),(9,8),(11,5),(8,2),(5,1),(2,1),(0,1),(15,0),(14,0),(17,15),(16,14)]
            self.edge = self_link + neighbor_link
            self.center =1
        elif layout =='ntu-rgb+d':
            self.num_node =25
            self_link =[(i, i)for i in range(self.num_node)]
            neighbor_1base =[(1,2),(2,21),(3,21),(4,3),(5,21),(6,5),(7,6),(8,7),(9,21),(10,9),(11,10),(12,11),(13,1),(14,13),(15,14),(16,15),(17,1),(18,17),(19,18),(20,19),(22,23),(23,8),(24,25),(25,12)]
            neighbor_link =[(i -1, j -1)for(i, j) in neighbor_1base]
            self.edge = self_link + neighbor_link
            self.center =21-1
        elif layout =='ntu_edge':
            self.num_node =24
            self_link =[(i, i)for i in range(self.num_node)]
            neighbor_1base =[(1,2),(3,2),(4,3),(5,2),(6,5),(7,6),(8,7),(9,2),(10,9),(11,10),(12,11),(13,1),(14,13),(15,14),(16,15),(17,1),(18,17),(19,18),(20,19),(21,22),(22,8),(23,24),(24,12)]
            neighbor_link =[(i -1, j -1)for(i, j) in neighbor_1base]
            self.edge = self_link + neighbor_link
            self.center =2#eliflayout=='customer settings'#passelse:
            raise ValueError("Do Not Exist This Layout.")

    #计算邻接矩阵A
    def get_adjacency(self, strategy):
        valid_hop =range(0, self.max_hop +1, self.dilation)  #range(start,stop,step)
        adjacency = np.zeros((self.num_node, self.num_node))for hop in valid_hop:
            adjacency[self.hop_dis == hop]=1
        normalize_adjacency =normalize_digraph(adjacency)
        unnormalize_adjacency =normalize_undigraph(adjacency)if strategy =='uniform':
            A = np.zeros((1, self.num_node, self.num_node))
            A[0]= normalize_adjacency
            self.A = A
        elif strategy =='distance':
            A = np.zeros((len(valid_hop),18,18))for i, hop in enumerate(valid_hop):
                A[i][self.hop_dis == hop]= normalize_adjacency[self.hop_dis ==
                                                                hop]
            self.A = A
        elif strategy =='spatial':
            A =[]for hop in valid_hop:
                a_root = np.zeros((self.num_node, self.num_node))
                a_close = np.zeros((self.num_node, self.num_node))
                a_further = np.zeros((self.num_node, self.num_node))for i in range(self.num_node):for j in range(self.num_node):if self.hop_dis[j, i]== hop:if self.hop_dis[j, self.center]== self.hop_dis[
                                    i, self.center]:
                                a_root[j, i]= normalize_adjacency[j, i]
                            elif self.hop_dis[j, self.
                                              center]> self.hop_dis[i, self.
                                                                     center]:
                                a_close[j, i]= normalize_adjacency[j, i]else:
                                a_further[j, i]= normalize_adjacency[j, i]if hop ==0:
                    A.append(a_root)else:
                    A.append(a_root + a_close)
                    A.append(a_further)
            A = np.stack(A)
            self.A = A
        else:
            raise ValueError("Do Not Exist This Strategy")

# 此函数的返回值hop_dis就是图的邻接矩阵
def get_hop_distance(num_node, edge, max_hop=1):
    A = np.zeros((num_node, num_node))for i, j in edge:
        A[j, i]=1
        A[i, j]=1#computehop steps
    hop_dis = np.zeros((num_node, num_node))+ np.inf  # np.inf 表示一个无穷大的正数
    #np.linalg.matrix_power(A, d)求矩阵A的d幂次方,transfer_mat矩阵(I,A)是一个将A矩阵拼接max_hop+1次的矩阵
    transfer_mat =[np.linalg.matrix_power(A, d)for d in range(max_hop +1)]
    # (np.stack(transfer_mat)>0)矩阵中大于0的返回Ture,小于0的返回False,最终arrive_mat是一个布尔矩阵,大小与transfer_mat一样
    arrive_mat =(np.stack(transfer_mat)>0)#range(start,stop,step) step=-1表示倒着取for d in range(max_hop,-1,-1):
        # 将arrive_mat[d]矩阵中为True的对应于hop_dis[]位置的数设置为d
        hop_dis[arrive_mat[d]]= d
    return hop_dis

# 将矩阵A中的每一列的各个元素分别除以此列元素的形成新的矩阵
def normalize_digraph(A):
    Dl = np.sum(A,0) #将矩阵A压缩成一行
    num_node = A.shape[0]
    Dn = np.zeros((num_node, num_node))for i in range(num_node):if Dl[i]>0:
            Dn[i, i]= Dl[i]**(-1)
    AD = np.dot(A, Dn)return AD

def normalize_undigraph(A):
    Dl = np.sum(A,0)
    num_node = A.shape[0]
    Dn = np.zeros((num_node, num_node))for i in range(num_node):if Dl[i]>0:
            Dn[i, i]= Dl[i]**(-0.5)
    DAD = np.dot(np.dot(Dn, A), Dn)return DAD
    

总结

科学家认为深度学习目前的瓶颈需要人脑结构的启发,类脑智能逐渐兴起,
人脑智能的感知能力 + 机器智能的高效处理混合智能在不断探索。

深度学习+脑机交互 提供了新的结合和思路,
深度网络作为工具用于脑电数据的分类和解码仅是浅层应用。

深度网络结构为研究人员提供了很大的灵活性和自由度
在大数据的数据驱动模式下可以获得优异性能。

matlab 可视化友好,python 搭建网络友好,
建议新手在数据处理及可视化阶段使用Matlab 分析查看数据,
搭建网络时使用pytorch构建深度网络框架,可以较大发挥各平台的优势。

囿于能力,挂一漏万,如有笔误请大家指正~


感谢您耐心的观看,本系列更新了约30000字,约3000行开源代码,体量相当于一篇硕士工作

往期内容放在了文章开头,麻烦帮忙点点赞,分享给有需要的朋友~

坚定初心,本博客永远:
免费拿走,全部开源,全部无偿分享~


To:新想法、鬼点子的道友:

自己:脑机接口+人工智领域,主攻大脑模式解码、身份认证、仿脑模型…
在读博士第3年,在最后1年,希望将代码、文档、经验、掉坑的经历分享给大家~
做的不好请大佬们多批评、多指导~ 虚心向大伙请教!
想一起做些事情 or 奇奇怪怪点子 or 单纯批评我的,请至Rongkaizhang_bci@163.com

在这里插入图片描述)


本文转载自: https://blog.csdn.net/weixin_44425788/article/details/127103444
版权归原作者 Coco恺撒 所有, 如有侵权,请联系我们删除。

“脑电EEG代码开源分享 【6. 分类模型-深度学习篇】”的评论:

还没有评论