分布式文件系统使用——MinIO
1 分布式文件系统
1.1 概念
- 常见的文件系统:FAT16/FAT32、NTFS、HFS、UFS、APFS、XFS、Ext4等 。
现在有个问题,一此短视频平台拥有大量的视频、图片,这些视频文件、图片文件该如何存储呢?如何存储可以满足互联网上海量用户的浏览。
分布式文件系统
就是海量用户查阅海量文件的方案。
通过概念可以简单理解为:一个计算机无法存储海量的文件,通过网络将若干计算机组织起来共同去存储海量的文件,去接收海量用户的请求,这些组织起来的计算机通过网络进行通信,如下图:
分布式文件系统的好处:
- 一台计算机的文件系统处理能力扩充到多台计算机同时处理
- 一台计算机挂了还有另外副本计算机提供数据
- 每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度
总结:干活的人多、有副本、就近访问
1.2 常见的分布式文件系统
①NFS
类比
网络上的共享文件夹
方式
1)在客户端上映射NFS服务器的驱动器。
2)客户端通过网络访问NFS服务器的硬盘完全透明。
②GFS(google)
主从结构:master、chunkserver
1)GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver组成。
2)master存储了数据文件的元数据,一个文件被分成了若干块存储在多个chunkserver中。
3)用户从master中获取数据元信息,向chunkserver存储数据。
③HDFS
HDFS,是Hadoop Distributed File System的简称,是Hadoop抽象文件系统的一种实现。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 HDFS的文件分布在集群机器上,同时提供副本进行容错及可靠性保证。例如客户端写入读取文件的直接操作都是分布在集群各个机器上的,没有单点性能压力。
1)HDFS采用主从结构,一个HDFS集群由一个名称结点和若干数据结点组成。
2) 名称结点存储数据的元信息,一个完整的数据文件分成若干块存储在数据结点。
3)客户端从名称结点获取数据的元信息及数据分块的信息,得到信息客户端即可从
数据块来存取数据。
④云计算厂家(类似:阿里的OOS)
阿里云对象存储服务(Object Storage Service,简称 OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。
百度对象存储BOS提供稳定、安全、高效、高可扩展的云存储服务。
⑤MinIO(去中心化)
MinIO 是一个非常轻量的服务,可以很简单的和其他应用的结合使用,它兼容亚马逊 S3 云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等。
它一大特点就是轻量,使用简单,功能强大,支持各种平台,单个文件最大5TB,兼容 Amazon S3接口,提供了 Java、Python、GO等多版本SDK支持。
2 MinIO教程
2.1 MinIO概念
MinIO是一个轻量级的服务,但是服务功能齐全,我们日常的小项目可以用它来做我们的分布式文件系统。
官网:https://min.io
中文:https://www.minio.org.cn/,http://docs.minio.org.cn/docs/
MinIO集群采用去中心化共享架构,每个结点是对等关系,通过Nginx可对MinIO进行负载均衡访问。
- 在大数据领域,通常的设计理念都是无中心和分布式。Minio分布式模式可以帮助你搭建一个高可用的对象存储服务,你可以使用这些存储设备,而不用考虑其真实物理位置。
- 它将分布在不同服务器上的多块硬盘组成一个对象存储服务。由于硬盘分布在不同的节点上,分布式Minio避免了单点故障。
结构图如下:
- Minio使用纠删码技术来保护数据,它是一种恢复丢失和损坏数据的数学算法,它将数据分块冗余的分散存储在各各节点的磁盘上,所有的可用磁盘组成一个集合
- 使用纠删码的好处是即便丢失一半数量(N/2)的硬盘,仍然可以恢复数据。 比如上边集合中有4个以内的硬盘损害仍可保证数据恢复,不影响上传和下载,如果多于一半的硬盘坏了则无法恢复。
如上图,一共4个server,如果有1个server挂了,依然可以上传和下载文件,并且当挂
掉的server恢复后,会自动恢复数据。
"如果多于一半的server挂了,那么无法恢复",比如:如果有两个挂了,就算server重
新上线,也依然无法恢复数据,数据将无法同步,这对分布式文件系统DFS是致命的。
2.2 使用MinIO
从MinIO官网下载对应操作系统版本,这里以windows为例
①下载好后,创建存放文件的目标文件夹,进入MinIO的cmd执行以下命令
照理来说是应该有多台机器的,但是由于条件限制,采用创建几个文件夹来模拟分布式【大家可以通过虚拟机的方式模拟】
- 此处我创建四个data文件:
- 执行命令完成映射:
minio.exe server D:\develop\minio_data\data1 D:\develop\minio_data\data2 D:\develop\minio_data\data3 D:\develop\minio_data\data4
- 输入url,进入minio的管理页面
复制上面cmd窗口中展示的任意一个url【端口为:9000】
例如:http://169.254.133.199:9000
用户名、密码默认都是:minioadmin
②创建bucket
下一步创建bucket,桶,它相当于存储文件的目录,可以创建若干的桶
③点击“upload”上传文件。
④观察本地四个data目录情况
我们发现上传的1.mp4文件存储在了四个目录,即四个硬盘上。
下边测试minio的数据恢复过程:
1、首先删除一个目录。
删除目录后仍然可以在web控制台上传文件和下载文件。
稍等片刻删除的目录自动恢复。
2、删除两个目录。
删除两个目录也会自动恢复。
3、删除三个目录 。
由于 集合中共有4块硬盘,有大于一半的硬盘损坏数据无法恢复。
此时报错:We encountered an internal error, please try again. (Read failed. Insufficient number of drives online)在线驱动器数量不足。
2.3 Java操作MinIO
MinIO提供多个语言版本SDK的支持,下边找到java版本的文档:
地址:https://docs.min.io/docs/java-client-quickstart-guide.html
最低需求Java 1.8或更高版本:
2.3.1 导入依赖
<dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.4.3</version></dependency><dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.8.1</version></dependency>
2.3.2 测试上传
- 创建bucket
- 点击“Manage”修改bucket的访问权限,改为public
public,任意人都可访问
- 创建一个路径:file【如果不创建,运行下面的代码会自动创建】
- 测试代码
packagecom.zi.test;importio.minio.BucketExistsArgs;importio.minio.MakeBucketArgs;importio.minio.MinioClient;importio.minio.UploadObjectArgs;importio.minio.errors.MinioException;importjava.io.IOException;importjava.security.InvalidKeyException;importjava.security.NoSuchAlgorithmException;/**
* @author zhouYi
* @description TODO
* @date 2023/2/14 17:47
*/publicclassMinIOTest{staticMinioClient minioClient =MinioClient.builder()//url先择任何一个server.endpoint("http://169.254.133.199:9000")//用户名密码.credentials("minioadmin","minioadmin").build();//上传文件publicstaticvoidupload()throwsIOException,NoSuchAlgorithmException,InvalidKeyException{try{boolean found =
minioClient.bucketExists(BucketExistsArgs.builder()//选择testbucket.bucket("testbucket").build());//检查testbucket桶是否创建,没有创建自动创建if(!found){
minioClient.makeBucket(MakeBucketArgs.builder().bucket("testbucket").build());}else{System.out.println("Bucket 'testbucket' already exists.");}//上传hello.txt
minioClient.uploadObject(UploadObjectArgs.builder().bucket("testbucket").object("hello.txt").filename("D:\\hello.txt").build());//上传hello.txt,上传到txt子目录
minioClient.uploadObject(UploadObjectArgs.builder().bucket("testbucket").object("txt/hello2.txt").filename("D:\\hello2.txt").build());System.out.println("上传成功");}catch(MinioException e){System.out.println("Error occurred: "+ e);System.out.println("HTTP trace: "+ e.httpTrace());}}publicstaticvoidmain(String[] args)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{upload();}}
上面的参数说明:
5. 结果
运行main方法,查看结果:
在MinIO的控制台查看:
http://169.254.133.199:9000
2.3.3 测试删除
//连接的MinIO服务器同上文...//删除文件publicstaticvoiddelete(String bucket,String filepath)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{try{
minioClient.removeObject(RemoveObjectArgs.builder().bucket(bucket).object(filepath).build());System.out.println("删除成功");}catch(MinioException e){System.out.println("Error occurred: "+ e);System.out.println("HTTP trace: "+ e.httpTrace());}}publicstaticvoidmain(String[] args)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{// upload();delete("testbucket","hello.txt");delete("testbucket","txt/hello2.txt");}...
删除成功!
2.3.4 查询文件是否存在
重新上传文件,然后查询文件是否存在,是否存在,下载到本地
//连接MinIO的服务器同上...//下载文件publicstaticvoidgetFile(String bucket,String filepath,String outFile)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{try{try(InputStream stream = minioClient.getObject(GetObjectArgs.builder().bucket(bucket).object(filepath).build());FileOutputStream fileOutputStream =newFileOutputStream(newFile(outFile));){// Read data from streamIOUtils.copy(stream,fileOutputStream);System.out.println("下载成功");}}catch(MinioException e){System.out.println("Error occurred: "+ e);System.out.println("HTTP trace: "+ e.httpTrace());}}publicstaticvoidmain(String[] args)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{upload();// delete("testbucket","hello.txt");// delete("testbucket","txt/hello2.txt");getFile("testbucket","txt/hello2.txt","D:\\hello3.txt");}...
2.3.5 全部测试代码
publicclassMinIOTest{staticMinioClient minioClient =MinioClient.builder()//url先择任何一个server.endpoint("http://169.254.133.199:9000")//用户名密码.credentials("minioadmin","minioadmin").build();//上传文件publicstaticvoidupload()throwsIOException,NoSuchAlgorithmException,InvalidKeyException{try{boolean found =
minioClient.bucketExists(BucketExistsArgs.builder()//选择testbucket.bucket("testbucket").build());//检查testbucket桶是否创建,没有创建自动创建if(!found){
minioClient.makeBucket(MakeBucketArgs.builder().bucket("testbucket").build());}else{System.out.println("Bucket 'testbucket' already exists.");}//上传hello.txt
minioClient.uploadObject(UploadObjectArgs.builder().bucket("testbucket").object("hello.txt").filename("D:\\hello.txt").build());//上传hello.txt,上传到txt子目录
minioClient.uploadObject(UploadObjectArgs.builder().bucket("testbucket").object("txt/hello2.txt").filename("D:\\hello2.txt").build());System.out.println("上传成功");}catch(MinioException e){System.out.println("Error occurred: "+ e);System.out.println("HTTP trace: "+ e.httpTrace());}}//删除文件publicstaticvoiddelete(String bucket,String filepath)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{try{
minioClient.removeObject(RemoveObjectArgs.builder().bucket(bucket).object(filepath).build());System.out.println("删除成功");}catch(MinioException e){System.out.println("Error occurred: "+ e);System.out.println("HTTP trace: "+ e.httpTrace());}}//下载文件publicstaticvoidgetFile(String bucket,String filepath,String outFile)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{try{try(InputStream stream = minioClient.getObject(GetObjectArgs.builder().bucket(bucket).object(filepath).build());FileOutputStream fileOutputStream =newFileOutputStream(newFile(outFile));){// Read data from streamIOUtils.copy(stream,fileOutputStream);System.out.println("下载成功");}}catch(MinioException e){System.out.println("Error occurred: "+ e);System.out.println("HTTP trace: "+ e.httpTrace());}}publicstaticvoidmain(String[] args)throwsIOException,NoSuchAlgorithmException,InvalidKeyException{upload();// delete("testbucket","hello.txt");// delete("testbucket","txt/hello2.txt");getFile("testbucket","txt/hello2.txt","D:\\hello3.txt");}}
2.4 MinIO整合SpringCloud项目
文件上传是众多项目中比较基础的功能,但是其实现起来细节也很多,下面我将通过MinIO实现文件上传。
前置条件;已经导入好了项目,并且搭建好了nacos环境
2.4.1 文件上传controller
SpringWeb提供了注解:@RequestPart
,同时指明文件类型consumes = {MediaType.MULTIPART_FORM_DATA_VALUE}
/**
* 上传文件
* @param filedata
* @param folder
* @param objectName
* @return
*/@RequestMapping(value ="/upload/coursefile", consumes ={MediaType.MULTIPART_FORM_DATA_VALUE})publicUploadFileResultDtoupload(@RequestPart("filedata")MultipartFile filedata,@RequestParam(value="folder", required =false)String folder,@RequestParam(value="objectName", required =false)String objectName){Long companyId =1232141425L;//构建参数传给serviceUploadFileParamsDto uploadFileParamsDto =newUploadFileParamsDto();//判断文件类型String contentType = filedata.getContentType();
uploadFileParamsDto.setContentType(contentType);
uploadFileParamsDto.setFileSize(filedata.getSize());//contentType中的image/gif、image/jpeg、image/png都包含imageif(contentType.indexOf("image")>=0){//图片
uploadFileParamsDto.setFileType("001001");}else{
uploadFileParamsDto.setFileType("001003");}//文件名称
uploadFileParamsDto.setFilename(filedata.getOriginalFilename());//构建返回对象UploadFileResultDto uploadFileResultDto =null;try{
uploadFileResultDto = mediaFileService.uploadFile(companyId, uploadFileParamsDto, filedata.getBytes(), folder,objectName);}catch(Exception e){XcPlusException.cast("上传文件过程出错");}return uploadFileResultDto;}
2.4.2 文件上传interface、service、minioConfig
①interface
UploadFileResultDtouploadFile(Long companyId,UploadFileParamsDto uploadFileParamsDto,byte[] bytes,String folder,String objectName);
②service
/**
* 上传文件通用接口
*
* @param companyId
* @param uploadFileParamsDto
* @param bytes
* @param folder
* @param objectName
* @return
*/@OverridepublicUploadFileResultDtouploadFile(Long companyId,UploadFileParamsDto uploadFileParamsDto,byte[] bytes,String folder,String objectName){//获取文件md5值【根据md5可以判断是否是同一文件】String fileMd5 =DigestUtils.md5Hex(bytes);if(StringUtils.isEmpty(folder)){//如果没有传文件夹,自动按照年月日生成
folder =getFileFolder(newDate(),true,true,true);}elseif(folder.indexOf("/")<0){
folder = folder +"/";}//文件名称String filename = uploadFileParamsDto.getFilename();if(StringUtils.isEmpty(objectName)){//如果objectName为空,则使用文件的md5值为文件名
objectName = fileMd5 + filename.substring(filename.lastIndexOf("."));}//上传到MinIO【文件夹路径+文件名】
objectName = folder + objectName;try{//将文件的字节数组转换为字节输入流ByteArrayInputStream byteArrayInputStream =newByteArrayInputStream(bytes);String contentType = uploadFileParamsDto.getContentType();PutObjectArgs putObjectArgs =PutObjectArgs.builder().bucket(bucket_files).object(objectName)//InputStream stream, long objectSize 对象大小, long partSize 分片大小(-1表示5M,最大不要超过5T,最多10000).stream(byteArrayInputStream, byteArrayInputStream.available(),-1).contentType(contentType).build();//上传到minio
minioClient.putObject(putObjectArgs);//保存到数据库[存储文件使用的是md5值]MediaFiles mediaFiles = mediaFilesMapper.selectById(fileMd5);if(mediaFiles ==null){
mediaFiles =newMediaFiles();//封装数据BeanUtils.copyProperties(uploadFileParamsDto, mediaFiles);
mediaFiles.setId(fileMd5);
mediaFiles.setFileId(fileMd5);
mediaFiles.setCompanyId(companyId);
mediaFiles.setFilename(filename);
mediaFiles.setBucket(bucket_files);
mediaFiles.setFilePath(objectName);
mediaFiles.setUrl("/"+ bucket_files +"/"+ objectName);
mediaFiles.setCreateDate(LocalDateTime.now());
mediaFiles.setStatus("1");
mediaFiles.setAuditStatus("002003");//插入数据库【文件表】
mediaFilesMapper.insert(mediaFiles);}//准备返回数据UploadFileResultDto uploadFileResultDto =newUploadFileResultDto();BeanUtils.copyProperties(mediaFiles, mediaFiles);return uploadFileResultDto;}catch(Exception e){
log.debug("上传文件失败:{}",e.getMessage());}returnnull;}//根据日期生成文件夹privateStringgetFileFolder(Date date,boolean year,boolean month,boolean day){SimpleDateFormat sdf =newSimpleDateFormat("yyyy-MM-dd");//获取当前日期字符串String dataStr = sdf.format(newDate());//取出年月日String[] arr = dataStr.split("-");StringBuffer folderStr =newStringBuffer();if(year){
folderStr.append(arr[0]);
folderStr.append("/");}if(month){
folderStr.append(arr[1]);
folderStr.append("/");}if(day){
folderStr.append(arr[2]);
folderStr.append("/");}return folderStr.toString();}
③minio配置类(从nacos读取配置)
/**
* @author zhouYi
* @description Minio配置类,配置Minio客户端
* @date 2023/2/15 10:18
*/@ConfigurationpublicclassMinioConfig{//从nacos读取参数//URL@Value("${minio.endpoint}")privateString endpoint;//账号@Value("${minio.accessKey}")privateString accessKey;//密码@Value("${secretKey}")privateString secretKey;publicMinioClientminioClient(){MinioClient minioClient =MinioClient.builder().endpoint(endpoint).credentials(accessKey, secretKey).build();return minioClient;}}
版权归原作者 NPE~ 所有, 如有侵权,请联系我们删除。