高效数据加密混淆方法及实现简介

背景

当需要对数据的传输或表达有安全级别不高的可逆加密，但要求其加解密时间复杂度越低越好，这时使用常规的对称加解密（3DES、AES）或者非对称加解密（RSA、ECC）显然不合适。首先（1），加密的安全级别和加解密时间复杂度两者之间就是一对矛盾，那么如何做到破解起来不那么容易，加解密本身又非常高效的熊鱼兼得呢？另外（2），依稀记得上大学的时候老师说过这样的一句话：相对于古典加解密，现代加解密一般都是算法公开，密钥的管理才是其核心问题。那么，基于以上两点有没有什么好的套路去兼顾各方呢？即：我既不想加解密成本高，也不想去管理该死的密钥（常规的套路就是将密钥的生成或者管理揉到加密算法之中去），还要其破解起来不那么容易。那么，下面我举例一些常用套路。

1. 密码学三大原则

在正式介绍开始之前先说下密码学三大原则：扩散、混淆、雪崩效应

扩散扩散就是让明文中的每一位影响密文中的许多位，或者说让密文中的每一位受明文中的许多位的影响，这样可以隐蔽明文的统计特性。
混淆混淆就是将密文与密钥之间的统计关系变得尽可能复杂，使得对手即使获取了关于密文的一些统计特性，也无法推测密钥。使用复杂的非线性代替变换可以达到比较好的混淆效果，而简单的线性代替变换得到的混淆效果则不理想。
雪崩雪崩效应（Avalanche effect）指加密算法（尤其是块密码和加密散列函数）的一种理想属性。雪崩效应就是一种不稳定的平衡状态也是加密算法的一种特征，它指明文或密钥的少量变化会引起密文的很大变化。雪崩效应是指当输入发生最微小的改变（例如，反转一个二进制位）时，也会导致输出的剧变（如，输出中一半的二进制位发生反转）。在高品质的块密码中，无论密钥或明文的任何细微变化都应当引起密文的剧烈改变。

2. 常用套路实例

2.1 利用多表位移法（维尼吉亚密码）生成看似随机的定长数字会议号

1、场景:
关于腾讯会议号的生成方法的推测网络上真实说啥都有，有的真的太重了，例如：[腾讯会议号设计的几种猜测]https://cloud.tencent.com/developer/article/2030928，不管怎么样，保障轻量高效和密码学三大原则都是应该充分被遵守的。

2、思路：

利用MD5的高散列性生成一定数量的KeyMap<Integer, Integer>（多表位移用）。
加密时根据一个满足一致性的规则（简单取模）获得1个对应的KeyMap，最后再根据该KeyMap进行移位，同时处理MAX_NUMBER越界循环复用。
解密即加密逆计算。
初始密钥为密钥数量的MD5值。初始密钥：用于加密工作密钥。工作密钥：用于加密敏感数据(密码、个人信息等)的密钥。初始密钥为密钥数量的MD5值，这使得我们不可以不去考虑该死的密钥管理问题了。

packageencode;importjava.nio.charset.StandardCharsets;importjava.security.MessageDigest;importjava.util.HashMap;importjava.util.Map;/**
 * PseudoRandomNumberUtil
 *
 * @author chenx
 */publicclassPseudoRandomNumberUtil{privatestaticfinalint KEY_COUNT =128;privatestaticfinalint MAX_NUMBER =1000000000;privatestaticfinalint MASK_CODE = MAX_NUMBER / KEY_COUNT;privatestaticfinalMap<Integer,Integer> KEY_MAP =newHashMap<>();privatePseudoRandomNumberUtil(){}static{try{MessageDigest md5 =MessageDigest.getInstance("MD5");
            md5.update(String.valueOf(KEY_COUNT).getBytes(StandardCharsets.UTF_8));byte[] keyData = md5.digest();for(int i =0; i < KEY_COUNT; i++){
                md5.update(keyData);
                keyData = md5.digest();
                KEY_MAP.put(i,getKeyDataIntValue(keyData));}}catch(Exception e){thrownewRuntimeException("PseudoRandomNumberUtil init error! "+ e.getMessage());}}/**
     * encode
     *
     * @param number
     * @return
     */publicstaticintencode(int number){int index = number % KEY_COUNT;int key = KEY_MAP.get(index).intValue();int temp =(number / KEY_COUNT)+ key;if(temp >= MASK_CODE){
            temp -= MASK_CODE;}return temp * KEY_COUNT + index;}/**
     * decode
     *
     * @param number
     * @return
     */publicstaticintdecode(int number){int index = number % KEY_COUNT;int key = KEY_MAP.get(index).intValue();int temp = number / KEY_COUNT;if(temp <= key){
            temp += MASK_CODE;}

        temp -= key;int result = temp * KEY_COUNT + index;if(result >= MAX_NUMBER){
            result -= MAX_NUMBER;}return result;}/**
     * getKeyDataIntValue
     *
     * @param keyData
     * @return
     */privatestaticintgetKeyDataIntValue(byte[] keyData){int result =0;for(int i =0, len =4; i < len; i++){
            result = result |(keyData[i]&0xff);
            result = result <<((len - i)*8);}

        result = result &Integer.MAX_VALUE;
        result = result % MASK_CODE;return result;}publicstaticvoidmain(String[] args){for(int i =0; i <1000; i++){int encodedData =PseudoRandomNumberUtil.encode(i);int decodeData =PseudoRandomNumberUtil.decode(encodedData);System.out.println("rawData:"+ i +" encodedData:"+ encodedData +" decodeData:"+ decodeData);}}}

运行效果如下，可以看出散的还是非常开的。由于计算上都是非常简单的加/减/乘/除/取模，因此十分轻量和高效。

rawData:0 encodedData:777307648 decodeData:0
rawData:1 encodedData:673582081 decodeData:1
rawData:2 encodedData:462563842 decodeData:2
rawData:3 encodedData:572984835 decodeData:3
rawData:4 encodedData:375370756 decodeData:4
rawData:5 encodedData:404839941 decodeData:5
rawData:6 encodedData:936941574 decodeData:6
rawData:7 encodedData:490034183 decodeData:7
rawData:8 encodedData:606869000 decodeData:8
rawData:9 encodedData:968213001 decodeData:9
rawData:10 encodedData:753664522 decodeData:10
rawData:11 encodedData:151120907 decodeData:11
rawData:12 encodedData:509426188 decodeData:12
rawData:13 encodedData:518332429 decodeData:13
rawData:14 encodedData:667913230 decodeData:14
rawData:15 encodedData:787467791 decodeData:15
rawData:16 encodedData:947158544 decodeData:16
rawData:17 encodedData:333873681 decodeData:17
rawData:18 encodedData:212811794 decodeData:18
rawData:19 encodedData:379195923 decodeData:19
rawData:20 encodedData:701412884 decodeData:20
rawData:21 encodedData:660866069 decodeData:21
rawData:22 encodedData:96149526 decodeData:22
rawData:23 encodedData:186095127 decodeData:23
rawData:24 encodedData:64869400 decodeData:24
rawData:25 encodedData:461154841 decodeData:25
rawData:26 encodedData:475000346 decodeData:26
rawData:27 encodedData:601995291 decodeData:27
rawData:28 encodedData:754361372 decodeData:28
rawData:29 encodedData:938285085 decodeData:29
rawData:30 encodedData:513153054 decodeData:30

2.2 按位异或混淆数据

1、场景：
业务系统开发的时候常常使用数字型ID做为数据的主键，但是由于数字的易暴力穷举性，因此如果将其做为参数对外暴露，则有暴力穷举的安全隐患，这个时候则需要一种高效的编码方式（因为满大街的地方用的实在太多了）。当然相关的做法有很多，这里举例一种按位异或的方法，由于异或本身的高效性（目前CPU都对异或运算进行了内置优化）和特性（不进位的二进制加法），对同样的东西进行两次异或即可对数据进行还原。

2、思路：

将数据本身进行一次高离散度哈希（不推荐MD5，虽然MD5离散度好，但是效率相对不高，推荐Murmur哈希）
将第1步的数据哈希值与数据自身一起进行序列化（serialize(Long snowflakeId)方法）
用数据哈希值与数据自身进行按位异或运算得到混淆数据（obfuscate(byte[] bytes)方法）
数据本身的哈希值实际上起到一个密钥的作用，由于数据本身不固定，另外哈希算法也不对外直接暴露，因此这里我们也可以不必去考虑密钥管理问题。

importjava.io.*;/**
 * IdWorker
 *
 * @author chenx
 */publicclassIdWorker{privatestaticfinalint HASH_CODE_LENGTH =4;privatestaticfinalint LONG_BYTE_LENGTH =8;privatestaticSnowFlakeIdWorker snowFlakeIdWorker =newSnowFlakeIdWorker(0,0);privateIdWorker(){}/**
     * getStringId
     *
     * @return
     * @throws IOException
     */publicstaticStringgetStringId()throwsIOException{byte[] bytes =serialize(snowFlakeIdWorker.nextId());obfuscate(bytes);returnBase58Util.encode(bytes);}/**
     * getStringId
     *
     * @param longId
     * @return
     * @throws IOException
     */publicstaticStringgetStringId(Long longId)throwsIOException{byte[] bytes =serialize(longId);obfuscate(bytes);returnBase58Util.encode(bytes);}/**
     * getLongId
     *
     * @return
     */publicstaticLonggetLongId(){return snowFlakeIdWorker.nextId();}/**
     * getLongId
     *
     * @param stringId
     * @return
     * @throws IOException
     */publicstaticLonggetLongId(String stringId)throwsIOException{byte[] bytes =Base58Util.decode(stringId);obfuscate(bytes);returndeserialize(bytes);}/**
     * serialize
     *
     * @param snowflakeId
     * @return
     * @throws IOException
     */privatestaticbyte[]serialize(Long snowflakeId)throwsIOException{try(ByteArrayOutputStream out =newByteArrayOutputStream();DataOutputStream dos =newDataOutputStream(out)){
            dos.writeInt(getHashCode(snowflakeId));
            dos.writeLong(snowflakeId);return out.toByteArray();}}/**
     * deserialize
     *
     * @param bytes
     * @return
     * @throws IOException
     */privatestaticLongdeserialize(byte[] bytes)throwsIOException{try(ByteArrayInputStream in =newByteArrayInputStream(bytes);DataInputStream dis =newDataInputStream(in)){
            dis.readInt();return dis.readLong();}}/**
     * obfuscate（hashCode按位异或混淆）
     *
     * @param bytes
     */privatestaticvoidobfuscate(byte[] bytes){byte[] hashBytes =null;byte[] payloadBytes =null;if(bytes ==null){thrownewRuntimeException("bytes is null");}if(bytes.length <= HASH_CODE_LENGTH){thrownewRuntimeException("bytes.length <= "+ HASH_CODE_LENGTH);}int leftBytesSize = bytes.length - HASH_CODE_LENGTH;
        hashBytes =newbyte[HASH_CODE_LENGTH];
        payloadBytes =newbyte[leftBytesSize];System.arraycopy(bytes,0, hashBytes,0, HASH_CODE_LENGTH);System.arraycopy(bytes, HASH_CODE_LENGTH, payloadBytes,0, leftBytesSize);for(int i = HASH_CODE_LENGTH; i < bytes.length; i++){
            bytes[i]=(byte)(hashBytes[i % HASH_CODE_LENGTH]^ payloadBytes[i - HASH_CODE_LENGTH]);}}/**
     * getHashCode：使用murmur哈希算法的原因为其散列性较好
     *
     * @param snowflakeId
     * @return
     */privatestaticintgetHashCode(Long snowflakeId){returnMurmurHashUtil.hash32(long2Bytes(snowflakeId));}/**
     * long2Bytes
     *
     * @param num
     * @return
     */privatestaticbyte[]long2Bytes(long num){byte[] byteNum =newbyte[LONG_BYTE_LENGTH];for(int ix =0; ix < LONG_BYTE_LENGTH;++ix){int offset =64-(ix +1)* LONG_BYTE_LENGTH;
            byteNum[ix]=(byte)((num >> offset)&0xff);}return byteNum;}publicstaticvoidmain(String[] args)throwsIOException{for(int i =0; i <1000; i++){long longId =IdWorker.getLongId();String encodedLongId =IdWorker.getStringId(longId);long decodedLongId =IdWorker.getLongId(encodedLongId);System.out.println("longId:"+ longId +" , encodedLongId:"+ encodedLongId +" , decodedLongId:"+ decodedLongId);}}}

运行效果如下，同样可以看到使用murmur32进行哈希后再按位异或其结果还是散的比较开的，大家试下用其他的哈希方式，例如直接用String.hashCode，那么一定会看到其密码学三大原则评判上的不佳。虽然上述示例只是简单的对Long类型数据进行混淆编码，但是实际上该方法是一种通用的数据混淆方式，之前写了一个文件服务，为了防止文件下载地址的暴力穷举，对于文件索引数据（MetaDataIndex）的混淆就是使用的同样的方式，大家可以参考：https://github.com/bossfriday/bossfriday-nubybear/blob/master/cn.bossfriday.fileserver/src/main/java/cn/bossfriday/fileserver/engine/impl/v1/MetaDataHandler.java

longId:155205853429891072 , encodedLongId:51eYjUeFFvY2jALLq , decodedLongId:155205853429891072
longId:155205853446668288 , encodedLongId:3Wgm2Uhmsdwe7SaDf , decodedLongId:155205853446668288
longId:155205853446668289 , encodedLongId:2c73jdjfPKsitiDbP , decodedLongId:155205853446668289
longId:155205853446668290 , encodedLongId:4CURDUt6mQBE2LTH5 , decodedLongId:155205853446668290
longId:155205853446668291 , encodedLongId:4hrNARwhL537ShgQM , decodedLongId:155205853446668291
longId:155205853446668292 , encodedLongId:3cCxrqvL42Q9D3UNk , decodedLongId:155205853446668292
longId:155205853446668293 , encodedLongId:2xKY2dpMEP7ecDmHb , decodedLongId:155205853446668293
longId:155205853446668294 , encodedLongId:3ZaMM5okHucTDDNUY , decodedLongId:155205853446668294
longId:155205853446668295 , encodedLongId:4NCsDx5KnLYFykeVD , decodedLongId:155205853446668295
longId:155205853446668296 , encodedLongId:HvFSG6kSan2yGmmg , decodedLongId:155205853446668296
longId:155205853446668297 , encodedLongId:5Ad3PAWMrmCB4ya5H , decodedLongId:155205853446668297
longId:155205853450862592 , encodedLongId:5NbiVFkWihqyMru9V , decodedLongId:155205853450862592
longId:155205853450862593 , encodedLongId:2oqmVzAGYT53ZGB1Q , decodedLongId:155205853450862593
longId:155205853450862594 , encodedLongId:26Zq7uhzZavRmzA9t , decodedLongId:155205853450862594
longId:155205853450862595 , encodedLongId:3u8s2PwMb2H93WCBr , decodedLongId:155205853450862595
longId:155205853450862596 , encodedLongId:ARHkhBKd5dG1jaM9 , decodedLongId:155205853450862596
longId:155205853450862597 , encodedLongId:2u81176vAEN9gZv41 , decodedLongId:155205853450862597
longId:155205853450862598 , encodedLongId:w98z2TAQd526wZx8 , decodedLongId:155205853450862598
longId:155205853450862599 , encodedLongId:2GiztYWt59YMFWeKb , decodedLongId:155205853450862599
longId:155205853450862600 , encodedLongId:3vLEYNr8iaxccHH5j , decodedLongId:155205853450862600
longId:155205853450862601 , encodedLongId:2dzH8hoTmdFatGW7F , decodedLongId:155205853450862601
longId:155205853455056896 , encodedLongId:kftKoQrqZ6QZs9kQ , decodedLongId:155205853455056896
longId:155205853455056897 , encodedLongId:5jbp912w62xSSiBTW , decodedLongId:155205853455056897

3. 总结

密码学相关的东西可能多数开发同学了解甚少，我也是同样，不过做为程序猿多少还是有必要了解其基本的东西。从网络上搜索到的片段信息总结来看，一般把密码学归类为：古典密码学和现代密码学。

古典密码学基本要点为：替换法和移位法（当然为了增加其复杂度又衍生出：多表替换和多表位移）：

单表代换 *是指英文字母在进行密码编码替换的时候，有一张对照表，也就是说，对于每一个字母，都是唯一对应。简单来说就是明文和密文一一对应。
单表位移 *本质也是一种“替换”的加密技术，需要加密的“原信息”中的所有字母都在字母表上向后（或向前）按照一个固定数目进行偏移后被替换为加密好的信息。例如，当偏移量是3的时候，所有的字母A将被替换成D，B变成E，以此类推。代表加密算法为：凯撒加密。

现代密码学中我们常常见到或者听到的手段有：

散列摘要 例如：MD5,SHA-1,SHA-256,SHA-512。其中MD5具备高散列性：目前标准的MD5算法理论碰撞概率是2的128次方分之一；因此MD5具备强抗碰撞性，即：已知原数据和其MD5值，想找到一个具有相同MD5值的数据（即伪造数据）是非常困难的。
对称加密 使用的加密和解密的方式是同一把密钥。常见的加密算法有： DES：Data Encryption Standard，数据加密标准，使用密钥的块加密算法。 AES：Advanced Encryption Standard，高级加密标准，又称Rijndael加密法，区块加密标准。 RC4：Rivest Cipher 4，流加密算法，密钥长度可变。
非对称加密 使用公钥加密，必须使用私钥机密；使用私钥加密，必须使用公钥解密。常见的加密算法有： RSA：RSA是一种公钥密码算法，它的名字是由它的三位开发者，即Ron Rivest、Adi Shamir 和 Leonard Adleman 的姓氏的首字母组成的。RSA可以被用于公钥密码和数字签名。RSA是被研究得最广泛的公钥算法，从提出到现在已近三十年，经历了各种攻击的考验，逐渐为人们接受，普遍认为是目前最优秀的公钥方案之一。 ECC：ECC加密算法的全称为“Elliptic curve cryptography”，中文名为“椭圆加密算法”，是一种基于椭圆曲线数学的公开密钥加密算法。

标签： java 安全算法

本文转载自: https://blog.csdn.net/camelials/article/details/128845389
版权归原作者 BossFriday 所有，如有侵权，请联系我们删除。

高效数据加密混淆方法及实现简介

背景

1. 密码学三大原则

2. 常用套路实例

2.1 利用多表位移法（维尼吉亚密码）生成看似随机的定长数字会议号

2.2 按位异或混淆数据

3. 总结

发表评论

“高效数据加密混淆方法及实现简介”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航