1. 개요
1. Base64란 무엇입니까?
Base64는 인터넷에서 8비트 바이트 코드를 전송하는 가장 일반적인 인코딩 방법 중 하나이며 MIME에 대한 자세한 사양이 나와 있는 RFC2045~RFC2049를 확인할 수 있습니다. Base64 인코딩은 HTTP 환경에서 더 긴 식별 정보를 전달하는 데 사용될 수 있습니다. 예를 들어, Java Persistence 시스템 Hibernate에서 Base64는 긴 고유 식별자(일반적으로 128비트 UUID)를 문자열로 인코딩하는 데 사용되며, 이는 HTTP 양식 및 HTTP GET URL에서 매개변수로 사용됩니다. 다른 애플리케이션에서는 바이너리 데이터를 URL 배치에 적합한 형식(숨겨진 양식 필드 포함)으로 인코딩해야 하는 경우가 많습니다. 이때 Base64 인코딩을 사용하면 길이가 더 짧을 뿐만 아니라 읽을 수도 없습니다. 즉, 인코딩된 데이터가 육안으로 직접 표시되지 않습니다.
2. 소개:
표준 Base64는 URL 인코더가 표준 Base64의 "/" 및 "+" 문자를 "%XX" 형식으로 변경하고 데이터베이스에 입력할 때 이러한 "%" 문자가 존재하므로 URL에서 직접 전송하는 데 적합하지 않습니다. , ANSI SQL에서 "%" 기호가 와일드카드 문자로 사용되었으므로 추가 변환이 필요합니다.
이 문제를 해결하려면 끝에 '=' 기호를 추가하지 않고 표준 Base64의 "+" 및 "/"를 각각 "*" 및 "-"로 변경하는 향상된 URL용 Base64 인코딩을 사용할 수 있습니다. , 이는 URL 인코딩, 디코딩 및 데이터베이스 저장 중에 변환의 필요성을 제거하고 프로세스에서 인코딩된 정보의 길이 증가를 방지하며 데이터베이스, 양식 등의 개체 식별자 형식을 통합합니다.
또한 "+", "*" 및 "[" 및 "]" 모두 특별한 의미를 가질 수 있으므로 "+" 및 "/"를 "!" 및 "-"로 변경하는 향상된 Base64 변형도 있습니다. 정규식.
"+/"를 "_-" 또는 "._"(프로그래밍 언어에서 식별자 이름으로 사용됨), ".-"(XML에서 Nmtokens에 사용됨) 또는 심지어 "_:"(이름에 사용됨)로 변경하는 변형도 있습니다. XML로).
Base64에서는 3개의 8Bit 바이트를 4개의 6Bit 바이트(3*8 = 4*6 = 24)로 변환한 다음 6Bit에 2개의 상위 비트 0을 추가하여 4개의 8Bit 바이트를 형성해야 합니다. 즉, 변환된 문자열은 이론적으로 다음과 같습니다. 원래 것보다 1/3 더 길어졌습니다.
3. 규칙:
이 인코딩에 대한 규칙:
①.3자를 4자로 변환합니다..
②.76자마다 줄바꿈 문자를 추가합니다..
③.최종 터미네이터도 처리해야 합니다..
너무 추상적이지 않나요? 걱정하지 마세요. 예를 살펴보겠습니다.
변환 전: aaaaaabb ccccdddd eeffffff
변환 후: 00aaaaaa 00bbcccc 00ddddee 00ffffff
분명해야겠죠? 상위 3바이트는 원본 텍스트이고 하위 4바이트는 변환된 Base64 인코딩이며 처음 2비트는 0입니다.
변환 후 코드 테이블을 사용하여 원하는 문자열(즉, 최종 Base64 인코딩)을 얻습니다.
2. Java 구현 코드 예:
public final class Base64 { static private final int BASELENGTH = 255; static private final int TWENTYFOURBITGROUP = 24; static private final int SIXTEENBIT = 16; = 6; 정적 개인 최종 int FOURBYTE = 4; int SIGN = -128; static private final char PAD = '='; static final private byte[] base64Alphabet = new byte[BASELENGTH] = new char[LOOKUPLENGTH ]; 정적 { for (int i = 0; i < BASELENGTH; i++) { base64Alphabet[i] = -1; } for (int i = 'Z'; i >= 'A'; i--) { base64Alphabet[i] = (바이트) (i - 'A') } i = 'z'; i >= 'a'; i--) { base64Alphabet[i] = (바이트) (i - 'a' + 26) } for (int i = '9'; >= '0'; i--) { base64Alphabet[i] = (바이트) (i - '0' + 52) } base64Alphabet['/'] = 63; int i = 0; i <= 25; i++) lookUpBase64Alphabet[i] = (char) ('A' + i); 26, j = 0; i <= 51; i++, j++) lookUpBase64Alphabet[i] = (char) ('a' + j) for (int i = 52, j = 0; i <= 61; i++, j++ ) lookUpBase64Alphabet[i] = (문자) ('0' + j); lookUpBase64Alphabet[62] = (문자) '+'; lookUpBase64Alphabet[63] = (char) '/'; } protected static boolean isWhiteSpace(char octect) { return (octect == 0x20 || octect == 0xd || octect == 0xa || octect == 0x9); static boolean isPad(char octect) { return (octect == PAD); } protected static boolean isData(char octect) { return (base64Alphabet[octect] != -1) } protected static boolean isBase64(char octect) { return (isWhiteSpace(octect) || isPad(octect) || isData(octect) ); } /** * 16진수 옥타브를 Base64로 인코딩합니다. * * @param BinaryData * 다음을 포함하는 배열 BinaryData * @return 인코딩된 Base64 배열 */ public static String encode(byte[] binaryData) { if (binaryData == null) return null int lengthDataBits = binaryData.length * EIGHTBIT; if (lengthDataBits == 0) { return "" ; } int lessThan24bits = lengthDataBits % TWENTYFOURBITGROUP = lengthDataBits / TWENTYFOURBITGROUP; lessThan24bits != 0 ? numberTriplets + 1 : int numberLines = (numberQuartet - 1) / 19 + 1; 인코딩된 데이터 = new char[numberQuartet * 4 + numberLines]; = 0, l = 0, b1 = 0, b2 = 0, b3 = 0; int encodeIndex = 0; int i = 0; if (fDebug) { System.out.println("number of threelets = " + numberTriplets); 0; 라인 < numberLines - 1; 라인++) { for (int quartet = 0; quartet < 19; quartet++) { b1 = BinaryData[dataIndex++]; b2 = BinaryData[dataIndex++]; if (fDebug) { System.out.println("b1= " + b1 + ", b2= " + b2 + ", b3= " + b3); } l = (바이트) (b2 & 0x0f) k = (바이트) (b1 & 0x03); ((b1 & SIGN) == 0) ? (바이트) (b1 >> 2) : (바이트) ((b1) >> 2 ^ 0xc0) ? ( 바이트) (b2 >> 4) : (바이트) ((b2) >> 4 ^ 0xf0) 바이트 val3 = ((b3 & SIGN) == 0) ? (바이트) (b3 >> 6) : (바이트) ((b3) >> 6 ^ 0xfc); if (fDebug) { System.out.println("val2 = " + system.out. println("k4 = " + (k << 4)); System.out.println("vak = " + (val2 | (k << 4))); encodedIndex++] = lookUpBase64Alphabet[val1]; encodedIndex++] = lookUpBase64Alphabet[val2 | (k << 4)]; encodedIndex++] = lookUpBase64Alphabet[(l << 2) | val3]; lookUpBase64Alphabet[b3 & 0x3f]; i++; } encodedIndex++] = 0xa; } for (; i < numberTriplets; i++) { b2 = binaryData[dataIndex++]; (fDebug) { System.out.println("b1= " + b1 + ", b2= " + b2 + ", b3= " + b3) } l = (바이트) (b2 & 0x0f) k = (바이트) (b1 & 0x03); = 0) ? (바이트) (b1 >> 2) : (바이트) ((b1) >> 2 ^ 0xc0); ((b2 & SIGN) == 0) ? (바이트) (b2 >> 4) : (바이트) ((b2) >> 4 ^ 0xf0) ? ( 바이트) (b3 >> 6) : (바이트) ((b3) >> 6 ^ 0xfc) if (fDebug) { System.out.println("val2 = " + val2); System.out.println("k4 = " + (k << 4)) System.out.println("vak = " + (val2 | (k < < 4))) } encodedData[encodedIndex++] = lookUpBase64Alphabet[val1] = lookUpBase64Alphabet[val2 | (k << 4)]; encodedIndex++] = lookUpBase64Alphabet[(l << 2) | val3]; encodedIndex++] = lookUpBase64Alphabet[b3 & 0x3f] } // 비트 그룹 if (fewerThan24bits == EIGHTBIT) { b1 = 바이너리데이터[데이터인덱스]; k = (바이트) (b1 & 0x03); if (fDebug) { System.out.println("b1=" + b1); " + (b1 >> 2)); } byte val1 = ((b1 & SIGN) == 0) ? (바이트) (b1 >> 2) : (바이트) ((b1) >> 2 ^ 0xc0); encodedData[encodedIndex++] = lookUpBase64Alphabet[val1]; encodedIndex++] = lookUpBase64Alphabet[k << 4]; encodedIndex++] = PAD; if(24비트보다 적음 == SIXTEENBIT) { b1 = 바이너리데이터[데이터인덱스]; b2 = 바이너리데이터[데이터인덱스 + 1] l = (바이트) (b2 & 0x0f); k = (바이트) (b1 & 0x03); == 0) ? (바이트) (b1 >> 2) : (바이트) ((b1) >> 2 ^ 0xc0); 바이트 val2 = ((b2 & SIGN) == 0) ? (바이트) (b2 >> 4) : (바이트) ((b2) >> 4 ^ 0xf0); ; encodedIndex++] = lookUpBase64Alphabet[val2 | 4)]; encodedIndex++] = lookUpBase64Alphabet[l << 2]; encodedData[encodedIndex] = 0xa; return new String(encodedData) } /** * Base64 데이터를 옥텍트로 디코딩합니다. * @param BinaryData * Base64 데이터를 포함하는 바이트 배열 * @return Array containind 디코딩된 데이터. */ public static byte[] decode(String encoded) { if (encoded == null) return null; char[] base64Data = encoded.toCharArray() // 공백 제거 int len = RemoveWhiteSpace ); if (len % FOURBYTE != 0) { return null;// 4로 나누어야 함 } int numberQuadruple = (len / FOURBYTE); if (numberQuadruple == 0) 새 바이트[0] 반환; 바이트 decodedData[] = null; 바이트 b1 = 0, b2 = 0, b4 = 0, marker1 = 0; d1 = 0, d2 = 0, d3 = 0, d4 = 0; int encodeIndex; = 0; int dataIndex = 0; decodedData = new byte[(numberQuadruple) * 3]; for (; i < numberQuadruple - 1; i++) { if (!isData((d1 = base64Data[dataIndex++])) || !isData ((d2 = base64Data[dataIndex++])) ||isData((d3 = base64Data[dataIndex++])) || !isData((d4 = base64Data[dataIndex++]))) return null;// "데이터 없음"이 발견되면 null을 반환합니다. b1 = base64Alphabet[d1] b2 = base64Alphabet[d2]; = base64Alphabet[d3]; b4 = base64Alphabet[d4]; = (바이트) (b1 << 2 | b2 >> 4); decodedData[encodedIndex++] = (바이트) (((b2 & 0xf) << 4) | ((b3 >> 2) & 0xf)); encodeIndex++] = (바이트) (b3 << 6 | b4) } if (!isData((d1 = base64Data[dataIndex++])) || !isData((d2 = base64Data[dataIndex++]))) { return null;// "데이터 없음"이 발견되면 그냥 null 반환 } b1 = base64Alphabet[d1] b2 = base64Alphabet[d2] ; d3 = base64Data[dataIndex++]; d4 = base64Data[dataIndex++]; (!isData((d3)) || !isData((d4))) {// PAD 문자인지 확인합니다. if (isPad(d3) && isPad(d4)) { // 두 개의 PAD eg 3c[Pad][ Pad] if ((b2 & 0xf) != 0)// 마지막 4비트는 0이어야 합니다. return null; byte[] tmp = new byte[i * 3 + 1]; System.arraycopy(decodedData, 0, tmp, 0, i * 3); tmp[encodedIndex] = (바이트) (b1 << 2 | b2 >> 4) return tmp(!isPad d3) && isPad(d4)) { // 하나의 PAD 예: 3cQ[Pad] b3 = base64Alphabet[d3]; if ((b3 & 0x3) != 0)// 마지막 2비트는 0이어야 합니다. return null; tmp = new byte[i * 3 + 2]; tmp, 0, i * 3); tmp[encodedIndex++] = (바이트) (b1 << 2 | b2 >> 4); tmp[encodedIndex] = (byte) (((b2 & 0xf) << 4) | ((b3 >> 2) & 0xf)) return tmp } else { return null;// " 3c[Pad]r", "3cdX", "3cXd", "3cXX" // 여기서 X는 데이터가 아닙니다. } } else { // PAD 없음 예: 3cQl b3 = base64Alphabet[d3]; b4 = base64Alphabet[d4]; decodedData[encodedIndex++] = (바이트) (b1 << 2 | b2 >> 4) decodedData[encodedIndex++] = (((b2 & 0xf) << 4) | ((b3 >> 2) & 0xf)); decodedData[encodedIndex++] = (byte) (b3 << 6 | b4); } return decodedData; } /** * 인코딩된 Base64 데이터가 포함된 MIME에서 WhiteSpace를 제거합니다. * * @param data * WS 사용 ) * @새 길이를 반환합니다. */ protected static int RemoveWhiteSpace(char[] data) { if (data == null) return 0 // 그렇지 않은 문자 수를 계산합니다. 공백 int newSize = 0; int len = data.length; for (int i = 0; i < len; i++) { if (!isWhiteSpace(data[i])) data[newSize++] = data[i]; } return newSize; } public static void main(String[] args) { System.out.println(encode("중화인민공화국".getBytes()));