Computer/PHP

인코딩 디코딩의 종류

알찬돌삐 2012. 8. 10. 16:40

 

  • ISO-2022
    • RFC-1557에서 MIME 문자 세트 이름으로 처음 사용되었습니다.
    • IS0-2022라는 문자 세트를 바탕으로 KSC-5601을 7Bit로 표현하는 방식입니다.
    • ISO-2022는 여러 종류의 정보 교환용 부호를 정하는 방식에 대한 국제 표준입니다.

  • ISO-2022-KR
    • 한글이 사용되는 것을 표시하기 위해 메일의 본문에 $)C에 라는 문자열이 먼저 나옵니다.
    • Esc는 아스키 27번의 이스케이프(Escape) 제어 문자입니다.
    • 한글이 시작되는 곳에는 SO(Shift-Out, 아스키 14번,[Ctrl]-[N]에 해당) 문자가 나옵니다.
    • 한글이 끝나는 곳에는 SI(Shift-In, 아스키 15번,[Ctrl]-[O]에 해당) 문자가 나옵니다.

  • QP
    • 'Quoted-Printable'의 약자로서 MIME에서 사용하는 인코딩 방식입니다.
    • 전자 우편 프로그램인 유도라에서 채택하고 있으며, 7Bit 범위에 있는 문자는 바꾸지 않지만 8Bit로 된 문자는 모두 16진수 숫자로 바꾸어 문자 앞부분에 '=' 기호를 붙입니다.
    • QP의 경우는 8Bit가 세트된 문자를 16진수 두 자리로 바꾸고 앞에 '='를 붙입니다.
      (예) '안녕하세요.'는 '=BE=C8=B3=E7=C7=CF=BC=BC=BF=E4'와 같이 표현됩니다.

  • Base64
    • RFC-1113에 의한 코드 체계를 따르며
    • 8Bit 데이터를 6Bit씩 나누어서 각 6Bit를 특정 코드값으로 매핑시켜 변환하는 인코딩 방식으로 MIME를 사용하고 있습니다.

  • UUENCODE
    • 이진 파일이나 한글 메일을 7Bit 아스키로 변환하는 인코딩 방식입니다.
    • UUENCODE로 변환된 파일은 Begin으로 시작해서 End로 끝나는 형식으로 구성되어 있습니다.
    • Uuencode/Uudecode는 원래 바이너리 파일을 E-mail로 전송하기 위해 만들어진 방법이며, 텍스트 파일을 전송하는데는 잘 사용되지 않습니다. 그러나 한글 텍스트를 Uuencode로 인코딩하여 보내기도 합니다.
    • Uuencode/Uudecode도 Base64 와 비슷하게 8Bit 문자 3개를 7Bit 문자 4개로 변환하는 방식입니다.
    • Begin으로 시작하는 줄과 End로 끝나는 줄 사이에 있는 내용이 인코딩된 내용이며, 각각의 줄은 그 줄의 글자 수를 나타내는 값으로 시작합니다.

이 글은 스프링노트에서 작성되었습니다.

.