유니코드 문자를 알려진 모든 인코딩에 적용할 수 있습니다. 유니코드는 ASCII (American national interactive information standards Unicode) 에 이어 새로운 문자 코드입니다. 각 기호에 대해 숫자와 이름, 문자와 해당 숫자 (코드 포인트) 및 해당 값의 이진 표현을 정의합니다. 16 진수와 접두어 (u) 를 사용하여 16 자리 숫자 (예: U+00465438+) 를 정의합니다. 그러나 JavaScript 1.3 이전 버전에서는 유니코드 인코딩이 지원되지 않았습니다.
유니코드와 ASCII 및 ISO 의 호환성
유니코드는 ASCII 문자와 호환되며 대부분의 프로그램에서 지원됩니다. 처음128 유니코드 코드는 ASCII 코드와 바이트 값이 같습니다. U+0020 에서 U+007E 까지의 유니코드 문자는 ASCII 코드의 0x20 ~ 0x7E 에 해당합니다. 라틴 문자를 지원하는 7 비트 ASCII 와 달리 유니코드는 문자당 16 비트의 인코딩 값을 설정하여 수만 자를 허용합니다. 예를 들어 유니코드 버전에는 38,885 자가 포함되어 있습니다. 연장도 가능합니다. 예를 들어 UTF- 16 을 사용하면 16 자를 백만 자 이상으로 결합할 수 있으며 UTF 는 인코딩을 실제 이진 비트로 변환합니다.
유니코드는 국제 표준 iso/iec10646-1; 1993 은 ISO UCS-2 (범용 문자 세트) 의 2 개의 8 진수를 지원하는 ISO 10646 의 하위 세트입니다. 자바스크립트1.3 의 유니코드에 대한 지원은 프로그램에서 현지 문자와 특수 과학 기호를 자유롭게 사용할 수 있음을 의미합니다. 유니코드는 다국어 텍스트를 인코딩하는 표준 방법을 제공하며 ASCII 와 호환되므로 ASCII 문자를 자유롭게 사용할 수 있습니다.
유니코드 이스케이프 시퀀스
6 개의 ASCII 문자로 구성된 문자 텍스트에 유니코드 이스케이프 시퀀스를 사용할 수 있습니다. \u+4 개의 값이 있는 16 진수. 예: \u00A9 는 저작권 기호를 나타냅니다. 자바스크립트의 각 유니코드 이스케이프 시퀀스는 한 문자로 해석됩니다. 다음 표에서는 일반적으로 사용되는 특수 문자와 해당 유니코드 값을 보여 줍니다.
범주 유니코드 값 이름 형식 이름
비어 있음 \ u0009 탭
\u000B 세로 탭
\ u000C 페이지 나누기
\u0020 공간
행 종료자 값 \u000A 줄 바꿈
\u000D 캐리지 리턴.
기타 유니코드 이스케이프 시퀀스 값 \u000b 백스페이스
\u0009 가로 탭
\u0022 큰따옴표 "
\u0027 작은 따옴표'
\u005C 백슬래시/
JavaScript 는 유니코드 이스케이프 시퀀스를 사용하여 Java 와 다릅니다. 첫째, 이스케이프 시퀀스는 자바스크립트에서 특수 문자로 해석되지 않습니다. 예를 들어, 문자열의 줄 바꿈에 대한 이스케이프 시퀀스는 함수가 해석될 때까지 문자열을 종료하지 않으며, 주석에 사용될 경우 JavaScript 에서 무시합니다. Java 에서 단일 주석 행에 이스케이프 시퀀스를 사용하면 유니코드 문자로 해석됩니다. 문자열 문자의 경우 Java 컴파일러는 먼저 이스케이프 시퀀스를 해석합니다. 예를 들어 Java 에서 줄 바꿈 (\ u000A) 을 사용하면 문자열이 종료되고 Java 에서 오류가 발생합니다. 문자열 리터럴에는 줄 바꿈이 허용되지 않으므로 \n 기호를 사용해야 합니다. 자바스크립트에서는 차이가 없습니다.
유니코드로 문자 표시
유니코드를 사용하여 다른 언어로 문자 또는 전문 기호를 표시할 수 있지만 이를 위해서는 클라이언트가 Netscape Navigator 4.x 와 같은 유니코드를 지원할 수 있고 클라이언트가 유니코드 글꼴과 운영 플랫폼도 지원해야 합니다. 예를 들어 Windows 95 는 일부 유니코드만 지원합니다. 또한 ASCII 가 아닌 문자를 입력하려면 모든 유니코드 문자를 지원하는 입력 장치가 있어야 합니다. 표준 확장 키보드로는 이 작업을 수행할 수 없지만 유니코드 이스케이프 시퀀스를 사용하여 유니코드 문자를 입력할 수 있습니다. 유니코드에 대한 자세한 내용은 유니코드 콘솔 웹 사이트 버전 2.0 을 참조하십시오.