사이트 검색

컴퓨터에서 텍스트 정보 코딩

컴퓨터는 복잡한 장치입니다.정보를 생성, 변환 및 저장할 수 있습니다. 그러나 컴퓨터는 우리에게 아주 명료하게 작동하지 않습니다. 그래픽, 텍스트 및 숫자 데이터는 이진 배열로 저장됩니다

텍스트 정보의 인코딩
숫자. 이 기사에서는 텍스트 정보가 어떻게 코딩되는지 살펴 보겠습니다.

우리를위한 텍스트는 무엇인가?기호의 시퀀스입니다. 각 기호는 0과 1의 특정 세트를 나타냅니다. 이 기호 아래에는 라틴 알파벳의 소문자 및 대문자뿐만 아니라 구두점, 산술 기호, 서비스 기호, 특수 기호 및 심지어 공백까지 포함됩니다.

텍스트 정보의 이진 코딩

내부 키의 특정 키를 누르면컨트롤러는 바이너리 코드로 변환 된 전기 신호를 보냅니다. 코드가 표시된 특정 문자와 일치합니다. 라틴 알파벳을 디지털 형식으로 표현하기 위해 국제 ASCII 코딩 시스템이 만들어졌습니다. 1 문자를 쓰려면 1 바이트가 필요하므로 심볼은 8 자리 숫자 0과 1로 구성됩니다. 녹음 간격은 00000000에서 11111111까지입니다. 즉,이 시스템을 사용하여 텍스트 정보를 인코딩하면 256 개의 기호가 표시됩니다. 대부분의 경우이 정도면 충분합니다.

텍스트 정보의 이진 코딩

ASCII는 두 부분으로 나뉩니다. 처음 127 자 (00000000에서 01111111까지)는 국제 문자이며 영문자의 특정 문자와 문자를 나타냅니다. 두 번째 부분 - 확장자 (10,000,000에서 11111111까지) - 국가 알파벳을 나타 내기위한 것이며, 서체는 라틴어와 다릅니다.

ASCII로 텍스트 정보 인코딩즉, 라틴 문자가 많을수록 ASCII 코드의 값이 커집니다. 도표와 러시아어 부분은 같은 원리로 만들어졌습니다.

그러나, 세계에 더 많은 종들이있다.키릴 문자를위한 인코딩. 가장 일반적인 것들은 KOI-8 (8 비트 인코딩, 최초의 통합 유닉스 OS에서 1970 년대에 이미 사용됨), ISO 8859-5 (국제 표준화기구 (International Bureau of Standardization)에서 개발 됨), CP 1251

텍스트 정보의 인코딩 및 처리
최신 Windows OS)뿐만 아니라 2 바이트65,536자를 전송할 수있는 유니 코드 인코딩. 이러한 다양한 인코딩은 서로 다른 운영 체제 및 다양한 이유로 서로 다른 시간에 개발 되었기 때문에 발생합니다. 이 때문에 한 미디어에서 다른 미디어로 텍스트를 전송할 때 종종 어려움이 있습니다. 인코딩이 일치하지 않으면 이해할 수없는 아이콘 집합 만 보입니다. 이 상황을 어떻게 해결할 수 있습니까? 예를 들어 Word에서 문서를 열면 텍스트 표시 문제에 대한 메시지가 표시되고 코드 변환을위한 여러 가지 옵션이 제공됩니다.

따라서 텍스트의 인코딩과 처리컴퓨터의 깊이에있는 정보 - 프로세스가 복잡하고 시간 소모적입니다. 모든 알파벳의 모든 기호는 이진 시스템의 특정 자릿수 시퀀스만을 나타냅니다. 하나의 셀은 1 바이트의 정보입니다.

</ p>
  • 등급 :