• No se han encontrado resultados

Representación de textos

La información en forma de texto se suele representar por medio de un código en el que se asigna un patrón determinado de bits a cada uno de los distintos símbolos que aparecen en el texto (como por ejemplo las letras del alfabeto y los signos de puntuación). El texto se representa entonces mediante una larga cadena de bits, en la que los sucesivos patrones representan los símbolos suce- sivos del texto original.

En la década de 1940 y 1950, se diseñaron y utilizaron muchos de esos códi- gos con diferentes tipos de equipos, lo que generó una lógica proliferación de problemas de comunicación. Para aliviar esta situación, el instituto ANSI (American National Standards Institute, Instituto Nacional Estadounidense de Estandarización) adoptó el código ASCII (American Standard Code for Information Interchange, Código estándar americano para el intercambio de

Cuestiones y ejercicios

1. ¿Qué ventaja obtenemos incrementando la velocidad de rotación de un disco o CD?

2. A la hora de grabar datos en un sistema de almacenamiento de múltiples discos, ¿debemos rellenar completamente la superficie de un disco antes de comenzar en otra superficie, o debemos rellenar un cilindro com- pleto antes de empezar con el siguiente?

3. ¿Por qué deberíamos almacenar los datos en un sistema de reservas de vuelos que está siendo actualizado constantemente en un disco magné- tico y no en un CD o DVD?

4. En ocasiones, al modificar un documento con un procesador de textos, el añadir más texto no incrementa el tamaño aparente del archivo en el dispositivo de almacenamiento masivo, mientras que en otras ocasiones la adición de un solo símbolo puede incrementar el tamaño aparente del archivo en varios cientos de bytes. ¿Por qué?

5. ¿Qué ventajas tienen las unidades flash con respecto a otros sistemas de almacenamiento masivo presentados en esta sección?

43

1.4 Representación de la información mediante patrones de bits información). Este código utiliza patrones de siete bits para representar las

letras mayúsculas y minúsculas del alfabeto inglés, además de los signos de puntuación, los dígitos 0 a 9 y cierta información de control, como por ejemplo las indicaciones de avance de línea, retorno de carro y tabulación. ASCII puede ampliarse a un formato de ocho bits por símbolo, añadiendo un 0 en el extremo más significativo de cada uno de los patrones de siete bits. Esta técnica no solo permite obtener un código en el que cada patrón encaja convenientemente en las celdas típicas de memoria, con un tamaño igual a un byte, sino que también proporciona 128 patrones de bits adicionales (los que se obtienen asignando al bit extra el valor 1), dichos patrones adicionales pueden utilizarse para repre- sentar símbolos no contenidos en el alfabeto inglés y en su conjunto de signos de puntuación asociado.

En el Apéndice A se presenta una parte del código ASCII en su formato de ocho bits por símbolo. Consultando dicho apéndice, podemos ver que el patrón de bits

01001000 01100101 01101100 01101100 01101111 00101110

representa el mensaje “Hello.” , como se ilustra en la Figura 1.13.

La Organización Internacional de Estandarización (International Organization for Standardization), también denominada ISO (en referencia a la palabra griega isos, que significa igual) ha desarrollado un serie de exten- siones del código ASCII, cada una de las cuales se diseñó para satisfacer las necesidades de cada uno de los grupos de lenguajes existentes. Por ejemplo, uno de los estándares proporciona los símbolos necesarios para escribir texto en la mayoría de los idiomas hablados en Europa occidental. Entre sus 128 patrones adicionales se encuentran los símbolos correspondientes a la libra inglesa, a las vocales alemanas ä, ö y ü y a las vocales acentuadas del español. Los estándares ASCII ampliados definidos por ISO representaron un gran avance a la hora de permitir comunicaciones multilingües a nivel mundial. Sin embargo, pronto aparecieron dos obstáculos importantes. En primer lugar, el número de patrones de bits adicionales disponibles en el código ASCII ampliado es simplemente insuficiente para representar el alfabeto de muchos idiomas asiáticos y de algunos del este de Europa. En segundo lugar, puesto que cada documento estaba restringido a utilizar símbolos en uno solo de los estándares seleccionados, no podían emplearse documentos que contuvieran textos pertenecientes a grupos de idiomas distintos. Ambos obstáculos resulta- ron ser bastante más graves de lo previsto a la hora de permitir el uso interna- cional de la tecnología de computadoras. Para resolver estos problemas, se desarrolló el código Unicode mediante la cooperación de varios de los princi- pales fabricantes de hardware y software; dicho código ha obtenido rápida- mente el respaldo del sector informático. Este código utiliza un patrón distintivo de 16 bits para representar cada símbolo. Como resultado, Unicode

01001000 H 01101100 I 01101100 I 01101111 o 00101110 . 01100101 e

está compuesto por 65.536 patrones de bits diferentes, lo cual es suficiente para poder escribir textos en idiomas como el chino, el japonés y el hebreo.

Un archivo compuesto por una larga secuencia de símbolos codificados mediante ASCII o Unicode suele denominarse archivo de texto. Es impor- tante distinguir entre los archivos de texto simples que son manipulados mediante programas de utilidad denominados editores de textos (o simple- mente editores), y los archivos más elaborados generados por procesadores de textos tales como Microsoft Word. Ambos están compuestos por texto; sin embargo, un archivo de texto contiene únicamente una codificación carácter a carácter del texto, mientras que un archivo generado por un procesador de tex- tos contiene numerosos códigos propietarios que representan cambios en los tipos de fuente, información acerca de la alineación, etc.