Preliminares Matemáticos II

(1)

Preliminares Matem´

aticos

Universidad Antonio Nari˜

no

2 Aritm´

etica de una computadora

En nuestro mundo matemático tradicional permitimos la exitencia de números con una cantidad infinita de cifras, por ejemplo √3, sin embargo en las com-putadoras es imposible manejar una cantidad de información infinita. Más aún el resultado de multiplicar dos números con cuatro cifras decimales es en general un número con ocho cifras decimales, si tenemos que efectuar varias multiplica-ciones sucesivas es imposible manejar una cantidad siempre creciente de cifras decimales.

El computador sólo utiliza números con una cantidad finita de cifras, de modo que los cálculos se realizan unicamente con respresentaciones aproximadas de los números verdaderos. En una computadora común, solo se usa un subcon-junto relativamente pequeño del sistema de números reales para representarlos a todos. Este subconjunto contiene sólo algunos números racionales. Aunque los errores individuales debidos a esta causa sean pequeños, su efecto acumulativo puede en un gran número de operaciones crecer rapidamente, y debemos tener en cuenta que actualmente las operaciones aritméticas, especialmente cuando son muchas, las deben realizar computadoras. Antes de estudiar las causas del error con algo de profundidad empezaremos por conocer otro sistema numérico, común en los computadores actuales: el sistema numérico en base dos (desde luego, esto no impide que la comunicación con el computador se haga en base 10, con la cual estamos familiarizados: ¡el computador debe traducirnos su re-spuesta!). Luego explorararemos el mundo de la aritmética con un número finito de cifras.

2.1 N´

umeraci´

on binaria

El n´umero 5307 se puede descomponer en potencias de diez as´ı:

5·103+ 3·102+ 0·101+ 7·100

Siguiendo con el mismo razonamiento, podemos definir una numeración binaria o en base 2. As´ı, el número 10110 escrito en base 2 o binaria equivale al siguiente número en base 10 o decimal:

(2)

Cuando hay lugar a confusión se acostumbra escribir el número de la base como sub´ındice del número.

Podemos utilizar facilmente un algoritmo eficiente para hallar una representaci´on en base 2 de cualquier n´umero natural m. En efecto sim=b0·20+b1·21+b2·

22+. . .+bn·2n, entonces

m 2 =

b0

2 +b1·2 0₊_b

2·21+b3·22+. . .+bn·2n−1

| {z }

R0

= b0 2 +R0

luegom= 2R0+b0, es decir queb0 es el resto de divivirmentre 2 yR0 es el cociente.

De igual manera:

R0 2 =

b1

2 +b2·2 0₊_b

3·21+b4·22+. . .+bn·2n−2

| {z }

R1

entoncesR0= 2R1+b1 donde b1 es el resto de la divisi´on deR0 entre 2 yR1 es el cociente.

Si continuamos este proceso encontraremos todos losbk, 0≤k≤n.

Ejercicio resuelto 1.

Obtener, mediante el proceso indicado arriba, la representaci´on binaria del n´umero 1867

m= 1867 = 2·933 + 1 b0= 1

R0= 933 = 2·466 + 1 b1= 1

R1= 466 = 2·233 + 0 b2= 0

R2= 233 = 2·116 + 1 b3= 1

R3= 116 = 2·58 + 0 b4= 0

R4= 58 = 2·29 + 0 b5= 0

R5= 29 = 2·14 + 1 b6= 1

R6= 14 = 2·7 + 0 b7= 0

R7= 7 = 2·3 + 1 b8= 1

R8= 3 = 2·1 + 1 b9= 1

R9= 1 = 2·0 + 1 b10= 1

R10= 0

Entonces (1867)10= (11101001011)2

(3)

1. Escriba (11001101)2 en base decimal

2. Obtener la representaci´on binaria del n´umero 5709

2.2 Fracciones binarias

El n´umero 25.43 se puede descomponer en potencias de 10 as´ı:

(25.43)10= 2·101+ 5·100+ 4·10−1+ 3·10−2

Si sabemos representar los reales del intervalo (0,1) en el sistema binario, pode-mos entonces, inmediatamente, tener la repreentación en base 2 de cualquier número real. As´ı por ejemplo el número 0.11 en base 2 equivale al siguiente número en base 10.

1·2−1+ 1·2−2= 0.5 + 0.25 = 0.75

entonces, de acuerdo con el ejercicio resuelto 2.1.1 , tendremos (1867.75)10 = (11101001011.11)2.

Un eficiente algoritmo para pasar una fracci´on decimal a la correspondiente fracci´on binaria es el siguiente:

Seax∈(0,1),x=c1·2−1₊_c2_·₂−2₊_c3_·₂−3₊_{. . .}₊_c

n·2−n

entonces

2x=c1+c2·2−1+c3·2−2+. . .+cn·2−n+1

| {z }

F1

Notese queF1∈(0,1), entoncesc1 es la parte entera de 2x, es decir: c1= [2x] yF1 es su parte fraccionaria.

2F1=c2+c3·2−1+. . .+cn·2−n+2

| {z }

F2

entoncesc2= [2F1]

Continuando con este proceso encontramos todos losck, 1≤k≤n

Escriba el n´umero decimalx= 0.6 como una fracci´on binaria.

2x= 1.2 c1= 1 F1= 0.2 2F1= 0.4 c2= 0 F2= 0.4 2F2= 0.8 c3= 0 F3= 0.8 2F3= 1.6 c4= 1 F4= 0.6 2F4= 1.2 c5= 1 F5= 0.2 2F5= 0.4 c6= 0 F6= 0.4

..

(4)

Es evidente que a partir dec4 se repiten los siguientes cuatro valores: c5=c1, c6=c2, . . . , es decir que la trepresentaci´on binaria de xresulta peri´odica:

(0.6)10= (0.1001)2

En muchos casos la representación binaria requiere de un número infinito de cifras, aunque su correspondiente representación decimal no lo requiera. Si deseamos volver a la base 10, basta observar que:

x= 0.1001

= 2−1+ 2−4+ 2−5+ 2−8+ 2−9+ 2−12+. . .

= 2−1

∞

X

k=0 2−4k+

∞

X

k=1 2−4k

= (2−1+ 1)

∞

X

k=0

2−4k−1

=3 2

₁

1−2−4

−1

=3 5 = 0.6

Ejercicios

3. Escriba el n´umero decimalx= 0.8 como una fracci´on binaria.

4. Escriba (0.110)2 en base decimal

2.3 N´

umeros de m´

aquina

Cada n´umero real x puede ser representado en un sistema num´erico de base B∈_Z+_{, en la forma:}

x=±0.a1a2a3. . .·BL

Esta representaci´on se llama de punto flotante de x para la baseB. L se llama exponente ´o caracter´ıstica y la cadenaa1a2a3. . . se llama mantisa.

Six6= 0, a través de cambios en el exponenteL puede lograrse siempre que la primera cifra de la mantisa no sea cero; as´ı por ejemplo, 0.0001·BL = 0.1·BL−3. De esta manera se obtiene una representación de punto flotante normalizada. Una representación en forma de punto flotante normalizada del número π = 3.14159265. . .para la base 10 es: 0.314159265. . .·101

La representación interna de números doble precisión, norma IEEE utiliza 64 bits:

(5)

2. Le sigue un exponente de 11 bits, c

3. y una mantisa de 52 bits,f

La base para el exponente es 2. Como 52 d´ıgitos binarios corresponden a entre 16 y 17 d´ıgitos decimales, podemos suponer que un número representado en este sistema tiene al menos 16 cifras decimales de precisión. El exponente de 11 d´ıgitos binarios proporciona un intervalo de 0 a 211₋_{1 = 2047. Sin embargo} el uso exclusivo de enteros positivos para el exponente no permitir´ıa una repre-sentación adecuada de los números con magnitud pequeña. Para garantizar que estos números también sean representables, se resta 1023 de la caracter´ıstica, de modo que el intervalo del exponente es en realidad de -1023 a 1024: 2c−1023_.

Supongamos que, en lugar de punto flotante binario, tenemos punto flotante decimal con k cifras signicativas. El truncamiento se obtiene al suprimir de la mantisa las cifrask+ 1, k+ 2, . . ., dejando unicamente las primeras k cifras signicativas. El redondeo se obtiene sumando a la mantisa 0.5·10−ky en seguida se truncankcifras significativas.

Por ejemplo, consideremose= 2.718281828459. . .= 0.2718281828459. . .·101 . Al truncar a 5 cifras signicativas se obtiene ˜e= 0.27182·101 . Para redondear, 0.2718281828459. . .+ 0.000005 = 0.2718331828459. . .y al truncar se obtiene el valor redondeado ˆe= 0.27183·101_.

Definici´on 2.3.1 (error relativo y absoluto) Si p∗ e una aproximaci´on de p, el error absoluto es|p−p∗| y el error relativo es |p−_|_pp_|∗|, siempre quep6= 0.

Uno de los cálculos más comunes que producen errores tiene que ver con la cancelación de cifras significativa debido a la resta de números casi iguales:

Seanp= 0.54617 yq = 0.54601. Calcularp−q con una aritm´etica de cuatro cifras. Determinar el error relativo

El valor exacto de r = p−q es r = 0.00016. Al redondear p y q a cuatro cifras, tenemosp∗= 0.5462 yq∗= 0.5460, entonces r∗=p∗−q∗= 0.0002 es la aproximaci´on de cuatro cifras der. Como

|r−r∗| |r| =

|0.00016−0.0002|

0.00016 = 0.25

el resultado s´olo tiene una cifra significativa, en tanto que la precisi´on para p∗ yq∗ fue de cuatro y cinco cifras significativas, respectivamente.

Si se usa el truncamiento para obtener las cuatro ciras, las aproximaciones de cuatro cifras dep,q yr sonp∗ _{= 0.5461} _q∗ _{= 0.5460 y}_r∗ _{= 0.0001. Con esto}

se obtiene

|r−r∗| |r| =

|0.00016−0.0001|

(6)

lo que también produce sólo una cifra de precisión

Si una representación con un número finito de cifras o un cálculo introduce un error, éste aumenta al dividir entre un número con magnitud pequeña.

Ejercicios

5. Evaluef(x) =x3₋_6.1x2_{+ 3.2x}_{+ 1.5 en} _x_{= 4.71 con una aritm´}_{etica de} tres cifras. Determine el error absoluto y el error relativo

6. Utilice la fórmula cuadratica para hallar las ra´ıces de la ecuación x2+ 62.10x+ 1 con aritmética de redondeo a cuatro cifras. Determine el error relativo

Definición 2.3.2 (números de máquina) El conjunto M de los números

de la forma de punto flotante normalizada, que pueden ser representados en un computador, se llama conjuntos de n´umeros de m´aquina. M depende de

la base B, de la longitud de la mantisa M, y del rango para el exponente L∈ {−k,−k+ 1, . . . , K−1, K}, siendok, K∈Z+. Explicitamente,

M=M(B.M,−k, K)

={0} ∪ {0.a1a2a3. . . aM ·BL:a1, a2, . . . , aM ∈ {0,1,2, . . . , B−1}, a16= 0

L∈ {−k,−k+ 1, . . . , K−1, K}}

Mantilla

El computador sólo puede calcular con números de _M y sólo puede arrojar números de_M. Ésta es de entrada una gran limitación y una enorme fuente de errores.

Construir explicitamente la m´aquina correspondiente a_M(2,2,−2,2)

Teniendo en cuenta la definici´on anterior,

M={0} ∪ {±0.1a·2L:a∈ {0,1}, L∈ {−2,−1,0,1,2}}

El menor n´umero positivo de_M(2,2,−2,2) es

xmin = 0.102·10−2= (1·2−1+ 0·2−2)·2−2= 1 8 y el mayor n´umero positivo de la m´aquina es

xmax= 0.112·22= (1·2−1+ 1·2−2)·22= 3

(7)

M+={ 1 8,

3 16,

1 4,

3 8,

1 2,

3 4,1,

3 2,2,3}

contiene todos los números positivos deM escritos en forma ascendente. Como se observa su distribución en la recta real no es uniforme, cerca al origen hay mayor densidad y los números mayores que 3 no pueden ser dominados por esta “mini2-máquina”. Si en algún proceso de cálculo se sobrepasa este valor máximo xmax, se produce un error conocido con el nombre de overflow y el

proceso se detiene. Los números realesx: 1₈ < x <3 que no pertenecen aM+ se aproximan al siguiente número (a la derecha) de máquina más cercano. Por ejemplo, 2.6 −→3. De igual manera los números negativos entre -3 y −1

8 que no estan en la m´aquina se aproximan al anterior n´umero (a la izquierda) de M: −0.7→ −0.75 = −3

4 . Los n´umeros reales que se encuentran en el intervalo (−1

8 , 1

8) son reemplazados por cero, por ejemplo 0.12 → 0, pero la m´aquina no detiene el proceso de c´alculo cuando hace estos “arrastres”. En este caso hablamos de underflow.(Mantilla)

Ejercicios

SeaM=M(2,3,−3,4)

7. Construya explicitamente la m´aquina correspondiente

8. Identifique elxmin y elxmaxde la m´aquina

9. Determine el intervalo de n´umeros reales que es reemplazado por cero

10. Determine el subconjunto de n´umeros reales para el cual se produce over-flow

11. ¿el número real 2.6 es aproximado a qué número de la máquina?

(8)

3 Bibliograf´ıa

Mantilla Ignacio, An´alisis Num´erico, Universidad Nacional de Colombia