Otras operaciones - Biblioteca de números grandes en C++

Otras operaciones desarrolladas son:

• Desplazamiento aritmético. Varios algoritmos de los presentados hacen uso del desplazamiento aritmético y es también una operación muy utilizada por mejorar la velocidad de ejecución de multiplicaciones y divisiones cuando se hacen con potencias de 2. Las rotaciones no están implementadas.

• Operadores de bits y máscaras. En una implementación completa de los operadores de enteros de C++ no pueden faltar las operaciones lógicas “o”, “y”, “o exclusivo” y “negación” aplicadas sobre bits. Para facilitar la creación de máscaras y, sobre todo, su uso eficiente se han añadido tres operaciones para consultar/establecer el contenido de un bit indicando su posición y para establecer el contenido de un intervalo de bits (get bit,set bityset range).

• Exponenciación. El algoritmo rápido de conversión a decimal requiere el cálculo de potencias de 10. Como no pod´ıa ser de otra manera, he usado la exponenciación binaria[23]. También existe un método para exponenciación en módulo.

• Conversión de tipos. Es de tres tipos: de entero básico a número grande y viceversa, y de número grande de un tamaño a número grande de otro. Cuando se asigna un número negativo a un número grande se hace extensión de signo para facilitar una futura implementación de números grandes con signo. Además es posible designar el valor de un número grande mediante una cadena de texto en las bases 2, 8, 10 y 16.

4. Pruebas y resultados

He hecho pruebas para verificar la corrección de los resultados comparando con la biblioteca GMP. Aparte de eso he hecho comparaciones de velocidad de ejecución con las bibliotecas GMP y TTMath.

La ejecución se ha hecho en un procesador de la arquitecturax86-64, modelo AMD64 Phenom II X6 1050T de 6 núcleos, aunque todas las pruebas funcionaron en un solo hilo. Cada núcleo tiene 64 KB de caché de instrucciones y 64 KB de datos en el nivel 1 y 512 KB en el nivel 2. Hay una caché de 6 MB compartida por todos los núcleos. La velocidad de reloj era de 2200 MHz.

En las siguientes tablas se muestran los resultados. En la columna izquierda están los tamaños de los operandos usados; en las restantes aparece el número de operaciones por segundo alcanzadas.

Sumas por segundo

Tama˜no gueb::big uint GMP TTMath 100 225432958 53330023 214277952 150 199155263 54792458 198740652 200 156554969 55824660 168572022 500 84318126 45609549 68353433 1000 33714132 34773819 29222259 2000 19397550 25188555 16791500 5000 8673320 12136349 7963292 10000 4506755 7750147 4392646 20000 2281162 3388096 2229634 50000 929014 1607045 916195 100000 466228 772899 362699 200000 229000 172851 171036 500000 85847 61485 57555 1000000 24858 9369 20409 2000000 10398 3833 8392

Desplazamientos aritm´eticos por segundo (31 bits a la izquierda)

Tama˜no gueb::big uint GMP TTMath 100 387631019 54596580 102139294 150 166483149 57057018 81172871 200 142551414 46757756 64764644 500 72155200 41345836 32232417 1000 33634088 30180593 5751876 2000 14245156 20887754 3270858 5000 6438706 9398081 1193211 10000 3360638 5183557 603582 20000 1721137 2771050 303377 50000 695328 1100436 137516 100000 325404 552342 71014 200000 167993 161930 35701 500000 66639 64067 13735 1000000 25171 8572 6537 2000000 13658 4211 2958

Multiplicaciones por segundo

Tama˜no gueb::big uint GMP TTMath 100 149375869 42877781 55063486 150 72441238 42933961 42855983 200 33191837 20742200 24826570 500 9660468 8871847 2192890 1000 2292563 2931087 638847 2000 524808 936794 184753 5000 93875 201664 27112 10000 30939 65988 8894 20000 10043 23241 2956 50000 2040 6425 745 100000 675 2409 246 200000 219 905 81 500000 51 271 24 1000000 17 111 8 2000000 5 53 2

Divisiones por segundo (el divisor tiene la mitad de bits)

Tama˜no gueb::big uint GMP TTMath 100: 2373963 12651306 223478978 150: 2148652 12641366 22649528 200: 1903429 9721190 2787253 500: 507155 4699269 1112222 1000: 187525 2624545 349989 2000: 63687 1362301 142015 5000: 13646 370517 34393 10000: 4015 115700 8098 20000: 1120 36117 2673 50000: 187 7941 406 100000: 48 2646 101 200000: 10 932 22 500000: ∼1 269 ∼2 1000000: <1 108 <1 2000000: <1 46 <1

Se puede ver como en las operaciones sencillas como la suma y el desplazamiento aritmético es factible alcanzar la rapidez de una biblioteca de alto nivel como GMP. En tamaños pequeños el uso de tamaño fijo permite al compilador convertir datos variables en constantes y, con ello, desenrollar bucles, intercalar el código de los procedimientos en vez de llamarlos y mantener los datos de trabajo en registros sin necesidad de acceder a la memoria. Todo esto repercute en un mayor rendimiento. También se ve como a partir del tamaño∼1000 esta ventaja desaparece, yGMP es superior. Probablemente se deba a que la biblioteca GMP dispone de código con bucles desenrollados mientras que el compilador no realiza esta tarea automáticamente con tamaños grandes. Finalmente, cuando el tamaño pasa a ser mayor de ∼100000 bits el rendimiento de GMP vuelve a decaer, lo que puede ser achacable al desbordamiento de la memoria caché de nivel 1. El código de prueba que usan TTMath ygueb::big uint es tal que as´ı:

for ( u i n t 6 4 _ t i = 0; i < i t e r a c i o n e s ; i ++) c = a + b ;

Mientras que paraGMP es as´ı:

for ( u i n t 6 4 _ t i = 0; i < i t e r a c i o n e s ; i ++) m p z _ a d d ( c , a , b );

La variable de destino en el primer caso es siempre la misma, y su memoria asignada, por tanto, también. ParaGMP la variable de destino se crea en memoria dinámica y la memoria de esta variable podr´ıa ser distinta en dos llamadas consecutivas, sobre todo si se libera la memoria del contenido anterior antes de asignar el nuevo. Esto provocar´ıa que GMP estuviera usando la memoria correspondiente a 4 ó más variables, mientras que las versiones de memoria estática usan 3. El l´ımite para contener 3 variables en 64 KB de caché ser´ıan 65536/3∗8∼174762 bits, pero para 4 ser´ıan 65536/4∗8 = 131072. De esta forma GMP comenzar´ıa a tener fallos de caché al llegar a ese l´ımite, y con variables de 200000 bits tendr´ıa muchos mas fallos que las otras dos bibliotecas.

En el caso de las multiplicaciones sucede lo mismo para tamaños pequeños, sin em- bargo al aumentar la disparidad es bastante grande. La biblioteca GMP usa métodos distintos para multiplicar según las dimensiones de los operandos, como los algoritmos de Karatsuba[20], Toom-Cook[24] o Schönhage-Strassen [8], mientras que TTMath y gueb::big uint solo usan Karatsuba.

Por último, la división de gueb::big uint está a mucha distancia de tener un rendimiento aceptable.

5. Conclusiones y l´ıneas futuras

¿En qu´e medida se han logrado los objetivos?

- Facilidad de uso. Gracias a la conversión automática desde y hacia tipos básicos y la sobrecarga de operadores la interfaz es casi idéntica a la de los tipos básicos. Al estar compuesta la biblioteca únicamente de ficheros de cabeceras se puede integrar en otros proyectos con sencillez, tan solo copiando los ficheros.

- Rapidez. Conocer de antemano el tamaño de los números permite al compilador lograr mayor velocidad con números de hasta algo menos de 1000 bits, a partir de lo cual el tamaño dinámico comienza a ganar ventaja.

En general, las operaciones son considerablemente rápidas, pero la implementación de la división es varios órdenes de magnitud más lenta que la implementación que uso de referencia (la biblioteca GMP), y requiere más trabajo para mejorar. - Se puede implementar un tipo de datos de números en coma fija o coma flotante

con bastante facilidad basándose en esta biblioteca. La estructura compacta en memoria posibilita, por ejemplo, implementar números en coma flotante que sigan el estándar IEEE-754.

La biblioteca se puede mejorar o ampliar por las siguientes v´ıas:

• División por “divide y vencerás”. La división larga en bloques se basa en el uso de una instrucción de división entera mediante hardware, pues es de suponer que ésta sea bastante rápida. ¿Qué ocurre si no hay tal instrucción? ¿Es más rápido el método clásico o una emulación de la división entera usando registros como operandos puede ser de ayuda en la división larga en bloques? Llevando este concepto al extremo, ¿podemos basar la división de números deN bits en la suposición de que ya disponemos de una división de números de N₂ bits y usarla con la división larga mejorada? ¿Podemos implementar la divisi´on de números de N₂ bits mediante una división de números de N₄ bits? De aqu´ı surge otro método de división de números grandes, aplicando el famoso paradigma de diseño “divide y vencerás”. • Cuadrado más eficiente. Si representásemos los productos parciales de las cifras de

una multiplicación en una tabla comprobar´ıamos que cuando los dos factores de la multiplicación son iguales la tabla tiene el aspecto de una matriz simétrica. Como casi la mitad de estos cálculos están repetidos pueden ahorrarse y aumentar la velocidad del cálculo del cuadrado de un número, lo que beneficiará a la operación de exponenciación que se basa en el mismo.

• Multiplicaciones de Toom-Cook y Schönhage-Strassen. La multiplicación de Toom- Cook[24] es una generalización del algoritmo de Karatsuba que funciona partiendo los factores en fragmentos de igual tamaño, tipicamente 3 ó más, que son opera- dos recursivamente de forma que se evitan varias multiplicaciones originalmente necesarias. Debido a su sobrecoste en otras operaciones, no resulta práctico con

números relativamente pequeños, para los que la multiplicación clásica o la de Ka- ratsuba son más rápidas. Cuando se llega a un cierto l´ımite, aumentar el número de fragmentos resulta contraproducente y comienza a ser viable otro algoritmo: Schönhage-Strassen[8].

El algoritmo de Schönhage-Strassen concibe la multiplicación clásica de enteros como un producto de convolución[25] y, como tal, se puede calcular transformando el dominio del problema mediante una transformada de Fourier[26], que posibilita calcular la convolución con menos operaciones. Posteriormente hay que hacer la transformación inversa.

• Enteros con signo. Las operaciones de resta y opuesto de un número operan en complemento a 2, lo que facilita el paso a manejar enteros con signo. Las operaciones de multiplicación y división requerir´ıan una implementación distinta, aunque si tenemos en cuenta su, comparativamente, lenta velocidad de ejecución, un par de cambios de signo antes de operar no tendr´ıa un impacto demasiado apreciable en el rendimiento total, haciendo evitable reimplementar estas operaciones. • Tamaño variable. Para tamaños relativamente pequeños (128-1024 bits...) el cono-

cimientoa priori del tamaño del número resulta muy ventajoso para el compilador, pues puede propagar los valores conocidos de estos datos y preparar versiones más rápidas del código para esos tamaños, al ahorrar cálculos durante la ejecución. Cuando el tamaño crece más se hacen patentes otros problemas como el desper- dicio de memoria y de tiempo de procesador en números de mucho tamaño que pueden contener temporalmente valores pequeños. La parte alta de estos números contiene ceros que hay que almacenar y actualizar en cada operación aritmética. Aparte de las ventajas y desventajas explicadas antes, los procesadores operan con palabras de tamaño fijo por una razón: simplicidad. Pero una vez que necesitamos superar esos tamaños, y no teniendo instrucciones nativas para operar con tamaños mayores y fijos, ¿seguimos necesitando que sean fijos?

Referencias

[1] Arbitrary-precision arithmetic: Applications. _url: https://en.wikipedia.org/

wiki/Arbitrary-precision_arithmetic#Applications(visitado 27-08-2017).

[2] Jonathan M. Borwein David H. Bailey.High-Precision Arithmetic in Mathematical Physics. _url: http : / / www . mdpi . com / 2227 - 7390 / 3 / 2 / 337 / pdf (visitado 27-08-2017).

[3] Not invented here. _url:https://en.wikipedia.org/wiki/Not_invented_here (visitado 12-06-2018).

[4] List of arbitrary-precision arithmetic software. _url: https : / / en . wikipedia .

org / wiki / List _ of _ arbitrary - precision _ arithmetic _ software (visitado

20-08-2017).

[5] Boost (C++ libraries). _url: https://en.wikipedia.org/wiki/Boost_(C%2B%

2B_libraries)(visitado 20-08-2017).

[6] Christian Kaiser Tomasz Sowa. Frequency asked questions about TTMath. _url:

http://www.ttmath.org/faq(visitado 20-08-2017).

[7] GNU Multiple Precision Arithmetic Library. _url: https://en.wikipedia.org/

wiki/GNU_Multiple_Precision_Arithmetic_Library(visitado 20-08-2017).

[8] Sch¨onhage–Strassen algorithm._url:https://en.wikipedia.org/wiki/Sch%C3%

B6nhage%E2%80%93Strassen_algorithm(visitado 20-08-2017).

[9] Divide and Conquer Division. _url:https://gmplib.org/manual/Divide-and-

Conquer-Division.html(visitado 20-08-2017).

[10] Class Library for Numbers. _url: https : / / en . wikipedia . org / wiki / Class _

Library_for_Numbers(visitado 20-08-2017).

[11] David H. Bailey y col.High-Precision Software Directory._url:http://crd.lbl.

gov/~dhbailey/mpdist/arprec-2.2.19.tar.gz(visitado 13-08-2017).

[12] Michael C. Ring.url:https://github.com/LuaDist/mapm/raw/master/m_apm. h(visitado 20-08-2017).

[13] MPIR (mathematics software). _url: https://en.wikipedia.org/wiki/MPIR_

(mathematics_software)(visitado 20-08-2017).

[14] Libgcrypt._url:https://en.wikipedia.org/wiki/Libgcrypt(visitado 12-05-2018). [15] Status of Supported Architectures from Maintainers’ Point of View._url:https:

//gcc.gnu.org/backends.html(visitado 24-08-2017).

[16] Middle-endian. _url: https://en.wikipedia.org/wiki/Endianness#Middle-

endian(visitado 25-08-2017).

[17] Stream buﬀers. _url: https://en.wikipedia.org/wiki/Cache_prefetching#

Stream_buffers(visitado 26-08-2017).

[19] c++11 - Is signed integer overﬂow still undeﬁned behaviour in C++? _url:https: //stackoverflow.com/questions/16188263/is- signed- integer- overflow-

still-undefined-behavior-in-c(visitado 04-07-2018).

[20] Karatsuba algorithm. _url: https : / / en . wikipedia . org / wiki / Karatsuba _

algorithm(visitado 29-05-2018).

[21] Divisi´on larga. _url: https://es.wikipedia.org/wiki/Divisi%C3%B3n_larga (visitado 29-05-2018).

[22] Integer division with remainder. _url: https : / / en . wikipedia . org / wiki /

Division _ algorithm # Integer _ division _ (unsigned ) _with _ remainder (vi-

sitado 29-05-2018).

[23] Exponenciaci´on binaria._url:https://es.wikipedia.org/wiki/Exponenciaci%

C3%B3n_binaria(visitado 03-07-2018).

[24] Toom-Cook multiplication._url:https://en.wikipedia.org/wiki/Toom%E2%80%

93Cook_multiplication (visitado 06-07-2018).

[25] Convoluci´on._url:https://es.wikipedia.org/wiki/Convoluci%C3%B3n (visitado 06-07-2018).

[26] Transformada r´apida de Fourier. _url: https : / / es . wikipedia . org / wiki /

In document Biblioteca de números grandes en C++ (página 31-39)