En investigaciones anteriores hemos trabajado en torno a mejorar la eficiencia del FixedQueriesTrie (FQTrie) [1], un ´ındice basado en pivotes. En [4] se presenta un m´etodo de discretizaci´on, basado en los histogramas de distancias de los pivotes, que logra una implementaci´on eficiente del FQTrie no s´olo en t´erminos de cantidad de evaluaciones de distancia de la funci´on d, sino tambi´en en tiempo extra de CPU. En [6] se desarrolla una t´ecnica de paginado que permite reducir el tiempo de I/O, que se basa en la idea de particionar la base de datos y agrupar en cada parte elementos similares.
descartados se comparan directamente con q para determinar si forman o no parte de la respuesta. La familia de estructuras FQ (FQT [2], FHQT [2, 1], FQA [6], FQTrie [5]) forman parte de las estructuras basadas en pivotes; cada una de ellas fue presentada como una mejora de la anterior, siendo el FQTrie (FixedQueriesTrie) el de mejor desempe˜no. Por esta raz´on, en este trabajo nos enfocamos sobre FixedQueriesTrie (FQTrie) [5]. La eficiencia de este ´ındice depende no s´olo de la calidad de los pivotes seleccionados sino tambi´en de la funci´on de discretizaci´on utilizada. Una buena funci´on de discretizaci´on junto con la t´ecnica de Tablas Lookup permiten que el FQTrie sea eficiente no s´olo en t´erminos de cantidad de evaluaciones de distancia sino tambi´en en tiempo extra de CPU.
En este art´ıculo presentamos una implementaci´on del FixedQueriesTrie (FQtrie) que permite manejar espacios m´etricos cuyo ´ındice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria se- cundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una b´usqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo.
descartados se comparan directamente con q para determinar si forman o no parte de la respuesta. La familia de estructuras FQ (FQT [2], FHQT [2, 1], FQA [4], FQTrie [3]) forman parte de las estructuras basadas en pivotes; cada una de ellas fue presentada como una mejora de la anterior. Por esto, el punto de partida de este trabajo es el FixedQueriesTrie (FQTrie) [3]. El objetivo es lograr una implementaci´on eficiente no s´olo en t´erminos de cantidad de evaluaciones de la funci´on de distancia d, sino tambi´en en tiempo extra de CPU. Utilizamos la t´ecnica de Tablas Lookup en la implementaci´on, concentr´andonos en la definici´on de buenas funciones de discretizaci´on.
These characteristics make Genetic Algorithms (GAs) good candidates to tackle the problem of finding high-quality queries. This paper describes a framework based on GAs that addresses the problem of reflecting topical information when formulating search queries. The framework, discussed in detail in [5], takes an incremental approach to evolve high-quality queries for retrieving context-relevant textual resources (such as html pages, pdf files, Word files, etc.). It starts by generating an initial population of queries using terms extracted from a thematic context and incrementally evolves those queries based on their ability to retrieve relevant results when presented to a search engine. The contribution of this paper is a study of the effect that different mutation rates have on search results’ diversity and quality.
The approach of modeling problems using a geometric formulation is well- known. There are many classical representations that support the queries re- quired by the model and solve them efficiently. Range trees [4] and kd-trees [5] are two paradigmatic examples. Some of these classical data structures are even optimal both in query time and space. However, such classical rep- resentations usually do not take advantage of the distribution of the data in order to reduce the space requirements. When dealing with massive data, which is the case of some of the aforementioned data mining applications, the use of space-efficient data structures can make the difference between main- taining the data in main memory or having to resort to (orders of magnitude slower) external memory.
Con respecto a la aproximación en este trabajo se abordaron los aspectos esenciales para la obtención de las funciones de forma como lo son: la discretización del dominio en puntos, la g[r]
Se presenta en esta comunicación el tratamiento de problemas de potencial en sistemas bidimensionales, haciendo uso de la discretización de su contorno o fro..!:_l[r]
Las ideas expuestas en la primera parte de este trabajo4 para introducir una nueva categoría de estimadores del error de discretización en problemas de elasticidad, se han [r]
En la capa de negocio se usará el patrón de diseño VALUE LIST ITERATOR para la paginación; SESSION FAÇADE, para acceder al bean de entidad desde uno de sesión; VALUE OBJECT, para minimiz[r]
Desarrollos recientes para encajar dentro de un marco variacional la llamada Formulación Libre sugieren la posibilidad de introducir un nuevo tipo de estimador de error para cálculos[r]
Como futuros trabajos quedan pendientes generalizar resultados a DAG’s sin restricciones sobre los grados de entrada y/o salida, continuar con la problemática de optimización de queries, observando la computación paralela y la secuencial, y como un correlato la computación de queries en bases de datos distribuidas. También dada la pobre expresividad de FO, se pretende llevar estos desarrollos teóricos a lógicas con mayor poder expresivo, ya sea extendiendo FO con otros cuantificadores o tratando subconjuntos de lógicas de orden superior.
Received: 9 January 2019; Accepted: 29 March 2019; Published: 2 April 2019 Abstract: The interest in mobility data analysis has grown dramatically with the wide availability of devices that track the position of moving objects. Mobility analysis can be applied, for example, to analyze traffic flows. To support mobility analysis, trajectory data warehousing techniques can be used. Trajectory data warehouses typically include, as measures, segments of trajectories, linked to spatial and non-spatial contextual dimensions. This paper goes beyond this concept, by including, as measures, the trajectories of moving objects at any point in time. In this way, online analytical processing (OLAP) queries, typically including aggregation, can be combined with moving object queries, to express queries like “List the total number of trucks running at less than 2 km from each other more than 50% of its route in the province of Antwerp” in a concise and elegant way. Existing proposals for trajectory data warehouses do not support queries like this, since they are based on either the segmentation of the trajectories, or a pre-aggregation of measures. The solution presented here is implemented using MobilityDB, a moving object database that extends the PostgresSQL database with temporal data types, allowing seamless integration with relational spatial and non-spatial data. This integration leads to the concept of mobility data warehouses. This paper discusses modeling and querying mobility data warehouses, providing a comprehensive collection of queries implemented using PostgresSQL and PostGIS as database backend, extended with the libraries provided by MobilityDB.
En el presente trabajo se desarrolla una formulación integral para el problema de propagación de ondas en medios estratificados, esta formulación se denomina método indirecto de elementos de frontera (IBEM, por sus siglas en inglés) y consiste en la representación integral de ondas elásticas difractadas en términos de fuentes de frontera de capa simple. Para lograr lo anterior es necesario la discretización de la frontera de las diferentes capas propuestas y el planteamiento de las condiciones de frontera que prevalecen en ella, posteriormente se formula el sistema lineal de ecuaciones para obtener las soluciones en la frontera, una vez encontrada estas soluciones es posible determinar el campo de desplazamientos y presiones por medio de la superposición de las ondas generadas en la frontera. Este procedimiento se realiza para cada frecuencia y posteriormente se emplea la transformada discreta de Fourier (TDF) para observar el fenómeno de propagación de ondas en función del tiempo.
En el presente trabajo de investigación se trata sobre las Ecuaciones Diferenciales Parciales Elípticas y su solución por diferencias finitas que consiste en la discretización del proble[r]
Our antipattern detection methods follow a more general approach. They can work with an extensible set of antipatterns and some of them can be applied without the use of a reasoner. In general, our approach is based on the use of a set of SPARQL-DL queries for each antipattern to be detected. Then, each SPARQL-DL query is translated into SPARQL one. In our process, we can decide whether inferences are enabled or not before running any SPARQL queries, and we also offer the possibility of transforming the original ontologies into a form where SPARQL queries should retrieve more results.
The advantages derived from the use of character n-grams for text processing —simplicity, efficiency, robustness, completeness and independence of the domain— have converted treatment at n-gram level into a standard technique of the state of the art (Robertson and Willett, 1998; Vilares et al., 2011). These advantages have not gone unnoticed by the IR research community. Classic IR systems usually employ knowledge and linguistic resources such as lists of stopwords, stemmers, lexicons, thesauri, taggers and so on. However, tokenization in n-grams does not require any of these: queries and documents are merely tokenized in overlapping n-grams, being then processed by the retrieval engine like any other term. In this way, n-gram tokenization constitutes a language- and domain-independent approach (Leveling and Jones, 2010). Moreover, as shown by McNamee and Mayfield (2004b; 2004a) and Robertson and Willett (1998), the employment of n-grams matching is itself an inherent mechanism of standardization of terms that can work with a variety of languages without any additional processing.
A tree where the slices have fixed width avoids this last problem. Since the width is independent on the dimension of the space, the search will not enter more subtrees of a node as the dimension grows. However, a new consequence shows up when fixed slices are used: The subtrees corresponding to the slices containing the core of the distribution will have much more elements that the rest, ane therefore the tree will be more and more unbalanced as the dimensions grows.
El Fixed Height Queries Tree(FHQT), presentado en [1], pertenece al grupo de algo- ritmos basados en pivotes y b´asicamente es una variante del FixedQueries Tree (FQT) [2] en la que todas las hojas se encuentran a la misma altura. Originalmente estas estruc- turas fueron propuestas para funciones de distancias discretas, pero se pueden adaptar a distancias continuas discretizando los valores de las mismas [8].
El Directly Addressable Variable-Length Code (DAC), presentado en [1], es una t´ecnica que permite comprimir una secuencia de c´odigos de longitud variable permi- tiendo acceso aleatorio y eficiente a cada uno de ellos. Los autores muestran que esta t´ecnica logra reducciones de alrededor del 30 % en el espacio requerido para represen- tar la secuencia. Los c´odigos DAC pueden ser usados para los saltos, los r´otulos y los grados. Para el arreglo de sufijos A existen algoritmos espec´ıficos de compresi´on que lo- gran un muy buen desempe˜no en espacio [10]. Todas estas t´ecnicas permitir´ıan reducir a´un m´as el espacio requerido para representar el trie con rs, logrando una diferencia significativa en espacio respecto de rk.