PDF superior Paginación + discretización del fixed queries trie

Paginación + discretización del fixed queries trie

Paginación + discretización del fixed queries trie

En investigaciones anteriores hemos trabajado en torno a mejorar la eficiencia del Fixed Queries Trie (FQTrie) [1], un ´ındice basado en pivotes. En [4] se presenta un m´etodo de discretizaci´on, basado en los histogramas de distancias de los pivotes, que logra una implementaci´on eficiente del FQTrie no s´olo en t´erminos de cantidad de evaluaciones de distancia de la funci´on d, sino tambi´en en tiempo extra de CPU. En [6] se desarrolla una t´ecnica de paginado que permite reducir el tiempo de I/O, que se basa en la idea de particionar la base de datos y agrupar en cada parte elementos similares.
Mostrar más

12 Lee mas

Funciones de discretización para índices métricos basados en pivotes

Funciones de discretización para índices métricos basados en pivotes

descartados se comparan directamente con q para determinar si forman o no parte de la respuesta. La familia de estructuras FQ (FQT [2], FHQT [2, 1], FQA [6], FQTrie [5]) forman parte de las estructuras basadas en pivotes; cada una de ellas fue presentada como una mejora de la anterior, siendo el FQTrie (Fixed Queries Trie) el de mejor desempe˜no. Por esta raz´on, en este trabajo nos enfocamos sobre Fixed Queries Trie (FQTrie) [5]. La eficiencia de este ´ındice depende no s´olo de la calidad de los pivotes seleccionados sino tambi´en de la funci´on de discretizaci´on utilizada. Una buena funci´on de discretizaci´on junto con la t´ecnica de Tablas Lookup permiten que el FQTrie sea eficiente no s´olo en t´erminos de cantidad de evaluaciones de distancia sino tambi´en en tiempo extra de CPU.
Mostrar más

12 Lee mas

Métodos de paginación paraíndices métricos basados en pivotes

Métodos de paginación paraíndices métricos basados en pivotes

En este art´ıculo presentamos una implementaci´on del Fixed Queries Trie (FQtrie) que permite manejar espacios m´etricos cuyo ´ındice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria se- cundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una b´usqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo.

11 Lee mas

Discretización binaria para el FQTrie

Discretización binaria para el FQTrie

descartados se comparan directamente con q para determinar si forman o no parte de la respuesta. La familia de estructuras FQ (FQT [2], FHQT [2, 1], FQA [4], FQTrie [3]) forman parte de las estructuras basadas en pivotes; cada una de ellas fue presentada como una mejora de la anterior. Por esto, el punto de partida de este trabajo es el Fixed Queries Trie (FQTrie) [3]. El objetivo es lograr una implementaci´on eficiente no s´olo en t´erminos de cantidad de evaluaciones de la funci´on de distancia d, sino tambi´en en tiempo extra de CPU. Utilizamos la t´ecnica de Tablas Lookup en la implementaci´on, concentr´andonos en la definici´on de buenas funciones de discretizaci´on.
Mostrar más

12 Lee mas

Genetic algorithms for topical web search: A study of different mutation rates

Genetic algorithms for topical web search: A study of different mutation rates

These characteristics make Genetic Algorithms (GAs) good candidates to tackle the problem of finding high-quality queries. This paper describes a framework based on GAs that addresses the problem of reflecting topical information when formulating search queries. The framework, discussed in detail in [5], takes an incremental approach to evolve high-quality queries for retrieving context-relevant textual resources (such as html pages, pdf files, Word files, etc.). It starts by generating an initial population of queries using terms extracted from a thematic context and incrementally evolves those queries based on their ability to retrieve relevant results when presented to a search engine. The contribution of this paper is a study of the effect that different mutation rates have on search results’ diversity and quality.
Mostrar más

11 Lee mas

TítuloAggregated 2D range queries on clustered points

TítuloAggregated 2D range queries on clustered points

The approach of modeling problems using a geometric formulation is well- known. There are many classical representations that support the queries re- quired by the model and solve them efficiently. Range trees [4] and kd-trees [5] are two paradigmatic examples. Some of these classical data structures are even optimal both in query time and space. However, such classical rep- resentations usually do not take advantage of the distribution of the data in order to reduce the space requirements. When dealing with massive data, which is the case of some of the aforementioned data mining applications, the use of space-efficient data structures can make the difference between main- taining the data in main memory or having to resort to (orders of magnitude slower) external memory.
Mostrar más

35 Lee mas

Mejora y formalización del método de puntos finitos

Mejora y formalización del método de puntos finitos

Con respecto a la aproximación en este trabajo se abordaron los aspectos esenciales para la obtención de las funciones de forma como lo son: la discretización del dominio en puntos, la g[r]

101 Lee mas

Simulación numérica por el Método de los Elementos de Contorno. Utilización de elementos isoparamétricos parabólicos

Simulación numérica por el Método de los Elementos de Contorno. Utilización de elementos isoparamétricos parabólicos

Se presenta en esta comunicación el tratamiento de problemas de potencial en sistemas bidimensionales, haciendo uso de la discretización de su contorno o fro..!:_l[r]

6 Lee mas

Estimación del error de discretización con principios variacionales multicampo: II. Flexión de placas

Estimación del error de discretización con principios variacionales multicampo: II. Flexión de placas

Las ideas expuestas en la primera parte de este trabajo4 para introducir una nueva categoría de estimadores del error de discretización en problemas de elasticidad, se han [r]

18 Lee mas

Desarrollo de una tienda virtual en una arquitectura distribuída

Desarrollo de una tienda virtual en una arquitectura distribuída

En la capa de negocio se usará el patrón de diseño VALUE LIST ITERATOR para la paginación; SESSION FAÇADE, para acceder al bean de entidad desde uno de sesión; VALUE OBJECT, para minimiz[r]

55 Lee mas

Estimación del error de discretización con principios variacionales multicampo: I - Elasticidad

Estimación del error de discretización con principios variacionales multicampo: I - Elasticidad

Desarrollos recientes para encajar dentro de un marco variacional la llamada Formulación Libre sugieren la posibilidad de introducir un nuevo tipo de estimador de error para cálculos[r]

19 Lee mas

Computación paralela de queries expresados con circuitos booleanos

Computación paralela de queries expresados con circuitos booleanos

Como futuros trabajos quedan pendientes generalizar resultados a DAG’s sin restricciones sobre los grados de entrada y/o salida, continuar con la problemática de optimización de queries, observando la computación paralela y la secuencial, y como un correlato la computación de queries en bases de datos distribuidas. También dada la pobre expresividad de FO, se pretende llevar estos desarrollos teóricos a lógicas con mayor poder expresivo, ya sea extendiendo FO con otros cuantificadores o tratando subconjuntos de lógicas de orden superior.

12 Lee mas

Mobility data warehouses

Mobility data warehouses

Received: 9 January 2019; Accepted: 29 March 2019; Published: 2 April 2019 Abstract: The interest in mobility data analysis has grown dramatically with the wide availability of devices that track the position of moving objects. Mobility analysis can be applied, for example, to analyze traffic flows. To support mobility analysis, trajectory data warehousing techniques can be used. Trajectory data warehouses typically include, as measures, segments of trajectories, linked to spatial and non-spatial contextual dimensions. This paper goes beyond this concept, by including, as measures, the trajectories of moving objects at any point in time. In this way, online analytical processing (OLAP) queries, typically including aggregation, can be combined with moving object queries, to express queries like “List the total number of trucks running at less than 2 km from each other more than 50% of its route in the province of Antwerp” in a concise and elegant way. Existing proposals for trajectory data warehouses do not support queries like this, since they are based on either the segmentation of the trajectories, or a pre-aggregation of measures. The solution presented here is implemented using MobilityDB, a moving object database that extends the PostgresSQL database with temporal data types, allowing seamless integration with relational spatial and non-spatial data. This integration leads to the concept of mobility data warehouses. This paper discusses modeling and querying mobility data warehouses, providing a comprehensive collection of queries implemented using PostgresSQL and PostGIS as database backend, extended with the libraries provided by MobilityDB.
Mostrar más

22 Lee mas

PROPAGACION DE ONDAS EN MEDIOS CONTINUOS ESTRATIFICADOS POR EL METODO INDIRECTO DE ELEMENTOS DE FRONTERA

PROPAGACION DE ONDAS EN MEDIOS CONTINUOS ESTRATIFICADOS POR EL METODO INDIRECTO DE ELEMENTOS DE FRONTERA

En el presente trabajo se desarrolla una formulación integral para el problema de propagación de ondas en medios estratificados, esta formulación se denomina método indirecto de elementos de frontera (IBEM, por sus siglas en inglés) y consiste en la representación integral de ondas elásticas difractadas en términos de fuentes de frontera de capa simple. Para lograr lo anterior es necesario la discretización de la frontera de las diferentes capas propuestas y el planteamiento de las condiciones de frontera que prevalecen en ella, posteriormente se formula el sistema lineal de ecuaciones para obtener las soluciones en la frontera, una vez encontrada estas soluciones es posible determinar el campo de desplazamientos y presiones por medio de la superposición de las ondas generadas en la frontera. Este procedimiento se realiza para cada frecuencia y posteriormente se emplea la transformada discreta de Fourier (TDF) para observar el fenómeno de propagación de ondas en función del tiempo.
Mostrar más

116 Lee mas

Diferencias Finitas Asistidas con Matlab en la Solución de Ecuaciones Diferenciales Parciales Elípticas

Diferencias Finitas Asistidas con Matlab en la Solución de Ecuaciones Diferenciales Parciales Elípticas

En el presente trabajo de investigación se trata sobre las Ecuaciones Diferenciales Parciales Elípticas y su solución por diferencias finitas que consiste en la discretización del proble[r]

121 Lee mas

SPARQL-DL queries for antipattern detection

SPARQL-DL queries for antipattern detection

Our antipattern detection methods follow a more general approach. They can work with an extensible set of antipatterns and some of them can be applied without the use of a reasoner. In general, our approach is based on the use of a set of SPARQL-DL queries for each antipattern to be detected. Then, each SPARQL-DL query is translated into SPARQL one. In our process, we can decide whether inferences are enabled or not before running any SPARQL queries, and we also offer the possibility of transforming the original ontologies into a form where SPARQL queries should retrieve more results.
Mostrar más

12 Lee mas

TítuloStudying the Effect and Treatment of Misspelled Queries in Cross Language Information Retrieval

TítuloStudying the Effect and Treatment of Misspelled Queries in Cross Language Information Retrieval

The advantages derived from the use of character n-grams for text processing —simplicity, efficiency, robustness, completeness and independence of the domain— have converted treatment at n-gram level into a standard technique of the state of the art (Robertson and Willett, 1998; Vilares et al., 2011). These advantages have not gone unnoticed by the IR research community. Classic IR systems usually employ knowledge and linguistic resources such as lists of stopwords, stemmers, lexicons, thesauri, taggers and so on. However, tokenization in n-grams does not require any of these: queries and documents are merely tokenized in overlapping n-grams, being then processed by the retrieval engine like any other term. In this way, n-gram tokenization constitutes a language- and domain-independent approach (Leveling and Jones, 2010). Moreover, as shown by McNamee and Mayfield (2004b; 2004a) and Robertson and Willett (1998), the employment of n-grams matching is itself an inherent mechanism of standardization of terms that can work with a variety of languages without any additional processing.
Mostrar más

20 Lee mas

An unbalanced approach to metric space searching

An unbalanced approach to metric space searching

A tree where the slices have fixed width avoids this last problem. Since the width is independent on the dimension of the space, the search will not enter more subtrees of a node as the dimension grows. However, a new consequence shows up when fixed slices are used: The subtrees corresponding to the slices containing the core of the distribution will have much more elements that the rest, ane therefore the tree will be more and more unbalanced as the dimensions grows.

5 Lee mas

Métodos de acceso para bases de datos métrico-temporales

Métodos de acceso para bases de datos métrico-temporales

El Fixed Height Queries Tree(FHQT), presentado en [1], pertenece al grupo de algo- ritmos basados en pivotes y b´asicamente es una variante del Fixed Queries Tree (FQT) [2] en la que todas las hojas se encuentran a la misma altura. Originalmente estas estruc- turas fueron propuestas para funciones de distancias discretas, pero se pueden adaptar a distancias continuas discretizando los valores de las mismas [8].

10 Lee mas

Representación secuencial de un trie de sufijos

Representación secuencial de un trie de sufijos

El Directly Addressable Variable-Length Code (DAC), presentado en [1], es una t´ecnica que permite comprimir una secuencia de c´odigos de longitud variable permi- tiendo acceso aleatorio y eficiente a cada uno de ellos. Los autores muestran que esta t´ecnica logra reducciones de alrededor del 30 % en el espacio requerido para represen- tar la secuencia. Los c´odigos DAC pueden ser usados para los saltos, los r´otulos y los grados. Para el arreglo de sufijos A existen algoritmos espec´ıficos de compresi´on que lo- gran un muy buen desempe˜no en espacio [10]. Todas estas t´ecnicas permitir´ıan reducir a´un m´as el espacio requerido para representar el trie con rs, logrando una diferencia significativa en espacio respecto de rk.
Mostrar más

10 Lee mas

Show all 4800 documents...