Búsquedas por Similitud

Top PDF Búsquedas por Similitud:

Búsquedas por similitud en PostgreSQL

Búsquedas por similitud en PostgreSQL

Por lo tanto, debido a los cambios constantes en la estructura propia de los datos computacionales, que en general dichos datos se transforman como vectores de características de un espacio multidimensional, se ha debido repensar la forma de resolver las consultas que se hacen sobre ellos y así el enfoque tradicional de búsqueda exacta utilizando claves ha dado lugar a las búsquedas por similitud en espacios métricos, en las que generalmente se evalúa la distancia que existe entre los puntos del espacio multidimensional obtenidos a partir de un vector de características del objeto computacional (por ejemplo una imagen, Figura 1). El hecho de que los vectores de características sobre los cuales se trabaja son de muy alta dimensión representacional hace que soluciones pensadas para Bases de Datos Multidimensionales no sean aplicables por sufrir, en su mayoría, de la maldición de la dimensión, en cambio el desempeño de las soluciones disponibles para Bases de Datos Métricas depende de la dimensión intrínseca del espacio de datos, que en general es mucho menor que la representacional. La dimensión intrínseca de un espacio métrico refleja la facilidad o dificultad intrínseca para las búsquedas en dicho espacio métrico.

10 Lee mas

Elaboración de estrategias paralelas para búsquedas por similitud en espacios métricos

Elaboración de estrategias paralelas para búsquedas por similitud en espacios métricos

En este proyecto, se ha logrado: (a) Analizar dife- rentes estructuras utilizadas para las búsquedas por similitud; (b) Seleccionar al D-Index como estructu- ra de datos óptima para la realización de búsque- das por similitud; (c) Estudiar diferentes Modelos de Computación Paralela y sus infraestructuras asocia- das; (d) Explorar el modelo Filter-Stream y la infraes- tructura Watershed; (e) Implementar algoritmos pa- ralelos basados en D-Index sobre Watershed; (d) Im- plementar los mismos algoritmos paralelos bajo otro modelo de programación paralela para su posterior análisis y comparación con la versión implementada en Watershed; (d) Realizar experimentos utilizando dos conjuntos de datos para determinar su desem- peño.

5 Lee mas

TítuloMétodos de mejora del rendimiento en búsquedas por similitud sobre espacios métricos

TítuloMétodos de mejora del rendimiento en búsquedas por similitud sobre espacios métricos

Como ya se ha expuesto al principio de la sección 2.3, en la búsqueda por similitud se plantea la obtención de elementos que no son exactamente iguales al objeto de búsqueda. La manera en la que se determina la similitud se asemeja más a cómo lo hace la mente humana que a otros procedimientos utilizados en computación, en los que, aún bajo condiciones de incertidumbre, se parte de un modelo y se exploran las transformaciones que pueden realizársele hasta convertirlo en el objeto a buscar. Por su parte, la mente humana reconoce la similitud entre objetos diferentes a través de sus características fundamentales, sin realizar una secuencia de transformaciones de uno a otro, sino que se centra primero en destacar una serie de peculiaridades más relevantes, y después en reconocerlas [Patella, 1999]. Los espacios métricos permiten convertir esas características en valores concretos mediante la utilización de una función de distancia.

230 Lee mas

Búsquedas por similitud en espacios métricos: el FQtrie

Búsquedas por similitud en espacios métricos: el FQtrie

Nos interesan las b´usquedas en donde se puedan recuperar objetos similares a uno dado. Este tipo de b´usqueda, se conoce con el nombre de b ´usqueda por proximidad o b ´usqueda por similitud, y surge en ´areas tales como reconocimiento de voz, reconocimiento de im´agenes, compresi´on de texto, recuperaci´on de texto, biolog´ıa computacional, etc. La necesidad de una respuesta r´apida y adecuada, y un uso eficiente de memoria, hacen necesaria la existencia de estructuras de datos especializadas que incluyan estos aspectos.

5 Lee mas

Búsquedas por similitud sobre objetos dinámicos

Búsquedas por similitud sobre objetos dinámicos

La mayoría de las aplicaciones de computación requieren realizar operaciones de búsquedas sobre bases de datos. En el campo de las bases de datos tradicionales se trabaja con el concepto de búsquedas exactas: la base de datos se divide en re- gistros, teniendo cada registro campos totalmente comparables; una consulta a la base retorna todos aquellos registros cuyos campos coincidan con los aportados en la búsqueda. Actualmente las bases de datos han incluido la capacidad de al- macenar datos no estructurados tales como imágenes, sonido, texto, video, datos geométricos, etc. Estructurar este tipo de datos en registros para adecuarlos al concepto tradicional de búsqueda exacta es difícil en muchos casos y hasta im- posible si la base de datos cambia más rápido de lo que se puede estructurar (por ejemplo, la web). Aún cuando esto pudiera hacerse, las consultas que se pueden satisfacer con la tecnología tradicional están limitadas a variaciones de búsquedas exactas. En este ámbito las búsquedas que son de interés son aquellas en las que se pueden recuperar objetos similares a uno dado. Este tipo de búsqueda se conoce con el nombre de búsqueda por proximidad o búsqueda por similitud y surge en diversas áreas. Algunas de ellas son:

102 Lee mas

Búsqueda por similitud de posiciones de ajedrez

Búsqueda por similitud de posiciones de ajedrez

Aún no existe un sistema que permita búsquedas por similitud sobre posiciones de Ajedrez. La idea de las búsquedas por similitud, es obtener posiciones que puedan tener algunas variaciones respecto a la posición consultada. En éste artículo proponemos una función de distancia para las búsquedas por similitud de posiciones de ajedrez sobre una base de datos de partidas. Este tipo de consulta es útil para que aprendices del juego, ante una situación determinada, conozcan posibles jugadas o estrategias que siguieron jugadores profesionales en partidas reales. También podría ser utilizada por motores de ajedrez para podar los árboles de búsqueda o para mejorar su capacidad de juego.

10 Lee mas

Búsqueda por similitud para recuperación de imágenes

Búsqueda por similitud para recuperación de imágenes

Resumen. En la búsqueda de imágenes por similitud en grandes bases de datos, es tan importante la eficiencia del sistema como su eficacia. La eficacia depende principalmente del preprocesamiento de las imágenes, de la técnica de extracción de características y de la función de distancia o disimilitud que se emplee. Por otro lado, los factores de mayor relevancia para la eficiencia del proceso son el costo de la función de distancia y el tipo de índice que se utilice para acelerar la búsqueda. En este trabajo se propone y evalúa experimentalmente una implementación completa orientada al uso de índices métricos para la búsqueda de imágenes por similitud, que adapta métodos y técnicas existentes para integrar en forma eficiente y eficaz estos elementos.

10 Lee mas

Biblioteca de medidas de similitud para textos

Biblioteca de medidas de similitud para textos

Este método recibe como parámetros cuatro cadenas, de las cuales las dos primeras son para cadenas pasadas directamente y los otros dos son la dirección completa de los documentos que se desean comparar, y un parámetro idioma para identificar el idioma en que se encuentran las variables. Además hace uso del método stop_words para eliminar las palabras vacías. El método como tal va tomar cada palabra de la primera frase y buscar la palabra más semejante en la segunda frase de acuerdo a las dos medidas explicadas anteriormente, y tomando la mayor para comparar con un umbral que dice si dos palabras tienen relación o no, en caso de tener un contador se incrementa para calcular la similitud basándonos en una modificación a la medida de Jaccard. En caso que no se encuentren los synsets necesarios para poder comparar por las dos medidas que se utilizan, se calcula la semejanza entre las palabras con el método (damerau_leveshtein / la longitud de la mayor palabra de las dos que se analizan) y después se compara el resultado con un umbral para ver si se puede incrementar el contador el cual es la base de esta modificación que no solo se encarga de las palabras iguales sino de las semejantes entre ellas ampliando la búsqueda.

91 Lee mas

Mejora del ranking de búsquedas en un contexto legal

Mejora del ranking de búsquedas en un contexto legal

Para el desarrollo de la mejora en la búsqueda de los documentos jurídicos, se toma como referencia una librería de alto rendimiento llamada Lucene; la cual es escalable basado en Recuperación de Información (IR) [5]. La misma permite la creación de índices y capacidad de búsquedas. Es un proyecto maduro, libre, de código abierto e implementado en Java; es miembro de la familia de proyectos de Apache Jakarta, autorizado bajo la licencia de Software libre de Apache. Lucene es actualmente, y ha sido durante años, la librería mas popular de Recuperación de Información en Java.

12 Lee mas

Espacios de búsquedas geométricamente separables

Espacios de búsquedas geométricamente separables

Willard [21] [22] sobre búsquedas por rangos con semiplanos, las que se han generalizado para búsquedas por rangos semiespaciales. Mejores construcciones se han hallado, incluso para dimensiones superiores. Todos los algoritmos de la literatura se basan en el teorema del Ham- Sandwich, consecuencia del teorema de Borsuk-Ulam, quienes utilizan siempre algún esquema de partición para lograr partir el espacio respecto de un conjunto de puntos en varias regiones acotadas por hiperplanos. Una propiedad que se destaca es que para cualquier hiperplano de consulta, las regiones intersecadas contienen una cantidad reducida de los puntos del conjunto total. Teniendo un esquema de partición, es posible construir un árbol de partición en forma estándar [18][25].

11 Lee mas

Indexación y búsquedas en bases de datos

Indexación y búsquedas en bases de datos

En la actualidad se utilizan nuevos mode­ los de bases de datos en los que no es apli­ cable el concepto de btísqueda exacta que se emplea en las bases de datos tradicionales. La causa principal es que estos nuevos modelos de bases de datos permiten gestionar tipos de datos con características que difieren de los datos clásicos: no es posible establecer un or­ den entre ellos y, en general, no pueden estruc­ turarse por lo que no pueden almacenarse en registros ni campos. Estos tipo de datos pueden ser sonidos, imaígenes, videos, entre otros, y para realizar consultas sobre los mismos se emplea el concepto de btísqueda por similitud. Tambien resulta de interes en algunas aplica­ ciones poder consultar estados pasados de la base de datos y no solamente el estado ac­ tual. A raíz de estas situaciones, se plantean nuevas estrategias para el almacenamiento y la consulta en las bases de datos, entre los

5 Lee mas

Introducción a las búsquedas bibliográficas

Introducción a las búsquedas bibliográficas

Al realizar búsquedas en Internet, es conveniente que te asegures de que las fuentes a las que accedas en la red sean fiables. En el siguiente apartado encontrarás distintos criterios para evaluarlas. En Internet convive la información valiosa y contrastada con otra menos fiable. Te ofrecemos una serie de criterios que pueden servir para evaluar recursos Web.

23 Lee mas

Métodos de acceso por similitud

Métodos de acceso por similitud

Nos interesan las b´usquedas en donde se puedan recuperar objetos similares a uno dado. Este tipo de b´usqueda, se conoce con el nombre de b ´usqueda por proximidad o b ´usqueda por similitud, y surge en ´areas tales como reconocimiento de voz, reconocimiento de im´agenes, compresi´on de texto, recuperaci´on de texto, biolog´ıa computacional, etc. La necesidad de una respuesta r´apida y adecuada, y un uso eficiente de memoria, hacen necesaria la existencia de estructuras de datos especializadas que incluyan estos aspectos.

5 Lee mas

Paralelización del análisis de similitud de imágenes

Paralelización del análisis de similitud de imágenes

De la definición anterior, se puede deducir que dos imágenes son consideradas similares si la fracción del área que hace "matching" comparada con el total de áreas de las dos imágenes es mayor a un parámetro α (α es el error permitido entre dos imágenes). Hay que tener en cuenta que permitiendo variaciones del parámetro α se puede afectar en el resultado que se obtiene para informar si dos imágenes son similares. Como paso siguiente se define un algoritmo para el análisis de similitud de imágenes considerando los algoritmos explicados anteriormente, el cual se divide en cuatro pasos fundamentales:

11 Lee mas

Búsquedas en bases de datos no convencionales

Búsquedas en bases de datos no convencionales

La b´usqueda por similitud es un tema de investigaci´on que abstrae varias nociones de las ya mencionadas. Este problema se puede expresar como sigue: dado un conjunto de objetos de naturaleza desconocida, una funci´on de distancia definida entre ellos, que mide cu´an diferentes son, y dado otro objeto, llamado la consulta, encontrar todos los elementos del conjunto suficientemente similares a la consulta. El conjunto de objetos junto con la funci´on de distancia se denomina espacio m´etrico.

5 Lee mas

Indexación y búsquedas en bases de datos.

Indexación y búsquedas en bases de datos.

En la actualidad resulta necesario gestionar nuevos modelos de bases de datos que permi- tan almacenar y consultar de manera eficiente ciertos tipos de datos no estructurados como im´agenes (m´edicas, satelitales, huellas dacti- lares, etc), audio, textos, videos, entre otros. En este ´ambito resulta necesario implemen- tar nuevas estrategias de almacenamiento y de consulta, teniendo en cuenta que generalmente no es posible estructurar este tipo de datos, por lo que no puede almacenarse la informaci´on en registros y campos. Por tales motivos, es que no puede aplicarse el concepto de b´usque- da exacta utilizado en las bases de datos tradi- cionales, por lo que ´ındices tales como el B*- Tree no son utilizables para realizar b´usquedas de manera eficiente. En estos casos se apli- ca el concepto de b´usquedas por similitud, en las que dos objetos se comparan mediante una funci´on de distancia que indica el grado de similitud que existe entre ellos. El conjunto de objetos se denomina espacio m´etrico. Adi- cionalmente, existen aplicaciones en las que se requiere almacenar mas de un estado de la base de datos, y no solamente el estado actual. Por lo que esta situaci´on debe tenerse en cuenta tanto en las estrategias de almacenamiento co- mo en las de b´usquedas a implementar.

5 Lee mas

Show all 1521 documents...