Clasificación de documentos

Top PDF Clasificación de documentos:

Modelamiento de espacio de palabras en la clasificación de documentos

Modelamiento de espacio de palabras en la clasificación de documentos

En el presente artículo se presenta la mecánica de la clasificación de documentos bajo un enfoque genérico inicialmente, este será abordado considerando las deficinciones clásicas respecto a la clasificación de documentos. en este punto se resalta dos grupos fundamentales; el primero constituido por un grupo de ejemplos de documentos: preclasificados que constituyen las diferentes categorías de entrenamiento, posteriormente un segundo grupo de ejemplos de documentos preclasificados que se usaran con el propósito de probar la precisión de los algoritmos de clasificación. Enseguida se muestra la técnica del modelo de espacio de palabras, el mismo que introduce a la constitución de textos conformadas por términos que son contabilizados, que a posteriori representan un patrón de clasificación, esto conlleva a que si existiera un nuevo documentos, y este puede sometérsele a la misma técnica, también podría encontrársele el patrón individual, con lo que en forma consiguiente, posteriori se podría determinar la proximidad entre el patrón del tipo de documento con el patrón del documento individual, de ello se puede extraer en suma de varios documentos individuales, una matriz que contrasta cada documento por medio de su proximidad con cada tipo de documento establecido, a lo que se denomina matriz de confusión, de ella se puede extraer en definitiva la precisión del modelo empleado. Cabe resaltar que si se desea emplear este modelo en una aplicación real, con motivo de mejorar el acceso a los documentos clasificados, lo que en realidad se emplea es la matriz de confusión.
Mostrar más

14 Lee mas

Desarrollo de un sistema inteligente para la clasificación de documentos ya digitalizados aplicando redes neuronales supervisadas

Desarrollo de un sistema inteligente para la clasificación de documentos ya digitalizados aplicando redes neuronales supervisadas

Para garantizar una buena clasificación de documentos se creyó necesario en la muestra 2 se incremente un mayor número de palabras al vocabulario con la finalidad de dar una mejor exactitud en la clasificación de los documentos. Definir correctamente el vocabulario de cada una de las categorías hace que la clasificación tenga un buen porcentaje de aciertos logrando que el documento sea asignado correctamente a su categoría, de tal medida que el desempeño de la exactitud de la red mejora de acuerdo al tamaño del vocabulario.

16 Lee mas

Minería de texto en la clasificación de documentos digitales

Minería de texto en la clasificación de documentos digitales

La presente investigación tiene como objetivo, desarrollar un clasificador automatizado para la clasificación de material bibliográfico por medio de la minería de texto. La minería de texto es empleada para el desarrollo del clasificador, basado en un método de tipo supervisado, conformado por dos etapas; de aprendizaje y reconocimiento, en la etapa de aprendizaje, el clasificador aprende patrones a través del análisis de registros bibliográficos, pertenecientes a la clasificación Z, del área de bibliotecología, ciencias de la información y recursos de información, recuperados de la base de datos LIBRUNAM. En esta etapa de aprendizaje el clasificador es capaz de reconocer diferentes subclases. En la etapa de reconocimiento el clasificador se valida y evalúa a través de pruebas de clasificación, para este fin se toman aleatoriamente registros bibliográficos de la clasificación Z, clasificados por un catalogador y procesados por el clasificador automatizado, con el fin de obtener la precisión del clasificador automatizado. El trabajo se encuentra estructurado de la siguiente forma: introducción, minería de texto y clasificación de documentos, metodología de la minería de texto, aplicación de la minería de texto en la base de datos LIBRUNAM, resultados y conclusiones.
Mostrar más

11 Lee mas

Análisis comparativo de la aplicación de monogramas y digramas en la clasificación de documentos

Análisis comparativo de la aplicación de monogramas y digramas en la clasificación de documentos

Todos los aspectos anteriormente descritos constituyen un conjunto de patrones que son susceptibles de emplear para el reconocimiento de los tipos de documentos que generan. En el procesamiento de lenguaje natural, existe la técnica del modelamiento del espacio de palabras, el mismo que trata de la asociación de los diversos vocablos a los documentos que los contiene, lo cual constituye, en suma, un patrón de clasificación. En este contexto, surge la duda de que si un vocablo está directamente asociado en algún grado de importancia con un tipo de documento, y si la asociación de dos vocablos que constituyen mayor cantidad de datos, lo que daría a entender una mayor cantidad de información y que, por consiguiente, podría aportar mayor precisión en el tratamiento de la clasificación de documentos, este es el problema que trata de abordar el presente artículo, que básicamente tratará de demostrar qué tan bueno es tratar de efectuar trabajos de clasificación empleando monogramas y digramas de palabras lematizadas.
Mostrar más

5 Lee mas

Diseño y construcción de robot cartesiano para la clasificación de documentos en función de un código de barras

Diseño y construcción de robot cartesiano para la clasificación de documentos en función de un código de barras

Los documentos a clasificar son de tamaño A4 y serán ubicados en una matriz de casilleros de 4 filas y 5 columnas. Una hoja con formato A4 tiene las siguientes dimensiones: 210x297mm. Por lo tanto, el largo de cada casillero debería ser de 21cm. Sin embargo, se contará con 1cm de holgura a cada lado de la hoja. Con esta consideración el largo de cada casillero es de 23cm. Para la profundidad se considerará una holgura de 5cm, por lo tanto la profundidad de cada casillero es de 30cm. La altura de cada casillero se determinó en 16cm, que son suficientes para ingresar libremente las manos así como cualquier efector final del robot. El material que se utilizó es madera triplex de 5mm para el contorno y de 3mm para la separación de cada cajón. Además, se incluye una bandeja de recolección en la cual se colocarán los documentos para que sean tomados y clasificados por el robot de manera automática. Una vista frontal y dos proyectadas de la matriz de casilleros se muestran en la Figura 2.1.
Mostrar más

172 Lee mas

Sistema híbrido para clasificación de documentos aplicado al problema bioinformático de inferencia de interacción proteína-proteína

Sistema híbrido para clasificación de documentos aplicado al problema bioinformático de inferencia de interacción proteína-proteína

En esta l´ınea de investigaci´on proponemos di- se˜nar, implementar y evaluar una infraestructu- ra inteligente, combinando distintas herramien- tas computacionales para clasificaci´on de docu- mentos. A partir de un conjunto de documentos previamente clasificados, el sistema inteligente utiliza: un m´odulo de clustering para identificar los posibles subt´opicos dentro del conjunto de documentos, un m´odulo evolutivo para determi- nar la importancia global de las palabras y un m´odulo de clasificaci´on que utiliza dicha infor- maci´on para inferir la clase a la que pertenece un nuevo documento. Particularmente, se pro- pone el uso del sistema para un problema im- portante en el ´area de bioinform´atica: detectar si un documento trata sobre interacci´on entre prote´ınas, el cual puede verse como un caso par- ticular del problema de clasificaci´on.
Mostrar más

5 Lee mas

ANÁLISIS COMPARATIVO DE LA APLICACIÓN DE MONOGRAMAS Y DIGRAMAS EN LA CLASIFICACIÓN DE DOCUMENTOS

ANÁLISIS COMPARATIVO DE LA APLICACIÓN DE MONOGRAMAS Y DIGRAMAS EN LA CLASIFICACIÓN DE DOCUMENTOS

Los resultados obtenidos en el caso de los digramas sin la aplicación de reducción dimensional, se muestran en la Tabla 5, en este se presentan resultados nada alentadores para el empleo de digramas como técnica de clasificación, pues solo alcanza un nivel de precisión promedio del orden del 78%, lo cual podría juzgarse erróneamente de forma apresurada como una técnica no confiable.

9 Lee mas

Aplicación de Sistemas Inteligentes para la Clasificación Automática de Documentos

Aplicación de Sistemas Inteligentes para la Clasificación Automática de Documentos

Es una acción que realizamos de manera habitual en nuestro día a día, muchas veces este comportamiento se demuestra de manera espontánea, pues desde que se inicia el día se empieza a clasificar objetos, todo ello para una rápida ubicación y fácil acceso. En la clasificación de documentos hay pasos a seguir comunes que se encuentran en la mayoría de documentos al momento de clasificar puesto que requiere de un análisis, selección, etc. de los documentos o lo contenido de ellos. Esta clasificación llevada a un ámbito laboral, llámese empresa o alguna institución educativa, se vuelve el problema más común para ellos, teniendo como relación que mientras mayores niveles de producción, mayor se hace la base
Mostrar más

95 Lee mas

Terminología y fraselogía en los documentos médico-legales (1): extracción, clasificación, análisis y traducción de unidades de naturaleza biosanitaria

Terminología y fraselogía en los documentos médico-legales (1): extracción, clasificación, análisis y traducción de unidades de naturaleza biosanitaria

En este artículo vamos a proceder al análisis de las unidades fraseológicas y de las fórmulas que aparecen en un tipo específico de documentos-tipo, los denominado documentos médico-legales. Para ello nos vamos a basar en un encargo de traducción profesional realizado por la autora de este trabajo durante los meses de marzo, abril y mayo de 2007 para la Unidad de Reproducción Asistida ( URE ) de un centro sanitario especializado de

24 Lee mas

Construcción automática y análisis de Modelos de Espacios de Palabras de n gramas y su aplicación a tareas de procesamiento de lenguaje natural

Construcción automática y análisis de Modelos de Espacios de Palabras de n gramas y su aplicación a tareas de procesamiento de lenguaje natural

El presente trabajo resume la propuesta del trabajo de tesis doctoral en computación del autor del artículo y su asesor de tesis, en el marco del procesamiento de lenguaje natural, específicamente en la tarea de clasificación de documentos. Este tipo de investigación está enmarcada dentro de la inteligencia artificial, aquí no se trata de hacer una comparación del modelo de espacio de palabras con otras técnicas que pueden aplicase a este problema, lo que se trata de hacer es proponer una mejora en la calidad de los vocablos que constituyen los términos en la construcción de los patrones de clasificación de los diferentes tipos de documentos, las etapas de un proceso de clasificación no difieren de la que se aplican en todas las técnicas prevalentes, como son la etapa de entrenamiento y control, para ello se emplea el corpus “corpora Reuter 21578”.
Mostrar más

122 Lee mas

Terminología y fraseología en los documentos médico-legales (2): extracción, clasificacion, análisis y traducción de unidades de naturaleza jurídica

Terminología y fraseología en los documentos médico-legales (2): extracción, clasificacion, análisis y traducción de unidades de naturaleza jurídica

A este respecto, vamos a obviar lo expuesto en el artículo publicado en este mismo número de la revista (cf. “Terminología y fraseología en los documentos médico-legales (1): extracción, clasificación, análisis y traducción de unidades de naturaleza biosanitaria”) para centrarnos exclusivamente en la extracción, clasificación y análisis de unidades de naturaleza jurídica y jurídico- administrativa.

16 Lee mas

TítuloEvolución urbana y cambios morfológicos, Santiago de Compostela 1778 1950

TítuloEvolución urbana y cambios morfológicos, Santiago de Compostela 1778 1950

La secuencia de propósitos pretendidos encontró acogida en las observaciones de síntesis reunidas a lo largo de las páginas del estudio. Primero al localizar los documentos de información relacionados con el cuadro de la evaluación urbana y cambios morfológicos de la ciudad de Santiago y poder establecer su clasificación; datos preferentemente obtenidos de fuentes directas custodiadas en los archivos del Ayuntamiento de Santiago de Compostela y, sobre todo, en el Histórico Universitario de Santiago. Segundo por las lecturas e interpretaciones contextuales de sus principales componentes estructurales y elementos de conformación, estableciendo sus factores de cambio. Tercero por evaluar la repercusión e influencia de sus dinámicas transformadoras, modos y maneras de intervención y modelos tipológicos resultantes. Finalmente por el crecimiento expansivo fuera de murallas.
Mostrar más

34 Lee mas

Estado de desarrollo de la archivística clásica hasta los años 30 del siglo XX: Tres manuales archivísticos de trascendencia universal

Estado de desarrollo de la archivística clásica hasta los años 30 del siglo XX: Tres manuales archivísticos de trascendencia universal

Casanova, estructuró su obra en cinco capítulos. Aunque en lo que puede considerarse una introducción a la obra hace un análisis general del archivo y la Archivística. En el primer capítulo Casanova describe todo lo relacionado con los edificios, construcción, distribución de espacio, mantenimiento, seguridad, entre otros aspectos de los edificios propios para archivos. En el segundo se refiere al tratamiento archivístico de los documentos. El tercer capítulo explica la fuente de los archivos y la Archivística y en el cuarto capítulo aborda la naturaleza jurídica y uso del archivo. Este último capítulo se divide en dos partes, una primera él aborda la legislación y reglamentación archivística y en la segunda la comunicación de los documentos. (Casanova, 1928, traducido por los autores). Otro aspecto importante en la obra de Casanova es que aportó el primer intento de periodización del desarrollo de los archivos y de las prácticas archivísticas realizadas desde la antigüedad. Casanova propone una periodización basada en cuatro grandes períodos. El primero se inicia en el mundo antiguo hasta el siglo XIII, el segundo lo comprenden los siglos XIII hasta el XV, entre estos periodos el archivero italiano deja ver claramente el carácter conservador de los documentos jurídicos que daban fe de las posesiones que tenían los hombres y los gobiernos, por ello consideraban a los archivos como patrimonio cultural. La tercera parte abarca desde los siglos XVI al XVIII, en esta se manifiesta que el archivo fue considerado como el repositorio documental para la construcción de la historia. El último período de la propuesta de Casanova lo comprende el siglo XIX y hasta el la segunda década del siglo XX, en que según su consideración empieza a observar la Archivística como ciencia independiente, que se fundamentaba en el principio de procedencia y orden natural de los documentos, que él llamaba el método histórico, es decir un método basado en la historia del órgano creador de los documentos. (Ibídem., p. 291-442, traducido por los autores).
Mostrar más

16 Lee mas

Aproximación al archivo de Eliseo Verón: ordenamiento preliminar y clasificación de los documentos - Proyecto

Aproximación al archivo de Eliseo Verón: ordenamiento preliminar y clasificación de los documentos - Proyecto

En virtud de tratarse de un proyecto que trabajará sobre materiales inexplorados, es difícil prever un cálculo aproximado de lo que se puede elaborar como informe, así como del ritmo de trabajo, que puede ser muy variable según densidades y dificultades para diagnosticar, evaluar y reconstruir la red de interrelaciones de cada documento. No obstante, se prevé poder consolidar –a partir de un registro exhaustivo de los materiales acopiados– una clasificación y una red de relaciones entre dichos textos y piezas, que permitan documentar en profundidad la producción de Eliseo Verón de las últimas tres décadas, y poner en valor dichos materiales para la decisión de formar parte de un archivo público.
Mostrar más

7 Lee mas

Promoción de competencias transversales en la formación docente: Actividades y evaluación

Promoción de competencias transversales en la formación docente: Actividades y evaluación

Las competencias transversales son, en la actualidad, muy importantes en la formación y, como consecuencia, en el desempeño docente. Por dicho motivo, el objetivo de este estudio fue determinar a través de qué actividades los docentes promueven y evalúan las competencias transversales. Para recoger la información se aplicó una encuesta y entrevista a los profesores participantes de la investigación. Según los resultados obtenidos, es bajo el porcentaje de docentes que realizan actividades de aprendizaje constructivas en sus clases de manera deliberada, planificada y explícita para promover competencias transversales. El grado de desarrollo de las competencias transversales, en la carrera de Pedagogía Básica, está por debajo de la relevancia concedida por los documentos oficiales emanados de la Universidad. Los docentes manifiestan que su principal debilidad, en esta materia, es construir instrumentos auténticos que evalúen este tipo de competencias.
Mostrar más

23 Lee mas

Propuesta organización de historias labores de docentes activos de la Secretaria de Educación en la Alcaldía de Duitama – Boyacá- 1979 - 2019

Propuesta organización de historias labores de docentes activos de la Secretaria de Educación en la Alcaldía de Duitama – Boyacá- 1979 - 2019

Por lo tanto, se realiza una breve descripción del proceso de organización de los documentos entendiéndose como el “proceso mediante el cual se aplican las acciones de clasificación, ordenación y descripción de los documentos”. Dentro de la Clasificación documental tenemos que es el primer paso de la labor archivística e implica identificar la procedencia de los documentos, en la siguiente actividad tenemos la ordenación documental entendiéndose como el proceso mediante el cual se da la disposición final a los documentos, determina qué documento va primero y cual después; teniendo en cuenta lo anterior para el desarrollo de la propuesta organización de historias labores de docentes activos del archivo de gestión de la secretaria de educación se toma el principio de orden original y como última etapa tenemos la descripción documental entendiéndose como un proceso de análisis de los documentos de archivos o de sus agrupaciones, que permiten su identificación, localización y recuperación para la gestión o la investigación 22 .
Mostrar más

82 Lee mas

La conveniencia de una clasificación de los documentos del ámbito financiero para la traducción especializada

La conveniencia de una clasificación de los documentos del ámbito financiero para la traducción especializada

Por su parte, el género es el concepto que se necesita para dar forma reconocible en el mundo real a los registros, esto es, la materialización de los registros, al facilitar la clasificación de manifestaciones lingüísticas en situaciones concretas. El género es lo que conocemos como categoría textual, el tipo de texto concreto que se usa en una determinada situación social para conseguir un propósito comunicativo concreto. Berkenkotter y Huckin (1995: VRQ PX\ JUiILFRV HQ VX GHILQLFLyQ ©>«@ ZH XVH JHQUHV to package our speech and make of it a recognizable response to the exigencies of the situation». En general, las definiciones que llegan de diversos ámbitos de estudio describen el género enfatizando o atendiendo al contexto social y/o comunicativo, es decir, a los aspectos contextuales y/o a los rasgos típicos que comparten los textos, los intratextuales. Hatim y Mason, en su referencial Discourse and the Translator (1990) parten del análisis de lo que ellos denominan la «ocasión social» para explicar que el género viene determinado por las convenciones que se consideran adecuadas para cada ocasión social. Así, dentro del registro médico, por ejemplo, el informe médico y la citación son dos géneros diferentes; en el registro financiero ³si finalmente llegamos a la conclusión de que es posible su independencia del económico³, dos géneros diferentes serían el inicio de cobertura y la OPV.
Mostrar más

14 Lee mas

El tratamiento físico de los documentos (II) La Clasificación Decimal Universal (CDU)

El tratamiento físico de los documentos (II) La Clasificación Decimal Universal (CDU)

La propuesta fue ganando adeptos y poco a poco las bibliotecas, las grandes y las pequeñas, se organizaron de manera similar, aunque en algunas zonas, como las de habla inglesa, pensaron que quizá sería más fácil si se ordenaban los documentos por centros de interés. Así lo hicieron. En algunas escuelas, diseñaban grandes temas, les ponían títulos generales. Por ejemplo, en “Astro” juntaban en un mismo espacio todo lo referido al espacio, es decir, los libros del sistema solar, las novelas de Asimov, los extraterrestres, etcétera. Sin duda, atendían la máxima “un libro debe estar situado donde el lector cree que va a encontrarlo”, pero la ordenación por centros de interés quedaba unida a la subjetividad de las personas que organizaban esa biblioteca. Se añadía, luego, la dificultad que encontraban los alumnos cuando visitaban otra biblioteca, la del instituto, la de la universidad o la municipal, donde sí había un lugar para cada libro, el mismo en todas ellas.
Mostrar más

5 Lee mas

Desarrollo de un agente inteligente ontológico para la clasificación y recuperación de información textual de documentos

Desarrollo de un agente inteligente ontológico para la clasificación y recuperación de información textual de documentos

El acceso a los contenidos de un conjunto extenso de conocimiento acumulado (una base de datos, un conjunto de documentos, etc.) es un problema de creciente interés en los últimos años. La búsqueda de información (InformationRetrieval, IR) es un tema que trata con grandes colecciones de material textual, siendo su objetivo satisfacer las búsquedas y las necesidades del usuario. (Ropero, 2006) Estas necesidades se ven incrementadas cuando el usuario en cuestión es nuevo en la materia o cuando existen contenidos ambiguos, mala organización o, simplemente, temas complejos o una gran cantidad de información difícil de gestionar, por ejemplo cuando se busca “Inteligencia Artificial”, estos términos pueden hacer alusión tanto a un área de la informática como también a la película de ciencia ficción.
Mostrar más

92 Lee mas

Diseño y desarrollo de una aplicación informática de gestión de documentos del proceso penal en español y rumano

Diseño y desarrollo de una aplicación informática de gestión de documentos del proceso penal en español y rumano

Aunque a una primera vista no parecen muchas las diferencias y nos podríamos dejar engañados diciendo que son dos países con sistemas parecidos basados en el código civil, si analizamos en más profundidad observaremos una serie de diferencias entre los dos países en cuanto a la organización política, clasificación de derecho y la organización jerárquica de los órganos judiciales, que pueden implicar una serie de dificultades de traducción por una parte a la hora de identificar los equivalentes si es el caso y por otra parte de encontrar soluciones y posibles traducciones para los términos que no tiene equivalentes en el otro idioma. Un buen ejemplo aquí es el Tribunal Superior de Justicia que tenemos para España, es representativa para las Comunidades Autónomas y que falta en Rumania dada también la forma de organización territorial.
Mostrar más

102 Lee mas

Show all 10000 documents...