• No se han encontrado resultados

Propuesta entrega preliminar OsvaldoRuedaCarreño

N/A
N/A
Protected

Academic year: 2020

Share "Propuesta entrega preliminar OsvaldoRuedaCarreño"

Copied!
21
0
0

Texto completo

(1)

Página 1 de 21 FACULTAD DE INGENIERÍA

UNIDAD DE POSGRADOS

PRESENTACIÓN PROPUESTA

TESIS DE MAESTRÍA: TRABAJO FINAL DE ESPECIALIZACIÓN:

1. PROPONENTE: Osvaldo Rueda Carreño

2. CÓDIGO: oruedac , c.c. 77.195.513 de Valledupar

3. CORREO: oruedac@unal.edu.co

4. PROGRAMA: MAESTRÍA EN INGENIERIA DE SISTEMAS Y COMPUTACIÓN

5. DIRECTOR PROPUESTO: Pendiente

5.1. DEPARTAMENTO: Ingeniería de Sistemas e Industrial

5.2. TÍTULO:

Diseño de un modelo predictivo basado en técnicas de minería de datos para la detección temprana del carcinoma de cérvix. Caso: Hospital San Rafael Nivel II, San Juan del Cesar, La Guajira.

(2)

Página 2 de 21

6. ANTECEDENTES Y JUSTIFICACIÓN

6.1. INTRODUCCION A LA HISTORIA CLÍNICA

Cada vez que un usuario usa los servicios médicos de una clínica u hospital se abre o se actualiza su historial médico, este, hoy en día se encuentra sistematizado. Dicha actualización creación genera grandes volúmenes de registros detallados de procedimientos y/o medicamentos, convirtiéndose éstos en una fuente importante de datos.

Los dominios de aplicación como las enfermedades frecuentes, perfiles epidemiológicos, frecuencias de uso, grupos de edades, costos de procedimientos y de tratamientos, son aspectos relevantes dentro de los indicadores de desempeño y gestión de todo hospital. Por ello, mediante una revisión bibliográfica se abordarán las técnicas de minería de datos que, haciendo uso de los registros detallados de las historias clínicas, soportan la toma de decisiones en las áreas científica y administrativa.

El presente estado del arte resulta relevante por el aporte que brinda al identificar los campos de aplicación más frecuentes de la minería de datos en el sector de las investigaciones en las historias clínicas, así como al hecho de resaltar que los mayores esfuerzos a nivel de investigación se ha enfocado hacia las enfermedades inmunosupresoras como el cáncer, VIH, tuberculosis; justo a sus costos, tanto en el área de laboratorio como en sus tratamientos. Son diversas las herramientas usadas, la más común, clustering.

(3)

Página 3 de 21

decisiones o guías de práctica clínica, que contribuyen al ejercicio de una medicina basada en pruebas (2).

El objetivo consiste en realizar una revisión del estado actual y principales tendencias que se adivinan en la utilización de la HCE en investigación. Para ello se describirán las principales barreras existentes y las soluciones que, desde las tecnologías de la información y la informática biomédica se están ofreciendo para superarlas.

6.2. USOS ACTUALES

Hasta el momento, gran parte de la investigación clínica y epidemiológica se había estado basando en el uso de los registros informatizados del servicio de admisión de los hospitales o los certificados de defunción, al no disponer de otras fuentes de datos bien estructurados en los servicios clínicos (3).

La HCE demuestra que es posible superar estas limitaciones porque permite a los investigadores disponer de datos clínicos de más calidad y precisión (menor redundancia de información, validación de datos, bases de datos integradas) y, adicionalmente, posibilita el planteamiento de nuevos interrogantes que pueden responder las bases de datos de forma inmediata (4).

Algunas de esas nuevas líneas de investigación surgen al poder disponer de información sobre las mejores prácticas en salud, que es precisamente uno de los objetivos de la llamada “historia de salud federada o distribuida”, que consiste en una vista virtual de los datos de la historia clínica electrónica de un paciente, que puede ser obtenida del conjunto global de entradas disponibles sobre ese paciente, independientemente de dónde se encuentren ubicadas físicamente (5).

(4)

Página 4 de 21

identificación de poblaciones de riesgo, desarrollo de registros y bases de datos centrales y análisis de la eficacia de procesos (como la gestión de archivos). De hecho, el interés de la comunidad científica por la HCE ha crecido significativamente en los últimos años, como lo demuestra la presencia creciente de artículos sobre HCE en las revistas científicas de mayor impacto como “British Medical Journal”, “Lancet” o “Annals of Internal Medicine” (6).

6.3. La tecnología de HCE al servicio de la investigación

Para una integración efectiva entre la HCE, las herramientas de soporte a la toma de decisiones, la evaluación clínica, los estudios epidemiológicos y la investigación biomédica, es necesario disponer de repositorios o almacenes de datos clínicos bien estructurados y de calidad y de guías clínicas aceptadas con enlaces explícitos a los datos clínicos y a terminologías en los conjuntos de datos clínicos (15).

Entre los principales problemas que se encuentra un proyecto de repositorio de datos clínicos de calidad cabría mencionar:

– La captura, integración y presentación de información descriptiva, que no está disponible para un análisis automático.

– Los formatos incompatibles o sin rigor suficiente que impiden su redimensión, la agregación de datos o la integración. Para que los documentos sean útiles, hay que poder inferir de ellos una crónica o relato coherente de hechos.

– Problemas tecnológicos para describir automáticamente el significado científico y clínico de la información biomédica, lo que se traduce en la práctica en una incapacidad para manejar efectivamente la información clínica.

(5)

Página 5 de 21

– La cooperación requiere estándares, que apenas están emergiendo.

(6)

Página 6 de 21

Las tecnologías de la información ofrecen posibles soluciones a algunos de estos problemas como:

– Los entornos de computación distribuida o GRID, con las medidas de seguridad necesarias (17).

– Informática de alto rendimiento para el procesamiento, interpretación, integración, minería y visualización de enormes cantidades de datos (18).

– Vistas unificadas y personalizadas de datos procedentes de múltiples fuentes.

– Técnicas de gestión del conocimiento (proyectos e-Science/Grid), de extracción de términos, generación de lenguaje y despersonalización (8, 16), que permiten la integración de servicios de HCE federada con ontologías.

.

– Arquetipos (o plantillas asociadas a actos clínicos) acordes con la prenorma CEN 13606, como los desarrollados en el proyecto K4Health (15).

La HCE en el contexto de la e-ciencia

(7)

Página 7 de 21

– El investigador puede contactar con las redes de colegas clínicos y biólogos moleculares que participan en comunidades virtuales e-ciencia relacionadas.

– El investigador solicita a la Autoridad de Custodia del Repositorio acceso a más detalles incluido el texto completo de informes e historias autorizadas.

– Se puede formular rápidamente un estudio con protocolos existentes gestionados por el entorno de trabajo e-ciencia clínico, y éste es enviado a los Comités de Ética para una aprobación rápida. Los pacientes candidatos son rápidamente identificados y reclutados a través del repositorio y sus enlaces al sistema de HCE.

– Los genetistas y otros investigadores pueden aportar información sobre modelos animales relacionados, enlazando con los recursos de genómica y proteómica.

– Si los resultados del estudio clínico tienen suficiente relevancia, la información se añade a guías de práctica clínica, que son ampliamente distribuidas mediante los enlaces a NICE, la colaboración Cochrane y las redes de cáncer (16).

Las imágenes procesadas y la información más significativa extraída de los informes (por ejemplo, de radiología) están a su vez disponibles en tiempo real para uso clínico (8). Además, las bases de datos de imágenes y las señales biomédicas pueden ser incluso interpretadas (proyecto MIAS-Grid) y ayudar a la toma de decisiones; y las imágenes estándar pueden ser personalizados para la morfología de cada paciente o para investigación (The Dynamic Brain Atlas) (30).

(8)

Página 8 de 21

En resumen, para la puesta en marcha de estas posibilidades es necesario contemplar aspectos organizativos y solucionar problemas técnicos en tecnología de lenguaje, integración de la información y en presentación de la información (figura 1). Estas mismas tecnologías también proporcionarán el núcleo de un nuevo sistema de cuidados del paciente en equipos multiprofesionales integrados y comunidades de pacientes (16).

Registros, bancos y centros de investigación

Los registros representan un aspecto esencial de la investigación sobre patologías y proporcionan datos obtenidos en una población amplia que resultan muy útiles para formular nuevas preguntas e investigaciones.

(9)

Página 9 de 21

En determinados casos es necesaria la creación de unidades intermedias que recogen los datos de cada centro (por ejemplo, el Registro Hospitalario de Tumores) y los envían al registro central de cáncer. En nuestro país, los Bancos de Tumores están coordinados por el Centro Nacional de Investigaciones Oncológicas (CNIO), que los pone a disposición de la comunidad científica. Shared Pathology Informatics Network es un consorcio de instituciones conectadas por un sistema Web que ofrece acceso a información de las bases de datos médicas y de los repositorios de información de anatomía patológica según unos criterios de búsqueda, eliminando la información que pueda comprometer la privacidad del paciente (45).

En estos sistemas, los datos deben ser recogidos directamente en ordenadores, codificados en su origen (46) y validados (47). Los registros de trasplantes se han visto beneficiados, gracias a la HCE, de una integración de datos que ha optimizado su rendimiento, efectividad y precisión, a la vez que ha disminuido para estos centros el tiempo y el coste empleado en tareas administrativas (48).

(10)

Página 10 de 21

7. IDENTIFICACIÓN DEL PROBLEMA:

Los usuarios que padecen o han padecido cáncer y han sido tratados, tienen un registro de sus enfermedades o padecimientos en la base de datos de historias clínicas del hospital; estos registros sólo son consultados por los especialistas para hacer seguimiento individual a dichos pacientes, sin relacionarlos con casos similares ni retroalimentar con esta información la toma de decisiones orientada a aumentar la efectividad de los tratamientos y la optimización de los recursos médicos necesarios para tratar la enfermedad partiendo del hecho que los medicamentos para tratar la enfermedad son de alto costo, difícil consecución y escasa disponibilidad.

De esta manera, con cada paciente atendido se ha ido multiplicando la cantidad de datos almacenados en el Hospital San Rafael; sin embargo, contrariamente a lo que pudiera esperarse, esta situación no ha generando un aumento en la adquisición de conocimiento y mucho menos, ha conducido al aprovechamiento de la información para disminuir el tiempo de los tratamientos y los costos de medicamentos.

(11)

Página 11 de 21

8. OBJETIVO GENERAL Y OBJETIVOS ESPECÍFICOS

8.1. OBJETIVO GENERAL

Diseñar un modelo predictivo basado en técnicas de minería de datos para la detección temprana del carcinoma del cérvix o de cuello uterino en pacientes del Hospital San Rafael Nivel II en San Juan del Cesar, La Guajira.

8.2. OBJETIVOS ESPECÍFICOS

A. Preparar el conjunto de datos de las historias clínicas de pacientes que han presentado diagnóstico positivo de carcinoma del cérvix o de cuello uterino.

B. Aplicar a un grupo de prueba ideal de historias clínicas un modelo para la estimación del diagnóstico, gradación y pronóstico de carcinoma del cérvix o de cuello uterino.

(12)

Página 12 de 21

9. METODOLOGÍA:

Para dar cumplimiento a los objetivos trazados en el proyecto, se reconoce la importancia de la preparación de datos. En efecto, la adecuada preparación de éstos permitirá la utilización de modelos predictivos de menor complejidad y la obtención de datos más precisos.

En primera instancia, se identificará el tipo de dato de cada uno de los campos del registro de cada paciente, determinando si corresponde a datos numéricos, textos, nominales, binominales, categóricos, decidir qué hacer con los datos nulos, outliers y con datos no balanceados.

Si en la base de datos de las historias clínicas de pacientes que han

presentado diagnóstico positivo de carcinoma del cérvix, existieran campos nulos, se aplicará el modelo más adecuado con una cantidad de datos relevante.

Si los datos están alejados de la mayoría de los valores que toma una variable, es posible asegurar que se trata de un error, que podría corregirse y en algunos casos ser tratado como nulo. En todo caso, se establecerán rangos para los datos outliers de manera que no generen problemas con la herramienta de modelado que se aplique.

Durante la preparación del conjunto de datos, se transformarán variables numéricas a categóricas con base en los grupos etáreos según los cuales las EPS pagan los tratamientos de valor diferencial o donde se presentan patologías particulares.

(13)

Página 13 de 21

Posteriormente, se caracterizará la información asociada a los pacientes, casos, tratamientos y progresos de la enfermedad, con el fin de encontrar correlaciones y dependencias entre variables (edades, factores de riesgo, pronósticos, costos de los tratamientos, entre otras). Así mismo, en el marco del proceso de caracterización, se identificarán qué tratamientos han sido exitosos, costo de los tratamientos, variables comunes de los casos exitosos (edades, número de compañeros, número de partos, tipo de sangre, entre otras), casos de pacientes fallecidos, y las demás que el modelo a aplicar contribuya a encontrar.

Con base en la caracterización, se procederá a la creación de un grupo de pacientes con tratamientos óptimos, es decir, detección temprana, costos mínimos y efectividad del tratamiento mismo, denominado grupo de prueba ideal sobre el cual se aplicará la técnica de minería de datos que se seleccione.

Al grupo ideal se le realizarán pruebas de datos de entrada al modelo, así como el ajuste necesario de los resultados del modelo, en atención a la naturaleza de los datos (categóricos, numéricos, entre otros).

(14)

Página 14 de 21

10. ACTIVIDADES A DESARROLLAR:

A continuación se describen las actividades específicas a desarrollar en cada una de las fases del proyecto:

FASE 1. Preparación de conjunto de datos. Al culminar esta fase se pretende contar con datos que contengan información necesaria para cumplir el objetivo del proyecto.

Para extraer de la base de datos de historias clínicas los registros de pacientes que han presentado diagnóstico positivo de carcinoma del cérvix, se llevarán a cabo las siguientes actividades:

 Solicitud de las historias clínicas de los pacientes del hospital, para lo cual se suscribirá un acuerdo de confidencialidad.

 Identificación de la base de datos de pacientes con diagnóstico positivo de carcinoma del cérvix.

 Solicitud de costo de tratamientos y exámenes de laboratorios realizados a pacientes con diagnóstico positivo de carcinoma del cérvix.

 Identificación del tipo de dato de cada uno de los campos del registro de cada paciente, determinando si corresponde a datos numéricos, textos, nominales, binominales, categóricos.

 Decisión sobre el tratamiento a los datos nulos, outliers y datos no balanceados.

 Depuración de los datos para tomar los registros válidos, es decir, aquellos que contienen los campos completos.

(15)

Página 15 de 21

FASE 2. Aplicación de modelo de minería de datos a grupo de prueba ideal.

 Creación de un grupo de pacientes con tratamientos óptimos, es decir, detección temprana, costos mínimos y efectividad del tratamiento.

 Selección de la técnica de minería de datos a aplicar en el grupo de prueba ideal.

 Pruebas de datos de entrada al modelo.

 Ajuste de los resultados del modelo en atención a la naturaleza de los datos.

 Aplicación de modelo de minería de datos al grupo de prueba ideal.

FASE 3. Comparación de resultados contra muestra de pacientes recientemente diagnosticados.

 Tomar el modelo refinado y aplicarle los datos de las historias clínicas

reales de personas con diagnóstico positivo de cáncer de cérvix.

 Comparar los resultados de la aplicación con los datos correspondientes.

 Realizar ajustes necesarios al modelo.

(16)

Página 16 de 21

11. CRONOGRAMA:

En la siguiente grafica se describe el cronograma de actividades del proyecto:

Figura 1. Cronograma de actividades propuesto

Meses 1 2 3 4 5 6 7 8 9 10 11 12 Actividad

Fase 1

Solicitud de las historias clínicas

Identificación de pacientes con diagnóstico positivo de carcinoma del cérvix

Solicitud de costo de tratamientos y exámenes de laboratorios realizados a pacientes con diagnóstico positivo

Identificación del tipo de dato de cada uno de los campos del registro de cada paciente

Decisión sobre el tratamiento a los datos nulos, outliers y datos no balanceados.

Depuración de los datos para tomar los registros válidos, es decir, aquellos que contienen los campos completos.

Caracterización de la información asociada a los pacientes, correlaciones y dependencias entre variables.

Fase 2

Creación de un grupo de pacientes con tratamientos óptimos

Selección de la técnica de minería de datos a aplicar en el grupo de prueba ideal.

Pruebas de datos de entrada al modelo.

Ajuste de los resultados del modelo en atención a la naturaleza de los datos.

Aplicación de modelo de minería de datos al grupo de prueba ideal.

Fase 3

Aplicación del modelo refinado a los datos de las historias clínicas reales de personas con diagnóstico positivo de cáncer de cérvix.

Comparación de resultados de la aplicación con datos correspondientes.

Ajustes necesarios al modelo.

(17)

Página 17 de 21

12. BIBLIOGRAFÍA BÁSICA:

[1]. Dick R. S., Oteen E. B., Detmer D. E. (eds). The computer-based patient record: An essential technology for health care. Revised Edition Washington,D.C.: The Nacional Academy Press. 1997. Capítulo 2. p. 74-99.

http://books.nap.edu/books/0309055326/html/R1.html.

[2]. Sim I., Gorman P., Greenes R. A., Haynes R. B., Kaplan B., Lehmann H., Tang P. C. Clinical decision support systems for the practice of evidence-based medicine. J. Am Med Inform Assoc 2001; 8: 527-34.

[3]. Miller E., Waight P., Efstratiou A., Brisson M., Johnson A., George R.Epidemiology of invasive and other pneumococcal disease in children in England and Wales 1996-1998. Acta Paediatr Suppl 2000; 89: 11-6.

[4]. Multi-Professional Working Group. Towards an information standard for organising clinical communications. University of Portsmouth. 1998. Disponible en: http://www.schin.ncl.ac.uk/rcgp/scopeEPR/nhs/Headings/HdMpwg.doc.

[5]. CEN/TC 251. prEN 13606-1. Health informatics-Electronic health record communication-Part 1: Reference model. 2003-06. Request for Comments. Disponible en: http://www.centc251.org/RFC/RFC-prEN13606-1__E_.pdf.

[6]. Moorman P. W., van der Lei J. An inventory of publications on computer-based medical records: an update. Methods Inf Med 2003; 42: 199-202. 7 Neubauer A. S., Priglinger S., Ehrt O. Electronic versus paper-based patient records: a cost-benefit analysis. Ophthalmologe 2001; 98: 1083-8.

[7]. The CLEF Project. A framework for clinical e-Science. University of Manchester. 2003-2005. Disponible en: http://www.clinical-escience.org/start. html.

[8]. Hellawell A. e-Science core programme. UK Research Councils. 2003. Disponible en: http://www.rcuk.ac.uk/escience/10 Klein C., Kajbjer K. CEN/TC 251. Health Informatics. Notes from the meeting at EMEA, London 2002-09-24. Disponible en: http://www.centc251.org/TCMeet/doclist/TCdoc02/N02-079-Notes-Emea-meeting.doc.

[9]. Lloyd D., Kalra D. OpenEHR. EUROREC 2002. Berlín. 13-14 Diciembre.Disponible en: http://www.eurorec.net/EUROREC_2002_presentations.html.

[10]. CEN/TC 251/PT 34. N99-097. Health Informatics-Interoperability of healthcare multimedia report systems. Final draft CEN Report. 1999-11-02. Disponible: http://www.centc251.org/TCMeet/Doclist/TCdoc99/N99-097.pdf.

[11]. Van Ginneken A. M. Considerations for the representation of meta-data for the support of structured data entry. Methods Inf Med 2003; 42: 226-35.

[12]. Klein G. O. Chairman’s introduction. CEN/TC 251 Joint Working GroupsMeeting. Manchester, 21-22 de mayo de 2001. Disponible en: http://www.centc251.org/TCMeet/doclist/TCdoc01/N01-015.ppt.

[13]. Engelbrecht R. K4Health. Knowledge for Health. Integrating EHR and Knowledge for better health care. Status of the EoI and work items. EUROREC 2002. Berlin. 13-14 December. Disponible en: http://www.eurorec.net/EUROREC_2002_presentations.html.

(18)

Página 18 de 21 [15]. The Department of Trade and Industry. UK e-Science (GRID) core programme. Londres. Disponible en:

http://www.escience-grid.org.uk/index.htm.

[16]. PELLUCID Partners. Akademickie Centrum Komputerowe CYFRONET AGH (Academic Computer Centre of the University of Mining and Metallurgy). Cracovia, Polonia. Disponible en:

http://www.sadiel.es/Europa/

[17]. Wald J. S., Rind D., Safran C., Kowaloff H., Barker R., Slack W. V. Patient entries in the electronic medical record: an interactive interview used in primary care. Proc Annu Symp Comput Appl Med Care 1995:.147-51.

[18]. Wyatt J. Acquisition and use of clinical data for audit and research. J. Eval Clin Pract 1995; 1: 15-27.

[19]. Oostenbrink R., Moons K. G., Bleeker S. E., Moll H. A., Grobbee D. E. Diagnostic research on routine care data: prospects and problems. J. Clin Epidemiol 2003; 56: 501-6.

[20]. CO-ODE (2003-2005). Medical Informatics Group. Department of Computer Science. University of Manchester. Disponible en: http://www.cs.man.ac.uk/mig/projects/current/coode/.

[21]. Unit of Assessment (UoA) CS Structure and policy. Research Assessment Exercise (RAE) analysis. University of Portsmouth. 6/1/2003. Disponible en:

http://www.tech.port.ac.uk/staffweb/briggsj/research/rae2001analysis/struct25.htm.

[22]. Stavri P. Z. Personal health information-seeking: A qualitative review of the literature. En: V. Patel et al. (Eds) MEDINFO. Amsterdam: IOS Press. 2001. Disponible en: http://www.centc251.org/forums/aca-1/dispatch.cgi/hsi/showFile/100316/d20011004135731/No/263_STAVRI.PDF

[23]. Berg M., Goorman E. The contextual nature of medical information. Int J. MedInf 1999; 56: 51-60.

[24]. Power, R., Scot, D. and Evans, R., What you see is what you meant: direct knowledge editing with natural language feedback, in Proc ECAI-98, (1998), Spring-Verlag, 677-81.

[25]. The Department of Trade and Industry. The Grid outreach programme 2002-2003. Londres. Disponible

en: http://www.gridoutreach.org.uk/.

[26]. Padkin, A., Rowan, K., and Black, N., Using high quality clinical databases to complement the results of randomised controlled trials: the case of recombinant human activated protein C. BMJ 2001; 323: 923-6. Disponible en:http://bmj.bmjjournals.com/cgi/content/full/323/7318/923.

[27]. Cabello C., Sanz Menéndez L. La organización social en los procesos de investigación y desarrollo tecnológico en el sector de informática de la salud.Comunicación al IV Congreso Nacional de Informática de la Salud (Inforsalid 2001). Madrid, 28-30 de Marzo de 2001. Disponible en:

http://www.seis.es/inforsalud2001/cientificas5/cabello.htm.

[28]. Van’t Riet A., Berg M., Hiddema F., Sol K. Meeting patients’ needs with patient information systems: potential benefits of qualitative research methods.Int J. Med Inf 2001; 64: 1-14.

[29]. Lau R. K., Catchpole M. Improving data collection and information retrieval for monitoring sexual health. Int J. STD AIDS 2001; 12: 8-13.

[30]. Pugliese P., Cuzin L., Enel P., Agher R., Alfandari S., Billaud E., Druard P., Duvivier C., Perez M., Salmi D., Pradier C. NADIS 2000, developpement d’undossier medical informatise pour les patients infectes par VIH, VHB et VHC. Presse Med 2003; 32: 299-303.

[31]. Rao, Y.N, Sudir Gupta and S.P. Agarwal 2003. National Cancer Control Programme:Current status and strategies, 50 years of cancer control in India,NCD Section, Director General of Health.

(19)

Página 19 de 21 [33]. M. Ester, H.-P. Kriegel, J. Sander, and X. Xu.1996. Adensity-based algorithm for discovering clusters in

large spatial databases. KDD'96.

[34]. Ng R.T., and Han J. 1994. Efficient and Effective Clustering Methods for Spatial Data Mining, Proc. 20th Int. Conf. on Very Large Data Bases, Chile.

[35]. W. Wang, J. Yang, and R. Muntz, STING: A Statistical Information grid approach to spatial data mining, Proc. 23rd1nt. Conf. on Very Large Databases, Morgan Kaufmann, pp. 186-195 (1997).

[36]. T. Zhang, R. Ramakrishnan, and M. L1nvy, B1RCH: An Efficient Data C1ustering Method for Very Large

[37]. Databases, Proc. ACM SIGMOD Int’L Conf. On Management of Data, ACM Press, pp. 103-114 (1996).

[38]. J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001.

[39]. L. Kaufinan, and P.J. Rousseeuw, Finding Groups in Data: an Introduction to Cluster Analysis, John Wiley & Sons1990.

[40]. Y. Zhao and G. Karypis. Evaluation of hierarchical clustering algorithms for document datasets. In CIKM, 2002.

[41]. http://eric.univlyon2.fr/~ricco/tanagra/en/tanagra.html.

[42]. Surveillance, Epidemiology, and End Results (SEER) Program (www.seer.cancer.gov)Public-Use Data (1973-2002), National Cancer Institute, DCCPS, Surveillance Research Program, Cancer Statistics Branch, released April 2005.

[43]. Mihael Ankerst, Markus M. Breunig, Hans-Peter Kriegel, Jörg Sander (1999). "OPTICS: Ordering Points to Identify the Clustering Structure". ACM SIGMOD international conference on Management of data.

[44]. U.M. Fayyad and P. Smyth. Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, Menlo Park, CA, 1996.

[45]. Kaur H, Wasan S K, Al-Hegami A S and Bhatnagar V, A Unified Approach for Discovery of Interesting Association

[46]. Rules in Medical Databases, Advances in Data Mining, Lecture Notes in Artificial Intelligence, Vol. 4065, Springer- Verlag, Berlin, Heidelberg (2006).

[47]. Kaur H and Wasan S K, An Integrated Approach in Medical Decision Making for Eliciting Knowledge, Web-based

[48]. Applications in Health Care & Biomedicine, Annals of Information Systems (AoIS), ed. A. Lazakidou, Springer 2009.

[49]. M. S. Chen, J. Han, and P. S. Yu. Data mining: an overview from database perspective. IEEE Trans. On Knowledge and Data Engineering, 5(1):866—883, Dec.1996.

(20)

Página 20 de 21

13. RECURSOS FÍSICOS:

A continuación se listan los principales recursos físicos requeridos en el proyecto, todos aportados por el proponente:

 Computador

 Impresora

 Conexión a Internet

 Elementos de papelería

 Grabadora de Voz

 Transporte

14. COSTOS DEL TRABAJO Y FUENTES DE FINANCIACIÓN:

CONCEPTO FUENTE COSTO UNITARIO COSTO TOTAL

Recurso humano

Investigador (160h/mes) Estudiante $50.000/hora $64.000.000 Director (4h/mes) U. Nacional $100.000/hora $3.200.000

Recursos Físicos

Computador Estudiante $2.500.000 $2.500.000

Conexión a Internet Estudiante 120.000/mes $1.440.000

Impresora Estudiante $50.000/mes $600.000

Elementos de papelería Estudiante $1.000.000 $1.000.000

Grabadora de Voz Estudiante $100.000 $100.000

Transporte Estudiante $400.000/mes $480.000

(21)

Página 21 de 21

15. COMENTARIO CON VISTO BUENO DEL DIRECTOR: (calificar los siguientes aspectos: organización, pertinencia, relevancia y originalidad).

16. FIRMA DEL PROPONENTE

Osvaldo Rueda Carreño

17. FIRMA DEL DIRECTOR (ASESORES)

Por definir

Referencias

Documento similar

"No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

[r]

SECUNDARIA COMPRENDE LOS

[r]

Asegurar una calidad mínima en los datos es una de las tareas más difíciles de conseguir para los organismos públicos cuyo objetivo es publicar datos lo más rápidamente posible

 Clave ajena: sus valores deben coincidir con los de la clave primaria de otra relación  representa una relación entre datos a modo de referencia.