Web scraping

Top PDF Web scraping:

Modelo de búsqueda de productos alimenticios en supermercados online categoría abarrotes utilizando asistente virtual de tipo chatbot y extracción de datos con web scraping

Modelo de búsqueda de productos alimenticios en supermercados online categoría abarrotes utilizando asistente virtual de tipo chatbot y extracción de datos con web scraping

The research proposal allowed the implementation of a Chatbot virtual assistant on the Facebook Messenger messaging platform as an input interface for consultations, this positively influenced since most of the users are familiar with the Facebook platform, in addition the proposed model contemplates the integration of Web Scraping technique (data extraction) for data storage, allowing to obtain updated and real information. The storage of information is done using a non-relational database in the Firebase cloud which will be consulted through our virtual assistant. It was demonstrated that by implementing a Chatbot-type virtual assistant in the search service of a product, it was able to reduce the time by 77% in the consultation process, providing quick answers and with an excellent level of user satisfaction of 69% on the use of the proposed model.

261 Lee mas

Diseño y desarrollo de una aplicación web Scraping de extracción de enlaces de tiendas web

Diseño y desarrollo de una aplicación web Scraping de extracción de enlaces de tiendas web

El web scraping más común es el que se lleva a cabo con spiders bots (arañas web de ahora en adelante) una estructura software con unas instrucciones muy precisas y con la capacidad de indexar solo los datos que le interesan al programador. Estas arañas pueden interpretar la estructura de la web (normalmente codificada en formato HTML) y transformar la información que contiene en datos ordenados, que después serán almacenados en una base de datos central, en una hoja de cálculo o en alguna otra fuente de almacenamiento, para su posterior análisis.

56 Lee mas

Aplicación de Técnicas de Web Scraping al Boletín Oficial de Castilla y León (BOCyL)

Aplicación de Técnicas de Web Scraping al Boletín Oficial de Castilla y León (BOCyL)

Además, existen otras limitaciones relacionadas con las barreras legales, ya que, algunos países reconocen los derechos de bases de datos limitando el derecho a reutilizar la información que se obtiene de lugares ya publicados. De hecho, algunas páginas se protegen del scraping declarando en sus condiciones legales la prohibición de realizar scraping sobre la página, como en el caso de una autoescuela la cual en una de sus cláusulas legales dice textualmente “Entre los usos comerciales prohibidos se incluyen, sin limitación: 1.La reventa o redistribción del sitio web, sus contenidos y/o su servicio a través de otro sitio wen. En particular, técnicas de “web scraping” para acceder a los contenidos del sitio web”. 6

89 Lee mas

Análisis del Perfil Profesional de los Profesionales de Ingeniería de Sistemas en Instituciones del Sector  Público Peruano a partir de la Aplicación de Técnicas de Inteligencia de Negocios y Scraping

Análisis del Perfil Profesional de los Profesionales de Ingeniería de Sistemas en Instituciones del Sector Público Peruano a partir de la Aplicación de Técnicas de Inteligencia de Negocios y Scraping

A nivel nacional, existen investigaciones relacionadas con la presente. En el mes de julio de 2014, en Perú, la Asociación Civil Transparencia y un equipo de trabajo del blog “Utero.pe” emprendieron un proyecto digital denominado Verita (Cabral, 20 de mayo de 2014), el cual es un buscador orientado a ayudar a los ciudadanos peruanos a indagar entre los datos de los más de cien mil candidatos que se presentaron en las elecciones municipales y regionales de octubre de 2014, todo ello a partir de la aplicación de técnicas de web scraping. En tanto, este grupo también aplicó la misma técnica para obtener los procesos penales y civiles de los postulantes, de modo que fue capaz de estructurar datos de antecedentes penales y civiles de los candidatos en la elección, pudiendo generar información estadística importante para los electores, tal como se aprecia en la publicación del 17 de julio de 2014 en el blog Útero, el cual se titula “1400 candidatos en todo el Perú tienen sentencias penales y civiles” (Cabral, 17 de Julio de 2014), dicha publicación indica como resultado del análisis que la sentencia más frecuente de los candidatos de la elección era la sentencia “por alimentos”, perteneciente al ámbito civil (871 candidatos).

218 Lee mas

Desarrollo de aplicación para la recolección de Tweets para proyecto de Agenda Setting

Desarrollo de aplicación para la recolección de Tweets para proyecto de Agenda Setting

La Teoría de la Fijación de Agenda postula que los medios de comunicación tienen una gran influencia sobre el público y logran determinar qué asuntos poseen interés informativo y qué relevancia le otorgan los usuarios. En este artículo se presenta un proyecto que, mediante técnicas de minería de textos, pretende determinar si los medios periodísticos argentinos lo- gran o no instalar temáticas en usuarios de redes so- ciales como Twitter. Como resultado de la primer etapa del proyecto se presentan en este artículo algunos desarrollos como: un script en R para realizar web scraping sobre los sitios web de periódicos digitales de Argentina, obtener las noticias publicadas en un período de tiempo y determinar los tópicos claves que se abordan en dichas noticias; y el desarrollo de una aplicación web que permite realizar la captura de tweets, en base a parámetros definidos previos a la búsqueda, para constrastar si los temas abordados en los periódicos tambien tienen repercusión en redes sociales. Conjuntamente se presenta una novedosa metodología para la gestión de proyectos de ciencias de datos.

11 Lee mas

Investigación y desarrollo de técnicas de scraping

Investigación y desarrollo de técnicas de scraping

Desde un punto de vista puramente técnico, es difícil describir qué es exactamente. La primera vez que te hablan del web scraping te imaginas una herramienta software perfecta que sabe lo que quieres y lo hace a la perfección, con solo darle a un botón consigue hacer tus deseos realidad. Y realmente esto no es mentira, existen herramientas poderosas que permiten hasta hacer bots que busquen por sí solos, pero eso no es lo que he venido a contar aquí. Vamos a tratar el web scraping no como una herramienta concreta, sino más bien como un arte. El arte de conocer qué datos quieres extraer de una web y utilizar un lenguaje de programación para crear lo que tú quieras hacer. En definitiva, de ser capaz de crearte algo a medida, y tratándolo siempre desde un enfoque más de autoaprendizaje e investigación que desde un enfoque de producto.

90 Lee mas

Iwantim - Proyecto de Actualización en TIC para Docentes del Colegio Sagrada Familia

Iwantim - Proyecto de Actualización en TIC para Docentes del Colegio Sagrada Familia

Iwantim web Messenger es un servicio de mensajería instantánea para la web. Puede utilizarse en cualquier sitio y cuando quiera con una conexión a internet, siempre mediante un navegador web. Puede enviar mensajes conectándose con un servicio de mensajería mediante Iwantim sin la necesidad de tener instalado ningún software en su ordenador.

20 Lee mas

Evaluación del grado de accesibilidad de la web de la Universidad Tecnológica de Pereira mediante la especificación doble A de WCAG 2 0

Evaluación del grado de accesibilidad de la web de la Universidad Tecnológica de Pereira mediante la especificación doble A de WCAG 2 0

La intención de este criterio de éxito es garantizar que los usuarios con discapacidad se les dan tiempo suficiente para interactuar con el contenido de la Web siempre que sea posible. Las personas con discapacidad, como ceguera, baja visión, deficiencias de destreza, y las limitaciones cognitivas pueden requerir más tiempo para leer el contenido o para realizar funciones como llenar formularios en línea. Si las funciones de Web dependen del tiempo, será difícil para algunos usuarios para realizar la acción requerida antes de un límite de tiempo se produce. Esto puede hacer que el servicio inaccesible para ellos. Diseño de funciones que no dependen del tiempo ayudará a las personas con discapacidad tener éxito en la realización de estas funciones. Ofrecer opciones a los plazos inhabilitar, personalizar la longitud de los plazos, o pedir más tiempo antes de que un plazo se produce ayuda a los usuarios que requieren más tiempo del previsto para completar con éxito las tareas. Estas opciones se enumeran en el orden en que será muy útil para el usuario. Desactivación de los plazos es mejor que la personalización de la longitud de los plazos, que es mejor que la que piden más tiempo antes de un límite de tiempo se produce.

232 Lee mas

Metodología para el desarrollo de sitios Web

Metodología para el desarrollo de sitios Web

Si un usuario visita paginas Web y se interesa sobre la compra de libros por medio de Internet. Recorre muchas páginas relacionados a ello, de diferentes empresas que se encargan de venderlos. Encuentra el libro que quería y a la hora de comprarlo tiene un problema. Se pregunta. ¿Cuan seguro será comprar aquí?, ¿Será confiable?. Por primera vez comienza a sentirse inseguro. Experimenta una emoción muy común pero a su vez extraña. Lo hace razonar y pensar mucho, no siempre para el bien. Reflexiona en lo que es la confianza en sí. Concluye que la misma es algo que se gana, ya sea por la aprobación sistemática de uno mismo como consecuencia de resultados buenos por parte de una institución o empresa, o porque esa institución haya tenido un prestigio durante el tiempo. Después de momentos de reflexión se decide investigar cual de las empresas que vende libros ha sido la más confiable durante el tiempo.

87 Lee mas

Jóvenes, participación, tics e iglesia : estrategias educomunicacionales de evangelización para la pastoral juvenil "apóstoles" de la parroquia Santa Catalina de Siena

Jóvenes, participación, tics e iglesia : estrategias educomunicacionales de evangelización para la pastoral juvenil "apóstoles" de la parroquia Santa Catalina de Siena

- 128 - decimos “hay que hacer una página web porque todos hacen una página web” o “hay que estar en Facebook porque todos están en Facebook” Pero el tema es que los jóvenes sean los protagonistas de este segundo paso que consiste en propiciar desde la Iglesia en instancias de índole real y de escucha a los jóvenes, más que como una plataforma de mensajes, de entrega de mensajes ha sido propuesta como una plataforma de escucha. Entonces en este último año 2012-2013 estamos haciendo un proceso de Misión Joven, la Misión Continental en Chile en estos dos últimos años se ha vivido como una MISIÓN JOVEN y en eso ha consistido. Eso ha significado hacer un programa juvenil radial que se llama “Misión Joven todo el rato” que lo hacen jóvenes, que tienen como plataforma escuchar a los jóvenes y luego de escucharles, de compartir con ellos una propuesta desde el Evangelio que no es estándar, porque desde algún movimiento apostólico tiene algún énfasis carismático, un énfasis en el discernimiento, un énfasis en la vocación… que tampoco es estándar en términos regionales, porque hablarle a jóvenes mapuches hoy día es necesariamente hablarles de postergación, hablarles de falta de respeto a su cultura, hablarles de pacificación y que a lo mejor no son temas en las grandes urbes de Chile. Hablarle a los jóvenes que están viviendo en Arica y Parinacota que se relacionan de tu a tu con los hermanos de Perú cuando estamos con nuestros Estados en problemas diplomáticos es distinto hacerlo desde el Evangelio, por eso es que eso lo han manejado más bien los jóvenes, la pastoral juvenil. Los videos que hace la pastoral juvenil son videos distintos, tienen un sello distinto, son desordenados, son chascones, son juguetones y muchas veces las decisiones que se han tomado en la Iglesia respecto a los jóvenes son decisiones con la lógica y mentalidad de adulto, entonces en este caso las plataformas comunicativas han sido manejadas por los jóvenes.

174 Lee mas

Nº 46 2003  (74 Kb.)

Nº 46 2003 (74 Kb.)

El KAW se ha concebido como una herramienta estática compuesta por documentos hiperenlazados con formato XHTML y formateados únicamente mediante hojas de estilo en cascada (CSS). Para su consulta es necesario disponer de un ordenador personal con lector de CDROM y un navegador web, siendo compatible con cualquier entorno operativo (Microsoft Windows, Linux, MacOS, Solaris...) y agente de usuario (Explorer, Netscape, Opera, Lynx,...). El KAW cumple con todas las recomendaciones más exigentes del grupo de trabajo Web Accesibility Initiative perteneciente al WWW Consortium (WAI/W3C), y ha sido validada su accesibilidad mediante las herramientas de comprobación Bobby (desarrollada por el propio WAI/W3C) y Test de Accesibilidad a la Web (TAW), promovido por el CEAPAT-IMSERSO, alcanzándose el nivel máximo de accesibilidad: AAA.

11 Lee mas

La Web Cubana y el Paradigma del Web 2.0

La Web Cubana y el Paradigma del Web 2.0

Es de señalar que las mayoría de los profesionales que hoy allí trabajan (líderes de proyectos, analistas, programadores, diseñadores, y demás miembros de un equipo de desarrollo de software) conocen muy poco de los enunciados que definen el paradigma del Web 2.0, si ellos no lo conocen que decir de los clientes nacionales los que quizás puedan tener una expectativa de lo que quieren pero no una base fuerte para exigir y pedir lo que realmente quieren, podemos especular entonces que igual es la situación o parecida de los demás profesionales en el resto del país, ya que la mayoría de las Aplicaciones Web nacionales que hoy están hosteadas se realizan o están realizadas en sus lugares de origen por desarrolladores locales. La situación es simple, el desconocimiento y la desactualización en cuanto a los estándares y tendencias del mercado nos hace pecar en la visión que deben poseer nuestros desarrollos para lograr llegar a una posición ventajosa en el mercado e industria informática, el desconocimiento provoca diseños e implementaciones de Aplicaciones Web, que cumplen con las exigencias del cliente pero que condena al producto o solución entregado, según sea su función social o empresarial, al fracaso o a su caducidad prematura. Quizás pueda parecer un tanto catastrófico pero el costo de producción de un producto software y su mantenimiento tiene que ser superado por los beneficios que este producto reporta y no solo pensando en beneficios económicos. La leyes del mercado, la ingeniería y la vida son claras el que no se adapta, no se desarrolla, navega contracorriente, hace caso omiso a los estándares, el que se tarda en adaptarse al medio y asumir las nuevas tendencias, simplemente muere, fracasa, quiebra, o no llega a las metas inicialmente trazadas; uno de los postulados de las paradójicas Leyes de Murphy plantea, que cuando una Aplicación Software funciona (y entiéndase como "funciona", que ya está a punto y lista para su salida al mercado y su explotación) entonces ha quedado antigua; igual nos ha pasado con el desarrollo de aplicaciones Web en Cuba, ahora que el país ha ido ganando en cultura informática y que la necesidad de informatización del país no solo es una misión de la “Batalla de Ideas”, sino una necesidad de nuestra sociedad toda y que hemos comenzado a poblar la red con aplicaciones Web de factura nacional abarcando diversos sectores y áreas de nuestra sociedad y con visibilidad tanto nacional como internacional, corremos el peligro de invertir recursos en el desarrollo de productos software que a la postre no cumplan con las expectativas, su función social, ni el aporte económico esperado creando un daño que podría ser catastrófico para la naciente industria del software cubana, ya que los procesos de reinversión y actualización de las tecnologías generalmente en Cuba tienen un ciclo mucho mayor que el que el mercado de la informática acepta como aceptable.

8 Lee mas

Estado actual de la Web 3.0 o Web Semántica

Estado actual de la Web 3.0 o Web Semántica

El servicio de RSS permite difundir información actualizada a usuarios que se han suscrito a una o más fuentes de contenidos. Es un formato desarrollado para compartir contenidos Web en sitios que se actualizan con frecuencia. Los sitios Web que brindan el servicio de RSS, tienen un botón anaranjado (figura 5), el cual permite suscribirse a ellos. Una vez realizado este proceso, bastará con un simple navegador para consultar las novedades del sitio Web solicitado, sin tener que entrar a éste.

17 Lee mas

Construcción de una maquina de control numérico " CNC" para prototipado rápido de piezas 3D en diferentes polímeros "impresora 3D"

Construcción de una maquina de control numérico " CNC" para prototipado rápido de piezas 3D en diferentes polímeros "impresora 3D"

101 comando Speed, ya que cuanto mayor sean las velocidades en Speed mayor tendrá que ser esta velocidad, ya que si no dejaremos más trozo de objeto sin imprimir. Una buena relación seria poner casi el doble del valor de Feed Rate del comando Speed, aunque yo no pondría más de 90 mm/s ya que podemos dañar los engranajes del extrusor (aunque en la web de ayuda, interrogación, dicen que para un Feed Rate de 48 usan un Extruder Retraction Speed de 150). El siguiente parámetro importante es el Filament Diameter, que se refiere al diámetro del filamento plástico que usamos, por tanto con un calibre digital realizamos barias mediciones en nuestro filamento y ponemos la media de los datos que obtengamos. Los otros dos últimos parámetros importantes, de los cuales ya hable anteriormente son el Retraction Distance (es la distancia de filamento que chupa el extrusor cuando deja de imprimir) y el Restart Extra Distance (es la distancia extra de filamento que chupa antes de imprimir, por tanto tendremos que poner valores negativos para extruir mas plástico de lo normal para dejar la menor distancia de objeto sin imprimir, por ejemplo -0.2) ver figura 142

156 Lee mas

Art – Technology-Mediated Social Participation-The next 25 years of HCI challenges – Shneiderman – 2011

Art – Technology-Mediated Social Participation-The next 25 years of HCI challenges – Shneiderman – 2011

The increased use of social media has taken on new forms from personal blogs that allow lengthy thoughtful, often passionate, commentaries read by those with shared interests to the steady stream of 140-character tweets broadcast to hundreds of diverse followers and possibly retweeted to thousands more. Vigorous participation in social networks encourages awareness, responses, and sometimes serious discussions among “friends”, while well-crafted YouTube videos can go viral when the web address is emailed, tweeted, posted to blogs, or mentioned on national television. The remarkable capacity of collaborative tools encourages massive coordinated efforts such as Wikipedia or beneficial collective intelligence projects such as film recommender systems, product review websites, or governmental knowledge sharing such as the U.S. State Department’s Diplopedia. User-generated content sites also include photo sharing such as Flickr, music sharing, poetry, political essays, how-to, question-answering, open source software, and much more.

12 Lee mas

Elicitación y especificación de requerimentos no funcionales para aplicaciones web

Elicitación y especificación de requerimentos no funcionales para aplicaciones web

En esta sección se presentan los resultados más relevantes de la utilización de los procesos, lineamientos y herramientas definidas para el tratamiento de los Requeri- mientos No Funcionales de Aplicaciones Web (de calidad y restricciones) en un pro- yecto real. El caso completo se encuentra desarrollado en [14]. Cabe acotar que no se proporcionan detalles de las actividades relacionadas a la captura y especificación de los requerimientos funcionales ni de las fases siguientes del ciclo de vida involucradas en el desarrollo.

14 Lee mas

Desarrollo de una aplicación Web de gestión y control del historial clínico en el departamento médico de la ESPAM MFL

Desarrollo de una aplicación Web de gestión y control del historial clínico en el departamento médico de la ESPAM MFL

tratados y adoptados en una reunión determinada, con el objetivo de poder conseguir certificar lo que ha ocurrido y darle una validez legal (Emprendepyme, 2016). Una vez finalizado el desarrollo de los casos de uso de los módulos que conforman la Aplicación Web, los autores realizaron un Acta de Reunión con el objetivo de iniciar con la fase dos denominada: “Ejecución del desarrollo del software” (Anexo 5). Dentro del Acta se define el planteamiento de una reunión con el personal de la Unidad de Producción de Software, con el propósito de determinar aspectos fundamentales para dar inicio al desarrollo de la aplicación web y de todas las actividades que se requieren para la implementación del sistema, el cual son responsables los miembros del trabajo de titulación. También se toma en cuenta el tiempo de finalización de cada actividad, las mismas que tienen un lapso de tiempo establecido en el cronograma. Una de las actividades más importantes que se encuentra en la fase 2 “Ejecución del desarrollo del software”, es el desarrollo de la base de datos, objetivo principal para la ejecución de la aplicación web. 2.2.2. ANÁLISIS Y DISEÑO DE LA BASE DE DATOS.

151 Lee mas

Implicación de internet en la evolución de la era tecnológica

Implicación de internet en la evolución de la era tecnológica

El programador inglés Berners­Lee desarrolló un software que permitía compartir información de                         y en cualquier computador conectado a través de Internet, estableciendo la primera comunicación                           entre un cliente y un servidor, a través de las primeras versiones del protocolo de transferencia o                                   intercambio de información de hipertexto HTTP (Hipertext Transfer Protocol), en lenguaje de                         programación HTML (HiperText Markup Languaje) que presenta y estructura el texto que se                           muestra a los usuarios y establece los enlaces de hipertexto a otros documentos en Internet,                               usando los localizadores URL (Uniform Resource Locator) que son la dirección de una página                             web. Es decir, en un mismo año había creado el primer servidor web, el primer navegador web y                                     las bases de HTML. En colaboración con Robert Cailliau construyeron un sistema de hipertexto                             en 1990.  

54 Lee mas

Aplicación web de para la gestión administrativa de la empresa calzado Maryan

Aplicación web de para la gestión administrativa de la empresa calzado Maryan

Las páginas web dinámicas tienen la capacidad de interactuar con el usuario, proporcionando múltiples facilidades, entre las que destacan el acceso a la base de datos y múltiples redes sociales y la utilización de `potentes buscadores de información. Además, el desarrollo de aplicaciones más dinámicas y tienen la capacidad de actualizar sus contenidos por medio de una gran variedad de lenguajes que facilitan y mejoran su funcionalidad dentro de las aplicaciones de páginas dinámicas que podemos encontrar esta la capacitación en línea (e- learning), el comercio de una gran cantidad de artículos (e-commerce), las aplicaciones de gobierno (e-gobierno) y las de tipo empresarial o las más utilizadas en su intranet. Por sus características operativas y el ámbito de acción de cada página, podemos tener páginas de tipo privado o público. (Gutierrez Angel; Lopez Jose, 2017)

81 Lee mas

Desarrollo de Easymaps, una librería en Javascript para aplicaciones web con mapas que usen Openlayers y Geoserver y que utilicen los estándares WMS, WFS y WPS

Desarrollo de Easymaps, una librería en Javascript para aplicaciones web con mapas que usen Openlayers y Geoserver y que utilicen los estándares WMS, WFS y WPS

Desde el lanzamiento de su versión 3.0 (en agosto del año 2014), Openlayers ha venido agregando más funcionalidades, cubriendo así, cada vez más las necesidades que se presentan en el desarrollo de aplicaciones web de mapas. No obstante, y a pesar de las significativas mejoras que se introdujeron en su última versión, esta librería aun cuenta con pocas funcionalidades relevantes relacionadas con los estándares WMS, WFS y WPS, desaprovechando así, sus capacidades. Sin embargo, cabe señalar que viene ampliando paulatinamente su cobertura sobre dichos, más dichas funcionalidades no están prestas para su uso, pues antes, es necesaria la creación y combinación de algunos objetos. (por ejemplo, la funcionalidad GetFeatureInfo de WMS).

179 Lee mas

Show all 7522 documents...