Comparaci´ on de la exactitud obtenida entre CNN y otras t´ ecnicas

CD-D 95.60 % 88.05 % CD-T 88.00 % 81.95 % CD-N 66.00 % 74.59 %

6.3.6. Comparaci´on de CNN con otros clasificadores

Por los experimentos en CNN reportados en la literatura sabemos que las arquitecturas GoogleNet (22 capas) [Szegedy et al., 2015], Alexnet (8 capas) [Krizhevsky et al., 2012] y entre otras, han logrado grandes resultados en detección de objetos con más de 10 categor´ıas, su robustez es resultado de su gran profundidad es decir mayor cantidad de neuronas y capas, sumado a un diseño de arquitectura eficiente, debido a su complejidad la cantidad de caracter´ısticas requeridas en la primera capa es mayor a la cantidad de caracter´ısticas que posee nuestro conjunto de datos de entrenamiento que es de 44x28 pixeles, en el caso de GoogleNet esta requiere imágenes de dimensión 224x224 pixeles y AlexNet solicita imágenes de dimensión 227x227 pixeles, la gran dimensión de las imágenes de entrada a su primera capa pueden adecuarse a su arquitectura de gran cantidad de capas y neuronas. La complejidad de la arquitectura de las CNN estándar implica también mayor tiempo computacional en los pasos feedforward,backward yupdate.

En cuanto a nuestra propuesta, los resultados presentados en la tabla 6.9 demuestran que un modelo CNN es preferido para la clasificación de veh´ıculos, a comparación de C-Haar. Como se mencionó en la sección6.2, CD-T representa el conjunto de datos extra´ıdos de una escena con escasa iluminación, Fig. 6.1b, el porcentaje obtenido por CNN-M11 es de 88 % que supera el porcentaje obtenido por C-Haar con CD-T. Para el caso de CD-N, Fig.6.1c, las muestras son obtenidas en una escena nocturna, donde los faros de los automóviles dificultan parcialmente la visión del mismo, el modelo CNN-M11 obtiene menor exactitud que con C-Haar, aún as´ı los porcentajes son bajos y se espera mejorar la clasificación de veh´ıculos en escenas nocturnas para conseguir una mayor exactitud.

6.4. Resultados del procesamiento de video

En la siguiente sección son presentados los resultados obtenidos de medir el tiempo de ejecución del detector de veh´ıculo, basado en la detección de movimiento para la generación de candidatos y en CNN para la clasificación de veh´ıculos. Un conjunto de 1249 fotogramas extra´ıdos de un video de 720x640 pixeles de resolución serán utilizados para los siguientes experimentos. El video fue capturado de d´ıa con una cámara de vigilancia [Dahua-Technology Co., 2010] que se encuentra

ubicada en la v´ıa pública, aproximadamente a 10mts. de altura sobre la acera en los exteriores de institución académica.

6.4.1. Detecci´on de veh´ıculos

Debido a la aparición de varios veh´ıculos es que un sistema de tiempo real debe realizar la detección en el menor tiempo posible. El tiempo de ejecución ha sido medida tanto en una versión secuencial como en una versión optimizada. En la figura 6.5 se observa el tiempo de ejecución en milisegundos del algoritmo de detección de movimiento y del algoritmo de detección de veh´ıculo, en una versión secuencial, obteniéndose aproximadamente 25ms por cada fotograma. En la figura6.6se observan los tiempos de ejecución en una versión optimizada, y se obtiene 20ms por cada fotograma.

130 24,4835253,8541520,002915B 17,78957746,1301692 20#N/A17,789577#N/A#N/A 131 23,2656583,7627620,001953B 17,73718544,7675582 20#N/A17,737185#N/A#N/A 132 23,2504573,6881680,002202B 18,18630345,127132 20#N/A18,186303#N/A#N/A 133 24,8192773,5793580,001963B 17,67895446,0795522 20#N/A17,678954#N/A#N/A 134 23,2689053,6857810,002295B 19,02463845,9816192 20#N/A19,024638#N/A#N/A 135 23,0813683,9046950,003129B 17,74999644,7391882 20#N/A17,749996#N/A#N/A 136 23,3852983,8070580,002217B 17,85159545,0461682 20#N/A17,851595#N/A#N/A 137 23,5853323,732130,001932B 18,46683945,7862332 20#N/A18,466839#N/A#N/A 138 24,6341713,8238540,002725B 18,71558447,1763342 20#N/A18,715584#N/A#N/A 139 23,2317383,8274790,002985B 18,76891945,8311212 20#N/A18,768919#N/A#N/A 140 23,703983,884080,002915B 23,95629551,547272 20#N/A23,956295#N/A#N/A 141 26,8296334,0497450,003345B 22,87929953,7620222 20#N/A22,879299#N/A#N/A 142 24,1839853,852810,002729B 20,12267648,16222 20#N/A20,122676#N/A#N/A 143 24,2287333,7725520,003121B 18,43582546,4402312 20#N/A18,435825#N/A#N/A 144 23,4941013,8495540,002919B 23,01969150,3662652 20#N/A23,019691#N/A#N/A 145 23,8174643,8458810,001592B 25,10303752,7679742 20#N/A25,103037#N/A#N/A 146 24,1975143,7936780,002817B 23,00629851,0003072 20#N/A23,006298#N/A#N/A 147 23,1167123,861140,002805B 23,06806450,0487212 20#N/A23,068064#N/A#N/A 148 23,1491173,8419960,002747B 23,26026650,2541262 20#N/A23,260266#N/A#N/A 149 22,637993,8302530,003178B 23,24040849,7118292 20#N/A23,240408#N/A#N/A 150 23,738783,9163920,002292B 23,16025750,8177212 20#N/A23,160257#N/A#N/A 151 23,025063,9278940,00249B 23,09137650,046822 20#N/A23,091376#N/A#N/A 152 22,6979674,0215890,002129B 23,1439249,8656052 20#N/A23,14392#N/A#N/A 153 23,2634473,9329720,001965B 23,21914850,4175322 20#N/A23,219148#N/A#N/A 154 23,3822173,7167140,00222B 23,1306750,2318212 20#N/A23,13067#N/A#N/A 155 22,9774663,8891910,00295B 18,25261245,1222192 20#N/A18,252612#N/A#N/A 156 22,6277723,8978760,002785B 18,66155645,1899892 20#N/A18,661556#N/A#N/A 157 22,5386313,8465820,003266B 17,79362444,1821032 20#N/A17,793624#N/A#N/A 158 23,7183973,7111210,002493B 17,95527245,3872832 20#N/A17,955272#N/A#N/A 159 23,7046583,759170,002733B 18,11686845,5834292 20#N/A18,116868#N/A#N/A 160 23,3277353,9088480,003161B 17,95995545,1996992 20#N/A17,959955#N/A#N/A 161 23,4347623,8432590,002831B 18,34339945,6242512 20#N/A18,343399#N/A#N/A 162 23,9136053,8415010,002932B 17,88434945,6423872 20#N/A17,884349#N/A#N/A 163 24,2977153,8317810,002943B 24,14313252,2755712 20#N/A24,143132#N/A#N/A 164 23,8637063,730620,003054B 23,60594951,2033292 20#N/A23,605949#N/A#N/A 165 23,5963473,8462830,002358B 25,0340852,4790682 20#N/A25,03408#N/A#N/A 166 24,0568293,8080650,003481B 21,423549,2918752 20#N/A21,4235#N/A#N/A 167 25,2728853,7761610,009093B 19,74046548,7986042 20#N/A19,740465#N/A#N/A 168 24,0658383,8317740,002801B 17,82241945,7228322 20#N/A17,822419#N/A#N/A 169 23,889083,7444940,003027B 19,95638647,5929872 20#N/A19,956386#N/A#N/A 170 26,6308833,829680,002282B 20,34678150,8096262 20#N/A20,346781#N/A#N/A 171 23,6235323,7232130,003127B 25,28350852,633382 20#N/A25,283508#N/A#N/A 172 24,5927193,8170240,002027B 24,02878952,4405592 20#N/A24,028789#N/A#N/A 173 26,1728673,797120,002512B 23,99316253,9656612 20#N/A23,993162#N/A#N/A 174 23,4365063,9075590,002541B 23,84576651,1923722 20#N/A23,845766#N/A#N/A 175 24,8227244,3624050,002673B 25,02837854,216183 30#N/A25,028378#N/A#N/A 176 25,3958234,0096020,002321B 23,98985153,3975973 30#N/A23,989851#N/A#N/A 177 25,5086433,8301460,002707B 28,07434457,415843 30#N/A28,074344#N/A#N/A 178 24,8956464,1768820,002903B 24,53986653,6152973 30#N/A24,539866#N/A#N/A 179 23,7464613,7211210,001961B 24,3759351,8454733 30#N/A24,37593#N/A#N/A 180 24,0487643,7569280,002089B 24,16012151,9679023 30#N/A24,160121#N/A#N/A 181 24,2514793,7885580,002615B 24,09963152,1422833 30#N/A24,099631#N/A#N/A 182 23,8710264,0148480,002756B 25,35689953,2455293 30#N/A25,356899#N/A#N/A 183 24,9677423,721480,002501B 24,04923452,7409573 30#N/A24,049234#N/A#N/A 184 24,1690883,8605690,001734B 24,52970252,5610933 30#N/A24,529702#N/A#N/A 185 23,9000293,7766080,001871B 24,10161251,780123 30#N/A24,101612#N/A#N/A 186 23,8728783,7752840,002709B 23,91984851,5707193 30#N/A23,919848#N/A#N/A 187 23,9269153,7420570,003225B 25,66642153,3386183 30#N/A25,666421#N/A#N/A 188 23,5746533,8295860,002564B 24,26484151,6716443 30#N/A24,264841#N/A#N/A 189 23,8987533,7932790,002416B 24,13059651,8250443 30#N/A24,130596#N/A#N/A 190 24,3552743,7661430,002409B 24,50114252,6249683 30#N/A24,501142#N/A#N/A 191 24,0251833,8389860,002127B 24,01538651,8816823 30#N/A24,015386#N/A#N/A 192 23,2660443,7490270,002706B 24,22654751,2443243 30#N/A24,226547#N/A#N/A 193 23,3879343,8327640,002383B 23,98984551,2129263 30#N/A23,989845#N/A#N/A 194 25,0590913,6946960,002259B 24,06745552,8235013 30#N/A24,067455#N/A#N/A

Fig. 6.5: Tiempo de ejecución de los algoritmos: detección de movimiento y detección de veh´ıculo, en versión secuencial. El eje “x” representa los fotogramas del video, y el eje “y” el tiempo en milisegundos.

124 19,5762675,2610960,002954B 0,0799924,9203070 0 #N/A 0,07999#N/A #N/A 125 19,8313634,9682070,003185B 14,14287538,945631 10 #N/A 14,142875#N/A #N/A 126 19,5230885,4822330,002084B 14,63342539,640831 10 #N/A 14,633425#N/A #N/A 127 19,523675,1951760,011487B 11,91497136,6453042 20 #N/A 11,914971#N/A #N/A 128 18,9133244,7444830,00244B 13,95321837,6134652 20 #N/A 13,953218#N/A #N/A 129 19,1349624,9560910,0029B 13,66162737,755582 20 #N/A 13,661627#N/A #N/A 130 19,615975,1785570,00224B 17,50431842,3010852 20 #N/A 17,504318#N/A #N/A 131 19,4824455,0076090,000907C 8,53521733,0261782 20 #N/A #N/A 8,535217#N/A 132 19,6788754,6355310,001961B 15,63542739,9517942 20 #N/A 15,635427#N/A #N/A 133 19,4051654,9979140,000904C 8,27490232,6788852 20 #N/A #N/A 8,274902#N/A 134 19,7196024,7077830,002033B 15,59660240,026022 20 #N/A 15,596602#N/A #N/A 135 20,1200544,8237770,002175B 17,76557342,7115792 20 #N/A 17,765573#N/A #N/A 136 19,6434245,057180,001601B 16,76205941,4642642 20 #N/A 16,762059#N/A #N/A 137 19,6937175,1232520,001411C 8,23933,057382 20 #N/A #N/A 8,239#N/A 138 19,6319664,7113070,001986B 17,11934641,4646052 20 #N/A 17,119346#N/A #N/A 139 19,9777485,1614920,001728B 16,85000941,9909772 20 #N/A 16,850009#N/A #N/A 140 20,2950574,8077980,001262C 8,30048333,4046 2 20 #N/A #N/A 8,300483#N/A 141 19,7044934,6918520,001885B 16,85609641,2543262 20 #N/A 16,856096#N/A #N/A 142 20,4495144,7466430,001687B 16,73856341,9364072 20 #N/A 16,738563#N/A #N/A 143 20,8106194,7888830,001021C 8,27976433,8802872 20 #N/A #N/A 8,279764#N/A 144 20,0283714,8604620,002042B 16,83982841,7307032 20 #N/A 16,839828#N/A #N/A 145 20,1646495,2799230,001609B 16,98517542,4313562 20 #N/A 16,985175#N/A #N/A 146 20,0683545,0686410,002235B 17,65742942,7966592 20 #N/A 17,657429#N/A #N/A 147 20,025825,2329940,001918B 16,9196342,1803622 20 #N/A 16,91963#N/A #N/A 148 20,4928644,7420920,001888B 16,9916742,2285142 20 #N/A 16,99167#N/A #N/A 149 19,66535,3373090,001733B 21,28859246,2929342 20 #N/A 21,288592#N/A #N/A 150 19,8751795,246660,001967B 23,53993148,6637372 20 #N/A 23,539931#N/A #N/A 151 19,6887085,3786630,001913B 22,16377847,2330622 20 #N/A 22,163778#N/A #N/A 152 19,9940165,3136570,002526B 23,16527348,4754722 20 #N/A 23,165273#N/A #N/A 153 19,7189515,4829860,001601B 22,05776247,2613 2 20 #N/A 22,057762#N/A #N/A 154 19,8452365,4415130,001845B 22,62549447,9140882 20 #N/A 22,625494#N/A #N/A 155 20,479495,2054480,001723B 28,84286254,5295232 20 #N/A 28,842862#N/A #N/A 156 19,683655,1950490,000645C 11,89481636,774162 20 #N/A #N/A 11,894816#N/A 157 19,8587514,9936830,001551B 24,06218148,9161662 20 #N/A 24,062181#N/A #N/A 158 20,6484914,845410,001986B 25,9231551,4190372 20 #N/A 25,92315#N/A #N/A 159 20,1513965,8948060,002297B 25,05808951,1065882 20 #N/A 25,058089#N/A #N/A 160 20,2459854,8115890,001707B 20,18538545,2446662 20 #N/A 20,185385#N/A #N/A 161 20,0425085,0331630,002131B 21,44329946,5211012 20 #N/A 21,443299#N/A #N/A 162 19,8885944,8479110,001427B 17,42684542,1647772 20 #N/A 17,426845#N/A #N/A 163 19,7530415,1393090,001636B 17,35847442,252462 20 #N/A 17,358474#N/A #N/A 164 20,0190195,3222210,000881C 8,42141733,7635382 20 #N/A #N/A 8,421417#N/A 165 19,3721824,8086940,002459B 21,35512845,5384632 20 #N/A 21,355128#N/A #N/A 166 18,8530114,9078240,001647B 23,74982847,512312 20 #N/A 23,749828#N/A #N/A 167 20,1193274,7687160,000915C 10,72877835,6177362 20 #N/A #N/A 10,728778#N/A 168 19,8747375,6142460,002397B 21,17270446,6640842 20 #N/A 21,172704#N/A #N/A 169 20,1743025,0520550,002197B 18,83944844,0680022 20 #N/A 18,839448#N/A #N/A 170 19,7104135,2596590,001503B 17,34342142,3149962 20 #N/A 17,343421#N/A #N/A 171 19,9489285,2362410,001558B 16,93786142,1245882 20 #N/A 16,937861#N/A #N/A 172 19,7505445,1498930,001539B 17,03442741,9364032 20 #N/A 17,034427#N/A #N/A 173 20,0021455,341650,001684B 28,29438553,6398642 20 #N/A 28,294385#N/A #N/A 174 19,851635,2456290,001464B 28,14448553,2432082 20 #N/A 28,144485#N/A #N/A 175 20,2429345,7181360,001896B 27,91124353,8742093 30 #N/A 27,911243#N/A #N/A 176 20,6734955,0554230,002058B 28,05518153,7861573 30 #N/A 28,055181#N/A #N/A 177 20,705745,0764760,002013B 28,0579353,8421593 30 #N/A 28,05793#N/A #N/A 178 19,9807755,6325680,001826B 28,1207153,7358793 30 #N/A 28,12071#N/A #N/A 179 19,9968925,4468380,002309B 27,62748553,0735243 30 #N/A 27,627485#N/A #N/A 180 19,9929735,2394310,001924B 28,1181753,3524983 30 #N/A 28,11817#N/A #N/A 181 19,9905355,0308850,00201B 28,08374253,1071723 30 #N/A 28,083742#N/A #N/A 182 20,1755755,4977030,00217B 28,13835653,8138043 30 #N/A 28,138356#N/A #N/A

Fig. 6.6: Tiempo de ejecución de los algoritmos: detección de movimiento y detección del veh´ıculo, con optimización computacional, El eje “x” representa los fotogramas del video, y el eje “y” el tiempo en milisegundos.

6.4.2. Seguimiento de veh´ıculos

Los experimentos para el seguimiento de veh´ıculos se han realizado con dos técnicas, una técnica de enfoque clásico, el algoritmo Camshift y la segunda técnica de enfoque moderno denominado Filtro de correlación. En los siguientes apartados se presenta gráficamente el resultado de las métricas de evaluación aplicadas a cada una de las dos técnicas para evaluar su rendimiento.

- Análisis Cuantitativo: Los gráficos success plot y precision plot, propuestos por [Wu et al., 2013], que fueron explicados en la sección 5.3 del cap´ıtulo 5, son empleados como métricas para evaluar cuantitativamente las dos técnicas de seguimiento de veh´ıculos, y son presentados en la figura 6.7.

A partir de los trabajos relacionados se analizaron dos técnicas de seguimiento de objetos, Camshift (CAM) y el filtro de correlación(FC). Como vemos en la figura 6.7a hasta el umbral 20 FC alcanza una precisión de 0.74 mientras que CAM en el mismo umbral obtiene 0.48, el mismo comportamiento se observa en la figura 6.7bdonde FC supera a CAM demostrando notoriedad en el umbral 0.4, este último valor indica que la tasa de Intersección sobre la Unión (IoU) entre todas la regiones reales y las regiones predecidas correspondientes alcanza 0.64 de precisión mientras que el algoritmo CAM obtiene 0.45.

En las figuras6.7cy6.7d,F C 1CSecrepresenta el uso de FC con la estrategia de correspondencia

de una sola caracter´ıstica, en este caso la caracter´ıstica tasa de sobreposici´on vi, y F C 3CSec

representa el uso de FC con la estrategia de correspondencia de las tres caracter´ısticas vi, pi y hi. En ambos casos “Sec” indica que la ejecución de las pruebas se hicieron con procesamiento secuencial, esto con la finalidad de demostrar posteriormente su diferencia ante un rendimiento optimizado de procesamiento paralelo. Se observa que la precisión de FC con 3 caracter´ısticas es mayor a la precisión obtenida con tan solo una caracter´ıstica, esto demuestra que el uso de varias caracter´ısticas que representen de manera única al objeto aumenta la precisión de ser detectado en cada fotograma hasta que el objeto desaparece de la escena. Es importante también ponderar adecuadamente, asignando un peso según la relevancia de cada caracter´ıstica frente a las demás.

- Análisis Cualitativo: En la figura6.8se observa una secuencia de fotogramas, cuyo orden es de izquierda a derecha y de arriba hacia abajo, extra´ıdos de una parte del video de pruebas. Mientras los veh´ıculos se movilizan su tamaño var´ıa progresivamente, esto debido a la posición y perspectiva de la cámara. Cabe resaltar que aquellos veh´ıculos más lejanos no presentan caracter´ısticas visuales con alta calidad como aquellos que se encuentran a una distancia menor de la cámara. Continuando con el análisis cualitativo, en la figura 6.9 una serie de veh´ıculos son detectados a pesar que se encuentran semioclu´ıdos, y algunos detenidos a una larga distancia de la cámara.

6.4.3. Tiempo de ejecuci´on

A continuación se presentan los experimentos que miden el tiempo de ejecución total del prototipo de detección de veh´ıculos, haciendo uso del filtro de correlación como algoritmo de seguimiento, y tres caracter´ısticas de correspondencia, estas son tasa de sobreposición; distancia entre centroides e histograma de color. En las siguientes figuras el eje “x” representa los fotogramas del video, y el eje “y” el tiempo en milisegundos.

0 5 10 15 20 25 30 35 40 45 50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Umbral DP Precision Plot Filtro de Correlación Algoritmo Camshift

(a)Exactitud de la distancia (DP) con Camshift y Filtro de correlaci´on.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Umbral OP Success Plot Filtro de Correlación Algoritmo Camshift

(b)Exactitud de sobreposici´on (OP) con Camshift y Filtro de correlaci´on.

0 5 10 15 20 25 30 35 40 45 50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Umbral DP Precision Plot FC 1C FC 3C

(c)Exactitud de la distancia (DP) del filtro de correlaci´on seg´un la cantidad de caracter´ısticas.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Umbral OP Success Plot FC 1C FC 3C

(d)Exactitud de sobreposición (OP) usando filtro de correlación según la cantidad de caracter´ısticas.

Fig. 6.7: Gr´aficos donde se demuestra la exactitud de distancia(DP) y la exactitud de sobreposici´on(OP), donde FC 1C representa el uso de una caracter´ıstica y FC 3C el uso de 3 caracter´ısticas.

En la figura 6.10 se muestra el tiempo de ejecución total que requiere el prototipo en una versión sin optimización por cada fotograma del video, el número de instancias indica el número de veh´ıculos que se presentan en cada fotograma. El número de instancias se encuentra normalizado para una mejor visualización, cada número fue multiplicado por diez, si en la gráfica el número de instancias es 20 entonces representa 2 veh´ıculos.

En la figura6.11se observa el tiempo total de ejecución y el número de instancias normalizada en una versión optimizada del prototipo sobre una plataforma GPU, obteniendo una media de tiempo de ejecución de 45,24ms, la versión optimizada supera a la versión secuencial presentada

Fig. 6.8: Secuencia de fotogramas que demuestran la detecci´on y seguimiento de veh´ıculos en diferentes escalas.

Fig. 6.9: Secuencia de fotogramas que demuestran la detecci´on y seguimiento de veh´ıculos semioclu´ıdos.

62 19,4898344,5751610,000989C 2,78622226,8522060 0 #N/A #N/A 2,786222#N/A 63 19,0646685,002090,002539B 0,06583224,1351290 0 #N/A 0,065832#N/A #N/A 64 19,3394824,6927090,012003B 0,06452124,1087150 0 #N/A 0,064521#N/A #N/A 65 19,2135344,7042930,003062B 7,89175431,8126430 0 #N/A 7,891754#N/A #N/A 66 19,0106324,9958870,002454B 1,24733525,2563080 0 #N/A 1,247335#N/A #N/A 67 19,4369194,6578990,001845B 0,06648224,1631450 0 #N/A 0,066482#N/A #N/A 68 19,1898854,9430240,002019B 4,31286328,4477910 0 #N/A 4,312863#N/A #N/A 69 19,4274424,7287920,00081n 0 24,1570440 0 #N/A #N/A#N/A 0 70 19,281845,1886980,001134n 0 24,4716720 0 #N/A #N/A#N/A 0 71 19,5532724,7065850,001021n 0 24,2608780 0 #N/A #N/A#N/A 0 72 19,0097824,7412470,000832n 0 23,7518610 0 #N/A #N/A#N/A 0 73 19,2167324,9880440,000967n 0 24,2057430 0 #N/A #N/A#N/A 0 74 19,1397954,6551790,001362n 0 23,7963360 0 #N/A #N/A#N/A 0 75 19,1160174,682040,001041n 0 23,7990980 0 #N/A #N/A#N/A 0 76 19,0056394,9015090,001012n 0 23,908160 0 #N/A #N/A#N/A 0 77 19,5381924,7822840,001993A 1,60611325,9285820 0 1,606113#N/A#N/A #N/A 78 19,2896744,5926190,001788B 4,76283928,646920 0 #N/A 4,762839#N/A #N/A 79 19,2949935,1900370,001951B 1,24395425,7309350 0 #N/A 1,243954#N/A #N/A 80 19,5545464,6951970,00087C 0,04248124,2930940 0 #N/A #N/A 0,042481#N/A 81 19,4404355,2202110,000824C 0,04381424,7052840 0 #N/A #N/A 0,043814#N/A 82 19,5329164,6538690,001011C 0,04204824,2298440 0 #N/A #N/A 0,042048#N/A 83 19,2282074,6603750,000827C 3,16549127,0549 0 0 #N/A #N/A 3,165491#N/A 84 19,3221535,0046690,001145C 3,16566427,4936310 0 #N/A #N/A 3,165664#N/A 85 19,3168594,6841430,001466n 0 24,0024680 0 #N/A #N/A#N/A 0 86 19,1991315,0327320,002648A 3,11238827,3468990 0 3,112388#N/A#N/A #N/A 87 19,5524034,6809860,001314C 2,82584327,0605460 0 #N/A #N/A 2,825843#N/A 88 19,3206624,9322450,00104C 0,05690924,3108560 0 #N/A #N/A 0,056909#N/A 89 19,986114,6030410,001926B 0,0664624,6575370 0 #N/A 0,06646#N/A #N/A 90 19,245894,5943170,001025C 0,04211623,8833480 0 #N/A #N/A 0,042116#N/A 91 19,4712475,254970,002492B 0,06700224,7957110 0 #N/A 0,067002#N/A #N/A 92 19,6728734,6486170,001251C 0,04238724,3651280 0 #N/A #N/A 0,042387#N/A 93 19,4051814,68690,002805B 6,30460430,399490 0 #N/A 6,304604#N/A #N/A 94 19,6323645,1197150,000833C 0,04207824,794990 0 #N/A #N/A 0,042078#N/A 95 19,7825234,771660,000888n 0 24,5550710 0 #N/A #N/A#N/A 0 96 19,5995674,9386070,001933A 0,34061124,8807180 0 0,340611#N/A#N/A #N/A 97 19,9440685,0368170,002063B 0,06493725,0478850 0 #N/A 0,064937#N/A #N/A 98 19,5997794,7321430,001244C 0,04248924,3756550 0 #N/A #N/A 0,042489#N/A 99 19,345894,8178770,000924C 0,04145524,2061460 0 #N/A #N/A 0,041455#N/A 100 19,6455135,3087250,0023B 0,06607425,0226120 0 #N/A 0,066074#N/A #N/A 101 19,943124,7847990,000901C 0,04267624,7714960 0 #N/A #N/A 0,042676#N/A 102 19,5852074,8189080,000999C 0,04160424,4467180 0 #N/A #N/A 0,041604#N/A 103 19,7663345,2380410,012818B 2,82653927,8437320 0 #N/A 2,826539#N/A #N/A 104 19,8688114,9625820,001805C 0,04226124,8754590 0 #N/A #N/A 0,042261#N/A 105 19,565955,3530440,001648n 0 24,9206420 0 #N/A #N/A#N/A 0 106 19,7448254,9994530,013157A 0,30924525,066680 0 0,309245#N/A#N/A #N/A 107 19,6573774,8855520,001829B 6,66043931,2051970 0 #N/A 6,660439#N/A #N/A 108 20,7120385,0095640,003429B 6,65598832,3810190 0 #N/A 6,655988#N/A #N/A 109 19,6260124,9095350,002182B 5,69053230,2282610 0 #N/A 5,690532#N/A #N/A 110 19,6570144,9337470,001557B 1,35730425,9496220 0 #N/A 1,357304#N/A #N/A 111 19,9910854,8720340,000655C 3,15622928,0200030 0 #N/A #N/A 3,156229#N/A 112 19,9741944,745030,001677B 7,59016332,3110640 0 #N/A 7,590163#N/A #N/A 113 20,0258584,8434420,00218B 1,64648226,5179620 0 #N/A 1,646482#N/A #N/A 114 20,2150394,7673780,001996B 0,07669625,0611090 0 #N/A 0,076696#N/A #N/A 115 19,8498675,1307440,001836B 1,26088226,2433290 0 #N/A 1,260882#N/A #N/A 116 19,9465234,8498820,002453B 0,38537225,184230 0 #N/A 0,385372#N/A #N/A 117 19,4801884,8877520,001621B 6,31930230,6888630 0 #N/A 6,319302#N/A #N/A 118 19,9196594,8490440,002981B 6,34992931,1216130 0 #N/A 6,349929#N/A #N/A 119 19,4889355,1878810,001872B 6,31962430,9983120 0 #N/A 6,319624#N/A #N/A 120 20,0516714,7273340,002083B 0,09540324,8764910 0 #N/A 0,095403#N/A #N/A 121 19,6638335,0926080,002385B 0,10502124,8638470 0 #N/A 0,105021#N/A #N/A 122 20,1490895,0116110,002153B 0,67901925,8418720 0 #N/A 0,679019#N/A #N/A 123 18,9420064,7305550,002275B 3,33438727,0092230 0 #N/A 3,334387#N/A #N/A

Fig. 6.10: Tiempo total de ejecuci´on, en versi´on secuencial, representado en la medida de tiempo milisegundos.

en la figura 6.10que es de 47,45ms.

65 21,6103583,6018520,002853B 0,03677225,2518350 0#N/A0,036772#N/A#N/A

66 21,5467883,61730,002246B 0,04026825,2066020 0#N/A0,040268#N/A#N/A

67 23,4486873,6572160,002242B 17,33685644,4450010 0#N/A17,336856#N/A#N/A

68 23,5268063,6876330,001904B 12,89545240,1117950 0#N/A12,895452#N/A#N/A

69 22,3371883,7469990,002376B 16,15258342,2391460 0#N/A16,152583#N/A#N/A

70 22,3553293,7302110,001965B 17,28790443,3754090 0#N/A17,287904#N/A#N/A

71 21,9299363,7773530,001532B 15,49601441,2048350 0#N/A15,496014#N/A#N/A

72 22,5865913,7488530,002115B 11,63966837,9772270 0#N/A11,639668#N/A#N/A

73 22,0319443,7599750,002275B 11,97660337,7707970 0#N/A11,976603#N/A#N/A

74 23,7026333,6748120,002606B 11,42167638,8017270 0#N/A11,421676#N/A#N/A

75 22,2888893,7152040,002156B 11,44953137,455780 0#N/A11,449531#N/A#N/A

76 22,2746213,7483770,001823B 11,62369137,6485120 0#N/A11,623691#N/A#N/A

77 23,3020673,7294210,001949B 19,29364946,3270860 0#N/A19,293649#N/A#N/A

78 26,1186694,1817320,002635B 12,86247643,1655120 0#N/A12,862476#N/A#N/A

79 22,1460453,6983220,002236B 11,58487837,4314810 0#N/A11,584878#N/A#N/A

80 22,1174663,787460,002213B 11,4578737,3650090 0#N/A11,45787#N/A#N/A

81 23,1891333,7818070,002191B 11,89956538,8726960 0#N/A11,899565#N/A#N/A

82 22,8241713,6779170,002414B 12,32280738,8273090 0#N/A12,322807#N/A#N/A

83 22,5068363,7248230,002046B 11,63737737,8710820 0#N/A11,637377#N/A#N/A

84 23,4547093,747440,0027B 11,89094939,0957980 0#N/A11,890949#N/A#N/A

85 23,2943793,7285160,002541B 11,93720338,9626390 0#N/A11,937203#N/A#N/A

86 23,7902083,7318630,002659B 11,80243439,3271640 0#N/A11,802434#N/A#N/A

87 22,8283,7629330,002196B 11,61191338,2050420 0#N/A11,611913#N/A#N/A

88 23,3208743,7093970,002531B 17,22776244,2605640 0#N/A17,227762#N/A#N/A

89 22,8317273,7663470,002835B 14,89849941,4994080 0#N/A14,898499#N/A#N/A

90 24,5899213,7178550,002445B 11,60316539,9133860 0#N/A11,603165#N/A#N/A

91 23,6819783,7437320,002371B 11,73483339,1629140 0#N/A11,734833#N/A#N/A

92 23,4393233,7419970,002477B 11,61088138,7946780 0#N/A11,610881#N/A#N/A

93 24,0728013,6908470,002762B 11,71399639,4804060 0#N/A11,713996#N/A#N/A

94 25,995933,7185410,001972B 17,51778547,2342280 0#N/A17,517785#N/A#N/A

95 24,0062163,6352750,001913B 13,15147240,7948760 0#N/A13,151472#N/A#N/A

96 23,3072413,7323110,001913B 11,6275638,6690250 0#N/A11,62756#N/A#N/A

97 22,7475913,7896340,002468B 11,64186438,1815570 0#N/A11,641864#N/A#N/A

98 24,153643,8093330,002252B 11,82121639,7864410 0#N/A11,821216#N/A#N/A

99 23,7485683,8696110,002943B 11,73746939,3585910 0#N/A11,737469#N/A#N/A

100 22,8693923,816450,002553B 11,56544338,2538380 0#N/A11,565443#N/A#N/A

101 23,2931583,8511730,001957B 11,70200638,8482940 0#N/A11,702006#N/A#N/A

102 22,5537933,8514150,002426B 11,82641938,2340530 0#N/A11,826419#N/A#N/A

103 24,3416693,8174420,002735B 11,56025939,7221050 0#N/A11,560259#N/A#N/A

104 22,8957653,8198020,002765B 11,67466538,3929970 0#N/A11,674665#N/A#N/A

105 23,5688523,9958660,001959B 17,34026744,9069440 0#N/A17,340267#N/A#N/A

106 23,4213473,8549440,002958B 18,30835245,5876010 0#N/A18,308352#N/A#N/A

107 24,9674953,8627420,001925B 14,46656843,298730 0#N/A14,466568#N/A#N/A

108 24,5784483,84260,002761B 18,19661446,6204230 0#N/A18,196614#N/A#N/A

109 24,5660253,866910,002811B 13,27215241,7078980 0#N/A13,272152#N/A#N/A

110 25,1534243,8460150,002283B 11,88308940,8848110 0#N/A11,883089#N/A#N/A

111 23,8596683,819640,002306B 15,0723242,7539340 0#N/A15,07232#N/A#N/A

112 24,6173113,7572130,00244B 19,6018447,9788040 0#N/A19,60184#N/A#N/A

113 26,1882433,8278910,00204B 15,32953345,3477070 0#N/A15,329533#N/A#N/A

114 24,376963,8595840,002048B 17,00694545,2455370 0#N/A17,006945#N/A#N/A

115 25,4115413,9133050,00284B 17,38384646,7115320 0#N/A17,383846#N/A#N/A

116 24,4577353,832790,002936B 12,69149140,9849520 0#N/A12,691491#N/A#N/A

117 22,9776743,8106240,002916B 18,27704945,0682630 0#N/A18,277049#N/A#N/A

118 23,2171993,8892850,00241B 17,78294544,8918390 0#N/A17,782945#N/A#N/A

119 23,4347793,7558160,002629B 17,60355244,7967760 0#N/A17,603552#N/A#N/A

120 23,5161923,781860,002646B 20,64371947,9444170 0#N/A20,643719#N/A#N/A

121 24,4606123,9450180,003047B 24,50124152,9099180 0#N/A24,501241#N/A#N/A

122 23,1884524,1572340,002127B 24,34515151,6929640 0#N/A24,345151#N/A#N/A

123 22,480274,0133030,002899B 24,60269651,0991680 0#N/A24,602696#N/A#N/A

124 24,0613943,7296550,002265B 28,5958356,3891440 0#N/A28,59583#N/A#N/A

125 23,0328783,7910960,002263B 18,88497645,7112131 10#N/A18,884976#N/A#N/A

126 25,1193283,8210640,003038B 17,90412546,8475551 10#N/A17,904125#N/A#N/A

127 24,3914773,6976660,001901B 17,80528945,8963332 20#N/A17,805289#N/A#N/A

128 22,7307973,8536910,003054B 22,74630949,3338512 20#N/A22,746309#N/A#N/A

129 23,0993,8596970,002557B 17,83014344,7913972 20#N/A17,830143#N/A#N/A

Fig. 6.11: Tiempo total de ejecuci´on, con optimizaci´on computacional, representado en la medida de tiempo milisegundos.

6.5. Consideraciones finales

En el presente cap´ıtulo se han demostrado los resultados de la experimentación con redes neuronales convolucionales y otras técnicas para la detección de veh´ıculos por video, demostrando a través de la fórmula de la exactitud el clasificador más conveniente para la detección de veh´ıculos. Seguidamente, en el cap´ıtulo siguiente se exponen las conclusiones del trabajo de investigación.

7

Conclusiones

7.1. Conclusiones

La tasa de exactitud y el tiempo de detección son factores de gran influencia en la eficiencia de un sistema de detección de objetos en tiempo real. La variación de iluminación puede afectar la eficiencia pero si es controlada se obtiene un mejor desempeño del sistema. Las técnicas de aprendizaje profundo han demostrado grandes éxitos en los últimos años, es por ello que su uso es de gran confiabilidad.

En el presente proyecto de investigación se han realizado cuatro experimentos para hallar el modelo de clasificación de veh´ıculos que sea capaz de afrontar la variación de iluminación en las imágenes y otros factores externos. El primer experimento tuvo como finalidad observar el comportamiento de los parámetros mean y batch en un modelo CNN de cinco capas denominado LeNet-5, con el conjunto de datos propuesto. Los porcentajes de clasificación demostraron la influencia del parámetro mean, si el clasificador tiene la información de la relación que existe entre los colores de sus muestras de entrenamiento, es decir el promedio, entonces la red converge a un menor error. En cuanto al tamaño del parámetro batch no existe una regla para usar un determinado valor, este depende de la arquitectura y del número de iteraciones que se va a realizar en el entrenamiento, su valor también se puede deducir de la experiencia de clasificadores CNN usados anteriormente en otros trabajos de investigación.

El segundo experimento tuvo como objetivo encontrar la mejor combinación de hiperparámetros y el análisis de la influencia del tamaño del kernel en las convoluciones. Los hiperparámetros ReLU, Xavier y Max predominaron en el mejor modelo de CNN para el conjunto de datos propuesto. ReLU es una función no-lineal y de operación más rápida, la función Xavier resulta ser más acertada porque considera el número de neuronas de entrada y el número de neuronas de salida, y en cuanto al hiperparámetro Max este calcula el mayor valor de pixel en cada ventana que recorre la imagen. La combinación del aporte positivo de cada uno de los tres hiperparámetros logra un porcentaje

de 95.37 % de exactitud en la clasificaci´on de veh´ıculos.

Para el tercer experimento podemos resaltar que el conjunto de datos utilizados para el entrenamiento se diferencian de los conjuntos de datos de prueba CD-T y CD-N en la intensidad de iluminación, debido a que los datos de entrenamiento fueron capturados en horas de mayor iluminación, a diferencia de los datos de pruebas que fueron capturados en horas con menor iluminación. Los resultados demostraron que el modelo CNN denominado en este trabajo como M11 supera en porcentaje de exactitud a la cascada de Haar, aún cuando las imágenes son extra´ıdas de una cámara de vigilancia, y tomando en cuenta que los veh´ıculos son multiescala y multiperspectiva. Con un modelo de CNN de cinco capas se puede realizar una eficiente clasificación binaria para imágenes de veh´ıculos extra´ıdas de una cámara de vigilancia.

La realización del cuarto experimento nos muestra el comportamiento de CNN ante imágenes capturadas en condiciones bien diferenciadas de las de entrenamiento, demostrando que la convolución y el algoritmo de aprendizaje gradiente estocástica de la CNN puede manipular diferentes contextos de iluminación pero, ante imágenes de diferente resolución y con multiperspectiva como el conjunto de datos ImageNet pueden provocar resultados diferentes en las convoluciones haciendo que la función de error arroje mayor cantidad de falsos positivos o falsos negativos.

Para complementar la detección de veh´ıculos en tiempo real se han realizado experimentos con las técnicas de procesamiento de video. Se ha analizado el tiempo de ejecución en una versión secuencial y en versión optimizada por GPU. Realizar el seguimiento de objetos visuales requiere también afrontar los factores externos, los más influyentes son la oclusión del objeto, los cambios en niveles de iluminación y la variación de escala del objeto durante su aparición en la escena. Durante la revisión de la literatura se observa que entre las técnicas de enfoque clásico el algorimo Camshift ha permanecido durante años como la técnica más robusta para seguimiento de objetos en tiempo real por mantener etiquetado el objeto a pesar de su variación en el tamaño durante toda su trayectoria, pero en aplicaciones donde la variación de iluminación y la oclusión están presentes el algoritmo Camshift decae en rendimiento, sobresaliendo en estos aspectos un enfoque moderno basado en el algoritmo de filtros de correlación.

Finalmente podemos concluir que en un contexto de iluminación variada con el uso de redes neuronales convolucionales se obtiene buenos porcentajes de clasificación de imágenes veh´ıculo, a comparación de una técnica tradicional como es Adaboost en cascada con caracter´ısticas de Haar. El modelo CNN obtenido junto a otras técnicas de procesamiento de video tales como la detección de movimiento y filtros de correlación conforman un sistema satisfactorio para la detección de veh´ıculos en videos extra´ıdos de una cámara de vigilancia, superando as´ı los factores externos que se presentan en la detección de objetos en tiempo real.

7.2. Recomendaciones

Cabe resaltar que la arquitectura y la cantidad de datos son aspectos altamente influyentes en el rendimiento de una red neuronal convolucional, como fue demostrado en investigaciones anteriores y en el presente proyecto de tesis. La relaci´on entre el tama˜no de la arquitectura y la cantidad de datos

es directamente proporcional, y la generalización de la CNN también es un aspecto importante, esta se ver´ıa afectada negativamente si el conjunto de datos fuera escaso. Seguidamente la elección de los hiperparámetros también es de gran influencia, estos deben ser seleccionados conociendo la operación que realizan y la información que utilizan, experimentos de prueba y error también han sido necesarios en muchos experimentos revisados en la literatura.

7.3. Trabajos Futuros

Modelos de clasificación binaria son bien acudidos en aplicaciones de tiempo real, un modelo de clasificación ligero y de buen rendimiento es adecuado para este tipo de aplicaciones, es por ello que un modelo CNN de cinco capas con los hiperparámetros demostrados puede ser aplicado a diferentes contextos con cámara de vigilancia, tales como la detección de peatones, la detección de acciones violentas, detección de rostros, etc. La experimentación en contextos diferentes de detección de objetos queda apta a futuras investigaciones.

Bibliograf´ıa

[Ahad, 2012] Ahad, M. A. R. (2012). Motion history images for action recognition and understanding. Springer Science & Business Media.

[Ahmed et al., 2017] Ahmed, K. E. B., Saeed, R. A., and Mokhtar, R. A. (2017). Real time camshift tracking algorithm using tms320dm6437 evm. InCommunication, Control, Computing

and Electronics Engineering (ICCCCEE), 2017 International Conference on, pages 1–6. IEEE.

[Ali et al., 2016] Ali, A., Jalil, A., Niu, J., Zhao, X., Rathore, S., Ahmed, J., and Iftikhar, M. A. (2016). Visual object tracking: classical and contemporary approaches. Frontiers of Computer Science, 10(1):167–188.

[Andy, 2017] Andy (2017). Stochastic Gradient Descent – Mini-batch and more. http:

//www.adventuresinmachinelearning.com/stochastic-gradient-descent/, ultimo´ acce-

so: 2017/12/12.

[Anzai, 2012] Anzai, Y. (2012). Pattern recognition and machine learning. Elsevier.

[Apple Inc., 2016] Apple Inc. (2016). Performing convolution operations. https: //developer.apple.com/library/content/documentation/Performance/Conceptual/

vImage/ConvolutionOperations/ConvolutionOperations.html, ´ultimo acceso: 2016/10/10.

[Attwell and Laughlin, 2001] Attwell, D. and Laughlin, S. B. (2001). An energy budget for signaling in the grey matter of the brain. Journal of Cerebral Blood Flow & Metabolism, 21(10):1133–1145.

[Barba, 2017] Barba, J. ´A. G. (2017). Aprendizaje profundo para el procesamiento del lenguaje natural.

[Bay et al., 2006] Bay, H., Tuytelaars, T., and Van Gool, L. (2006). Surf: Speeded up robust features. Computer vision–ECCV 2006, pages 404–417.

[Benenson et al., 2012] Benenson, R., Mathias, M., Timofte, R., and Van Gool, L. (2012). Pedestrian detection at 100 frames per second. In Computer Vision and Pattern Recognition

[Bengio and Delalleau, 2011] Bengio, Y. and Delalleau, O. (2011). On the expressive power of deep architectures. InAlgorithmic Learning Theory, pages 18–36. Springer.

[Bengio et al., 2009] Bengio, Y. et al. (2009). Learning deep architectures for ai. Foundations and trendsR in Machine Learning, 2(1):1–127.

[Bengio et al., 2007] Bengio, Y., LeCun, Y., et al. (2007). Scaling learning algorithms towards ai.

Large-scale kernel machines, 34(5):1–41.

[Bishop, 2006] Bishop, C. M. (2006). Pattern recognition and machine learning. springer.

[Bobick et al., 1997] Bobick, A., Davis, J., and Intille, S. (1997). The kidsroom: an example application using a deep perceptual interface. In Proc. Wkshp. Percept. User Interfaces, pages 1–4.

[Bolme et al., 2010] Bolme, D. S., Beveridge, J. R., Draper, B. A., and Lui, Y. M. (2010). Visual object tracking using adaptive correlation filters. InComputer Vision and Pattern Recognition

(CVPR), 2010 IEEE Conference on, pages 2544–2550. IEEE.

[Boureau et al., 2010] Boureau, Y.-L., Ponce, J., and LeCun, Y. (2010). A theoretical analysis of feature pooling in visual recognition. In Proceedings of the 27th international conference on machine learning (ICML-10), pages 111–118.

[Bradski, 1998] Bradski, G. R. (1998). Real time face and object tracking as a component of a perceptual user interface. In Applications of Computer Vision, 1998. WACV’98. Proceedings.,

Fourth IEEE Workshop on, pages 214–219. IEEE.

[Breitenstein et al., 2009] Breitenstein, M. D., Reichlin, F., Leibe, B., Koller-Meier, E., and Van Gool, L. (2009). Robust tracking-by-detection using a detector confidence particle filter.

InComputer Vision, 2009 IEEE 12th International Conference on, pages 1515–1522. IEEE.

[Bruno and de Carvalho, 2008] Bruno, O. M. and de Carvalho, L. A. V. (2008). Optica e Fisiologia´ da Vis˜ao-Uma Abordagem Multidisciplinar. Editora Roca.

[Cai et al., 2015] Cai, Y., Chen, X., Wang, H., and Chen, L. (2015). Deep representation and stereo vision based vehicle detection. In Cyber Technology in Automation, Control, and Intelligent

Systems (CYBER), 2015 IEEE International Conference on, pages 305–310. IEEE.

[Caltech, 1999] Caltech (1999). Computational Vision Group - California Institute of Technology.

www.vision.caltech.edu/html-files/archive.html, ´ultimo acceso: 2016/10/10.

[Chen et al., 2015] Chen, Z., Hong, Z., and Tao, D. (2015). An experimental survey on correlation filter-based tracking. arXiv preprint arXiv:1509.05520.

[Chen et al., 2014] Chen, Z., Wang, J., He, H., and Huang, X. (2014). A fast deep learning system using gpu. In Circuits and Systems (ISCAS), 2014 IEEE International Symposium on, pages 1552–1555. IEEE.

[Comaschi, 2016] Comaschi, F. (2016). Robust online face detection and tracking. PhD thesis, Technische Universiteit Eindhoven.

[Comaschi et al., 2016] Comaschi, F., Stuijk, S., Basten, T., and Corporaal, H. (2016). Robust online face tracking-by-detection. In Multimedia and Expo (ICME), 2016 IEEE International Conference on, pages 1–6. IEEE.

[Crowley, 1995] Crowley, J. L. (1995). Vision as process: basic research on computer vision systems, volume 10. Springer Verlag.

[Cunha, 2013] Cunha, A. (2013). Sistema automático para obten¸cão de parâmetros do tráfego veicular a partir de imagens de v´ıdeo usando opencv. Universidade de São Paulo, Escola de Engenharia de São Carlos, Departamento de Transportes.

[Dahua-Technology Co., 2010] Dahua-Technology Co., L. (2010). Dahua-Technology.http://www.

dahuasecurity.com/es, ´ultimo acceso: 2016/07/20.

[Dalal and Triggs, 2005] Dalal, N. and Triggs, B. (2005). Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE

Computer Society Conference on, volume 1, pages 886–893. IEEE.

In document Detección de vehículos con aprendizaje profundo en Cámara de Vigilancia (página 61-77)