CD-D 95.60 % 88.05 % CD-T 88.00 % 81.95 % CD-N 66.00 % 74.59 %
6.3.6. Comparaci´on de CNN con otros clasificadores
Por los experimentos en CNN reportados en la literatura sabemos que las arquitecturas GoogleNet (22 capas) [Szegedy et al., 2015], Alexnet (8 capas) [Krizhevsky et al., 2012] y entre otras, han logrado grandes resultados en detecci´on de objetos con m´as de 10 categor´ıas, su robustez es resultado de su gran profundidad es decir mayor cantidad de neuronas y capas, sumado a un dise˜no de arquitectura eficiente, debido a su complejidad la cantidad de caracter´ısticas requeridas en la primera capa es mayor a la cantidad de caracter´ısticas que posee nuestro conjunto de datos de entrenamiento que es de 44x28 pixeles, en el caso de GoogleNet esta requiere im´agenes de dimensi´on 224x224 pixeles y AlexNet solicita im´agenes de dimensi´on 227x227 pixeles, la gran dimensi´on de las im´agenes de entrada a su primera capa pueden adecuarse a su arquitectura de gran cantidad de capas y neuronas. La complejidad de la arquitectura de las CNN est´andar implica tambi´en mayor tiempo computacional en los pasos feedforward,backward yupdate.
En cuanto a nuestra propuesta, los resultados presentados en la tabla 6.9 demuestran que un modelo CNN es preferido para la clasificaci´on de veh´ıculos, a comparaci´on de C-Haar. Como se mencion´o en la secci´on6.2, CD-T representa el conjunto de datos extra´ıdos de una escena con escasa iluminaci´on, Fig. 6.1b, el porcentaje obtenido por CNN-M11 es de 88 % que supera el porcentaje obtenido por C-Haar con CD-T. Para el caso de CD-N, Fig.6.1c, las muestras son obtenidas en una escena nocturna, donde los faros de los autom´oviles dificultan parcialmente la visi´on del mismo, el modelo CNN-M11 obtiene menor exactitud que con C-Haar, a´un as´ı los porcentajes son bajos y se espera mejorar la clasificaci´on de veh´ıculos en escenas nocturnas para conseguir una mayor exactitud.
6.4.
Resultados del procesamiento de video
En la siguiente secci´on son presentados los resultados obtenidos de medir el tiempo de ejecuci´on del detector de veh´ıculo, basado en la detecci´on de movimiento para la generaci´on de candidatos y en CNN para la clasificaci´on de veh´ıculos. Un conjunto de 1249 fotogramas extra´ıdos de un video de 720x640 pixeles de resoluci´on ser´an utilizados para los siguientes experimentos. El video fue capturado de d´ıa con una c´amara de vigilancia [Dahua-Technology Co., 2010] que se encuentra
ubicada en la v´ıa p´ublica, aproximadamente a 10mts. de altura sobre la acera en los exteriores de instituci´on acad´emica.
6.4.1. Detecci´on de veh´ıculos
Debido a la aparici´on de varios veh´ıculos es que un sistema de tiempo real debe realizar la detecci´on en el menor tiempo posible. El tiempo de ejecuci´on ha sido medida tanto en una versi´on secuencial como en una versi´on optimizada. En la figura 6.5 se observa el tiempo de ejecuci´on en milisegundos del algoritmo de detecci´on de movimiento y del algoritmo de detecci´on de veh´ıculo, en una versi´on secuencial, obteni´endose aproximadamente 25ms por cada fotograma. En la figura6.6se observan los tiempos de ejecuci´on en una versi´on optimizada, y se obtiene 20ms por cada fotograma.
130 24,4835253,8541520,002915B 17,78957746,1301692 20#N/A17,789577#N/A#N/A 131 23,2656583,7627620,001953B 17,73718544,7675582 20#N/A17,737185#N/A#N/A 132 23,2504573,6881680,002202B 18,18630345,127132 20#N/A18,186303#N/A#N/A 133 24,8192773,5793580,001963B 17,67895446,0795522 20#N/A17,678954#N/A#N/A 134 23,2689053,6857810,002295B 19,02463845,9816192 20#N/A19,024638#N/A#N/A 135 23,0813683,9046950,003129B 17,74999644,7391882 20#N/A17,749996#N/A#N/A 136 23,3852983,8070580,002217B 17,85159545,0461682 20#N/A17,851595#N/A#N/A 137 23,5853323,732130,001932B 18,46683945,7862332 20#N/A18,466839#N/A#N/A 138 24,6341713,8238540,002725B 18,71558447,1763342 20#N/A18,715584#N/A#N/A 139 23,2317383,8274790,002985B 18,76891945,8311212 20#N/A18,768919#N/A#N/A 140 23,703983,884080,002915B 23,95629551,547272 20#N/A23,956295#N/A#N/A 141 26,8296334,0497450,003345B 22,87929953,7620222 20#N/A22,879299#N/A#N/A 142 24,1839853,852810,002729B 20,12267648,16222 20#N/A20,122676#N/A#N/A 143 24,2287333,7725520,003121B 18,43582546,4402312 20#N/A18,435825#N/A#N/A 144 23,4941013,8495540,002919B 23,01969150,3662652 20#N/A23,019691#N/A#N/A 145 23,8174643,8458810,001592B 25,10303752,7679742 20#N/A25,103037#N/A#N/A 146 24,1975143,7936780,002817B 23,00629851,0003072 20#N/A23,006298#N/A#N/A 147 23,1167123,861140,002805B 23,06806450,0487212 20#N/A23,068064#N/A#N/A 148 23,1491173,8419960,002747B 23,26026650,2541262 20#N/A23,260266#N/A#N/A 149 22,637993,8302530,003178B 23,24040849,7118292 20#N/A23,240408#N/A#N/A 150 23,738783,9163920,002292B 23,16025750,8177212 20#N/A23,160257#N/A#N/A 151 23,025063,9278940,00249B 23,09137650,046822 20#N/A23,091376#N/A#N/A 152 22,6979674,0215890,002129B 23,1439249,8656052 20#N/A23,14392#N/A#N/A 153 23,2634473,9329720,001965B 23,21914850,4175322 20#N/A23,219148#N/A#N/A 154 23,3822173,7167140,00222B 23,1306750,2318212 20#N/A23,13067#N/A#N/A 155 22,9774663,8891910,00295B 18,25261245,1222192 20#N/A18,252612#N/A#N/A 156 22,6277723,8978760,002785B 18,66155645,1899892 20#N/A18,661556#N/A#N/A 157 22,5386313,8465820,003266B 17,79362444,1821032 20#N/A17,793624#N/A#N/A 158 23,7183973,7111210,002493B 17,95527245,3872832 20#N/A17,955272#N/A#N/A 159 23,7046583,759170,002733B 18,11686845,5834292 20#N/A18,116868#N/A#N/A 160 23,3277353,9088480,003161B 17,95995545,1996992 20#N/A17,959955#N/A#N/A 161 23,4347623,8432590,002831B 18,34339945,6242512 20#N/A18,343399#N/A#N/A 162 23,9136053,8415010,002932B 17,88434945,6423872 20#N/A17,884349#N/A#N/A 163 24,2977153,8317810,002943B 24,14313252,2755712 20#N/A24,143132#N/A#N/A 164 23,8637063,730620,003054B 23,60594951,2033292 20#N/A23,605949#N/A#N/A 165 23,5963473,8462830,002358B 25,0340852,4790682 20#N/A25,03408#N/A#N/A 166 24,0568293,8080650,003481B 21,423549,2918752 20#N/A21,4235#N/A#N/A 167 25,2728853,7761610,009093B 19,74046548,7986042 20#N/A19,740465#N/A#N/A 168 24,0658383,8317740,002801B 17,82241945,7228322 20#N/A17,822419#N/A#N/A 169 23,889083,7444940,003027B 19,95638647,5929872 20#N/A19,956386#N/A#N/A 170 26,6308833,829680,002282B 20,34678150,8096262 20#N/A20,346781#N/A#N/A 171 23,6235323,7232130,003127B 25,28350852,633382 20#N/A25,283508#N/A#N/A 172 24,5927193,8170240,002027B 24,02878952,4405592 20#N/A24,028789#N/A#N/A 173 26,1728673,797120,002512B 23,99316253,9656612 20#N/A23,993162#N/A#N/A 174 23,4365063,9075590,002541B 23,84576651,1923722 20#N/A23,845766#N/A#N/A 175 24,8227244,3624050,002673B 25,02837854,216183 30#N/A25,028378#N/A#N/A 176 25,3958234,0096020,002321B 23,98985153,3975973 30#N/A23,989851#N/A#N/A 177 25,5086433,8301460,002707B 28,07434457,415843 30#N/A28,074344#N/A#N/A 178 24,8956464,1768820,002903B 24,53986653,6152973 30#N/A24,539866#N/A#N/A 179 23,7464613,7211210,001961B 24,3759351,8454733 30#N/A24,37593#N/A#N/A 180 24,0487643,7569280,002089B 24,16012151,9679023 30#N/A24,160121#N/A#N/A 181 24,2514793,7885580,002615B 24,09963152,1422833 30#N/A24,099631#N/A#N/A 182 23,8710264,0148480,002756B 25,35689953,2455293 30#N/A25,356899#N/A#N/A 183 24,9677423,721480,002501B 24,04923452,7409573 30#N/A24,049234#N/A#N/A 184 24,1690883,8605690,001734B 24,52970252,5610933 30#N/A24,529702#N/A#N/A 185 23,9000293,7766080,001871B 24,10161251,780123 30#N/A24,101612#N/A#N/A 186 23,8728783,7752840,002709B 23,91984851,5707193 30#N/A23,919848#N/A#N/A 187 23,9269153,7420570,003225B 25,66642153,3386183 30#N/A25,666421#N/A#N/A 188 23,5746533,8295860,002564B 24,26484151,6716443 30#N/A24,264841#N/A#N/A 189 23,8987533,7932790,002416B 24,13059651,8250443 30#N/A24,130596#N/A#N/A 190 24,3552743,7661430,002409B 24,50114252,6249683 30#N/A24,501142#N/A#N/A 191 24,0251833,8389860,002127B 24,01538651,8816823 30#N/A24,015386#N/A#N/A 192 23,2660443,7490270,002706B 24,22654751,2443243 30#N/A24,226547#N/A#N/A 193 23,3879343,8327640,002383B 23,98984551,2129263 30#N/A23,989845#N/A#N/A 194 25,0590913,6946960,002259B 24,06745552,8235013 30#N/A24,067455#N/A#N/A
Fig. 6.5: Tiempo de ejecuci´on de los algoritmos: detecci´on de movimiento y detecci´on de veh´ıculo, en versi´on secuencial. El eje “x” representa los fotogramas del video, y el eje “y” el tiempo en milisegundos.
124 19,5762675,2610960,002954B 0,0799924,9203070 0 #N/A 0,07999#N/A #N/A 125 19,8313634,9682070,003185B 14,14287538,945631 10 #N/A 14,142875#N/A #N/A 126 19,5230885,4822330,002084B 14,63342539,640831 10 #N/A 14,633425#N/A #N/A 127 19,523675,1951760,011487B 11,91497136,6453042 20 #N/A 11,914971#N/A #N/A 128 18,9133244,7444830,00244B 13,95321837,6134652 20 #N/A 13,953218#N/A #N/A 129 19,1349624,9560910,0029B 13,66162737,755582 20 #N/A 13,661627#N/A #N/A 130 19,615975,1785570,00224B 17,50431842,3010852 20 #N/A 17,504318#N/A #N/A 131 19,4824455,0076090,000907C 8,53521733,0261782 20 #N/A #N/A 8,535217#N/A 132 19,6788754,6355310,001961B 15,63542739,9517942 20 #N/A 15,635427#N/A #N/A 133 19,4051654,9979140,000904C 8,27490232,6788852 20 #N/A #N/A 8,274902#N/A 134 19,7196024,7077830,002033B 15,59660240,026022 20 #N/A 15,596602#N/A #N/A 135 20,1200544,8237770,002175B 17,76557342,7115792 20 #N/A 17,765573#N/A #N/A 136 19,6434245,057180,001601B 16,76205941,4642642 20 #N/A 16,762059#N/A #N/A 137 19,6937175,1232520,001411C 8,23933,057382 20 #N/A #N/A 8,239#N/A 138 19,6319664,7113070,001986B 17,11934641,4646052 20 #N/A 17,119346#N/A #N/A 139 19,9777485,1614920,001728B 16,85000941,9909772 20 #N/A 16,850009#N/A #N/A 140 20,2950574,8077980,001262C 8,30048333,4046 2 20 #N/A #N/A 8,300483#N/A 141 19,7044934,6918520,001885B 16,85609641,2543262 20 #N/A 16,856096#N/A #N/A 142 20,4495144,7466430,001687B 16,73856341,9364072 20 #N/A 16,738563#N/A #N/A 143 20,8106194,7888830,001021C 8,27976433,8802872 20 #N/A #N/A 8,279764#N/A 144 20,0283714,8604620,002042B 16,83982841,7307032 20 #N/A 16,839828#N/A #N/A 145 20,1646495,2799230,001609B 16,98517542,4313562 20 #N/A 16,985175#N/A #N/A 146 20,0683545,0686410,002235B 17,65742942,7966592 20 #N/A 17,657429#N/A #N/A 147 20,025825,2329940,001918B 16,9196342,1803622 20 #N/A 16,91963#N/A #N/A 148 20,4928644,7420920,001888B 16,9916742,2285142 20 #N/A 16,99167#N/A #N/A 149 19,66535,3373090,001733B 21,28859246,2929342 20 #N/A 21,288592#N/A #N/A 150 19,8751795,246660,001967B 23,53993148,6637372 20 #N/A 23,539931#N/A #N/A 151 19,6887085,3786630,001913B 22,16377847,2330622 20 #N/A 22,163778#N/A #N/A 152 19,9940165,3136570,002526B 23,16527348,4754722 20 #N/A 23,165273#N/A #N/A 153 19,7189515,4829860,001601B 22,05776247,2613 2 20 #N/A 22,057762#N/A #N/A 154 19,8452365,4415130,001845B 22,62549447,9140882 20 #N/A 22,625494#N/A #N/A 155 20,479495,2054480,001723B 28,84286254,5295232 20 #N/A 28,842862#N/A #N/A 156 19,683655,1950490,000645C 11,89481636,774162 20 #N/A #N/A 11,894816#N/A 157 19,8587514,9936830,001551B 24,06218148,9161662 20 #N/A 24,062181#N/A #N/A 158 20,6484914,845410,001986B 25,9231551,4190372 20 #N/A 25,92315#N/A #N/A 159 20,1513965,8948060,002297B 25,05808951,1065882 20 #N/A 25,058089#N/A #N/A 160 20,2459854,8115890,001707B 20,18538545,2446662 20 #N/A 20,185385#N/A #N/A 161 20,0425085,0331630,002131B 21,44329946,5211012 20 #N/A 21,443299#N/A #N/A 162 19,8885944,8479110,001427B 17,42684542,1647772 20 #N/A 17,426845#N/A #N/A 163 19,7530415,1393090,001636B 17,35847442,252462 20 #N/A 17,358474#N/A #N/A 164 20,0190195,3222210,000881C 8,42141733,7635382 20 #N/A #N/A 8,421417#N/A 165 19,3721824,8086940,002459B 21,35512845,5384632 20 #N/A 21,355128#N/A #N/A 166 18,8530114,9078240,001647B 23,74982847,512312 20 #N/A 23,749828#N/A #N/A 167 20,1193274,7687160,000915C 10,72877835,6177362 20 #N/A #N/A 10,728778#N/A 168 19,8747375,6142460,002397B 21,17270446,6640842 20 #N/A 21,172704#N/A #N/A 169 20,1743025,0520550,002197B 18,83944844,0680022 20 #N/A 18,839448#N/A #N/A 170 19,7104135,2596590,001503B 17,34342142,3149962 20 #N/A 17,343421#N/A #N/A 171 19,9489285,2362410,001558B 16,93786142,1245882 20 #N/A 16,937861#N/A #N/A 172 19,7505445,1498930,001539B 17,03442741,9364032 20 #N/A 17,034427#N/A #N/A 173 20,0021455,341650,001684B 28,29438553,6398642 20 #N/A 28,294385#N/A #N/A 174 19,851635,2456290,001464B 28,14448553,2432082 20 #N/A 28,144485#N/A #N/A 175 20,2429345,7181360,001896B 27,91124353,8742093 30 #N/A 27,911243#N/A #N/A 176 20,6734955,0554230,002058B 28,05518153,7861573 30 #N/A 28,055181#N/A #N/A 177 20,705745,0764760,002013B 28,0579353,8421593 30 #N/A 28,05793#N/A #N/A 178 19,9807755,6325680,001826B 28,1207153,7358793 30 #N/A 28,12071#N/A #N/A 179 19,9968925,4468380,002309B 27,62748553,0735243 30 #N/A 27,627485#N/A #N/A 180 19,9929735,2394310,001924B 28,1181753,3524983 30 #N/A 28,11817#N/A #N/A 181 19,9905355,0308850,00201B 28,08374253,1071723 30 #N/A 28,083742#N/A #N/A 182 20,1755755,4977030,00217B 28,13835653,8138043 30 #N/A 28,138356#N/A #N/A
Fig. 6.6: Tiempo de ejecuci´on de los algoritmos: detecci´on de movimiento y detecci´on del veh´ıculo, con optimizaci´on computacional, El eje “x” representa los fotogramas del video, y el eje “y” el tiempo en milisegundos.
6.4.2. Seguimiento de veh´ıculos
Los experimentos para el seguimiento de veh´ıculos se han realizado con dos t´ecnicas, una t´ecnica de enfoque cl´asico, el algoritmo Camshift y la segunda t´ecnica de enfoque moderno denominado Filtro de correlaci´on. En los siguientes apartados se presenta gr´aficamente el resultado de las m´etricas de evaluaci´on aplicadas a cada una de las dos t´ecnicas para evaluar su rendimiento.
- An´alisis Cuantitativo: Los gr´aficos success plot y precision plot, propuestos por [Wu et al., 2013], que fueron explicados en la secci´on 5.3 del cap´ıtulo 5, son empleados como m´etricas para evaluar cuantitativamente las dos t´ecnicas de seguimiento de veh´ıculos, y son presentados en la figura 6.7.
A partir de los trabajos relacionados se analizaron dos t´ecnicas de seguimiento de objetos, Camshift (CAM) y el filtro de correlaci´on(FC). Como vemos en la figura 6.7a hasta el umbral 20 FC alcanza una precisi´on de 0.74 mientras que CAM en el mismo umbral obtiene 0.48, el mismo comportamiento se observa en la figura 6.7bdonde FC supera a CAM demostrando notoriedad en el umbral 0.4, este ´ultimo valor indica que la tasa de Intersecci´on sobre la Uni´on (IoU) entre todas la regiones reales y las regiones predecidas correspondientes alcanza 0.64 de precisi´on mientras que el algoritmo CAM obtiene 0.45.
En las figuras6.7cy6.7d,F C 1CSecrepresenta el uso de FC con la estrategia de correspondencia
de una sola caracter´ıstica, en este caso la caracter´ıstica tasa de sobreposici´on vi, y F C 3CSec
representa el uso de FC con la estrategia de correspondencia de las tres caracter´ısticas vi, pi y hi. En ambos casos “Sec” indica que la ejecuci´on de las pruebas se hicieron con procesamiento secuencial, esto con la finalidad de demostrar posteriormente su diferencia ante un rendimiento optimizado de procesamiento paralelo. Se observa que la precisi´on de FC con 3 caracter´ısticas es mayor a la precisi´on obtenida con tan solo una caracter´ıstica, esto demuestra que el uso de varias caracter´ısticas que representen de manera ´unica al objeto aumenta la precisi´on de ser detectado en cada fotograma hasta que el objeto desaparece de la escena. Es importante tambi´en ponderar adecuadamente, asignando un peso seg´un la relevancia de cada caracter´ıstica frente a las dem´as.
- An´alisis Cualitativo: En la figura6.8se observa una secuencia de fotogramas, cuyo orden es de izquierda a derecha y de arriba hacia abajo, extra´ıdos de una parte del video de pruebas. Mientras los veh´ıculos se movilizan su tama˜no var´ıa progresivamente, esto debido a la posici´on y perspectiva de la c´amara. Cabe resaltar que aquellos veh´ıculos m´as lejanos no presentan caracter´ısticas visuales con alta calidad como aquellos que se encuentran a una distancia menor de la c´amara. Continuando con el an´alisis cualitativo, en la figura 6.9 una serie de veh´ıculos son detectados a pesar que se encuentran semioclu´ıdos, y algunos detenidos a una larga distancia de la c´amara.
6.4.3. Tiempo de ejecuci´on
A continuaci´on se presentan los experimentos que miden el tiempo de ejecuci´on total del prototipo de detecci´on de veh´ıculos, haciendo uso del filtro de correlaci´on como algoritmo de seguimiento, y tres caracter´ısticas de correspondencia, estas son tasa de sobreposici´on; distancia entre centroides e histograma de color. En las siguientes figuras el eje “x” representa los fotogramas del video, y el eje “y” el tiempo en milisegundos.
0 5 10 15 20 25 30 35 40 45 50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Umbral DP Precision Plot Filtro de Correlación Algoritmo Camshift
(a)Exactitud de la distancia (DP) con Camshift y Filtro de correlaci´on.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Umbral OP Success Plot Filtro de Correlación Algoritmo Camshift
(b)Exactitud de sobreposici´on (OP) con Camshift y Filtro de correlaci´on.
0 5 10 15 20 25 30 35 40 45 50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Umbral DP Precision Plot FC 1C FC 3C
(c)Exactitud de la distancia (DP) del filtro de co- rrelaci´on seg´un la cantidad de caracter´ısticas.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Umbral OP Success Plot FC 1C FC 3C
(d)Exactitud de sobreposici´on (OP) usando filtro de correlaci´on seg´un la cantidad de caracter´ısticas.
Fig. 6.7: Gr´aficos donde se demuestra la exactitud de distancia(DP) y la exactitud de sobreposici´on(OP), donde FC 1C representa el uso de una caracter´ıstica y FC 3C el uso de 3 caracter´ısticas.
En la figura 6.10 se muestra el tiempo de ejecuci´on total que requiere el prototipo en una versi´on sin optimizaci´on por cada fotograma del video, el n´umero de instancias indica el n´umero de veh´ıculos que se presentan en cada fotograma. El n´umero de instancias se encuentra normalizado para una mejor visualizaci´on, cada n´umero fue multiplicado por diez, si en la gr´afica el n´umero de instancias es 20 entonces representa 2 veh´ıculos.
En la figura6.11se observa el tiempo total de ejecuci´on y el n´umero de instancias normalizada en una versi´on optimizada del prototipo sobre una plataforma GPU, obteniendo una media de tiempo de ejecuci´on de 45,24ms, la versi´on optimizada supera a la versi´on secuencial presentada
Fig. 6.8: Secuencia de fotogramas que demuestran la detecci´on y seguimiento de veh´ıculos en diferentes escalas.
Fig. 6.9: Secuencia de fotogramas que demuestran la detecci´on y seguimiento de veh´ıculos semioclu´ıdos.
62 19,4898344,5751610,000989C 2,78622226,8522060 0 #N/A #N/A 2,786222#N/A 63 19,0646685,002090,002539B 0,06583224,1351290 0 #N/A 0,065832#N/A #N/A 64 19,3394824,6927090,012003B 0,06452124,1087150 0 #N/A 0,064521#N/A #N/A 65 19,2135344,7042930,003062B 7,89175431,8126430 0 #N/A 7,891754#N/A #N/A 66 19,0106324,9958870,002454B 1,24733525,2563080 0 #N/A 1,247335#N/A #N/A 67 19,4369194,6578990,001845B 0,06648224,1631450 0 #N/A 0,066482#N/A #N/A 68 19,1898854,9430240,002019B 4,31286328,4477910 0 #N/A 4,312863#N/A #N/A 69 19,4274424,7287920,00081n 0 24,1570440 0 #N/A #N/A#N/A 0 70 19,281845,1886980,001134n 0 24,4716720 0 #N/A #N/A#N/A 0 71 19,5532724,7065850,001021n 0 24,2608780 0 #N/A #N/A#N/A 0 72 19,0097824,7412470,000832n 0 23,7518610 0 #N/A #N/A#N/A 0 73 19,2167324,9880440,000967n 0 24,2057430 0 #N/A #N/A#N/A 0 74 19,1397954,6551790,001362n 0 23,7963360 0 #N/A #N/A#N/A 0 75 19,1160174,682040,001041n 0 23,7990980 0 #N/A #N/A#N/A 0 76 19,0056394,9015090,001012n 0 23,908160 0 #N/A #N/A#N/A 0 77 19,5381924,7822840,001993A 1,60611325,9285820 0 1,606113#N/A#N/A #N/A 78 19,2896744,5926190,001788B 4,76283928,646920 0 #N/A 4,762839#N/A #N/A 79 19,2949935,1900370,001951B 1,24395425,7309350 0 #N/A 1,243954#N/A #N/A 80 19,5545464,6951970,00087C 0,04248124,2930940 0 #N/A #N/A 0,042481#N/A 81 19,4404355,2202110,000824C 0,04381424,7052840 0 #N/A #N/A 0,043814#N/A 82 19,5329164,6538690,001011C 0,04204824,2298440 0 #N/A #N/A 0,042048#N/A 83 19,2282074,6603750,000827C 3,16549127,0549 0 0 #N/A #N/A 3,165491#N/A 84 19,3221535,0046690,001145C 3,16566427,4936310 0 #N/A #N/A 3,165664#N/A 85 19,3168594,6841430,001466n 0 24,0024680 0 #N/A #N/A#N/A 0 86 19,1991315,0327320,002648A 3,11238827,3468990 0 3,112388#N/A#N/A #N/A 87 19,5524034,6809860,001314C 2,82584327,0605460 0 #N/A #N/A 2,825843#N/A 88 19,3206624,9322450,00104C 0,05690924,3108560 0 #N/A #N/A 0,056909#N/A 89 19,986114,6030410,001926B 0,0664624,6575370 0 #N/A 0,06646#N/A #N/A 90 19,245894,5943170,001025C 0,04211623,8833480 0 #N/A #N/A 0,042116#N/A 91 19,4712475,254970,002492B 0,06700224,7957110 0 #N/A 0,067002#N/A #N/A 92 19,6728734,6486170,001251C 0,04238724,3651280 0 #N/A #N/A 0,042387#N/A 93 19,4051814,68690,002805B 6,30460430,399490 0 #N/A 6,304604#N/A #N/A 94 19,6323645,1197150,000833C 0,04207824,794990 0 #N/A #N/A 0,042078#N/A 95 19,7825234,771660,000888n 0 24,5550710 0 #N/A #N/A#N/A 0 96 19,5995674,9386070,001933A 0,34061124,8807180 0 0,340611#N/A#N/A #N/A 97 19,9440685,0368170,002063B 0,06493725,0478850 0 #N/A 0,064937#N/A #N/A 98 19,5997794,7321430,001244C 0,04248924,3756550 0 #N/A #N/A 0,042489#N/A 99 19,345894,8178770,000924C 0,04145524,2061460 0 #N/A #N/A 0,041455#N/A 100 19,6455135,3087250,0023B 0,06607425,0226120 0 #N/A 0,066074#N/A #N/A 101 19,943124,7847990,000901C 0,04267624,7714960 0 #N/A #N/A 0,042676#N/A 102 19,5852074,8189080,000999C 0,04160424,4467180 0 #N/A #N/A 0,041604#N/A 103 19,7663345,2380410,012818B 2,82653927,8437320 0 #N/A 2,826539#N/A #N/A 104 19,8688114,9625820,001805C 0,04226124,8754590 0 #N/A #N/A 0,042261#N/A 105 19,565955,3530440,001648n 0 24,9206420 0 #N/A #N/A#N/A 0 106 19,7448254,9994530,013157A 0,30924525,066680 0 0,309245#N/A#N/A #N/A 107 19,6573774,8855520,001829B 6,66043931,2051970 0 #N/A 6,660439#N/A #N/A 108 20,7120385,0095640,003429B 6,65598832,3810190 0 #N/A 6,655988#N/A #N/A 109 19,6260124,9095350,002182B 5,69053230,2282610 0 #N/A 5,690532#N/A #N/A 110 19,6570144,9337470,001557B 1,35730425,9496220 0 #N/A 1,357304#N/A #N/A 111 19,9910854,8720340,000655C 3,15622928,0200030 0 #N/A #N/A 3,156229#N/A 112 19,9741944,745030,001677B 7,59016332,3110640 0 #N/A 7,590163#N/A #N/A 113 20,0258584,8434420,00218B 1,64648226,5179620 0 #N/A 1,646482#N/A #N/A 114 20,2150394,7673780,001996B 0,07669625,0611090 0 #N/A 0,076696#N/A #N/A 115 19,8498675,1307440,001836B 1,26088226,2433290 0 #N/A 1,260882#N/A #N/A 116 19,9465234,8498820,002453B 0,38537225,184230 0 #N/A 0,385372#N/A #N/A 117 19,4801884,8877520,001621B 6,31930230,6888630 0 #N/A 6,319302#N/A #N/A 118 19,9196594,8490440,002981B 6,34992931,1216130 0 #N/A 6,349929#N/A #N/A 119 19,4889355,1878810,001872B 6,31962430,9983120 0 #N/A 6,319624#N/A #N/A 120 20,0516714,7273340,002083B 0,09540324,8764910 0 #N/A 0,095403#N/A #N/A 121 19,6638335,0926080,002385B 0,10502124,8638470 0 #N/A 0,105021#N/A #N/A 122 20,1490895,0116110,002153B 0,67901925,8418720 0 #N/A 0,679019#N/A #N/A 123 18,9420064,7305550,002275B 3,33438727,0092230 0 #N/A 3,334387#N/A #N/A
Fig. 6.10: Tiempo total de ejecuci´on, en versi´on secuencial, representado en la medida de tiempo milisegundos.
en la figura 6.10que es de 47,45ms.
65 21,6103583,6018520,002853B 0,03677225,2518350 0#N/A0,036772#N/A#N/A
66 21,5467883,61730,002246B 0,04026825,2066020 0#N/A0,040268#N/A#N/A
67 23,4486873,6572160,002242B 17,33685644,4450010 0#N/A17,336856#N/A#N/A
68 23,5268063,6876330,001904B 12,89545240,1117950 0#N/A12,895452#N/A#N/A
69 22,3371883,7469990,002376B 16,15258342,2391460 0#N/A16,152583#N/A#N/A
70 22,3553293,7302110,001965B 17,28790443,3754090 0#N/A17,287904#N/A#N/A
71 21,9299363,7773530,001532B 15,49601441,2048350 0#N/A15,496014#N/A#N/A
72 22,5865913,7488530,002115B 11,63966837,9772270 0#N/A11,639668#N/A#N/A
73 22,0319443,7599750,002275B 11,97660337,7707970 0#N/A11,976603#N/A#N/A
74 23,7026333,6748120,002606B 11,42167638,8017270 0#N/A11,421676#N/A#N/A
75 22,2888893,7152040,002156B 11,44953137,455780 0#N/A11,449531#N/A#N/A
76 22,2746213,7483770,001823B 11,62369137,6485120 0#N/A11,623691#N/A#N/A
77 23,3020673,7294210,001949B 19,29364946,3270860 0#N/A19,293649#N/A#N/A
78 26,1186694,1817320,002635B 12,86247643,1655120 0#N/A12,862476#N/A#N/A
79 22,1460453,6983220,002236B 11,58487837,4314810 0#N/A11,584878#N/A#N/A
80 22,1174663,787460,002213B 11,4578737,3650090 0#N/A11,45787#N/A#N/A
81 23,1891333,7818070,002191B 11,89956538,8726960 0#N/A11,899565#N/A#N/A
82 22,8241713,6779170,002414B 12,32280738,8273090 0#N/A12,322807#N/A#N/A
83 22,5068363,7248230,002046B 11,63737737,8710820 0#N/A11,637377#N/A#N/A
84 23,4547093,747440,0027B 11,89094939,0957980 0#N/A11,890949#N/A#N/A
85 23,2943793,7285160,002541B 11,93720338,9626390 0#N/A11,937203#N/A#N/A
86 23,7902083,7318630,002659B 11,80243439,3271640 0#N/A11,802434#N/A#N/A
87 22,8283,7629330,002196B 11,61191338,2050420 0#N/A11,611913#N/A#N/A
88 23,3208743,7093970,002531B 17,22776244,2605640 0#N/A17,227762#N/A#N/A
89 22,8317273,7663470,002835B 14,89849941,4994080 0#N/A14,898499#N/A#N/A
90 24,5899213,7178550,002445B 11,60316539,9133860 0#N/A11,603165#N/A#N/A
91 23,6819783,7437320,002371B 11,73483339,1629140 0#N/A11,734833#N/A#N/A
92 23,4393233,7419970,002477B 11,61088138,7946780 0#N/A11,610881#N/A#N/A
93 24,0728013,6908470,002762B 11,71399639,4804060 0#N/A11,713996#N/A#N/A
94 25,995933,7185410,001972B 17,51778547,2342280 0#N/A17,517785#N/A#N/A
95 24,0062163,6352750,001913B 13,15147240,7948760 0#N/A13,151472#N/A#N/A
96 23,3072413,7323110,001913B 11,6275638,6690250 0#N/A11,62756#N/A#N/A
97 22,7475913,7896340,002468B 11,64186438,1815570 0#N/A11,641864#N/A#N/A
98 24,153643,8093330,002252B 11,82121639,7864410 0#N/A11,821216#N/A#N/A
99 23,7485683,8696110,002943B 11,73746939,3585910 0#N/A11,737469#N/A#N/A
100 22,8693923,816450,002553B 11,56544338,2538380 0#N/A11,565443#N/A#N/A
101 23,2931583,8511730,001957B 11,70200638,8482940 0#N/A11,702006#N/A#N/A
102 22,5537933,8514150,002426B 11,82641938,2340530 0#N/A11,826419#N/A#N/A
103 24,3416693,8174420,002735B 11,56025939,7221050 0#N/A11,560259#N/A#N/A
104 22,8957653,8198020,002765B 11,67466538,3929970 0#N/A11,674665#N/A#N/A
105 23,5688523,9958660,001959B 17,34026744,9069440 0#N/A17,340267#N/A#N/A
106 23,4213473,8549440,002958B 18,30835245,5876010 0#N/A18,308352#N/A#N/A
107 24,9674953,8627420,001925B 14,46656843,298730 0#N/A14,466568#N/A#N/A
108 24,5784483,84260,002761B 18,19661446,6204230 0#N/A18,196614#N/A#N/A
109 24,5660253,866910,002811B 13,27215241,7078980 0#N/A13,272152#N/A#N/A
110 25,1534243,8460150,002283B 11,88308940,8848110 0#N/A11,883089#N/A#N/A
111 23,8596683,819640,002306B 15,0723242,7539340 0#N/A15,07232#N/A#N/A
112 24,6173113,7572130,00244B 19,6018447,9788040 0#N/A19,60184#N/A#N/A
113 26,1882433,8278910,00204B 15,32953345,3477070 0#N/A15,329533#N/A#N/A
114 24,376963,8595840,002048B 17,00694545,2455370 0#N/A17,006945#N/A#N/A
115 25,4115413,9133050,00284B 17,38384646,7115320 0#N/A17,383846#N/A#N/A
116 24,4577353,832790,002936B 12,69149140,9849520 0#N/A12,691491#N/A#N/A
117 22,9776743,8106240,002916B 18,27704945,0682630 0#N/A18,277049#N/A#N/A
118 23,2171993,8892850,00241B 17,78294544,8918390 0#N/A17,782945#N/A#N/A
119 23,4347793,7558160,002629B 17,60355244,7967760 0#N/A17,603552#N/A#N/A
120 23,5161923,781860,002646B 20,64371947,9444170 0#N/A20,643719#N/A#N/A
121 24,4606123,9450180,003047B 24,50124152,9099180 0#N/A24,501241#N/A#N/A
122 23,1884524,1572340,002127B 24,34515151,6929640 0#N/A24,345151#N/A#N/A
123 22,480274,0133030,002899B 24,60269651,0991680 0#N/A24,602696#N/A#N/A
124 24,0613943,7296550,002265B 28,5958356,3891440 0#N/A28,59583#N/A#N/A
125 23,0328783,7910960,002263B 18,88497645,7112131 10#N/A18,884976#N/A#N/A
126 25,1193283,8210640,003038B 17,90412546,8475551 10#N/A17,904125#N/A#N/A
127 24,3914773,6976660,001901B 17,80528945,8963332 20#N/A17,805289#N/A#N/A
128 22,7307973,8536910,003054B 22,74630949,3338512 20#N/A22,746309#N/A#N/A
129 23,0993,8596970,002557B 17,83014344,7913972 20#N/A17,830143#N/A#N/A
Fig. 6.11: Tiempo total de ejecuci´on, con optimizaci´on computacional, representado en la medida de tiempo milisegundos.
6.5.
Consideraciones finales
En el presente cap´ıtulo se han demostrado los resultados de la experimentaci´on con redes neuronales convolucionales y otras t´ecnicas para la detecci´on de veh´ıculos por video, demostrando a trav´es de la f´ormula de la exactitud el clasificador m´as conveniente para la detecci´on de veh´ıculos. Seguidamente, en el cap´ıtulo siguiente se exponen las conclusiones del trabajo de investigaci´on.
7
Conclusiones
7.1.
Conclusiones
La tasa de exactitud y el tiempo de detecci´on son factores de gran influencia en la eficiencia de un sistema de detecci´on de objetos en tiempo real. La variaci´on de iluminaci´on puede afectar la eficiencia pero si es controlada se obtiene un mejor desempe˜no del sistema. Las t´ecnicas de aprendizaje profundo han demostrado grandes ´exitos en los ´ultimos a˜nos, es por ello que su uso es de gran confiabilidad.
En el presente proyecto de investigaci´on se han realizado cuatro experimentos para hallar el modelo de clasificaci´on de veh´ıculos que sea capaz de afrontar la variaci´on de iluminaci´on en las im´agenes y otros factores externos. El primer experimento tuvo como finalidad observar el comportamiento de los par´ametros mean y batch en un modelo CNN de cinco capas denominado LeNet-5, con el conjunto de datos propuesto. Los porcentajes de clasificaci´on demostraron la influencia del par´ametro mean, si el clasificador tiene la informaci´on de la relaci´on que existe entre los colores de sus muestras de entrenamiento, es decir el promedio, entonces la red converge a un menor error. En cuanto al tama˜no del par´ametro batch no existe una regla para usar un determinado valor, este depende de la arquitectura y del n´umero de iteraciones que se va a realizar en el entrenamiento, su valor tambi´en se puede deducir de la experiencia de clasificadores CNN usados anteriormente en otros trabajos de investigaci´on.
El segundo experimento tuvo como objetivo encontrar la mejor combinaci´on de hiperpar´ametros y el an´alisis de la influencia del tama˜no del kernel en las convoluciones. Los hiperpar´ametros ReLU, Xavier y Max predominaron en el mejor modelo de CNN para el conjunto de datos propuesto. ReLU es una funci´on no-lineal y de operaci´on m´as r´apida, la funci´on Xavier resulta ser m´as acertada porque considera el n´umero de neuronas de entrada y el n´umero de neuronas de salida, y en cuanto al hiperpar´ametro Max este calcula el mayor valor de pixel en cada ventana que recorre la imagen. La combinaci´on del aporte positivo de cada uno de los tres hiperpar´ametros logra un porcentaje
de 95.37 % de exactitud en la clasificaci´on de veh´ıculos.
Para el tercer experimento podemos resaltar que el conjunto de datos utilizados para el entrenamiento se diferencian de los conjuntos de datos de prueba CD-T y CD-N en la intensidad de iluminaci´on, debido a que los datos de entrenamiento fueron capturados en horas de mayor iluminaci´on, a diferencia de los datos de pruebas que fueron capturados en horas con menor iluminaci´on. Los resultados demostraron que el modelo CNN denominado en este trabajo como M11 supera en porcentaje de exactitud a la cascada de Haar, a´un cuando las im´agenes son extra´ıdas de una c´amara de vigilancia, y tomando en cuenta que los veh´ıculos son multiescala y multiperspectiva. Con un modelo de CNN de cinco capas se puede realizar una eficiente clasificaci´on binaria para im´agenes de veh´ıculos extra´ıdas de una c´amara de vigilancia.
La realizaci´on del cuarto experimento nos muestra el comportamiento de CNN ante im´agenes capturadas en condiciones bien diferenciadas de las de entrenamiento, demostrando que la convoluci´on y el algoritmo de aprendizaje gradiente estoc´astica de la CNN puede manipular diferentes contextos de iluminaci´on pero, ante im´agenes de diferente resoluci´on y con multiperspectiva como el conjunto de datos ImageNet pueden provocar resultados diferentes en las convoluciones haciendo que la funci´on de error arroje mayor cantidad de falsos positivos o falsos negativos.
Para complementar la detecci´on de veh´ıculos en tiempo real se han realizado experimentos con las t´ecnicas de procesamiento de video. Se ha analizado el tiempo de ejecuci´on en una versi´on secuencial y en versi´on optimizada por GPU. Realizar el seguimiento de objetos visuales requiere tambi´en afrontar los factores externos, los m´as influyentes son la oclusi´on del objeto, los cambios en niveles de iluminaci´on y la variaci´on de escala del objeto durante su aparici´on en la escena. Durante la revisi´on de la literatura se observa que entre las t´ecnicas de enfoque cl´asico el algorimo Camshift ha permanecido durante a˜nos como la t´ecnica m´as robusta para seguimiento de objetos en tiempo real por mantener etiquetado el objeto a pesar de su variaci´on en el tama˜no durante toda su trayectoria, pero en aplicaciones donde la variaci´on de iluminaci´on y la oclusi´on est´an presentes el algoritmo Camshift decae en rendimiento, sobresaliendo en estos aspectos un enfoque moderno basado en el algoritmo de filtros de correlaci´on.
Finalmente podemos concluir que en un contexto de iluminaci´on variada con el uso de redes neuronales convolucionales se obtiene buenos porcentajes de clasificaci´on de im´agenes veh´ıculo, a comparaci´on de una t´ecnica tradicional como es Adaboost en cascada con caracter´ısticas de Haar. El modelo CNN obtenido junto a otras t´ecnicas de procesamiento de video tales como la detecci´on de movimiento y filtros de correlaci´on conforman un sistema satisfactorio para la detecci´on de veh´ıculos en videos extra´ıdos de una c´amara de vigilancia, superando as´ı los factores externos que se presentan en la detecci´on de objetos en tiempo real.
7.2.
Recomendaciones
Cabe resaltar que la arquitectura y la cantidad de datos son aspectos altamente influyentes en el rendimiento de una red neuronal convolucional, como fue demostrado en investigaciones anteriores y en el presente proyecto de tesis. La relaci´on entre el tama˜no de la arquitectura y la cantidad de datos
es directamente proporcional, y la generalizaci´on de la CNN tambi´en es un aspecto importante, esta se ver´ıa afectada negativamente si el conjunto de datos fuera escaso. Seguidamente la elecci´on de los hiperpar´ametros tambi´en es de gran influencia, estos deben ser seleccionados conociendo la operaci´on que realizan y la informaci´on que utilizan, experimentos de prueba y error tambi´en han sido necesarios en muchos experimentos revisados en la literatura.
7.3.
Trabajos Futuros
Modelos de clasificaci´on binaria son bien acudidos en aplicaciones de tiempo real, un modelo de clasificaci´on ligero y de buen rendimiento es adecuado para este tipo de aplicaciones, es por ello que un modelo CNN de cinco capas con los hiperpar´ametros demostrados puede ser aplicado a diferentes contextos con c´amara de vigilancia, tales como la detecci´on de peatones, la detecci´on de acciones violentas, detecci´on de rostros, etc. La experimentaci´on en contextos diferentes de detecci´on de objetos queda apta a futuras investigaciones.
Bibliograf´ıa
[Ahad, 2012] Ahad, M. A. R. (2012). Motion history images for action recognition and understanding. Springer Science & Business Media.
[Ahmed et al., 2017] Ahmed, K. E. B., Saeed, R. A., and Mokhtar, R. A. (2017). Real time camshift tracking algorithm using tms320dm6437 evm. InCommunication, Control, Computing
and Electronics Engineering (ICCCCEE), 2017 International Conference on, pages 1–6. IEEE.
[Ali et al., 2016] Ali, A., Jalil, A., Niu, J., Zhao, X., Rathore, S., Ahmed, J., and Iftikhar, M. A. (2016). Visual object tracking: classical and contemporary approaches. Frontiers of Computer Science, 10(1):167–188.
[Andy, 2017] Andy (2017). Stochastic Gradient Descent – Mini-batch and more. http:
//www.adventuresinmachinelearning.com/stochastic-gradient-descent/, ultimo´ acce-
so: 2017/12/12.
[Anzai, 2012] Anzai, Y. (2012). Pattern recognition and machine learning. Elsevier.
[Apple Inc., 2016] Apple Inc. (2016). Performing convolution operations. https: //developer.apple.com/library/content/documentation/Performance/Conceptual/
vImage/ConvolutionOperations/ConvolutionOperations.html, ´ultimo acceso: 2016/10/10.
[Attwell and Laughlin, 2001] Attwell, D. and Laughlin, S. B. (2001). An energy budget for signaling in the grey matter of the brain. Journal of Cerebral Blood Flow & Metabolism, 21(10):1133–1145.
[Barba, 2017] Barba, J. ´A. G. (2017). Aprendizaje profundo para el procesamiento del lenguaje natural.
[Bay et al., 2006] Bay, H., Tuytelaars, T., and Van Gool, L. (2006). Surf: Speeded up robust features. Computer vision–ECCV 2006, pages 404–417.
[Benenson et al., 2012] Benenson, R., Mathias, M., Timofte, R., and Van Gool, L. (2012). Pedestrian detection at 100 frames per second. In Computer Vision and Pattern Recognition
[Bengio and Delalleau, 2011] Bengio, Y. and Delalleau, O. (2011). On the expressive power of deep architectures. InAlgorithmic Learning Theory, pages 18–36. Springer.
[Bengio et al., 2009] Bengio, Y. et al. (2009). Learning deep architectures for ai. Foundations and trendsR in Machine Learning, 2(1):1–127.
[Bengio et al., 2007] Bengio, Y., LeCun, Y., et al. (2007). Scaling learning algorithms towards ai.
Large-scale kernel machines, 34(5):1–41.
[Bishop, 2006] Bishop, C. M. (2006). Pattern recognition and machine learning. springer.
[Bobick et al., 1997] Bobick, A., Davis, J., and Intille, S. (1997). The kidsroom: an example application using a deep perceptual interface. In Proc. Wkshp. Percept. User Interfaces, pages 1–4.
[Bolme et al., 2010] Bolme, D. S., Beveridge, J. R., Draper, B. A., and Lui, Y. M. (2010). Visual object tracking using adaptive correlation filters. InComputer Vision and Pattern Recognition
(CVPR), 2010 IEEE Conference on, pages 2544–2550. IEEE.
[Boureau et al., 2010] Boureau, Y.-L., Ponce, J., and LeCun, Y. (2010). A theoretical analysis of feature pooling in visual recognition. In Proceedings of the 27th international conference on machine learning (ICML-10), pages 111–118.
[Bradski, 1998] Bradski, G. R. (1998). Real time face and object tracking as a component of a perceptual user interface. In Applications of Computer Vision, 1998. WACV’98. Proceedings.,
Fourth IEEE Workshop on, pages 214–219. IEEE.
[Breitenstein et al., 2009] Breitenstein, M. D., Reichlin, F., Leibe, B., Koller-Meier, E., and Van Gool, L. (2009). Robust tracking-by-detection using a detector confidence particle filter.
InComputer Vision, 2009 IEEE 12th International Conference on, pages 1515–1522. IEEE.
[Bruno and de Carvalho, 2008] Bruno, O. M. and de Carvalho, L. A. V. (2008). Optica e Fisiologia´ da Vis˜ao-Uma Abordagem Multidisciplinar. Editora Roca.
[Cai et al., 2015] Cai, Y., Chen, X., Wang, H., and Chen, L. (2015). Deep representation and stereo vision based vehicle detection. In Cyber Technology in Automation, Control, and Intelligent
Systems (CYBER), 2015 IEEE International Conference on, pages 305–310. IEEE.
[Caltech, 1999] Caltech (1999). Computational Vision Group - California Institute of Technology.
www.vision.caltech.edu/html-files/archive.html, ´ultimo acceso: 2016/10/10.
[Chen et al., 2015] Chen, Z., Hong, Z., and Tao, D. (2015). An experimental survey on correlation filter-based tracking. arXiv preprint arXiv:1509.05520.
[Chen et al., 2014] Chen, Z., Wang, J., He, H., and Huang, X. (2014). A fast deep learning system using gpu. In Circuits and Systems (ISCAS), 2014 IEEE International Symposium on, pages 1552–1555. IEEE.
[Comaschi, 2016] Comaschi, F. (2016). Robust online face detection and tracking. PhD thesis, Technische Universiteit Eindhoven.
[Comaschi et al., 2016] Comaschi, F., Stuijk, S., Basten, T., and Corporaal, H. (2016). Robust online face tracking-by-detection. In Multimedia and Expo (ICME), 2016 IEEE International Conference on, pages 1–6. IEEE.
[Crowley, 1995] Crowley, J. L. (1995). Vision as process: basic research on computer vision systems, volume 10. Springer Verlag.
[Cunha, 2013] Cunha, A. (2013). Sistema autom´atico para obten¸c˜ao de parˆametros do tr´afego veicular a partir de imagens de v´ıdeo usando opencv. Universidade de S˜ao Paulo, Escola de Engenharia de S˜ao Carlos, Departamento de Transportes.
[Dahua-Technology Co., 2010] Dahua-Technology Co., L. (2010). Dahua-Technology.http://www.
dahuasecurity.com/es, ´ultimo acceso: 2016/07/20.
[Dalal and Triggs, 2005] Dalal, N. and Triggs, B. (2005). Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE
Computer Society Conference on, volume 1, pages 886–893. IEEE.