Videovigilancia en el siglo XXI
Publicado en la revista Seguridad en América, en la edición de Enero - Febrero de 2010
El que no aplique nuevos remedios, debe esperar nuevos males, Porque el tiempo es el máximo innovador. (Francis Bacon)

La información más compleja, y por ello la más difícil de procesar es la información visual, de imágenes. Y sin embargo existe un sistema que es capaz y ha sido capaz a lo largo de la historia, no solo de procesarla, sino de utilizarla de manera muy eficiente, el organismo humano, aún en sus etapas iniciales de desarrollo durante su primera infancia, mediante la mejor computadora que se puede encontrar en la naturaleza, el cerebro humano.

En este contexto, históricamente los sistemas de CCTV se han utilizado a manera de extensión de las capacidades humanas para captar información, en este caso visual, mas allá de su alcance físico, ya sea en distancia o en presencia, lo que le ha proporcionado mayores y mejores referentes y elementos de juicio para la toma de decisiones. Pero a final de cuentas, su valoración sigue estando en manos del factor humano, ya sea en el momento de los hechos o posterior a su ocurrencia.

El problema actual consiste en que los avances tecnológicos y la proliferación de los sistemas de CCTV han generado una mayor y más acelerada producción de información visual, lo que ha llevado la capacidad humana para procesarla a niveles de saturación, por lo que ha sido necesario recurrir a la tecnología, automatizando parte de las tareas de discernimiento mediante procesos de Análisis de Contenido (VCA, Video Content Analisis) basadas en aplicaciones de inteligencia artificial.

El desarrollo de este tipo de aplicaciones se inició con la incorporación de mecanismos digitales a los sistemas de CCTV, y la investigación acerca de algoritmos para el procesamiento de video inteligente, a finales de los años noventa, y se intensificó a partir de 1997 con el proyecto de la Oficina de Sistemas de Información de la Agencia de Investigación de Proyectos Avanzados de Defensa del gobierno de los Estados Unidos (DARPA, Defence Advanced Research Projects Agency) para desarrollar un sistema de Monitoreo y Vigilancia de Video (VSAM, Video Surveillance And Monitoring), con propósitos inicialmente militares y que posteriormente se extendieron a la seguridad en general.

El esquema de funcionalidad en estas aplicaciones consiste en establecer en primer lugar una secuencia de segmentaciones de planos, de fondo y de primer plano, y posteriormente de los objetos sobre cada plano, tanto inmóviles como en movimiento (análisis de trayectorias, object tracking), además de una clasificación de éstos, ya sea como parte del entorno, descartables, o bien de interés para los propósitos particulares de vigilancia en cada caso, personas u objetos.

Para este propósito el principal problema que se enfrenta en estas aplicaciones, y de hecho el de mayor complejidad, es establecer un sentido de profundidad tridimensional sobre una imagen bidimensional, algo que el cerebro humano realiza de manera natural, como base para establecer las segmentaciones de planos y de objetos. Esto debido a que los algoritmos se deben aplicar con sistemas que integren cualquier tipo de cámaras, tanto analógicas como digitales.

A partir de ello lo que sigue es, por así decirlo, un simple problema de procesamiento de datos, realizado con el apoyo de equipos y sistemas informáticos, y que consiste en una comparación continua de las imágenes captadas y conservadas en formatos digitales, contra otras registradas como de referencia en bases de datos, a fin de valorar si la situación observada requiere de alguna forma de acción de respuesta.

Sin embargo, en el mundo real todo puede cambiar, las facciones de una persona por alteraciones naturales o artificiales, la apariencia de la vegetación por efecto del clima, el número y la distribución física de los objetos en un espacio, la apariencia e incluso la integridad de una estructura, etc. Y dado que cualquiera de estos objetos pueden encontrarse en una imagen, es muy posible que se presenten cambios a los objetos enfocados en el curso de una secuencia de imágenes.

Por ello el siguiente problema que se debe resolver es que las imágenes de referencia para la valoración automatizada pueden variar como resultado de cambios en el entorno, de tal suerte que la aplicación debe incorporarlos a sus esquemas de valoración, lo que equivale a aprender de manera continua. Esta es la razón de que se utilicen algoritmos heurísticos, con los que es posible realizar las adecuaciones necesarias no solo de manera automática sino oportuna, adaptándose continuamente a las variaciones del entorno.

La integración de aplicaciones de inteligencia artificial a los sistemas de CCTV han ampliado sus formas de utilización, desde las relativamente sencillas de detección de intrusiones, defensa perimetral y detección de objetos abandonados, sospechosos y desaparecidos, hasta otras más elaboradas como el conteo de vehículos y de personas, dimensiones y velocidad de vehículos, estacionamiento no permitido, control de congestión de tráfico, gestión de colas, control de multitudes y el reconocimiento facial. Y esta diversidad de aplicaciones seguramente se ampliará aún más cuando se logre incorporar la valoración de sonidos, actualmente en fase de investigación y desarrollo.

De acuerdo a la Unión de Libertades Civiles de Nueva York, después de los atentados del 11 de septiembre de 2001 se habían incrementado el número de instalaciones de sistemas de video vigilancia, multiplicándose por cinco con respecto a diciembre de 2006, lo cual de alguna manera confirmaba la proyección del IMS Research, que pronosticaba un crecimiento del mercado de 67.7 millones de dólares en 2004, a 839.2 millones de dólares en 2009.

En la actualidad Inglaterra con sus más de cuatro millones de cámaras vigilando calles, parques y edificios, es el país con más sistemas operando en el mundo. Tan sólo en Londres se tienen más de 500 mil cámaras en operación. Y a esta tendencia se pretende incorporar a la Ciudad de México, con el proyecto de las 8 mil cámaras que se instalarán en los próximos 3 años como parte del Proyecto Bicentenario con el consorcio formado por Telmex y la empresa francesa Thales.

Sin embargo, la instalación de este volumen de equipos requerirá de apoyos de tecnología de inteligencia artificial para facilitar su operación por el elemento humano, realizando el trabajo pesado de selección general, y permitiendo que éste último se enfoque al trabajo de análisis al detalle de las situaciones, con lo cual se aprovecharía lo mejor de los dos mundos, la capacidad de las máquinas para realizar rápidamente el trabajo rutinario, de contexto, y la capacidad del ser humano para el análisis de detalle, de valor final. Y esta es la perspectiva para la video vigilancia en el nuevo siglo, tecnología con una cada vez más creciente capacidad de discernimiento, atributo que hasta ahora había sido exclusivo del ser humano.

En este sentido es importante alertar de un posible escenario futuro, en el que la incorporación de recursos de inteligencia artificial con cada día mayores capacidades de aparente discernimiento, despierte la tentación de relegar o incluso llegar a prescindir del factor humano, olvidando que los sistemas de video vigilancia pueden llegar a ser engañados por imágenes fabricadas, además de que, hasta el día de hoy, sólo el factor humano es capaz de tomar decisiones con base en información incompleta y contradictoria, y muchas veces en sentido opuesto al que dictaría una lógica programada, y aún así tener éxito. Lo que algunas personas asocian con un atributo conocido como creatividad.

Parafraseando a Green Howard, una máquina puede llegar a hacer el trabajo ordinario que hacen entre muchas personas, pero nunca podrá hacer el trabajo extraordinario que puede hacer un solo ser humano. Los mecanismos con inteligencia pueden ayudar mucho al ser humano, facilitándolo su quehacer, pero es poco probable que lleguen a sustituirlo, al menos por su atributo de creatividad, que puede ser su último bastión de prevalencia sobre las máquina.

Corporación Euro Americana de Seguridad México, 2013 © Todos los Derechos Reservados