Problemas de redacción con vídeos de baja calidad
December 03, 2024 | 10 minutes read
Muchas empresas, cuerpos de seguridad, escuelas, hospitales y sistemas de seguridad manejan a diario datos de vídeo procedentes de diversas fuentes. El tratamiento de datos de vídeo puede plantear problemas por muchas razones, ya que se presentan dificultades como oclusiones de objetos, sombras, cambios de iluminación, grabaciones de vídeo movidas, borrosas o con poca luz por la noche. Cuando las empresas necesitan manejar, almacenar o compartir datos con terceros, la información procedente del vídeo debe contener la eliminación de datos de identificación personal (IPI). La calidad del vídeo puede afectar a la capacidad de redactar fácilmente con muchos sistemas automatizados de redacción, creando frustración o arriesgándose a fugas de privacidad.
Privacidad y seguridad pública
La preocupación por la seguridad pública, así como por la seguridad y las opciones rentables para hacer cumplir la ley, han iniciado una nueva era de tecnología de vigilancia a escala mundial. Según las estadísticas proporcionadas por IHS (Information Handling Services), líder mundial en el suministro de investigación e información a empresas, 245 millones de cámaras de videovigilancia ya estaban instaladas profesionalmente, en uso activo y plenamente operativas a escala mundial en 2014. La mayoría de estas cámaras son analógicas. Solo alrededor del 2 % de estas cámaras eran cámaras de CCTV HD y se calcula que un 20 % adicional eran cámaras en red.
Debido a las leyes de privacidad, como el Reglamento General de Protección de Datos (GDPR), la Ley de Privacidad del Consumidor de California (CCPA) y otras regulaciones federales y estatales de privacidad y datos, las empresas tienen la responsabilidad de proteger los datos y la privacidad de las personas dentro de los datos. Empleados, consumidores, seguridad en general, no importa a quién impliquen los datos, lo más probable es que su privacidad esté regulada en cierta medida. Esto incluye grabaciones de vídeo que pueden contener IPI. Esto puede incluir direcciones, caras, matrículas o cualquier otra información que identifique a una persona. Tanto las empresas como los organismos públicos y las compañías utilizan programas de redacción para proteger la privacidad de las personas y reducir el riesgo de los datos que conservan.
Analógico frente a digital
Hoy en día, la mayoría de la gente es consciente de que existe una diferencia entre el vídeo analógico y el digital. Incluso sin conocer los detalles, entienden que la tecnología se ha ido alejando de lo analógico mientras compran sus televisores HD de pantalla grande. Tanto el vídeo analógico como el digital se transmiten a través de señales electrónicas. Puede ser audio, vídeo o ambos. La diferencia está en cómo se transmite y recibe la señal.
Si pudieras visualizar las señales como un gráfico, podrías imaginar que muestra curvas. Ambos tipos de señales pueden enviar exactamente la misma información y ofrecer visualizaciones duplicadas. La diferencia está en los detalles. Pensando en el gráfico, si lo observara detenidamente vería que la curva de la señal digital es una línea suave. Sin embargo, si observas la estructura analógica, la misma curva se muestra a través de una variedad de pasos diminutos o bloques de distintos tamaños.
La forma en que se logra este tipo variado de señal es en cómo se envía y entrega. Las señales analógicas se envían a través de pulsos de longitud variable de amplitud variable de pulsos eléctricos. Este formato de impulsos explica la estructura en bloques del gráfico. Las señales digitales también son señales eléctricas, pero a diferencia de las analógicas, estas señales sólo tienen dos amplitudes y se traducen a un código binario.
Si la señal digital es mejor, ¿por qué entonces el 78% de los sistemas de vigilancia en funcionamiento en 2014 son analógicos? Tres características clave para muchas empresas encabezaban esta decisión, los costes, el ancho de banda y el tiempo de procesamiento. La señal de vídeo analógica puede procesarse en tiempo real. El procesamiento digital, por diversas razones, puede o no procesarse de inmediato. Las señales analógicas consumen menos ancho de banda que las digitales, lo que permite a las empresas ahorrar dinero y dejar el ancho de banda libre para otras aplicaciones empresariales. En comparación, los costes totales de un sistema analógico son bajos y la información es fácilmente transportable. Los sistemas digitales tienen costes más elevados y son menos portátiles debido al tamaño de los archivos.
CCTV
Los CCTV son el 2% de las secuencias de vídeo de los sistemas de vigilancia. Estos sistemas de vídeo están conectados por cable a su receptor. De nuevo, la información se envía y recibe en un formato totalmente distinto al analógico o al digital. Los circuitos cerrados de televisión utilizan lo que se denomina imagen entrelazada 2:1. Las entradas y salidas de imágenes se crean mediante vídeo creado por un CCD o dispositivo de carga acoplada. El CCD escanea y emite a través y hacia abajo exactamente 312 ½ veces, lo que se muestra en la pantalla. Un segundo barrido de 312 ½ comenzará exactamente ½ línea hacia abajo. Este ligero desplazamiento también se muestra mientras se entrelaza con la primera salida para crear la imagen o visualización completa.
Cámaras corporales
En los cuerpos de seguridad y en otros ámbitos en los que se utilizan cámaras corporales para recopilar datos, el vídeo obtenido presenta retos únicos para la redacción, tanto para los individuos como para el software de redacción. En estos casos, tanto el usuario como el objeto están en movimiento. Esto puede crear imágenes de vídeo movidas o borrosas, con paradas repentinas o momentos de claridad. El vídeo también podría grabarse con poca luz o en situaciones nocturnas. Con tantos escenarios diferentes para los agentes en el cumplimiento de su deber, no hay un principio decisivo o un enfoque individual para resolver la cuestión.
Los agentes se enfrentan a peligros en su trabajo, los BWC están ahí para su propia seguridad, así como para que la transparencia dé fe de lo que ocurre. Esto también puede significar que la grabación de vídeo puede ser inestable durante períodos de tiempo, como cuando el agente persigue a un delincuente a pie. Puede haber una gran cantidad de desenfoque y movimiento durante una detención cuando el sospechoso decide ponerse difícil o contraatacar. A medida que el vídeo se agita y se difumina, puede haber momentos detenidos o quietos en los que se capten imágenes. La calidad del vídeo en general puede dificultar la redacción.
Vídeo con poca luz
A veces, los vídeos captados por las cámaras de vigilancia no son óptimos. Las condiciones de filmación pueden ser malas, por ejemplo, poca luz, de noche, mala perspectiva. La falta de redacciones en la película debido a la poca luz o a la oscuridad del vídeo puede ser incluso peligrosa. En el ámbito policial, un vídeo de mala calidad puede tener graves consecuencias, incluso de vida o muerte. La omisión de un solo fotograma durante el proceso de redacción puede revelar la identidad de alguien, lo que podría poner en peligro su vida y la de su familia.
Costes de la redacción
Hay muchas cosas que pueden aumentar los costes de la redacción. Cuanto más tiempo tenga que estar en manos humanas la redacción y se tenga que revisar fotograma a fotograma, mayores serán los costes. Siempre que la calidad del vídeo se vea mermada, ya sea por una baja calidad analógica, poca iluminación, cámaras temblorosas o situaciones diversas, lo más probable es que el vídeo presente algún tipo de problema cuando una empresa intente utilizar la mayoría de las aplicaciones de redacción. YouTube ofrece tecnología de redacción, pero si el vídeo es oscuro o de baja calidad, simplemente no funciona.
Las empresas se dan cuenta de que su reputación es demasiado importante como para arriesgarse a permitir una violación de la privacidad por utilizar una tecnología de redacción automatizada de baja calidad. Puede ser difícil saber cuál elegir. También hay grandes malentendidos entre el público y las empresas sobre los costes de la redacción y el software de redacción.
Un ejemplo tanto de los elevados costes de la redacción individual como de la confusión que rodea a los costes del proceso de redacción puede encontrarse en una demanda presentada en Blackman Township, Michigan. Un hombre de la localidad demandó a Northwest Community Schools para obtener imágenes de vídeo de un incidente ocurrido en el autobús escolar. El juez ordenó a la escuela que distribuyera el vídeo y ordenó al demandante que pagara los costes de redacción.
Northwest Community Schools recibió cuatro ofertas para gestionar los costes de redacción que oscilaban entre 3.000 y 13.000 dólares. El demandante ha declarado que estas estimaciones son ridículas y que, con las tecnologías de automatización actuales, el proceso de redacción debería costar menos de 100 dólares. Tiene previsto volver a llevar a la escuela ante los tribunales.
El distrito escolar ha intentado explicar que los autobuses escolares sólo están equipados con vigilancia analógica y que la película es de baja calidad. Debido a la mala calidad, la redacción tendrá que hacerse manualmente y podría llevar hasta tres semanas. Sus puntos de vista son muy distintos, pero la realidad es que la mayoría de los sistemas automatizados de redacción tienen problemas cuando manejan vídeos de baja calidad.
Automatización e IA
El demandante tenía razón en que la automatización ha empezado a cambiar las aplicaciones de redacción. Incluso con el uso de la automatización y la inteligencia artificial, la mayoría de los sistemas de software no pueden seguir el ritmo de la mayoría de los vídeos problemáticos. Sin embargo, el sistema inteligente de redacción de vídeos de CaseGuard está diseñado específicamente para manejar todo tipo de vídeos, incluso los movidos y con poca luz. Utilizando capacidades de inteligencia artificial y aprendizaje automático, el sistema de CaseGuard conserva un conjunto de datos que se construye sobre sí mismo pero que ya está lleno de varios puntos de vista de cámara. Estos puntos de vista pretenden desafiar al sistema introduciendo todos los tipos de problemas de imagen a los que puede enfrentarse.
El perspicaz diseño del sistema de redacción de vídeos de CaseGuard contiene algoritmos que se centran y buscan específicamente rostros humanos desde todos los ángulos. El Annotated Facial Landmarks in the Wild (AFLW) es un ejemplo de conjunto de datos popular. Este conjunto de datos incluye aproximadamente 25.000 rostros anotados a partir de imágenes reales. Este conjunto utiliza una gran variedad de iluminaciones, como poca luz, poses humanas y oclusiones que pueden dificultar la detección. Se ha creado un conjunto de datos FaceScrub más reciente a partir de 100.000 imágenes de más de 500 famosos.
Percibido como el mejor en diseño inteligente, CaseGuard tiene una funcionalidad completa en diversas circunstancias. Su sistema de redacción facial puede utilizarse para automatizar y redactar multitudes enteras, o capturar los lados de las caras de todos los individuos de la filmación. No sólo contiene una amplia variedad de conjuntos de datos de imágenes, sino que también maneja multitud de conjuntos de datos de vídeo. Permite al usuario establecer los puntos de datos, el seguimiento de objetos y una variedad de métodos de redacción.
CaseGuard es un sistema de redacción de vídeo de calidad superior que ofrece mucho más que la redacción automatizada. Entre las ventajas alternativas se incluye la redacción de documentos, pdf e imágenes. Otras prestaciones son los servicios de subtitulado automático, transcripción y traducción. Las funciones mejoradas permiten a las empresas ahorrar dinero, ya que una sola aplicación puede gestionar multitud de tareas. También se ahorran los costes de formación de los empleados. El mayor ahorro de costes viene de la mano de la calidad superior de la redacción, que permite a las empresas reducir el riesgo para su negocio, su reputación y sus consumidores.