Maybaygiare.org

Blog Network

56 Aplicaciones de Visión por computadora más populares en 2021

La visión por computadora es un sector de inteligencia artificial que utiliza máquinas y aprendizaje profundo para permitir que las computadoras «vean» y analicen su entorno. La visión por computadora tiene un impacto masivo en las empresas de todos los sectores, desde el comercio minorista hasta la agricultura. Es especialmente útil para problemas en los que necesitaríamos un ojo humano para ver la situación. Debido a la gran cantidad de problemas que existen en ese criterio, miles de aplicaciones de la visión por computadora aún no se han descubierto o agotado.

Este artículo será una publicación de lista acumulativa de aplicaciones de visión por computadora progresivas y de rápido crecimiento utilizadas por industrias prominentes en 2021.

Visión por computadora en deportes

Seguimiento de pose de jugador

La visión AI se puede usar para reconocer patrones entre el movimiento del cuerpo humano y la pose en múltiples fotogramas en secuencias de video o transmisiones de video en tiempo real. La estimación de la postura humana se ha aplicado a videos del mundo real de nadadores donde cámaras fijas individuales filman por encima y por debajo de la superficie del agua. Esas grabaciones de video se pueden usar para evaluar cuantitativamente el rendimiento de los atletas sin anotar manualmente las partes del cuerpo en cada fotograma de video. Las Redes Neuronales convolucionales se utilizan para inferir automáticamente la información de postura requerida y detectar el estilo de natación de un atleta.

Las cámaras de captura de movimiento sin marcas

se pueden utilizar para rastrear el movimiento del esqueleto humano sin usar marcadores ópticos tradicionales ni cámaras especializadas. Esto es esencial en la captura deportiva, donde los jugadores no pueden cargar con atuendos o dispositivos de captura de rendimiento adicionales.

Evaluación Objetiva del Rendimiento del atleta

La detección y el reconocimiento automatizados de movimientos específicos del deporte superan las limitaciones asociadas con los métodos manuales de análisis del rendimiento. Las entradas de datos de visión por computadora se pueden utilizar en combinación con los datos de sensores y dispositivos portátiles usados en el cuerpo. Los casos de uso más populares son el análisis de natación, el análisis de swing de golf, el análisis de carrera sobre el terreno, el esquí alpino y la detección y evaluación de los bolos de cricket.

Seguimiento de Pose para varios jugadores

Mediante algoritmos de visión artificial, la pose y el movimiento de varios jugadores de equipo se pueden calcular a partir de conjuntos de datos de vídeo deportivo monoculares (imágenes de una sola cámara) y de varias vistas (imágenes de varias cámaras). El uso potencial de estimar la Pose en 2D o 3D de los jugadores en deportes es de amplio alcance e incluye análisis de rendimiento, captura de movimiento y aplicaciones novedosas en medios de difusión e inmersivos.

Reconocimiento de golpes

Las aplicaciones de visión artificial se pueden utilizar para detectar y clasificar golpes (por ejemplo, para clasificar golpes en tenis de mesa). El reconocimiento o clasificación de movimientos implica interpretaciones adicionales y predicciones etiquetadas de la instancia identificada (por ejemplo, diferenciar golpes de tenis como golpe de derecha o revés). El reconocimiento de accidentes cerebrovasculares tiene como objetivo proporcionar herramientas para que los maestros, entrenadores y jugadores analicen los juegos de tenis de mesa y mejoren las habilidades deportivas de manera más eficiente.

Detección de Pose Jugador Deportivo de Aprendizaje Profundo
Ejemplo de Seguimiento de Jugadores Con Estimación de Pose basada en Aprendizaje Profundo
Coaching Casi en Tiempo Real

El análisis deportivo basado en visión computarizada ayuda a mejorar eficiencia de los recursos y reducción de los tiempos de retroalimentación para tareas con limitaciones de tiempo. Los entrenadores y atletas que participan en tareas de notación que requieren mucho tiempo, incluido el análisis de la carrera posterior a la natación, pueden beneficiarse de una retroalimentación objetiva rápida antes de la próxima carrera en el programa del evento.

Análisis de comportamientos de equipo deportivo

Los analistas de deportes de equipo profesionales realizan análisis regularmente para obtener información estratégica y táctica sobre el comportamiento de los jugadores y el equipo (identificar debilidades, evaluar el rendimiento y los potenciales de mejora). Sin embargo, el análisis manual de vídeo suele ser un proceso que consume mucho tiempo, en el que los analistas necesitan memorizar y anotar escenas. Las técnicas de visión por computadora se pueden usar para extraer datos de trayectoria de material de video y aplicar técnicas de análisis de movimiento para derivar medidas analíticas relevantes de deportes de equipo para análisis de región, formación de equipos, eventos y jugadores (por ejemplo, en el análisis de deportes de equipo de fútbol).

Cobertura mediática automatizada

La tecnología de visión AI puede utilizar imágenes de vídeo para interpretar juegos deportivos y transmitirlos a los medios de comunicación sin necesidad de ir allí con cámaras físicas. Por ejemplo, el béisbol ha ganado esta ventaja en los últimos años con la automatización de la cobertura de noticias de juegos.

Seguimiento del balón

Los datos de trayectoria del balón son una de las informaciones más fundamentales y útiles en la evaluación del rendimiento de los jugadores y el análisis de las estrategias de juego. Por lo tanto, el seguimiento del movimiento de la bola es una aplicación de aprendizaje profundo y automático para detectar y luego rastrear la bola en fotogramas de video. El seguimiento de la pelota es importante en deportes con campos grandes (por ejemplo, fútbol) para ayudar a los presentadores de noticias y analistas a interpretar y analizar un juego deportivo y tácticas más rápido.

Tecnología de línea de goles

Los sistemas basados en cámaras se pueden utilizar para determinar si se ha marcado un gol o no para apoyar la toma de decisiones de los árbitros. A diferencia de los sensores, el método basado en la visión no es invasivo y no requiere cambios en los dispositivos de fútbol típicos. Estos sistemas de Tecnología de Línea de meta se basan en cámaras de alta velocidad cuyas imágenes se utilizan para triangular la posición del balón. Algoritmo de detección de bolas que analiza regiones de bolas candidatas para reconocer el patrón de la bola.

Detección de eventos en Deportes

El aprendizaje profundo se puede usar para detectar eventos complejos a partir de videos no estructurados, como marcar un gol en un partido de fútbol, casi fallar u otras partes emocionantes de un juego que no dan lugar a un marcador. Esta tecnología se puede utilizar para la detección de eventos en tiempo real en transmisiones deportivas, aplicable a una amplia gama de deportes de campo.

Retroalimentación de autoentrenamiento

Los sistemas de autoentrenamiento basados en visión computarizada para ejercicios deportivos son un tema de investigación recientemente emergente. Si bien el auto-entrenamiento es esencial en el ejercicio deportivo, un practicante puede progresar hasta cierto punto sin la instrucción de un entrenador. Por ejemplo, una aplicación de auto-entrenamiento de yoga tiene como objetivo instruir al practicante a realizar posturas de yoga correctamente, ayudar a rectificar posturas deficientes y prevenir lesiones. Un sistema de auto-entrenamiento da instrucciones sobre cómo ajustar la postura corporal.

Generación automática de reflejos

La producción de reflejos deportivos es un trabajo intensivo que requiere cierto grado de especialización, especialmente en deportes con un conjunto complejo de reglas que se juegan durante más tiempo (p. ej. Cricket). Un ejemplo de aplicación es la generación automática de destellos de Cricket que utiliza funciones basadas en eventos y emociones para reconocer y recortar eventos importantes en un partido de cricket. Otra aplicación es la curación automática de momentos destacados de golf utilizando funciones de excitación multimodelo con Visión por computadora.

Puntuación de Actividad Deportiva

Los métodos de aprendizaje profundo se pueden utilizar para la puntuación de actividad deportiva para evaluar la calidad de la acción de los atletas (Características profundas para la Puntuación de Actividad Deportiva). La puntuación automática de la actividad deportiva se puede usar en buceo, patinaje artístico o salto (ScoringNet es una aplicación de red CNN en 3D para la puntuación de la actividad deportiva). Por ejemplo, una aplicación de puntuación de buceo funciona evaluando la puntuación de calidad de un rendimiento de buceo de un atleta: Importa si los pies del atleta están juntos y sus dedos de los pies están en punta recta durante todo el proceso de buceo.

La visión artificial en la atención de la salud

Detección de cáncer

El aprendizaje automático se incorpora en las industrias médicas para fines como la detección de cáncer de mama y de piel. La detección de imágenes permite a los científicos detectar pequeñas diferencias entre imágenes cancerosas y no cancerosas, y diagnosticar los datos de las imágenes por resonancia magnética (RM) y las fotos ingresadas como malignas o benignas.

Diagnóstico de COVID-19

La visión por computadora se puede utilizar para el control del coronavirus. Existen múltiples modelos de visión computarizada de aprendizaje profundo para el diagnóstico de COVID-19 basado en rayos X. El más popular para la detección de casos de COVID-19 con imágenes digitales de radiografía de tórax (CXR) se llama COVID-Net y fue desarrollado por Darwin AI, Canadá.

Clasificación de células

El aprendizaje automático en casos de uso médico se utilizó para clasificar los linfocitos T contra las células epiteliales del cáncer de colon con alta precisión. Se espera que el ML acelere significativamente el proceso de identificación de la enfermedad con respecto al cáncer de colon de manera eficiente y con poco o ningún costo posterior a la creación.

Análisis de movimiento

Las enfermedades neurológicas y musculoesqueléticas, como los accidentes cerebrovasculares que se aproximan, los problemas de equilibrio y de marcha, se pueden detectar utilizando modelos de aprendizaje profundo y visión artificial, incluso sin análisis médico. Las aplicaciones de visión computarizada que analizan el movimiento del paciente ayudan a los médicos a diagnosticar a un paciente con facilidad y mayor precisión.

Detección de máscaras

El reconocimiento facial enmascarado se utiliza para detectar el uso de máscaras y equipos de protección para limitar la propagación del coronavirus. Los sistemas de visión por computadora ayudan a los países a aplicar máscaras como estrategia de control para contener la propagación de la enfermedad por coronavirus. Empresas privadas como Uber han creado funciones de visión por computadora que se implementarán en sus aplicaciones móviles para detectar si los pasajeros usan máscaras o no. Programas como este hacen que el transporte público sea más seguro durante la pandemia del coronavirus.

Detección de tumores

Los tumores cerebrales se pueden ver en imágenes por resonancia magnética y, a menudo, se detectan mediante redes neuronales profundas. El software de detección de tumores que utiliza aprendizaje profundo es crucial para la industria médica porque puede detectar tumores con alta precisión para ayudar a los médicos a hacer sus diagnósticos. Se están desarrollando constantemente nuevos métodos para aumentar la precisión de estos diagnósticos.

Puntuación de progresión de la enfermedad

La visión por computadora se puede utilizar para identificar a los pacientes que están en estado crítico para dirigir la atención médica (detección de pacientes críticos). Se ha descubierto que las personas infectadas con COVID-19 tienen una respiración más rápida. El aprendizaje profundo con cámaras de profundidad se puede utilizar para identificar patrones respiratorios anormales y realizar una detección precisa, discreta pero a gran escala de personas infectadas con el virus de la COVID-19.

Atención médica y rehabilitación

La fisioterapia es importante para el entrenamiento de recuperación de sobrevivientes de accidentes cerebrovasculares y pacientes con lesiones deportivas. Dado que la supervisión por parte de un profesional proporcionado por un hospital o agencia médica es costosa, se prefiere la capacitación en el hogar con una aplicación de rehabilitación basada en la visión, ya que permite a las personas practicar entrenamiento en movimiento de forma privada y económica. En la terapia o rehabilitación asistida por computadora, la evaluación de la acción humana se puede aplicar para ayudar a los pacientes a capacitarse en el hogar, guiarlos para realizar acciones correctamente y evitar que se lesionen más.

Capacitación en habilidades médicas

Las aplicaciones de visión artificial se utilizan para evaluar el nivel de habilidades de los estudiantes expertos en plataformas de autoaprendizaje. Por ejemplo, se han desarrollado plataformas de entrenamiento quirúrgico basadas en simulación para la educación quirúrgica. La técnica de evaluación de la calidad de la acción permite desarrollar enfoques computacionales que evalúan automáticamente el desempeño de los estudiantes de cirugía. En consecuencia, se puede proporcionar información de retroalimentación significativa a las personas y guiarlas para mejorar sus niveles de habilidades.

Visión por computadora en la agricultura

Monitoreo de cultivos

El rendimiento y la calidad de cultivos importantes como el arroz y el trigo determinan la estabilidad de la seguridad alimentaria. Tradicionalmente, el monitoreo del crecimiento de los cultivos se basa principalmente en el juicio humano subjetivo y no es oportuno ni preciso. Las aplicaciones de visión por computadora permiten monitorear de forma continua y no destructiva el crecimiento de las plantas y la respuesta a los requerimientos de nutrientes. En comparación con las operaciones manuales, el monitoreo en tiempo real del crecimiento de los cultivos mediante la aplicación de tecnología de visión por computadora puede detectar los cambios sutiles en los cultivos debido a la desnutrición mucho antes y puede proporcionar una base confiable y precisa para una regulación oportuna. Las aplicaciones de visión por computadora se pueden utilizar para medir indicadores de crecimiento de plantas o para determinar la etapa de crecimiento.

Detección de floración

La fecha de partida del trigo es uno de los parámetros más importantes para los cultivos de trigo. Se puede utilizar un sistema automático de observación por visión computarizada para determinar el período de partida del trigo. La tecnología de visión por computadora tiene las ventajas de bajo costo, pequeño error, alta eficiencia y buena robustez, y se puede analizar de forma dinámica y continua.

Monitoreo de plantaciones

En la agricultura inteligente, el procesamiento de imágenes con imágenes de drones se puede utilizar para monitorear las plantaciones de aceite de palma de forma remota. Con ortofotos geoespaciales, es posible identificar qué parte de la tierra de plantación es fértil para los cultivos plantados. También fue posible identificar áreas menos fértiles en términos de crecimiento, y también parte del campo de plantación que no está creciendo en absoluto.

Detección de insectos

El reconocimiento y el recuento rápidos y precisos de insectos voladores son de gran importancia, especialmente para el control de plagas. La identificación y el recuento manual tradicional de insectos voladores es ineficiente y requiere mucha mano de obra. Los sistemas basados en la visión permiten el recuento y el reconocimiento de insectos voladores (basados en la detección y clasificación de objetos de You Only Look Once (YOLO)).

Detección de enfermedades de plantas

La estimación automática y precisa de la gravedad de la enfermedad es esencial para la seguridad alimentaria, el manejo de enfermedades y la predicción de pérdida de rendimiento. El método de aprendizaje profundo evita la ingeniería de características que requiere mucha mano de obra y la segmentación de imágenes basada en umbrales. Se desarrolló una estimación automática de la gravedad de las enfermedades de las plantas basada en imágenes utilizando aplicaciones de redes neuronales convolucionales profundas (CNN), por ejemplo, para identificar la pudrición negra de la manzana.

Deshierbe automático

Las malas hierbas se consideran plantas dañinas en agronomía porque compiten con los cultivos para obtener el agua, los minerales y otros nutrientes en el suelo. Rociar pesticidas solo en la ubicación exacta de las malas hierbas reduce en gran medida el riesgo de contaminar los cultivos, los seres humanos, los animales y los recursos hídricos. La detección y eliminación inteligentes de malas hierbas son fundamentales para el desarrollo de la agricultura. Se puede utilizar un sistema de visión por computadora basado en redes neuronales para identificar plantas de patata y tres malas hierbas diferentes para la pulverización específica en el sitio.

Cosecha automática

En la agricultura tradicional, hay una dependencia de las operaciones mecánicas, con la cosecha manual como pilar, lo que resulta en altos costos y baja eficiencia. En los últimos años, con la aplicación continua de la tecnología de visión por computadora, las cosechadoras agrícolas inteligentes de alta gama, como la maquinaria de cosecha y los robots de recolección basados en la tecnología de visión por computadora, han surgido en la producción agrícola, lo que ha sido un nuevo paso en la cosecha automática de cultivos. El objetivo principal de las operaciones de cosecha es garantizar la calidad del producto durante la cosecha para maximizar el valor de mercado. Las aplicaciones con visión artificial incluyen la recolección automática de pepinos en un entorno de invernadero o la identificación automática de cerezas en un entorno natural.

Pruebas de calidad de productos agrícolas

La calidad de los productos agrícolas es uno de los factores importantes que afectan los precios de mercado y la satisfacción del cliente. En comparación con las inspecciones manuales, la visión por computadora proporciona una forma de realizar controles de calidad externos y lograr altos grados de flexibilidad y repetibilidad a un costo relativamente bajo y con alta precisión. Los sistemas basados en visión artificial y visión artificial se utilizan para realizar pruebas rápidas de los daños causados por el limón dulce o para evaluar la calidad no destructiva de las patatas.

Gestión del riego

La gestión del suelo basada en el uso de tecnología para mejorar la productividad del suelo a través del cultivo, la fertilización o el riego tiene un impacto notable en la producción agrícola moderna. Al obtener información útil sobre el crecimiento de cultivos hortícolas a través de imágenes, el balance hídrico del suelo se puede estimar con precisión para lograr una planificación de riego precisa. Las aplicaciones de visión artificial proporcionan información valiosa sobre el balance hídrico de la gestión del riego. Un sistema basado en la visión puede procesar imágenes multiespectrales tomadas por vehículos aéreos no tripulados (UAV) y obtener el índice de vegetación (VI) para proporcionar apoyo en la toma de decisiones para la gestión del riego.

Monitoreo de tierras de cultivo de UAV

La información de tierras de cultivo en tiempo real y una comprensión precisa de esa información desempeñan un papel básico en la agricultura de precisión. En los últimos años, el UAV, como tecnología de rápido avance, ha permitido la adquisición de información agrícola que tiene una alta resolución, bajo costo y soluciones rápidas. Las plataformas de UAV equipadas con sensores de imagen proporcionan información detallada sobre la economía agrícola y las condiciones de los cultivos (por ejemplo, monitoreo continuo de los cultivos). La teleobservación de los vehículos aéreos no tripulados ha contribuido a un aumento de la producción agrícola con una disminución de los costos agrícolas.

Evaluación del rendimiento

A través de la aplicación de tecnología de visión por computadora, se han realizado las funciones de manejo del suelo, detección de madurez y estimación del rendimiento para granjas. Además, la tecnología existente se puede aplicar bien a métodos como el análisis espectral y el aprendizaje profundo. La mayoría de estos métodos tienen las ventajas de alta precisión, bajo costo, buena portabilidad, buena integración y escalabilidad, y pueden proporcionar un soporte confiable para la toma de decisiones de gestión. Un ejemplo es la estimación del rendimiento de los cultivos de cítricos a través de la detección y el recuento de frutas mediante visión artificial. Además, el rendimiento de los campos de caña de azúcar se puede predecir mediante el procesamiento de imágenes obtenidas con UAV.

Monitoreo de animales

Los animales se pueden monitorear utilizando técnicas novedosas que han sido entrenadas para detectar el tipo de animal y sus acciones. Es muy útil el monitoreo de animales en la agricultura, donde el ganado se puede monitorear de forma remota para detectar enfermedades, cambios en el comportamiento o dar a luz. Además, los científicos de agricultura y vida silvestre pueden ver animales salvajes de forma segura a distancia.

Automatización de granjas

Las tecnologías como robots de cosecha, siembra y deshierbe, tractores autónomos y drones para monitorear las condiciones de la granja y aplicar fertilizantes pueden maximizar la productividad con escasez de mano de obra. La agricultura también puede ser más rentable cuando se minimiza la huella ecológica de la agricultura.

Caso de Uso de Detección de Objetos Agrícolas de Aprendizaje Profundo
Aplicación de Visión Artificial Agrícola para Monitoreo de Animales

Visión Artificial en el Transporte

Clasificación de vehículos

Visión artificial las aplicaciones para la clasificación automatizada de vehículos tienen una larga historia. Las tecnologías para la clasificación automatizada de vehículos han evolucionado durante décadas. Con sensores asequibles de rápido crecimiento, como cámaras de circuito cerrado de televisión (CCTV), detección y telemetría de luz (LiDAR) e incluso dispositivos de imágenes térmicas, los vehículos se pueden detectar, rastrear y clasificar en múltiples carriles simultáneamente. La precisión de la clasificación de vehículos se puede mejorar combinando múltiples sensores, como imágenes térmicas, imágenes LiDAR y cámaras visibles RGB. Hay múltiples especializaciones, por ejemplo, se ha empleado una solución de visión por computadora basada en el aprendizaje profundo para la detección de vehículos de construcción con fines como el monitoreo de seguridad, la evaluación de la productividad y la toma de decisiones gerenciales.

Detección de infracciones en movimiento

Los organismos encargados de hacer cumplir la ley y los municipios están aumentando el despliegue de sistemas de monitoreo de carreteras basados en cámaras con el objetivo de reducir el comportamiento de conducción insegura. Cada vez se utilizan más técnicas de visión por computadora para automatizar la detección de infracciones, como exceso de velocidad, luces rojas o señales de alto, conducción en sentido contrario y giros ilegales.

Análisis de flujo de Tráfico

El análisis de flujo de tráfico se ha estudiado ampliamente para sistemas de transporte inteligentes (STI) utilizando ambos métodos invasivos (etiquetas, bobinas debajo del pavimento, etc.) y métodos no invasivos como cámaras. Con el auge de la visión por computadora y la IA, el análisis de video ahora se puede aplicar a las cámaras de tráfico ubicuas, lo que puede generar un gran impacto en las TIC y en las ciudades inteligentes. El flujo de tráfico se puede observar utilizando medios de visión por computadora y medir algunas de las variables requeridas por los ingenieros de tráfico.

Detección de ocupación de estacionamiento

El monitoreo visual del espacio de estacionamiento se utiliza con el objetivo de detectar la ocupación del estacionamiento. Las aplicaciones de visión por computadora impulsan soluciones descentralizadas y eficientes para la detección visual de ocupación de estacionamientos basadas en una Red Neuronal Convolucional profunda (CNN). Existen múltiples conjuntos de datos para la detección de estacionamientos, como PKLot y CNRPark-EXT. Además, se han implementado sistemas de gestión de aparcamientos basados en vídeo utilizando imágenes estereoscópicas (3D) o cámaras térmicas.

Reconocimiento automatizado de matrículas

Muchos sistemas modernos de transporte y seguridad pública dependen de la capacidad de reconocer y extraer información de matrículas de imágenes fijas o videos. El reconocimiento automatizado de matrículas (ALPR) ha transformado de muchas maneras las industrias de seguridad pública y transporte, ayudando a habilitar soluciones modernas de carreteras con peaje, proporcionando enormes ahorros de costos operativos a través de la automatización e incluso habilitando capacidades completamente nuevas en el mercado (por ejemplo, unidades de lectura de matrículas montadas en un crucero de policía). OpenALPR es una popular biblioteca de reconocimiento automático de matrículas, basada en el reconocimiento de caracteres en imágenes o transmisiones de video de matrículas de vehículos.

Reidentificación de vehículos

Con mejoras en la reidentificación de personas, los sistemas inteligentes de transporte y vigilancia tienen como objetivo replicar este enfoque para vehículos que utilizan la reidentificación de vehículos basada en la visión. Los métodos convencionales para proporcionar una identificación de vehículo única suelen ser intrusivos (etiqueta en el vehículo, teléfono celular o GPS). Para configuraciones controladas, como en una cabina de peaje, el reconocimiento automático de matrículas (ALPR) es probablemente la mejor tecnología adecuada para la identificación precisa de vehículos individuales. Sin embargo, las matrículas están sujetas a cambio y falsificación, y ALPR no puede reflejar las especialidades sobresalientes de los vehículos, como marcas o abolladuras. Los métodos no intrusivos, como el reconocimiento basado en imágenes, tienen un alto potencial y demanda, pero aún están lejos de madurar para su uso práctico. La mayoría de las técnicas de reidentificación de vehículos basadas en la visión existentes se basan en la apariencia del vehículo, como el color, la textura y la forma. A día de hoy, el reconocimiento de características distintivas sutiles, como la marca del vehículo o el modelo del año, sigue siendo un desafío sin resolver.

Detección de peatones

La detección de peatones es crucial para los sistemas de transporte inteligentes, abarca desde la conducción autónoma hasta la vigilancia de la infraestructura, la gestión del tráfico, la seguridad y eficiencia del tránsito y la aplicación de la ley. La detección de peatones involucra muchos tipos de sensores, como cámaras CCTV o IP tradicionales, dispositivos de imágenes térmicas, dispositivos de imágenes de infrarrojo cercano y cámaras RGB a bordo. Los algoritmos de detección de peatones se pueden basar en firmas infrarrojas, características de forma, características de gradiente, aprendizaje automático o características de movimiento. La detección de peatones basada en redes neuronales de convolución profunda ha logrado un progreso significativo, incluso con la detección de peatones muy ocluidos.

Detección de señales de tráfico

Las aplicaciones de visión artificial se utilizan para la detección y el reconocimiento de señales de tráfico. Las técnicas de visión se aplican para segmentar señales de tráfico de diferentes escenas de tráfico (mediante segmentación de imágenes) y emplean algoritmos de aprendizaje profundo para el reconocimiento y la clasificación de señales de tráfico.

Los sistemas anticolisión

La detección de vehículos y la detección de carriles forman parte integral de la mayoría de los sistemas avanzados de asistencia al conductor (ADAS). Las redes neuronales profundas se han utilizado recientemente para investigar el aprendizaje profundo y el uso de ti para sistemas autónomos de prevención de colisiones.

Monitoreo del estado de la carretera

Se desarrollan aplicaciones para la detección de defectos y la evaluación del estado basadas en visión computarizada para monitorear la infraestructura civil de concreto y asfalto. La evaluación del estado de los pavimentos proporciona información para tomar decisiones más rentables y consistentes con respecto a la gestión de la red de pavimentos. En general, las inspecciones de peligro en el pavimento se realizan utilizando vehículos sofisticados de recopilación de datos y/o estudios a pie sobre el terreno. Se desarrolló un Enfoque de Aprendizaje Automático Profundo para desarrollar un índice de condición de pavimento asfáltico para proporcionar una forma de detección automatizada de problemas de pavimento a través de la visión por computadora, independiente del ser humano, económica, eficiente y segura. Otra aplicación es una aplicación de visión por computadora para detectar baches en la carretera para asignar el mantenimiento de la carretera y reducir el número de accidentes de vehículos relacionados.

Evaluación del estado de la infraestructura

Para garantizar la seguridad y el servicio de la infraestructura civil, es esencial inspeccionar y evaluar visualmente su estado físico y funcional. Los sistemas de inspección y supervisión de infraestructuras civiles basados en visión computarizada se utilizan para convertir automáticamente datos de imagen y vídeo en información procesable. Las aplicaciones de inspección por visión computarizada se utilizan para identificar componentes estructurales, caracterizar daños visibles locales y globales y detectar cambios a partir de una imagen de referencia. Tales aplicaciones de monitoreo incluyen la medición estática de la deformación y el desplazamiento y la medición dinámica del desplazamiento para el análisis modal.

Detección de atención al conductor

La conducción distraída, como soñar despierto, usar teléfonos celulares y mirar algo fuera del automóvil, representa una gran proporción de las muertes por accidentes de tráfico en todo el mundo. La inteligencia artificial se utiliza para comprender los comportamientos de conducción y encontrar soluciones para mitigar los incidentes de tráfico vial. Las tecnologías de vigilancia vial se utilizan para observar infracciones en los compartimentos de pasajeros, por ejemplo, en la detección de cinturones de seguridad basada en aprendizaje profundo en la vigilancia vial. Las tecnologías de monitoreo del conductor en el vehículo se centran en la detección visual, el análisis y la retroalimentación. El comportamiento del conductor se puede inferir tanto directamente de las cámaras orientadas hacia el conductor hacia adentro como indirectamente de las cámaras o sensores orientados hacia la escena hacia afuera. Las técnicas basadas en análisis de video orientado al conductor detectan la cara y los ojos con algoritmos para la dirección de la mirada, la estimación de la postura de la cabeza y el monitoreo de la expresión facial. Los algoritmos de aprendizaje profundo y automático a los que se han proporcionado miles de datos de rostros atentos frente a rostros desatentos pueden detectar diferencias entre ojos enfocados y desenfocados, así como signos de conducción bajo la influencia. Existen múltiples aplicaciones basadas en la visión para la clasificación de la postura del conductor distraído en tiempo real con múltiples métodos de aprendizaje profundo (RNN y CNN) utilizados en la detección de distracciones del conductor.

Aplicación de Visión por computadora para contar vehículos
Aplicación de Visión por computadora para Conteo de vehículos

Visión por computadora en el comercio minorista y la fabricación

Seguimiento de clientes

Los dispositivos de conteo ubicados estratégicamente en una tienda minorista pueden recopilar datos a través de procesos de aprendizaje automático sobre dónde pasan el tiempo los clientes y durante cuánto tiempo. El análisis de clientes puede mejorar la comprensión de las tiendas minoristas de la interacción con el consumidor y mejorar la optimización del diseño de la tienda.

Conteo de personas

Los algoritmos de visión artificial se entrenan con ejemplos de datos para detectar humanos y contarlos a medida que se detectan. Esta tecnología de conteo de personas es útil para que las tiendas recopilen datos sobre el éxito de sus tiendas y también se puede aplicar en situaciones relacionadas con la COVID-19 en las que se permite el acceso de un número limitado de personas a una tienda a la vez.

Detección de robo

Los minoristas pueden detectar comportamientos sospechosos, como merodear o acceder a áreas que están fuera de los límites, utilizando algoritmos de visión artificial que analizan de forma autónoma la escena.

Análisis del tiempo de espera

Para evitar clientes impacientes y filas de espera interminables, los minoristas están implementando la tecnología de detección de colas. La detección de colas utiliza cámaras para rastrear y contar el número de compradores en una línea. Una vez que se ha alcanzado un umbral de clientes, el sistema emite una alerta para que los empleados abran nuevas cajas.

Distancia social

Para garantizar que se sigan las precauciones de seguridad, las empresas utilizan detectores de distancia. Una cámara rastrea el movimiento de los empleados o clientes y utiliza sensores de profundidad para evaluar la distancia entre ellos. Dependiendo de su posición, el sistema dibuja un círculo rojo o verde alrededor de la persona.

Análisis de productividad

Análisis de productividad realiza un seguimiento del impacto del cambio en el lugar de trabajo, de cómo los empleados gastan su tiempo y recursos e implementa diversas herramientas. Estos datos pueden proporcionar información valiosa sobre la gestión del tiempo, la colaboración en el lugar de trabajo y la productividad de los empleados.

Gestión de calidad

Los sistemas de gestión de calidad garantizan que una organización cumpla con los requisitos de los clientes al abordar sus políticas, procedimientos, instrucciones y procesos internos para alcanzar una tasa general de satisfacción del consumidor.

Formación de habilidades

Otro campo de aplicación de los sistemas de visión es la optimización de las operaciones de línea de ensamblaje en la producción industrial. La evaluación de la acción humana puede ayudar a construir modelos de acción estandarizados relacionados con diferentes pasos de operación, así como a evaluar el desempeño de los trabajadores capacitados. La evaluación automática de la calidad de acción de los trabajadores puede ser beneficiosa al mejorar el rendimiento laboral, promover la eficiencia productiva (optimización AJUSTADA) y, lo que es más importante, descubrir acciones peligrosas antes de que se produzcan daños.

¿Qué sigue?

La tecnología de aprendizaje profundo y automático se ha utilizado para crear aplicaciones de visión artificial de docenas de maneras y para industrias de todo tipo.

  • Explore 8 aplicaciones de visión por computadora para el control del coronavirus
  • Aprenda todo sobre la Estimación de la postura humana con visión por computadora.
  • Vea nuestra descripción completa de la Detección de objetos en 2021.
  • Lea el estudio de caso sobre una aplicación de Visión artificial para el monitoreo de animales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.