Saltar al contenido
Electrónica Online

Reconocimiento de imágenes

Reconocimiento de imagenes

¿Qué es el reconocimiento de imágenes?

El reconocimiento de imágenes, en el contexto de la visión artificial, es la capacidad de los programas informáticos para identificar objetos, lugares, personas, escritos y acciones en imágenes digitales. Las computadoras pueden utilizar tecnologías de visión artificial en combinación con una cámara y software de inteligencia artificial (IA) para lograr el reconocimiento de imagen.

Los términos reconocimiento de imágenes, reconocimiento de pinturas y reconocimiento de fotos se utilizan indistintamente.

reconocimiento de imagen con ia
Los objetos se clasifican mediante el reconocimiento de imágenes.

¿Cómo funciona el reconocimiento de imágenes?

Mientras que los cerebros animales y humanos reconocen objetos con facilidad, las computadoras tienen dificultades con esta tarea. Existen numerosas formas de realizar el procesamiento de imágenes, incluidos el aprendizaje profundo y los modelos de aprendizaje automático. Sin embargo, el enfoque empleado viene determinado por el caso de uso. Por ejemplo, las técnicas de aprendizaje profundo suelen utilizarse para resolver problemas más complejos que los modelos de aprendizaje automático, como la seguridad de los trabajadores en la automatización industrial y la detección del cáncer en la investigación médica.

Normalmente, el reconocimiento de imágenes implica la construcción de redes neuronales profundas que analizan cada píxel de la imagen. Estas redes reciben tantas imágenes etiquetadas como sea posible para entrenarlas a reconocer imágenes relacionadas.

Este proceso suele dividirse en los tres pasos siguientes:

  1. Se recopila un conjunto de datos con imágenes y sus etiquetas. Por ejemplo, una imagen de un perro debe identificarse como «perro» o como algo que la gente reconoce.
  2. Se alimenta y entrena una red neuronal con estas imágenes. Los procesadores de redes neuronales convolucionales funcionan bien en estas situaciones, ya que pueden detectar automáticamente las características significativas sin supervisión humana. Además de múltiples capas de perceptrón, estas redes también incluyen capas convolucionales y capas de agrupación.
  3. La imagen que no está en el conjunto de entrenamiento se introduce en el sistema para obtener predicciones.
Tipos de aplicaciones de IA
El aprendizaje automático, el aprendizaje profundo y las redes neuronales son todas aplicaciones de la IA.

Los algoritmos de reconocimiento de imágenes comparan modelos y apariencias tridimensionales desde varias perspectivas mediante la detección de bordes. Suelen entrenarse mediante aprendizaje automático guiado en millones de imágenes etiquetadas.

Casos de uso del reconocimiento de imágenes

El reconocimiento de imágenes se utiliza para realizar muchas tareas visuales basadas en máquinas, como etiquetar el contenido de las imágenes con meta-etiquetas, realizar búsquedas de contenido de imágenes y guiar robots autónomos, vehículos autónomos y sistemas para evitar accidentes.

Los siguientes son algunos casos de uso destacados del reconocimiento de imágenes en el mundo real:

  • Reconocimiento facial. El reconocimiento facial se utiliza en diversos contextos -medios sociales, sistemas de seguridad y entretenimiento- y con frecuencia implica la identificación de rostros en fotos y vídeos. Por ejemplo, cuando alguien sube una foto de sus amigos a Facebook, la aplicación sugiere instantáneamente los amigos que cree que están en esa foto. Los algoritmos de aprendizaje profundo se utilizan en el reconocimiento facial para evaluar una foto de una persona y producir la identidad exacta del individuo en la imagen. El algoritmo se puede ampliar para extraer atributos importantes como la edad, el género y las expresiones faciales de una persona a través de su imagen. La función de reconocimiento facial de los teléfonos inteligentes, así como la verificación de identidad con imágenes computarizadas en puntos de control de seguridad como aeropuertos o entradas de edificios, son las aplicaciones más comunes de reconocimiento de imágenes.
  • Búsqueda visual. La búsqueda de imágenes mediante palabras clave o características visuales utiliza tecnología de reconocimiento de imágenes. Por ejemplo, Google Lens permite a los usuarios realizar búsquedas basadas en imágenes y la aplicación Google Translate ofrece traducción en tiempo real escaneando texto a partir de fotografías. Estos avances tecnológicos permiten a los consumidores realizar búsquedas en tiempo real. Por ejemplo, si alguien encuentra una flor en un picnic y está interesado en saber más sobre ella, puede simplemente hacer una foto de la flor y utilizar Internet para buscar información sobre ella al instante.
  • Diagnóstico médico. Gracias a la tecnología de reconocimiento de imágenes, los profesionales sanitarios y clínicos examinan imágenes médicas para diagnosticar enfermedades y afecciones. Por ejemplo, el software de reconocimiento de imágenes puede entrenarse para analizar y detectar patrones en los datos de dispositivos de resonancia magnética o radiografías. Esto permite a los médicos encontrar, detectar y notificar anomalías médicas en una fase temprana. La radiología, la oftalmología y la patología son tres campos que utilizan con frecuencia el reconocimiento de imágenes para el diagnóstico médico.
  • Control de calidad. La inspección de calidad manual tradicional requiere mucho trabajo, tiempo y es propensa a errores. Sin embargo, utilizando un conjunto de fotos anotadas de un producto de interés, se puede entrenar un modelo de inteligencia artificial o una red neuronal para detectar automáticamente patrones de equipos que funcionan mal. Como resultado, es posible identificar y aislar los artículos que no cumplen las normas, mejorando así la calidad general del producto.
  • Detección de fraudes. El procedimiento de detección de fraudes puede automatizarse y mejorarse con el uso de herramientas de reconocimiento de fotografías con IA. Por ejemplo, un método para detectar el fraude consiste en utilizar una herramienta de reconocimiento de imágenes mediante IA para procesar cheques u otros documentos presentados a los bancos. Para evaluar la autenticidad y legalidad de un cheque, la computadora analiza imágenes escaneadas del mismo para extraer datos cruciales como el número de cuenta, el número de cheque, el importe del cheque y la firma del titular de la cuenta.
  • Identificación de personas. Los organismos gubernamentales, las fuerzas del orden y otras agencias de seguridad utilizan el reconocimiento de imágenes para identificar y recopilar información sobre personas en fotografías y vídeos.

Entre las aplicaciones actuales y futuras del reconocimiento de imágenes figuran las fototecas inteligentes, la publicidad selectiva, los medios interactivos, la accesibilidad para los discapacitados visuales y la mejora de las capacidades de investigación.

¿Cuáles son los tipos de reconocimiento de imágenes?

El entrenamiento de los sistemas de reconocimiento de imágenes puede realizarse de tres formas: aprendizaje supervisado, aprendizaje no supervisado o aprendizaje auto-supervisado. Normalmente, el etiquetado de los datos de entrenamiento es la principal distinción entre los tres enfoques de entrenamiento.

  • Aprendizaje supervisado. Este tipo de reconocimiento de imágenes utiliza algoritmos de aprendizaje supervisado para distinguir entre diferentes categorías de objetos (como una persona o un automóvil) de una colección de fotografías. Una persona puede utilizar las etiquetas «coche» y «no coche», por ejemplo, si quiere que el sistema de clasificación de imágenes reconozca fotografías de coches. Con este tipo de reconocimiento de imágenes, ambas categorías de imágenes se etiquetan explícitamente en los datos de entrada antes de que las imágenes se introduzcan en el sistema.
  • Aprendizaje no supervisado. Un modelo de reconocimiento de imágenes se alimenta de un conjunto de imágenes sin que se le diga qué contienen. Como resultado, el sistema determina, mediante el análisis de los atributos o características de las imágenes, las similitudes o diferencias importantes entre las imágenes.
  • Aprendizaje auto-supervisado. El aprendizaje auto-supervisado suele considerarse un subconjunto del aprendizaje no supervisado porque también utiliza datos no etiquetados. Es un modelo de formación en el que el aprendizaje se realiza utilizando pseudo-etiquetas creadas a partir de los propios datos. Permite aprender a representar los datos con datos menos precisos. Con esto como punto de partida, se puede enseñar a una máquina a imitar rostros humanos utilizando la autosupervisión, por ejemplo. Una vez entrenado el algoritmo, el suministro de datos adicionales hace que genere rostros completamente nuevos.

¿Cuál es la diferencia entre el reconocimiento de imágenes y la detección de objetos?

El reconocimiento de imágenes y la detección de objetos son técnicas similares y ambas están relacionadas con la visión por computador. Sin embargo, presentan las siguientes diferencias:

Reconocimiento de imágenes

  • El reconocimiento de imágenes identifica y clasifica objetos, personas u otros elementos en una imagen o vídeo.
  • Normalmente, el software de reconocimiento de imágenes asigna una etiqueta de clasificación a cada fotograma de una imagen o vídeo.
  • Es posible que los sistemas de reconocimiento de imágenes sólo necesiten identificar la presencia de determinadas características o patrones en una imagen o vídeo, sin localizarlos necesariamente.

Detección de objetos

  • La detección de objetos encuentra instancias y ubicaciones de objetos en la imagen y su clase o tipo.
  • Los sistemas de detección de objetos utilizan cuadros delimitadores (el rectángulo que se utiliza para rodear una imagen y mostrar la posición y dimensiones de distintos objetos dentro de una imagen o vídeo) junto con la clase o tipo de cada objeto.
  • La detección de objetos suele ser más compleja que el reconocimiento de imágenes, ya que requiere identificar los objetos presentes en una imagen o vídeo, así como localizarlos y determinar su tamaño y orientación.

Entre las técnicas habituales de detección de objetos se encuentran la Red Neuronal Convolucional basada en Regiones más rápida (R-CNN) y You Only Look Once (YOLO), Version 3. R-CNN pertenece a una familia de modelos de aprendizaje automático para visión por computadora, concretamente para detección de objetos, mientras que YOLO es un conocido algoritmo de detección de objetos en tiempo real.

El futuro del reconocimiento de imágenes

El reconocimiento de imágenes está ganando una inmensa popularidad y puede dar lugar a una gran variedad de nuevas aplicaciones en el futuro, como las siguientes

  • Coches autónomos. Aunque esta tecnología aún no ha alcanzado su apogeo, muchas empresas están utilizando activamente la IA, el ML, la visión por computador y el reconocimiento de imágenes para comercializar vehículos autónomos. Una de las tecnologías fundamentales que permiten la tecnología de conducción autónoma -incluida la creación de medidas de seguridad- es la visión por computadora. En concreto, la tecnología de reconocimiento de imágenes permite prever la posición, velocidad y movimiento de otros objetos en movimiento, así como identificar objetos, personas, rutas y curvas peligrosas en las carreteras. Los científicos están desarrollando IA para que los coches puedan adaptarse a condiciones meteorológicas adversas y también ver en la oscuridad.
  • Gafas inteligentes. Con el reconocimiento de imágenes incorporado, la tecnología wearable, como las gafas inteligentes, debería estar a la altura de las primeras promesas. Por ejemplo, una persona con gafas inteligentes recibiría una notificación si un producto que acaba de poner en su carrito está disponible al otro lado de la calle a un precio más bajo.
  • Realidad aumentada. Otro campo que puede beneficiarse enormemente del reconocimiento de imágenes es la realidad aumentada (RA), impulsada por el sector de los videojuegos. La tecnología de RA ya se utiliza en juegos como Pokemon Go, pero en el futuro desempeñará un papel importante en los sectores de la moda, la medicina y la educación.
  • Predicción del comportamiento del consumidor. Las valiosas aplicaciones del reconocimiento de imágenes podrían ayudar a la publicidad de las marcas, la segmentación de anuncios y la mejora del servicio al cliente. Mediante el reconocimiento de imágenes, las marcas pueden centrarse en las fotos subidas por los clientes para conocer mejor sus preferencias y pautas de gasto. Al disponer de la información necesaria sobre sus clientes, las marcas pueden dirigir fácilmente un marketing eficaz a los consumidores.

Preocupación por la privacidad en el reconocimiento de imágenes

Google, Facebook, Microsoft, Apple y Pinterest son algunas de las muchas empresas que invierten importantes recursos e investigaciones en el reconocimiento de imágenes y aplicaciones relacionadas. Los problemas de privacidad que plantea el reconocimiento de imágenes y tecnologías similares son controvertidos, ya que estas empresas pueden extraer un gran volumen de datos de las fotos que los usuarios suben a sus plataformas de redes sociales.

¿Te ha resultado útil esta información?

No
¡Gracias por tus comentarios!