¿Qué son las Redes Neuronales Convolucionales?

5/5 - (1 voto)

Redes Neuronales Convolucionales

En este artículo, descubrirás:

Qué son las redes convolucionales.
Las razones detrás de su creación.
Cómo funcionan en detalle con un ejemplo.

Índice

¿Qué son las redes neuronales convolucionales?
¿Por qué se crearon las redes neuronales convolucionales?
¿Cómo funcionan las Redes Neuronales Convolucionales?
Aplicaciones de la redes neuronales convolucionales:

¿Qué son las redes neuronales convolucionales?

Las redes neuronales convolucionales son una redes neuronales que toman como entrada una imagen, extraen las características que necesita para clasificar y utiliza una red neuronal regular para clasificar.

Es decir una red convolucional, es una red neuronal regular, a la que se le ha añadido una capa en la que una imagen es procesada y se le extraen características (como el número de rectas) y estas características son usadas en la capa de entrada de la red neuronal regular para clasificar la imagen

Se usan características de la imagen en vez de píxeles, por lo que si la imagen rota, cambia de tamaño o la posición, la red convolucional sigue identificando la imagen correctamente.

Las características son extraídas por la red convolucional de manera automática en la fase de aprendizaje.

¿Por qué se crearon las redes neuronales convolucionales?

Las redes neuronales convolucionales surgen para resolver un problema de clasificación de imágenes avanzada.

Con una red neuronal regular, podemos clasificar imágenes, pero tienen un inconveniente muy grande y es que la imagen de entrada se tiene que parecer mucho a las imágenes que ha usado como datos de aprendizaje en el entranamiento.

Supongamos que queremos una red red neuronal que nos clasifique bolsos y camisetas.

En la imagen del artículo vemos una camiseta que está fotografiada del revés, nuestra inteligencia sabe que es una camiseta aunque esté del revés, pero una red neuronal regular la interpreta como un bolso.

La red neuronal regular falla en su clasificación, porque utiliza los pixeles de entrada de la imagen como características en las neuronas de entrada

Si una imagen es de 20×20 pixeles, utiliza una capa de entrada de 400 neuronas, cada una toma el valor de entrada el valor del pixel de la foto.

Si movemos la foto, la agrandamos o la rotamos, los píxeles cambia de valor.

En el caso que nos ocupa se ha rotado 180 grados la foto de la camiseta, por lo que ahora los valores de los píxeles que se colocan en la capa de entrada son totálmente distintos a las camisetas que usó en el aprendizaje.

La red neuronal regular da una salida de «¿Bolso?».

¿Cómo funcionan las Redes Neuronales Convolucionales?

Las características son los datos de entrada de las redes neuronales, y si en vez de usar píxeles en bruto usamos otras características.

Por ejemplo, el número de líneas rectas:

redes neuronales convolucionales ejemplos

La red neuronal convolucional en este caso usa el número de rectas de la imagen en la neurona de entrada y aprende que si hay 3 rectas se trata de una camiseta probablemente.

Por supuesto queda trabajo todavía porque puede que haya mas objetos que tengan tres líneas rectas, pero ahora se tiene en cuenta el número de rectas y no la posición de los píxeles, por lo que si la figura se rota, se mueve o se cambia, la red sigue identificando la foto como una «Camiseta».

Si tiene dos líneas rectas, la red aprende que es probablemente un bolso:

Aplicaciones de la redes neuronales convolucionales:

Las aplicaciones de las redes neuronales convolucionales son muy diversas y continúan expandiéndose a medida que se desarrollan nuevas técnicas y se aplican en diferentes campos:

Visión por computadora: Son especialmente útiles en reconocimiento de imágenes, detección de objetos, segmentación semántica, clasificación de imágenes, entre otros. Aplicaciones como reconocimiento facial, sistemas de seguridad basados en visión, identificación de enfermedades en imágenes médicas y reconocimiento de señales de tráfico.
Procesamiento de video: Se aplican en el análisis de videos para tareas como seguimiento de objetos, reconocimiento de acciones, etiquetado de videos, etc. Aplicaciones como vigilancia inteligente, análisis de videos en redes sociales y detección de actividades anómalas.
Procesamiento de lenguaje natural: Aunque las redes convolucionales son más comunes en tareas de visión por computadora, también se han utilizado en NLP para tareas como clasificación de texto, análisis de sentimientos, extracción de características de texto, entre otros.
Salud: En medicina se aplican para el análisis de imágenes médicas como radiografías, tomografías, resonancias magnéticas para diagnóstico de enfermedades, detección de cáncer, segmentación de órganos, entre otros.
Automatización y robótica: En aplicaciones de robótica para la percepción del entorno, identificación de objetos y toma de decisiones basadas en la visión.
Conducción autónoma: En sistemas de vehículos autónomos para la detección de peatones, vehículos, señales de tráfico, entre otros.

Ciberseguridad & Machine Learning