Se ha demostrado que las redes neuronales superan a varios algoritmos de aprendizaje automático en muchos dominios de la industria. Siguen aprendiendo hasta que sale con el mejor conjunto de características para obtener un rendimiento predictivo satisfactorio. Sin embargo, una red neuronal escalará sus variables en una serie de números que una vez que la red neuronal termina la etapa de aprendizaje, las características se vuelven indistinguibles para nosotros.

Si todo lo que nos importara fuera la predicción, una red neuronal sería el algoritmo de facto utilizado todo el tiempo. Pero en un entorno de la industria, necesitamos un modelo que pueda dar sentido a una característica / variable para las partes interesadas. Y es probable que estos interesados ​​sean cualquier persona que no sea alguien con conocimientos de deep learning o machine learning.

¿Cuál es la principal diferencia entre el bosque aleatorio y las redes neuronales?

Tanto random forest como las redes neuronales son técnicas diferentes que aprenden de manera diferente pero se pueden usar en dominios similares. Random Forest es una técnica de aprendizaje automático, mientras que las redes neuronales son exclusivas de Deep Learning.

¿Qué son las redes neuronales?

Una red neuronal es un modelo computacional basado en el funcionamiento de la corteza cerebral de un humano para replicar el mismo estilo de pensamiento y percepción. Las redes neuronales se organizan en capas formadas por nodos interconectados que contienen una función de activación que calcula la salida de la red.

Las redes neuronales son otro medio de aprendizaje automático en el que una computadora aprende a realizar una tarea mediante el análisis de ejemplos de entrenamiento. Como la red neuronal se basa en el cerebro humano, consistirá en miles o millones de nodos que están interconectados. Un nodo se puede conectar a varios nodos en la capa debajo de la cual recibe datos, y varios nodos por encima que reciben datos. Cada punto de datos entrante recibe un peso y se multiplica y agrega. Se agrega un sesgo si la suma ponderada equivale a cero y luego se pasa a la función de activación.

Arquitectura de las redes neuronales

Una red neuronal tiene 3 arquitecturas básicas:

  1. Redes de alimentación de una sola capa
    • Es la red más simple que es una versión extendida del perceptrón. Tiene nodos ocultos adicionales entre la capa de entrada y la capa de salida.
  2. Redes de alimentación de múltiples capas
    • Este tipo de red tiene una o más capas ocultas, excepto para la entrada y la salida. Su papel es intervenir en la transferencia de datos entre la capa de entrada y salida.
  3. Redes recurrentes
    • Las redes neuronales recurrentes son similares a las anteriores, pero se adoptan ampliamente para predecir datos secuenciales como texto y series temporales.

¿Qué es el bosque aleatorio?

Random Forest es un conjunto de árboles de decisión por los cuales el nodo final será la clase mayoritaria para problemas de clasificación o el promedio para problemas de regresión.

Un random forest puede crecer muchos árboles de Clasificación y por cada salida de ese árbol, decimos que el árbol ‘ vota’ para esa clase. Un árbol crece siguiendo los siguientes pasos:

  1. Se tomará una muestra aleatoria de filas de los datos de entrenamiento para cada árbol.
  2. A partir de la muestra tomada en el Paso (1), se tomará un subconjunto de características que se utilizarán para dividir en cada árbol.
  3. Cada árbol se cultiva en la mayor medida especificada por los parámetros hasta que alcanza un voto para la clase.

¿Por qué deberías usar Random Forest?

La razón fundamental para usar un random forest en lugar de un árbol de decisión es combinar las predicciones de muchos árboles de decisión en un solo modelo. La lógica es que un solo modelo compuesto por muchos modelos mediocres seguirá siendo mejor que un buen modelo. Esto es verdad dado el desempeño general de los random forest. Los random forest son menos propensos a sobreajustar debido a esto.

El ajuste excesivo puede ocurrir con un modelo flexible como los árboles de decisión, donde el modelo memoriza los datos de entrenamiento y también aprende cualquier ruido en los datos. Esto hará que no pueda predecir los datos de la prueba.

Un random forest puede reducir la alta varianza de un modelo flexible como un árbol de decisión combinando muchos árboles en un modelo de conjunto.

¿Cuándo deberías usar Random Forest frente a una red neuronal?

Random Forest es menos costoso desde el punto de vista computacional y no requiere una GPU para terminar el entrenamiento. Un random forest puede darle una interpretación diferente de un árbol de decisión pero con un mejor rendimiento. Las redes neuronales requerirán mucha más información de la que una persona común podría tener a la mano para ser realmente efectiva. La red neuronal simplemente diezmará la capacidad de interpretación de sus características hasta el punto en que deje de tener sentido por el bien del rendimiento. Si bien eso puede parecer razonable para algunos, depende de cada proyecto.

Si el objetivo es crear un modelo de predicción sin tener en cuenta las variables en juego, utilice una red neuronal, pero necesitará los recursos para hacerlo. Si se requiere una comprensión de las variables, entonces, nos guste o no, normalmente lo que sucede en esta situación es que el rendimiento tendrá que sufrir un pequeño golpe para asegurarse de que todavía podamos entender cómo cada variable está contribuyendo al modelo de predicción .


Este artículo se encuentra basado en 3 Reasons to Use a Random Forest Over a Neural Network.

Random Forest vs Neural Network
Si te gusto, comparte ...Share on email
Email
Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
Linkedin
Share on google
Google
Etiquetado en:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Facebook