Hola, soy Fernando

Soy un estudiante de ingeniería en informática, amante de la tecnología y fiel a android.

Aquí podras conocer un poco sobre mí y los proyectos en los que he trabajado de forma individual o colaborativa. Te invito a conocerme.

Acercamiento a KNIME

KNIME

El workflow muestra una regresión simple para predecir un valor numérico de la variable objetivo. El conjunto de datos se divide en dos partes, el 80% para el training y el restante para el testing. Se entrena el modelo con el training y luego se le aplica este al testing. Finalmente se ve el resultado obtenido.

Operador “File Reader”

Al hacer doble clic sobre el operador me muestra los datos que tiene la tabla Iris. Este operador tiene muchas más opciones para la importación de datos que RapidMiner. Para seleccionar la variable para predecir se hace en el operador Simple Regression Tree Model. Para el caso del modelo predicará el ancho del pétalo.

Operador “Partitioning”

Este operador permite particionar el conjunto de datos. KNIME solo se puede hacerlo en 2 conjuntos a diferencia de Split Data de RapidMiner que puede hacerlo en más particiones. KNIME tiene la opción de persistir estos datos en el disco duro además de la caché de la memoria.

Operador “Simple Regression Tree Learner”

Soporta variables de predicción numérica. El procedimiento sigue el algoritmo descrito por "Árboles de clasificación y regresión" (Breiman et al, 1984). Aquí el valor predicho para un nodo hoja es el valor objetivo medio de los registros dentro de la hoja. Los parámetros que permite configurar son:

Operador “Simple Regresión Tree Predictor”

Este operador tiene dos entradas, los datos que sirvieron para el entrenamiento en en operador “Simple Regression Tree Learner” y el conjunto de datos sobre el que se testeara el modelo. La salida de este operador es la predicción realizada.

Operador “Line Plot”

KNIME

Aquí se puede ver el resultado obtenido de la predicción comparado con los valores verdaderos.

Operador “Numeric Scorer”

KNIME

Este operador brinda información detallada de las estadísticas obtenidas del modelo. Un R2 muy cercano a uno quiere decir que el modelo funciona muy bien.