Inicio/Profesional/TICs y Computación/Nuevas tecnologías/Introducción al aprendizaje automático con Orange

Introducción al aprendizaje automático con Orange

$398

Hay existencias

Autor:   José Manuel Casas, Sergio Luis Suárez Gómez, Laura Bonavera y Fernando Sánchez Lasheras

Páginas:    186

Año:    2024

Edición:    1

Editorial:  Alfaomega –  Marcombo

Apoyos:    

Presentación:

E-Book:

Nivel:    Básico

Encuadernación:  Rústica

Hay existencias

ISBN: 9786075762975 Categorías: ,

Descripción

En un mundo donde los datos se han convertido en el activo más valioso, la capacidad para extraer información significativa de ellos es fundamental. En este contexto, Orange Data Mining emerge como una herramienta indispensable, una brújula que guía a los exploradores de datos a través del vasto océano de información. En este libro, descubrirá el potencial que ofrece Orange Data Mining. Paso a paso aprenderá todas sus capacidades, desde la exploración inicial de conjuntos de datos hasta la creación de modelos predictivos avanzados. Este software de código abierto ofrece un arsenal de herramientas poderosas, todo ello presentado en una interfaz visual intuitiva que facilita el análisis de datos a los menos expertos. A través del enfoque en componentes de este programa, los usuarios podrán construir flujos de trabajo personalizados sin necesidad de codificación, lo que permitirá una exploración ágil y flexible de los datos. Con Orange Data Mining, las posibilidades son infinitas. Desde la segmentación de clientes hasta el descubrimiento de patrones ocultos, desde la clasificación de imágenes hasta la predicción de resultados futuros, este software se convierte en un compañero imprescindible para cualquier persona interesada en este campo.

A medida que lea este libro, descubrirá las grandes posibilidades que ofrece este programa. Ya sea un novato en el campo de la ciencia de datos o un experto en la materia, estamos seguros de que encontrará en Orange Data Mining el mejor aliado en su viaje hacia el descubrimiento y la comprensión de los datos.!

Contenido

Prólogo .. XIII

CAPÍTULO 1

Introducción a Orange y su

entorno de trabajo .. 1

1.1. Introducción .. 1

1.2. Instalación de Orange .. 2

1.2.1. Mac OS X .. 2

1.2.2. Windows .. 3

1.2.3. Linux .. 4

1.2.4. Anaconda .. 5

1.2.5. Instalación con pip .. 6

1.3. El entorno de trabajo de Orange .. 6

1.4. Flujo de trabajo en Orange. Canvas y widgets .. 13

1.4.1. Más sobre flujos de trabajo .. 19

1.4.2. Carga de ficheros en

Orange .. 23

CAPÍTULO 2

Conceptos fundamentales del aprendizaje automático

2.1. Introducción .. 27

2.2. Clasificación de las metodologías y técnicas fundamentales del aprendizaje automático .. 28

2.2.1. Clasificación por tipo de aprendizaje .. 28

2.2.2. Clasificación por tipo de tarea .. 30

2.3. Métodos de regresión .. 31

2.3.1. Regresión lineal .. 31

2.3.2. Random forest .. 34

2.3.3. Otros métodos de regresión .. 36

2.4. Métodos de clasificación .. 37

2.4.1. Árbol de decisión .. 37

2.4.2. K-Nearest Neighbors .. 39

2.4.3. Otros modelos de clasificación .. 41

2.5. El agrupamiento o clustering .. 42

2.5.1. K-Means .. 42

2.5.2. t-SNE .. 45

2.5.3. DBSCAN .. 48

2.5.4. Otros métodos de clustering .. 50

CAPÍTULO 3

Análisis de bases de datos

3.1. Sobre la calidad de las bases de datos .. 53

3.2. Detección de espurios y de posibles agrupaciones en el conjunto de datos .. 54

3.2.1. Local Outlier Factor .. 56

3.2.2. Otros métodos para calcular outliers .. 58

3.3. Exploración de datos faltantes .. 59

3.4. Sobre los tipos de datos faltantes .. 62

3.5. Aplicación de metodologías de imputación .. 63

3.5.1. Ejercicio 3.1 .. 63

3.6. Escalado de las variables .. 64

3.6.1. Ejercicio 3.2 .. 65

3.6.2. Ejercicio 3.3 .. 67

CAPÍTULO 4

Visualización de datos

4.1. Introducción al análisis

exploratorio .. 69

4.1.1. Visualizaciones

inteligentes .. 70

4.2. Gráficos de dispersión .. 73

4.3. Gráficos de cajas .. 75

4.4. Gráficos de violín .. 78

4.5. Gráficos de barras .. 83

4.6. Gráficos de distribución .. 84

4.7. Diagramas de tamiz .. 85

4.8. Gráficos de mosaico .. 87

4.9. Mapas de calor .. 89

CAPÍTULO 5

Redes neuronales artificiales

5.1. Introducción a las redes neuronales artificiales .. 93

5.2. Conjuntos de datos .. 94

5.3. Arquitectura de una red .. 95

5.4. Funciones de activación .. 97

5.5. Funciones de coste .. 102

5.6. Algoritmo de retropropagación .. 104

5.7. Otras arquitecturas de redes .. 106

5.8. Ejemplo. MLP para el set de datos MNIST .. 107

CAPÍTULO 6

Las máquinas de vectores de soporte

6.1. Introducción .. 115

6.2. Ejemplo de aplicación de las máquinas de vectores de soporte como clasificador en Orange .. 116

6.3. Medidas de rendimiento .. 120

CAPÍTULO 7

Métodos combinados (ensemble)

7.1. Introducción .. 147

7.2. Métodos combinados. Un ejemplo que hace uso de la regresión logística y otros modelos .. 148

7.3. Gradient boosting .. 153

7.3.1. Preprocesado .. 154

7.3.2. Gradient boosting (scikit-learn) .. 155

7.3.3. Extreme gradient Boosting (xgboost) .. 156

7.3.4. Extreme gradient boosting random forest (xgboost) .. 158

7.3.5. Gradient boosting (catboost) .. 160

7.3.6. Ejercicio completo .. 164

7.4. Sobre los tipos de datos faltantes .. 165

7.5. Aplicación de metodologías de imputación .. 168

7.6. Escalado de las variables .. 169

7.6.1. Ejercicio 2 .. 172

Referencias .. 175

Información adicional

Peso .186 kg
Dimensiones 22 × 15 × 1 cm

Título

Ir a Arriba