MARC details
000 -LEADER |
campo de control de longitud fija |
01888nam a2200229Ia 4500 |
003 - IDENTIFICADOR DE NÚMERO DE CONTROL |
campo de control |
MX-SIABUC |
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN |
campo de control |
20240716171935.0 |
020 ## - NÚMERO INTERNACIONAL ESTÁNDAR DEL LIBRO |
Número Internacional Estándar del Libro |
978-1-83882-6999-4 (Pasta rústica) |
082 ## - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY |
Número de clasificación |
006.31 L299d 2020 |
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL |
campo de control de longitud fija |
5200302020 -uka 9100003300eng00 |
100 ## - ENTRADA PRINCIPAL--NOMBRE DE PERSONA |
Nombre de persona |
Lapan, Maxin |
245 ## - MENCIÓN DEL TÍTULO |
Título |
Deep reinforcement learning hands - on : |
Resto del título |
Apply moder RL methods to practical problems of chatbots, robotics, discrete optimization, web automation, and more / |
Título |
Maxin lapan |
250 ## - MENCION DE EDICION |
Mención de edición |
2 |
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC. |
Lugar de publicación, distribución, etc. |
Reino Unido : |
Nombre del editor, distribuidor, etc. |
Packt Publishing, |
Fecha de publicación, distribución, etc. |
2020 |
300 ## - DESCRIPCIÓN FÍSICA |
Extensión |
798 páginas : |
Otras características físicas |
il. ; |
Dimensiones |
19 x 24 cm. |
500 ## - NOTA GENERAL |
Nota general |
Incluye indice |
505 ## - NOTA DE CONTENIDO CON FORMATO |
Nota de contenido con formato |
Perface -- Chapter 1 : What is reinforcement learning ? -- Chapter 2 : OpenAL Gym -- Chapter 3: Deep learning with pytorch -- Chapter 4: The cross-Entropy Method -- Chapter 5 : Tabular learning and the bellman equation -- Chapter 6: Deep Q- Networks -- Chapter 7: Higher- level RL libraries -- Chapters 8: DQN extensions -- Chapter 9: Ways to speed up RL -- Chapter 10: Stock traing using RL -- Chapter 11: Policy grandients -an alternative -- Chapter 12: The actor - Critic Method -- Chapter 13: Asynchronous advantage actor - critic -- Chapter 14: Training chatbots with RL -- Chapter 15: : The texworld enviroment -- Chapter 16: Web navigation -- Chapter 17: Continuous action space -- Chapter 18: RL in robotics -- Chapter 19: Trus regions - PPO, TRPO, ACKT, and SAC -- Chapter 20: Black - box optimization in RL -- Chapter 21 Advanced exploration -- Chapter 22: Beyond model - free - imagination -- Chapter 23: AlphaGo zero -- Chapter 24: RL indiscrete optimization -- Chapter 25: Multi- agent RL. |
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento de entrada |
APRENDIZAJE PROFUNDO ( APRENDIZAJE AUTOMÁTICO) |
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento de entrada |
APRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL) |
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento de entrada |
INGENIERIA DE SOFTWARE |
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento de entrada |
PROCEDIMIENTO DE LENGUAJE NATURAL ( COMPUTADORES) |