Deep reinforcement learning hands - on : | Maxin lapan (Record no. 4320)

MARC details
000 -LEADER
campo de control de longitud fija 01888nam a2200229Ia 4500
003 - IDENTIFICADOR DE NÚMERO DE CONTROL
campo de control MX-SIABUC
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
campo de control 20240716171935.0
020 ## - NÚMERO INTERNACIONAL ESTÁNDAR DEL LIBRO
Número Internacional Estándar del Libro 978-1-83882-6999-4 (Pasta rústica)
082 ## - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY
Número de clasificación 006.31 L299d 2020
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL
campo de control de longitud fija 5200302020 -uka 9100003300eng00
100 ## - ENTRADA PRINCIPAL--NOMBRE DE PERSONA
Nombre de persona Lapan, Maxin
245 ## - MENCIÓN DEL TÍTULO
Título Deep reinforcement learning hands - on :
Resto del título Apply moder RL methods to practical problems of chatbots, robotics, discrete optimization, web automation, and more /
Título Maxin lapan
250 ## - MENCION DE EDICION
Mención de edición 2
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC.
Lugar de publicación, distribución, etc. Reino Unido :
Nombre del editor, distribuidor, etc. Packt Publishing,
Fecha de publicación, distribución, etc. 2020
300 ## - DESCRIPCIÓN FÍSICA
Extensión 798 páginas :
Otras características físicas il. ;
Dimensiones 19 x 24 cm.
500 ## - NOTA GENERAL
Nota general Incluye indice
505 ## - NOTA DE CONTENIDO CON FORMATO
Nota de contenido con formato Perface -- Chapter 1 : What is reinforcement learning ? -- Chapter 2 : OpenAL Gym -- Chapter 3: Deep learning with pytorch -- Chapter 4: The cross-Entropy Method -- Chapter 5 : Tabular learning and the bellman equation -- Chapter 6: Deep Q- Networks -- Chapter 7: Higher- level RL libraries -- Chapters 8: DQN extensions -- Chapter 9: Ways to speed up RL -- Chapter 10: Stock traing using RL -- Chapter 11: Policy grandients -an alternative -- Chapter 12: The actor - Critic Method -- Chapter 13: Asynchronous advantage actor - critic -- Chapter 14: Training chatbots with RL -- Chapter 15: : The texworld enviroment -- Chapter 16: Web navigation -- Chapter 17: Continuous action space -- Chapter 18: RL in robotics -- Chapter 19: Trus regions - PPO, TRPO, ACKT, and SAC -- Chapter 20: Black - box optimization in RL -- Chapter 21 Advanced exploration -- Chapter 22: Beyond model - free - imagination -- Chapter 23: AlphaGo zero -- Chapter 24: RL indiscrete optimization -- Chapter 25: Multi- agent RL.
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada APRENDIZAJE PROFUNDO ( APRENDIZAJE AUTOMÁTICO)
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada APRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL)
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada INGENIERIA DE SOFTWARE
650 ## - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada PROCEDIMIENTO DE LENGUAJE NATURAL ( COMPUTADORES)
Holdings
Estatus retirado Estado de pérdida Estado de daño No para préstamo Colección Biblioteca de origen Biblioteca actual Fecha de adquisición Total de préstamos Código de barras Visto por última vez Precio de reemplazo Tipo de ítem Koha
        Acervo general de Libros Unicomfacauca Unicomfacauca 16/07/2024   T06281 16/07/2024 16/07/2024 Libro
        Acervo general de Libros Unicomfacauca Unicomfacauca 16/07/2024   T06282 16/07/2024 16/07/2024 Libro