Categoría: Big Data

  • Big Data:  ISO 8000 y la calidad de los datos

    Big Data: ISO 8000 y la calidad de los datos

    Big Data: ISO 8000 y la calidad de los datos ¿Cuáles son las normas, estándares y marcos que nos ayudan a gestionar la calidad de los datos en entornos Big data?

  • Goodbye 2022 Hello 2023

    Goodbye 2022 Hello 2023

    Un nuevo año comienza y repaso las palabras del 2022 más utilizadas dentro de mi documentación, un reflejo del trabajo realizado a lo largo del mismo.. El 2022 ha sido el año de los cursos de Python, orientados a Big Data (Hadoop, Spark) y Analytics (pandas, matplotlib y numpy). Tampoco han faltado los cursos de…

  • JupyterLite, Pyolite, Pyodide, Python

    JupyterLite, Pyolite, Pyodide, Python

    En este tutorial os mostraré como desplegar JupyterLite para tener vuestra propia versión liviana de JupyterLab ejecutándose en una página gratuita (gratis – free 🙂 de Github. ¿Qué es JupyterLite y para qué sirve? JupyterLite es una distribución de JupyterLab que se ejecuta completamente en el navegador web

  • Fundamentos de Big Data

    Fundamentos de Big Data

    Libro Fundamentos de Big Data. Comparto un Jupyter Book que he realizado con los apuntes elaborados para el curso de Fundamentos de Big Data. Dentro del temario se ha visto una introducción al Big Data y al análisis de datos, Mercado y tendencias, su historia, Ejemplos de casos de usos, Buenas prácticas, y Procesos de…

  • Big Data Fundamentals, Part II

    Big Data Fundamentals, Part II

    I’m sharing Big Data Fundamentals, Part II, (Part I is here) with an introduction to Big Data covering: Big Data processes: ingest, store, process/query, visualize; tools and technologies: Hadoop, Sqoop, Kafka, Mesos, Redis, CouchDB; Document stores: MongoDB; Column stores: HBase + Cassandra; Big Data analytics: Spark, Storm; and Elastic Stack: Logstash, ElasticSearch and Kibana. We’ll…