Cerrar

Actualidad · Noticia

La sostenibilidad será el eje central del nuevo evento Focus Pyme y Emprendimiento Vinalopó y Vega Baja.

La sostenibilidad será el eje central del nuevo evento... 

Las entidades del ecosistema de dichas comarcas se han reunido para planificar esta nueva edición

CEEI Elche ha celebrado la primera reunión del Comité Organizativo de Focus Pyme y Emprendimiento "Comarcas del Vinalopó y Vega Baja" 2024. En este encuentro se ha iniciado la planificación de dicha...

Centro Europeo de Empresas e Innovación de Elche (CEEI - Elche)

Actualidad · Convocatoria

Subvenciones para apoyar la estrategia y acción internacional de las pymes de la Comunidad Valenciana 2024

Subvenciones para apoyar la estrategia y acción... 

IVACE+i lanza las subvenciones para apoyar la estrategia y acción internacional de las pymes de la Comunidad Valenciana 2024.   OBJETO Apoyo a la estrategia y acción internacional de las pymes de...

Actualidad · Noticia

CEEI Valencia abre el programa EmprendeAventura Rural para crear empleo en zonas despobladas

CEEI Valencia abre el programa EmprendeAventura Rural para... 

EmprendeAventura Rural es un ciclo de formación en zonas despobladas de la provincia de Valencia

El Centro Europeo de Empresas e Innovación de Valencia, inicia el programa de capacitación EmprendeAventura Rural 2024. Se trata de un ciclo formativo dirigido personas con idea de negocio o empresas...

Centro Europeo de Empresas e Innovación de Valencia

Agenda · Webinar

Webinar 100 WOMEN PLUS: Construyendo la Europa del mañana con las mujeres de hoy

Webinar 100 WOMEN PLUS: Construyendo la Europa del mañana... 

El martes, 07 de mayo de 2024

Un evento en el que las mujeres y las niñas son el centro de acción y reúne diferentes iniciativas encaminadas a promover el emprendimiento femenino. Para ello, el evento combinará talleres, mesas...

Agenda · Congresos

Foro empresas Valencia 2024

Foro empresas Valencia 2024 

El jueves, 23 de mayo de 2024

El único tour de eventos presenciales para las pequeñas y medianas empresas españolas, llega a Valencia

Lorenzo Escobar. CFO. SEA& PORTS GROUPEste año reuniremos en Valencia a directivos y gerentes en un espacio único, diseñado para inspirar el crecimiento y la gestión.  Súmate a estas sesiones...

Business+

Actualidad · Noticia

Aras de los Olmos acoge un evento empresarial sobre casos de éxito en el territorio y oportunidades de la Nueva Ruralidad

Aras de los Olmos acoge un evento empresarial sobre casos... 

Participarán negocios y proyectos nacidos en el territorio: Somnia Multidisciplinar, Rural Life, Ecoaromuz, Aceros Hispania y Rural Metal

El Teatro de Aras de los Olmos acoge, el 9 de mayo a las 10h., el evento empresarial Focus Pyme y Emprendimiento La Serranía y El Rincón de Ademuz Emprender en el rural. Larga vida al (nuevo)...

Centro Europeo de Empresas e Innovación de Valencia

Actualidad · Convocatoria

Mentoring Rural Horeca y Turismo 2024

Mentoring Rural Horeca y Turismo 2024 

Servicio de mentorización para proyectos y empresas de ámbito rural relacionados con servicios Horeca y de Turismo

El Programa de Mentorización Empresarial en municipios rurales de la Provincia de Valencia es una iniciativa del CEEI Valencia, financiada por el Área de Desarrollo Rural y Políticas contra la...

Centro Europeo de Empresas e Innovación de Valencia

Actualidad · Convocatoria

Ayudas a la mejora de la competitividad y sostenibilidad de las explotaciones ganaderas

Ayudas a la mejora de la competitividad y sostenibilidad de... 

Ayudas a la mejora de la competitividad y sostenibilidad de las explotaciones ganaderas de la Comunitat Valenciana. OBJETO: Favorecer las inversiones en materia de instalaciones, maquinaria y...

Agenda · Cursos

Cursos para trabajadores y autónomos de cualquier sector

Cursos para trabajadores y autónomos de cualquier sector 

El miércoles, 01 de mayo de 2024

Cursos gratuitos en modalidad online o presencial

¡Próximamente! Formaciones en modalidad online o presencial para autónomos o trabajadores del sector Cerámica en la Comunidad Valenciana. Las formaciones de intersectorial están destinadas a...

EUROFORMAC

Actualidad · Artículo

Estrategias efectivas para el registro y gestión de las pausas

Estrategias efectivas para el registro y gestión de las... 

La implementación del registro horario en 2019 ha llevado a las empresas a revisar cómo gestionan las horas de trabajo y las pausas de sus empleados.

Este artículo proporciona una guía sobre la documentación de descansos y la utilización de tecnología para optimizar estos procesos, asegurando el cumplimiento con las regulaciones laborales y...

Agenda · Cursos

CURSO DE SKETCHING EN CALZADO

CURSO DE SKETCHING EN CALZADO 

El sábado, 27 de abril de 2024

100% gratuito. Modalidad Presencial para ocupados de cualquier sector.

¿Quieres formarte en Sketching en calzado? ¡Este curso gratuito es para ti! Para ocupados de cualquier sector Duración: 15 horas Modalidad: Presencial en Valencia, CALLE DUQUE DE MANDAS,...

EUROFORMAC

Actualidad · Noticia

Ledger Deliver, Criadero López Fish y Desarrollo Únity, premiados en la "Iniciativa Emprendedora del Mes de Elche"

Ledger Deliver, Criadero López Fish y Desarrollo Únity,... 

CEEI ELCHE colabora activamente en estos premios del Ayuntamiento de Elche

El Ayuntamiento de Elche, a través de la Concejalía de Promoción Económica del Ayuntamiento de Elche, ha entregado los Premios Iniciativa Emprendedora del Mes del primer trimestre de 2024 a Ledger...

Centro Europeo de Empresas e Innovación de Elche (CEEI - Elche)

Principales herramientas de Big Data que debes conocer

Principales herramientas big data
Solver

Solver

Publicado el martes, 19 de abril de 2022 a las 17:00

Estamos ante un aumento constante de las herramientas de Big Data que hacen que nos perdamos en siglas y nombres con significados muchas veces desconocidos para la mayoría, y que hacen que a las empresas les cueste tomar decisiones sobre qué herramientas utilizar. 

A los Ingenieros en Informática y, en concreto, a los que nos especializamos en los datos, se nos generan dos problemas diferentes pero muy unidos:

  • Por un lado, nos encontramos con el problema del almacenamiento de los datos. Estos deben ser almacenados en sistemas y de maneras que podamos recuperarlos de una forma lo más sencilla y rápida posible. De nada nos sirven los datos si luego no somos capaces de encontrarlos o almacenarlos.
  • Por otro, tenemos un problema con el procesamiento de los mismos. No es lo mismo, ni se utilizan las mismas técnicas, para procesar un fichero con 1000 líneas de datos (algo que podríamos hacer hasta en nuestro teléfono móvil) que procesar un fichero con 1000 millones de líneas, y el tiempo de procesado no es el mayor de nuestros problemas.

Ante estos retos, se desarrollaron una multitud de herramientas para el almacenamiento y procesamiento de datos de forma distribuida. Desde Solver, te descubrimos las herramientas más conocidas y utilizadas:

1. Apache Hadoop

Se trata de un framework de software opensource que permite el tratamiento y gestión distribuido de grandes volúmenes de información. Además del Hadoop Common, consta de los siguientes componentes:

  • Hadoop Distributed File System (HDFS): Sistema de archivos distribuido que ofrece un alto rendimiento en los accesos a los datos. Diseñado para ser ejecutado en hardware de bajo coste y para que, su conjunto, sea tolerante a fallos y de alta disponibilidad.

 

  • Hadoop Yarn (Yet Another Resource Negotiator): Framework para gestión de recursos y planificación de tareasCombina un gestor de recursos central que gestiona la forma en que las aplicaciones utilizan los recursos del sistema, con agentes gestores en los nodos que gestionan las operaciones de proceso en los nodos individuales del clúster.

 

  • Hadoop MapReduce: Sistema para el procesamiento en paralelo de grandes volúmenes de información. El paradigma MapReduce se emplea para resolver algunos algoritmos que son susceptibles de ser paralelizados. Se basa en realizar el procesamiento de la información en el mismo lugar en que ésta reside. Al lanzar un proceso de MapReduce, las tareas son distribuidas entre los diferentes nodos del clúster. La parte de computación se realiza de forma local en el mismo nodo que contiene los datos, por lo que se minimiza el tráfico de datos por la red y paraleliza a nivel de nodos de un cluster.

2. Apache Spark 

Es un framework de código abierto para computación en clúster. Ha sido desarrollado para optimizar el rendimiento, y puede resultar hasta 100x veces más rápido que que Hadoop tanto para los procesos en batch como en streaming. Se puede utilizar en diferentes lenguajes de programación (Scala, Python, R). Además, dispone de librerías específicas para trabajar con SQL, para procesar datos en streaming, procesos de Machine Learning y la generación de gráficos

3. Apache Hive 

Es un software para gestión de un datawarehouse de forma distribuida y que permite gestionar grandes volúmenes de datos utilizando SQL y trabajando sobre el sistema de almacenamiento de Hadoop HDFS u otros sistemas de almacenamiento distribuido como S3 de Amazon.

4. Apache Cassandra

Software opensource para la gestión de bases de datos NoSQL, construidas para manejar grandes volúmenes de información. Es un sistema con alta disponibilidad, que no tiene un único punto de fallo y que está diseñado para el procesado rápido de grandes volúmenes de información. Dispone de un lenguaje de consulta propio, Cassandra Structure Language (CQL).

5. MongoDB  

Probablemente sea la base de datos de propósito general, distribuida y NoSQL más utilizada actualmente. También es open source y está orientada al almacenamiento de documentos, utilizando para ello un formato BSON (similar al JSON). Permite el sharding y las réplicas.

6. Apache Kafka 

Seguramente, es la plataforma para gestión de datos distribuidos en su versión streaming más utilizada. Permite capturar la información de diferentes fuentes (IoT, bases de datos, etc.) en tiempo real para su almacenamiento, procesado o análisis. Es muy utilizado en sistemas de gestión y análisis de cookies de navegación web

5.076 visitas

Utilizamos cookies propias y de terceros para ofrecerte toda la funcionalidad y una mejor experiencia, obtener estadísticas de tráfico, analizar el uso de la web y mejorar nuestros servicios.
Tienes disponible aquí nuestra política de cookies.
Puedes aceptar todas nuestras cookies pulsando el botón 'ACEPTAR' o configurar aquí tus preferencias.

Estrictamente necesarias +

Estas cookies son necesarias ya que permiten que el sitio web funcione correctamente, no se pueden desactivar.

Estadísticas +

Son las cookies que utilizamos exclusivamente con fines estadísticos para poder analizar cómo los usuasrios hacen uso de la web. Recopila información anónima tal como el número de visitantes del sitio, o las páginas más populares. Activar estas cookies nos permite seguir mejorando.

Funcionales +

Estas cookies son necesarias para el intercambio y presentación de contenidos de plataformas externas como youtube o de redes sociales como facebook, twitter o linkedin.

Marketing y publicidad +

Estas se utilizan para crear perfiles de usuario y analizar la efectividad de campañas publicitarias o para rastrear al usuario en un sitio web o en varios sitios web con fines de marketing similares..

GUARDAR AJUSTESACEPTO