Cerrar

Agenda · Curso Online

Talleres de emprendimiento online y gratuitos

Talleres de emprendimiento online y gratuitos 

El martes, 04 de junio de 2024

Dirigidos a jóvenes entre 18 y 29 años

Talleres online, totalmente gratuitos,  en materia de  emprendimiento, dirigidos a jóvenes de Valencia, Castellón o Alicante, entre 18 y 29 años, que no estén trabajando actualmente, tengan DNI/NIE y...

Acción contra el hambre Comunitat Valenciana

Agenda · Congresos

Redit Summit 2024

Redit Summit 2024 

El jueves, 26 de septiembre de 2024

En el Auditorio del Ministerio de Ciencia, Innovación y Universidades Madrid

El próximo 26 de septiembre la Red de Institutos Tecnológicos de la Comunitat Valenciana, REDIT, celebra la IV edición de su congreso anual, el REDIT Summit, con el apoyo del Instituto Valenciano de...

REDIT. Red de Institutos Tecnológicos de la Comunitat Valenciana

Agenda · Encuentros

II Encuentro Jóvenes Empresas con Impacto Social

II Encuentro Jóvenes Empresas con Impacto Social 

El miércoles, 29 de mayo de 2024

Contaremos con empresas referentes en un encuentro único.

INSCRÍBETE AQUÍ   Tras el éxito de la primera edición, volvemos por segundo año con nuestro Congreso de Jóvenes Empresas de Impacto Social. AJEV e YMCA siguen firmes en su objetivo de concienciar y...

AJEV. ASOCIACIÓN JÓVENES EMPRESARIOS DE VALENCIA

Actualidad · Artículo

Ayudas a cooperativas 2024

Ayudas a cooperativas 2024 

Convocatoria de ayudas a las cooperativas, sociedades laborales y empresas de inserción

La Conselleria de Educación, Universidades y Empleo lanza las ayudas a las cooperativas, sociedades laborales y empresas de inserción. AYUDAS INVERSIONES (ESEMOB) 2024  Ayudas para inversiones en...

Agenda · Jornadas

Ayudas de la Generalitat Valenciana  a emprendedores y pymes, para el inicio, consolidación e internacionalización

Ayudas de la Generalitat Valenciana a emprendedores y... 

El viernes, 24 de mayo de 2024

Este taller/dinámica proporcionará a las empresas del ecosistema PCA información actualizada de ayudas específicas en vigor de la Generalitat Valenciana en los ámbitos de emprendimiento e...

Parque Científico de la Universidad de Alicante

Agenda · Jornadas

¿Por qué es importante la ciberseguridad en tu organización?

¿Por qué es importante la ciberseguridad en tu organización? 

El martes, 04 de junio de 2024

Jornada presencial

La importancia de la ciberseguridad. Si eres una empresa con inquietudes en materia de ciberseguridad y necesitas conocer soluciones de IA aplicables a tus procesos, participa el próximo 4 de junio...

Cámara de Comercio de Alicante

Agenda · Jornadas

Presentación de Cuentas Anuales y Procedimientos Telemáticos en el Registro Mercantil

Presentación de Cuentas Anuales y Procedimientos... 

El martes, 18 de junio de 2024

Javier Navarro Díaz y Javier Moralejo Bejarano - Registro Mercantil de Valencia

INFORMACIÓN-INSCRIPCIÓN

Agenda · Jornadas

Mesa de trabajo con el Registro Mercantil de Alicante

Mesa de trabajo con el Registro Mercantil de Alicante 

El miércoles, 12 de junio de 2024

Problemática en la presentación de Cuentas Anuales y Procedimientos Telemáticos en el Registro Mercantil

INSCRIPCIÓN-INFORMACIÓN D. JUAN FRANCISCO BORRÁS MEGÍAS, Oficial Superior del Registro Mercantil de Alicante.D. VÍCTOR BAIDEZ SIMÓN, Responsable del Departamento de Informática del Registro...

Agenda · Jornadas

Nuevas estrategias de comunicación digital

Nuevas estrategias de comunicación digital 

El jueves, 06 de junio de 2024

Cómo llegar a las futuras audiencias de la generación Z y milenial. El 6 de junio en Cámara Comercio de Alcoy

Jornada OAP para Kit Digital: Nuevas estrategias de comunicación digital. Cómo llegar a las futuras audiencias de la generación Z y milenial. El caso de éxito de la experiencia "EscaparOTeh"...

Cámara de Comercio de Alcoy

Actualidad · Convocatoria

VDS2024 Competition

VDS2024 Competition 

Con el objetivo de encontrar las startups más disruptivas

La convocatoria VDS2024 está abierta a nuevas empresas de todo el mundo y de todos los sectores, con al menos un MVP que esté construyendo soluciones para un buen futuro.  Un jurado elegido...

Startup Valencia

Agenda · Encuentros

III Encuentro Conectando grandes corporaciones y startups

III Encuentro Conectando grandes corporaciones y startups 

El viernes, 24 de mayo de 2024

Impulsemos nuestra sociedad ilimitada a través de la empresa y las que cambiarán el futuro

Estamos de vuelta con el III Encuentro Conectando grandes corporaciones y startups. Un espacio, qué como bien se indica, promoverá las sinergias y colaboraciones entre startups y grandes...

Fundación LAB Mediterráneo

Actualidad · Noticia

Mejora de la calidad, aumento de seguridad o seguimiento de stock: estos son los beneficios de usar visión artificial en empresas

Mejora de la calidad, aumento de seguridad o seguimiento de... 

Hoy se ha celebrado la segunda jornada del Focus Pyme y Emprendimiento CREAMA Talento Digital

El segundo webinar del Focus Pyme y Emprendimiento CREAMA Talento Digital se ha celebrado esta mañana. "Aplicaciones prácticas de la visión artificial" es el título de la conferencia que ha impartido...

Centro Europeo de Empresas e Innovación de Elche (CEEI - Elche)

Principales herramientas de Big Data que debes conocer

Principales herramientas big data
Solver

Solver

Publicado el martes, 19 de abril de 2022 a las 17:00

Estamos ante un aumento constante de las herramientas de Big Data que hacen que nos perdamos en siglas y nombres con significados muchas veces desconocidos para la mayoría, y que hacen que a las empresas les cueste tomar decisiones sobre qué herramientas utilizar. 

A los Ingenieros en Informática y, en concreto, a los que nos especializamos en los datos, se nos generan dos problemas diferentes pero muy unidos:

  • Por un lado, nos encontramos con el problema del almacenamiento de los datos. Estos deben ser almacenados en sistemas y de maneras que podamos recuperarlos de una forma lo más sencilla y rápida posible. De nada nos sirven los datos si luego no somos capaces de encontrarlos o almacenarlos.
  • Por otro, tenemos un problema con el procesamiento de los mismos. No es lo mismo, ni se utilizan las mismas técnicas, para procesar un fichero con 1000 líneas de datos (algo que podríamos hacer hasta en nuestro teléfono móvil) que procesar un fichero con 1000 millones de líneas, y el tiempo de procesado no es el mayor de nuestros problemas.

Ante estos retos, se desarrollaron una multitud de herramientas para el almacenamiento y procesamiento de datos de forma distribuida. Desde Solver, te descubrimos las herramientas más conocidas y utilizadas:

1. Apache Hadoop

Se trata de un framework de software opensource que permite el tratamiento y gestión distribuido de grandes volúmenes de información. Además del Hadoop Common, consta de los siguientes componentes:

  • Hadoop Distributed File System (HDFS): Sistema de archivos distribuido que ofrece un alto rendimiento en los accesos a los datos. Diseñado para ser ejecutado en hardware de bajo coste y para que, su conjunto, sea tolerante a fallos y de alta disponibilidad.

 

  • Hadoop Yarn (Yet Another Resource Negotiator): Framework para gestión de recursos y planificación de tareasCombina un gestor de recursos central que gestiona la forma en que las aplicaciones utilizan los recursos del sistema, con agentes gestores en los nodos que gestionan las operaciones de proceso en los nodos individuales del clúster.

 

  • Hadoop MapReduce: Sistema para el procesamiento en paralelo de grandes volúmenes de información. El paradigma MapReduce se emplea para resolver algunos algoritmos que son susceptibles de ser paralelizados. Se basa en realizar el procesamiento de la información en el mismo lugar en que ésta reside. Al lanzar un proceso de MapReduce, las tareas son distribuidas entre los diferentes nodos del clúster. La parte de computación se realiza de forma local en el mismo nodo que contiene los datos, por lo que se minimiza el tráfico de datos por la red y paraleliza a nivel de nodos de un cluster.

2. Apache Spark 

Es un framework de código abierto para computación en clúster. Ha sido desarrollado para optimizar el rendimiento, y puede resultar hasta 100x veces más rápido que que Hadoop tanto para los procesos en batch como en streaming. Se puede utilizar en diferentes lenguajes de programación (Scala, Python, R). Además, dispone de librerías específicas para trabajar con SQL, para procesar datos en streaming, procesos de Machine Learning y la generación de gráficos

3. Apache Hive 

Es un software para gestión de un datawarehouse de forma distribuida y que permite gestionar grandes volúmenes de datos utilizando SQL y trabajando sobre el sistema de almacenamiento de Hadoop HDFS u otros sistemas de almacenamiento distribuido como S3 de Amazon.

4. Apache Cassandra

Software opensource para la gestión de bases de datos NoSQL, construidas para manejar grandes volúmenes de información. Es un sistema con alta disponibilidad, que no tiene un único punto de fallo y que está diseñado para el procesado rápido de grandes volúmenes de información. Dispone de un lenguaje de consulta propio, Cassandra Structure Language (CQL).

5. MongoDB  

Probablemente sea la base de datos de propósito general, distribuida y NoSQL más utilizada actualmente. También es open source y está orientada al almacenamiento de documentos, utilizando para ello un formato BSON (similar al JSON). Permite el sharding y las réplicas.

6. Apache Kafka 

Seguramente, es la plataforma para gestión de datos distribuidos en su versión streaming más utilizada. Permite capturar la información de diferentes fuentes (IoT, bases de datos, etc.) en tiempo real para su almacenamiento, procesado o análisis. Es muy utilizado en sistemas de gestión y análisis de cookies de navegación web

5.411 visitas

Utilizamos cookies propias y de terceros para ofrecerte toda la funcionalidad y una mejor experiencia, obtener estadísticas de tráfico, analizar el uso de la web y mejorar nuestros servicios.
Tienes disponible aquí nuestra política de cookies.
Puedes aceptar todas nuestras cookies pulsando el botón 'ACEPTAR' o configurar aquí tus preferencias.

Estrictamente necesarias +

Estas cookies son necesarias ya que permiten que el sitio web funcione correctamente, no se pueden desactivar.

Estadísticas +

Son las cookies que utilizamos exclusivamente con fines estadísticos para poder analizar cómo los usuasrios hacen uso de la web. Recopila información anónima tal como el número de visitantes del sitio, o las páginas más populares. Activar estas cookies nos permite seguir mejorando.

Funcionales +

Estas cookies son necesarias para el intercambio y presentación de contenidos de plataformas externas como youtube o de redes sociales como facebook, twitter o linkedin.

Marketing y publicidad +

Estas se utilizan para crear perfiles de usuario y analizar la efectividad de campañas publicitarias o para rastrear al usuario en un sitio web o en varios sitios web con fines de marketing similares..

GUARDAR AJUSTESACEPTO