Fuentes de datos para big data

Fuentes de datos para big data

Qué es el big data

Big data es un término que describe los grandes volúmenes de datos difíciles de gestionar -tanto estructurados como no estructurados- que inundan las empresas en su día a día. Pero lo importante no es sólo el tipo o la cantidad de datos, sino lo que las organizaciones hacen con ellos. Los grandes datos pueden analizarse para obtener información que mejore las decisiones y dé confianza para tomar medidas empresariales estratégicas.

El término “big data” se refiere a los datos que son tan grandes, rápidos o complejos que son difíciles o imposibles de procesar con los métodos tradicionales. El acto de acceder y almacenar grandes cantidades de información para su análisis existe desde hace mucho tiempo. Pero el concepto de big data cobró impulso a principios de la década de 2000, cuando el analista de la industria Doug Laney articuló la definición de big data, que ahora es la corriente principal, como las tres V:

Volumen.  Las organizaciones recopilan datos de diversas fuentes, como transacciones, dispositivos inteligentes (IoT), equipos industriales, vídeos, imágenes, audio, redes sociales, etc. En el pasado, almacenar todos esos datos habría sido demasiado costoso, pero el almacenamiento más barato mediante lagos de datos, Hadoop y la nube ha aliviado la carga.

Retos de los grandes datos

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de procesamiento de datos tradicional no puede gestionarlos. Sin embargo, estos volúmenes masivos de datos pueden utilizarse para resolver problemas empresariales que antes no habrían podido abordarse.

  No duplicar datos en excel

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Comentarios

Los autores escriben que los macrodatos son mucho más poderosos que los análisis del pasado. Los directivos pueden medir y, por tanto, gestionar con más precisión que nunca. Pueden hacer mejores predicciones y tomar decisiones más inteligentes. Pueden dirigir intervenciones más eficaces en áreas que hasta ahora han estado dominadas por el instinto y la intuición en lugar de por los datos y el rigor. Las diferencias entre el big data y la analítica son una cuestión de volumen, velocidad y variedad: Ahora cruzan por Internet más datos cada segundo que los que se almacenaban en todo Internet hace 20 años. La información casi en tiempo real permite a una empresa ser mucho más ágil que sus competidores. Y esa información puede proceder de redes sociales, imágenes, sensores, la web u otras fuentes no estructuradas.

  Tipo de bases de datos

Sin embargo, los retos de gestión son muy reales. Los responsables de la toma de decisiones de alto nivel tienen que aprender a hacer las preguntas correctas y adoptar una toma de decisiones basada en pruebas. Las organizaciones deben contratar a científicos que puedan encontrar patrones en conjuntos de datos muy grandes y traducirlos en información empresarial útil. Los departamentos de TI tienen que trabajar duro para integrar todas las fuentes de datos internas y externas relevantes.

Fuentes de grandes datos

No se puede discutir el poder de los grandes datos en el panorama empresarial actual. Las empresas están analizando una serie aparentemente interminable de fuentes de datos para obtener información sobre casi todas las actividades, tanto dentro de su negocio como de cara al cliente. En este momento, parece que las empresas no pueden tener en sus manos suficiente big data para fines de análisis – las oportunidades y ventajas que se pueden obtener aquí son tentadoras, así como procesables, y pueden realmente hacer toda la diferencia para las empresas de hoy.

Sin embargo, a medida que aumenta el hambre de datos de las empresas, también lo hace su búsqueda de fuentes de datos utilizables. Hay varios lugares en los que las empresas pueden reunir y recopilar big data, tanto dentro como fuera de sus propias organizaciones. En la actualidad, no son pocos los corredores de datos que venden listas de información y, aunque puedan parecer útiles, depende de la empresa analizar y hacer el mejor uso de estos datos.

  Que es analisis de datos

Es más, sin los conocimientos, las habilidades y el apoyo adecuados, estas listas pueden ser increíblemente ineficaces y, por lo tanto, no vale la pena la inversión. Antes de que las empresas recurran a los corredores de datos, hay algunos lugares clave en los que pueden buscar para reunir sus propios big data. Veamos algunas de las principales fuentes de información y cómo pueden beneficiar a su organización, independientemente del sector en el que opere.

Esta web utiliza cookies propias para su correcto funcionamiento. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad