Introducción a Hubble
¿Qué es Hubble?
Hubble es un conjunto de datos open-source, disponible públicamente, que proporciona un registro histórico completo de la red Stellar. Similar a Horizon, ingiere y presenta los datos producidos por la red Stellar en un formato que es más fácil de consumir que las representaciones de datos orientadas al rendimiento utilizadas por Stellar Core. El conjunto de datos está alojado en BigQuery, lo que significa que es adecuado para grandes cargas de trabajo analíticas, recuperación de datos históricos y agregación de datos complejos. Hubble no debe utilizarse para la recuperación de datos en tiempo real y no puede enviar transacciones a la red. Para casos de uso en tiempo real, recomendamos ejecutar un servidor API.
Esta guía describe cuándo usar Hubble y cómo conectarse. Para ver las estructuras de datos subyacentes, consultas y ejemplos, utiliza los tutoriales de Visualización de Metadatos y Optimización de Consultas.
¿Por qué usar Hubble?
Algunas preguntas son difíciles de responder con la API de Horizon y su base de datos subyacente de PostgreSQL. Esto se debe a que su infraestructura está optimizada para lecturas y escrituras rápidas en la base de datos, de modo que puede procesar transacciones en línea. Horizon puede almacenar con precisión los resultados de estas transacciones más pequeñas; sin embargo, sacrifica la capacidad de ejecutar consultas complejas fácilmente. La huella de datos de la red Stellar también ha aumentado exponencialmente, lo que está generando restricciones de espacio y problemas de rendimiento para las instancias de Horizon que almacenan el registro histórico completo.
Aquí es donde entra Hubble. Está optimizado para ejecutar consultas complejas y escanear grandes cantidades de datos. Hubble puede almacenar órdenes de magnitud más datos que Horizon y no encontrará las mismas restricciones de almacenamiento. Las consultas que requieren paginación en Horizon o que agotan el tiempo pueden ser devueltas en una sola consulta. Hubble empodera a los usuarios para explorar, analizar y obtener conclusiones significativas de los datos sin la carga de mantener una base de datos.
Los usuarios deben estar al tanto de las siguientes limitaciones:
- Hubble es de solo lectura; no puede interactuar con la red Stellar.
- La base de datos se actualiza en lotes intradía. No hay garantía de disponibilidad de datos el mismo día.
- El SDF alberga una instancia pública de Hubble, y los usuarios finales incurren en el costo de ejecutar consultas. Visita la Página de Precios de BigQuery para aprender más.
Why We Chose BigQuery
BigQuery es el almacén de datos de Google Cloud que viene con algunas características clave que satisfacen las necesidades analíticas de Stellar.
Primero, BigQuery permite a cualquiera hacer que un conjunto de datos esté disponible públicamente. Esto significa que el SDF puede contribuir con repositorios open-source para crear y mantener un almacén de datos y también alojar una instancia pública.
BigQuery también separa el almacenamiento de la computación, lo que hace sostenible alojar una instancia pública. El mantenedor solo tiene que pagar el costo del almacenamiento sin incurrir en el costo de las analíticas que se ejecutan sobre el conjunto de datos.
Lo más importante, BigQuery es la plataforma de facto para conjuntos de datos de blockchain. Al seleccionar BigQuery, los datos de la red Stellar se ubican con otros datos de blockchain, lo que permite análisis cross-chain.