GTT Academia y Ciencia
2024-08-15
La visualización de datos, es un importante aspecto de las Ciencias de Datos. Es posible analizar grandes cúmulos de datos y producir información resumida y condensada.
El web scraping es una técnica automatizada ampliamente utilizada para extraer información precisa de páginas web y catálogos web mediante el uso de programas o scripts (Vaughan, 2028).
Tambien es importante aplicar técnicas de clasificación y predicción de datos.
Por ejemplo: Clasificación de datos geoespaciales a partir de Técnicas de IA, para detectar infinidad de fenómenos: detectar construcciones (catastro), detectar focas (en el artico), detectar autos, cultivos, etc. Es decir fenómenos geoespaciales.
Es crucial para mantener actualizadas las competencias técnicas y profesionales en un campo en constante evolución como la geoinformación.
Son capacidades altamente valoradas en el sector privado (económicamente): Tener presente el costo de la hora hombre de programación gráfica (horas-hombre) es más alta que la programación común, de aquí la deserción de perfiles calificados en el Estado.
Por otro lado se requieren recursos de hardware sólidos, resilientes, buena calidad de monitores, y de instrumental tecnológico: GPS, Estaciones permanentes, Vehículos Aéreos No Tripulados (VANT), etc.
Python adquiere doble importancia ya que es utilizado tanto por QGIS como por ARCGis (ESRI), incluso utiliza Jupyter Notebooks en ArcGis Pro.
Desarrollar capacidades en Ciencia de Datos Geoespaciales permitirá el desarrollo de aplicaciones gráficas, de tableros (dashboards), geo-APIs, incluso geohistorias. Además de conocer como consumir geoservicios desde un GIS (QGis, ArcGis, etc.) debemos enseñar a consumirlos desde distintos lenguajes de programación y GIS.
115 WFS, 6135 capas (fenómenos), 90 millones de observaciones 16 WCS, 187 coberturas (muchos utilizan coberturas pero quizás no las difunden como servicio)
Algunos elementos y los vemos en el tablero:
Cada proveedor puede elegir qué operaciones implementar en su servicio WCS. No todos los servicios implementan todas las operaciones del estándar. ## CRS de Geoservicios WCS
64 coberturas en World Geodetic System 1984, used in GPS - EPSG:4326
47 coberturas en EPSG:32720 - WGS 84 / UTM zone 20S
46 coberturas en POSGAR 2007 / Argentina 3 - EPSG:5345
1 cobertura en EPSG:3857 - WGS 84 / Pseudo-Mercator
1 cobertura en WGS 84 / UTM zone 33N - EPSG:32633
1 cobertura en EPSG:26713 - NAD27 / UTM zone 13N
2 coberturas en POSGAR 98 / Argentina 5 - EPSG:22175
9 coberturas en POSGAR 98 / Argentina 4 - EPSG:22174
La muestra del estudio
El estudio realizado implicó el análisis de una muestra significativa del catálogo de metadatos de IDERA. La muestra consiste en 2852 registros de un total de 4644 registros que contiene el catálogo de metadatos. Es decir la muestra representa el 61,41% del catálogo.
El estudio se focalizó en analizar aquellos tipos de elementos del Perfil de metadatos de IDERA correspondientes a las clases A y B: “A. Información de Identificación”; “B. Información del Sistema de Referencia” (ver anexo I del resumen).
La norma ISO 19115 estructura la información que se debe cargar en un metadato de información geoespacial, ejemplo en datos vectoriales: Solicita información clave como los detalles del responsable, la descripción del dataset, la referencia espacial, la calidad de los datos y las restricciones de acceso.
Esta norma asegura que los metadatos sean consistentes y útiles para describir, entender y utilizar los datos geoespaciales. Si los entendemos lo podremos reutilizar en estudios, aplicaciones y APIs.
La reutilización de la informacíón es un índice de la economia del conocimiento en materia de información geoespacial. Más reutilizamos la información geoespacial a partir de los geoservicios, más podremos ahorrar en adquisición de datos en proyectos.
Información del Responsable del dato
- Sección: CI_ResponsibleParty
- Descripción: Identifica la organización o persona responsable del recurso, incluyendo información de contacto y el rol.
Descripción del Dataset
- Sección: MD_DataIdentification
- Descripción: Proporciona detalles sobre el contenido del dataset, como el título, resumen, palabras clave, y la extensión temporal.
Referencia Espacial
- Sección: MD_ReferenceSystem
- Descripción: Especifica el sistema de referencia espacial utilizado para el dataset.
Calidad de los Datos
- Sección: DQ_DataQuality
- Descripción: Describe la calidad de los datos, incluyendo exactitud, consistencia, y completitud.
Restricciones de Acceso
- Sección: MD_Constraints
- Descripción: Indica las restricciones legales y de seguridad que se aplican al acceso y uso del dataset.
Estos grupos y sus secciones específicas dentro de la norma ISO 19115 son esenciales para asegurar la consistencia y la utilidad de los metadatos en información geoespacial.
Desde la encuesta anual 2024 que podemos leer desde las respuestas:
Sobre geoservicios WCS
Sobre metadatos: