8.9 KiB

Raw Blame History

Architecture Overview

This document provides a comprehensive overview of the Aurora GIS architecture, including system components, data flows, and design patterns.

System Architecture

Aurora GIS follows a modular architecture with clear separation between:

Frontend: PHP-based web interface with JavaScript for interactivity
Backend: PHP application layer with PostgreSQL/PostGIS database
Workers: Background job processing system
API: RESTful API layer for programmatic access
Analysis Engine: Spatial analysis tools and algorithms

Core Components

1. Dataset Engine

The dataset engine is the core component responsible for managing spatial datasets.

Data Storage Model

Each dataset is stored in its own table following the naming convention spatial_data_{dataset_id}:

CREATE TABLE spatial_data_{id} (
    id SERIAL PRIMARY KEY,
    feature_id TEXT,
    geometry_type TEXT,
    properties JSONB,
    geometry JSONB,
    geom GEOMETRY,
    created_at TIMESTAMP DEFAULT NOW()
);

Benefits:

Better performance with large numbers of datasets
Easier data management and cleanup
Improved query performance for individual datasets
Reduced table size and index overhead

Dataset Metadata

Dataset metadata is stored in the spatial_files table:

File information (name, path, type, size)
User-provided description
Extracted metadata (JSONB)
Access permissions
Creation and update timestamps

PostGIS Integration

All spatial data stored as PostGIS GEOMETRY type
Automatic SRID handling (default: 4326)
Spatial indexes using GiST for performance
Support for all PostGIS geometry types

2. Background Jobs System

The background jobs system enables asynchronous processing of long-running operations.

Job Queue

Jobs are stored in the background_jobs table:

CREATE TABLE background_jobs (
    id SERIAL PRIMARY KEY,
    user_id INTEGER,
    job_type TEXT,
    params JSONB,
    status TEXT,  -- 'queued', 'running', 'completed', 'failed'
    result JSONB,
    error_message TEXT,
    progress INTEGER,
    created_at TIMESTAMP,
    started_at TIMESTAMP,
    finished_at TIMESTAMP
);

Job Lifecycle

Enqueue: Job created with status 'queued'
Fetch: Worker fetches next job using FOR UPDATE SKIP LOCKED
Process: Worker updates status to 'running' and processes job
Complete: Worker updates status to 'completed' with results
Error: On failure, status set to 'failed' with error message

Worker Architecture

Workers are long-running PHP CLI scripts that:

Poll the database for queued jobs
Process jobs of a specific type
Handle errors gracefully
Log progress and results
Run continuously until stopped

See Workers Documentation for details on each worker.

3. Analysis Tools

Aurora GIS provides a comprehensive suite of spatial analysis tools.

Vector Analysis Tools

Hot Spot Analysis: Getis-Ord Gi* statistics for identifying clusters
Outlier Detection: Z-score and MAD-based outlier identification
KDE (Kernel Density Estimation): Density surface generation
Clustering: Spatial clustering algorithms
Proximity Analysis: Buffer, nearest neighbor, distance calculations
Overlay Operations: Intersect, union, erase, join

Raster Analysis Tools

Zonal Statistics: Calculate statistics within polygon zones
Raster Histogram: Analyze pixel value distributions
Raster Summary: Generate summary statistics
Raster Profile: Extract values along a line
Raster Conversion: Convert between formats
Raster Comparison: Compare two raster datasets

See Analysis Tools Documentation for details.

4. API Layer

The API layer provides RESTful access to datasets and analysis tools.

API Structure

Basic API (/api/basic/index.php): Dataset listing, details, GeoJSON queries
Server API (/api/server/index.php): Server information and capabilities
Images API (/api/images/index.php): GeoServer proxy and catalog
Analysis APIs: Endpoints for running analysis tools
Worker APIs: Endpoints for job management

Authentication

Session-based authentication for web interface
API key authentication (optional)
Dataset-level access control
Public dataset access (configurable)

See API Documentation for endpoint details.

5. PostGIS Data Flows

Import Flow

Uploaded File
    ↓
Format Detection
    ↓
Geometry Extraction
    ↓
PostGIS Processing
    ↓
spatial_data_{id} Table
    ↓
Spatial Index Creation
    ↓
Metadata Extraction
    ↓
spatial_files Record

Analysis Flow

User Request
    ↓
Job Enqueue
    ↓
Worker Fetch
    ↓
PostGIS Analysis
    ↓
Result Table/View
    ↓
Job Complete
    ↓
User Notification

Export Flow

Dataset Selection
    ↓
Query PostGIS Table
    ↓
Format Conversion
    ↓
GeoJSON/Shapefile/CSV
    ↓
Download

Data Processing Pipeline

File Upload Processing

File Validation: Check file type, size, and format
Geometry Extraction: Parse geometry from source format
SRID Detection: Identify or assign spatial reference system
Table Creation: Create spatial_data_{id} table
Data Import: Insert features into PostGIS table
Index Creation: Create spatial and attribute indexes
Metadata Extraction: Extract and store metadata
Registration: Create spatial_files record

Analysis Processing

Parameter Validation: Validate input parameters
Job Creation: Enqueue background job
Worker Processing: Worker fetches and processes job
PostGIS Execution: Run spatial analysis queries
Result Storage: Store results in table/view
Metadata Update: Update job status and results
User Notification: Notify user of completion

Database Schema

Core Tables

spatial_files: Dataset metadata and file information
spatial_data_{id}: Individual dataset tables (dynamic)
background_jobs: Job queue and status
user: User accounts and authentication
access_group: Access control groups
user_access: User-group associations
dataset_permissions: Dataset-level permissions

Supporting Tables

ogc_connections: External PostGIS connections
scheduled_imports: Scheduled URL imports
map_views: Saved map configurations
dashboards: Dashboard definitions
presentations: Presentation configurations
categories_keywords: Dataset categorization

Security Architecture

Authentication

Session-based authentication
OAuth support (GitHub, Google, Microsoft)
Password hashing (bcrypt)
Session management

Authorization

Role-based access control (Admin, User, Publisher)
Dataset-level permissions
Access group management
Public dataset access (optional)

Data Security

SQL injection prevention (prepared statements)
XSS protection (output escaping)
File upload validation
Path traversal prevention
Secure file storage

Performance Optimizations

Database Optimizations

Spatial indexes (GiST) on geometry columns
Attribute indexes on frequently queried fields
Connection pooling (PgBouncer support)
Query optimization and caching
Materialized views for complex queries

Application Optimizations

Lazy loading of map components
Pagination for large datasets
Background job processing
Caching of metadata and configurations
Efficient JSONB storage

Worker Optimizations

Parallel job processing (multiple workers)
Job prioritization
Resource limits and timeouts
Error handling and retry logic

Scalability Considerations

Horizontal Scaling

Stateless application design
Database connection pooling
Worker scaling (multiple worker instances)
Load balancing support

Vertical Scaling

Database query optimization
Index optimization
Memory management
Worker resource allocation

Integration Points

External Services

GeoServer: WMS/WFS services
QGIS Server: QGIS project rendering
pg_tileserv: Vector tile generation
OAuth Providers: Authentication
S3: Cloud storage for large files

Data Sources

PostGIS Remote: External PostGIS databases
URL Imports: Web-accessible spatial data
File Uploads: Local file uploads
Overture Maps: Parquet file imports
S3 Buckets: Cloud-based data sources

8.9 KiB Raw Blame History

Architecture Overview

System Architecture

Core Components

1. Dataset Engine

Data Storage Model

Dataset Metadata

PostGIS Integration

2. Background Jobs System

Job Queue

Job Lifecycle

Worker Architecture

3. Analysis Tools

Vector Analysis Tools

Raster Analysis Tools

4. API Layer

API Structure

Authentication

5. PostGIS Data Flows

Import Flow

Analysis Flow

Export Flow

Data Processing Pipeline

File Upload Processing

Analysis Processing

Database Schema

Core Tables

Supporting Tables

Security Architecture

Authentication

Authorization

Data Security

Performance Optimizations

Database Optimizations

Application Optimizations

Worker Optimizations

Scalability Considerations

Horizontal Scaling

Vertical Scaling

Integration Points

External Services

Data Sources

Monitoring and Logging

Application Logging

Database Monitoring

Related Documentation

8.9 KiB

Raw Blame History