ML Anomaly Detection System for Production Monitoring

Machine learning project that flags abnormal behavior in operational time-series metrics (CPU, memory, latency, errors, throughput, disk, network) using Isolation Forest and a TensorFlow dense autoencoder.

Features (in progress)

Synthetic observability dataset with daily/weekly seasonality and injected anomalies
Preprocessing: sort by time, drop duplicate timestamps, fill missing values, chronological train/test split, StandardScaler fit on train only (saved as models/scaler.pkl)
Baseline Isolation Forest and autoencoder (MSE reconstruction error, 95th-percentile threshold on normal train rows)
Evaluation: classification reports, ROC-AUC on continuous scores, confusion matrices and timeline/score plots under outputs/

Quick start

cd ml-anomaly-detection-system
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python src/generate_data.py
python src/preprocess.py
python src/train_isolation_forest.py
python src/train_autoencoder.py
python src/evaluate.py

This writes data/raw/metrics.csv, then data/processed/train.csv, data/processed/test.csv, and models/scaler.pkl (artifacts are gitignored by default; regenerate anytime).

Training saves models/isolation_forest.pkl, outputs/metrics/isolation_forest_summary.txt, and outputs/predictions/isolation_forest_test.csv.

The autoencoder writes models/autoencoder.keras, models/autoencoder_threshold.json, outputs/metrics/autoencoder_summary.txt, and outputs/predictions/autoencoder_test.csv.

python src/evaluate.py expects both models and the threshold file; it writes outputs/metrics/classification_report.txt, outputs/metrics/summary_metrics.txt, and plots under outputs/plots/.

Preprocessing notes: CSVs keep unscaled feature columns; training scripts should joblib.load the scaler and transform FEATURE_COLUMNS before fitting models.

Project layout

Metrics → Preprocessing → Model → Anomaly Score → Alert

See the repo tree: data/, notebooks/, src/, models/, outputs/, tests/.

Dataset columns

Column	Description
`timestamp`	Observation time
`cpu_usage`	CPU utilization %
`memory_usage`	Memory utilization %
`request_latency_ms`	Average request latency
`error_rate`	Proportion of failed requests
`request_count`	Requests in the interval
`disk_io`	Disk activity
`network_in_mb`	Incoming traffic
`is_anomaly`	Injected label for evaluation

License

MIT (add a LICENSE file when you publish).

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
.cursor/rules		.cursor/rules
.github		.github
.vscode		.vscode
data		data
models		models
notebooks		notebooks
outputs		outputs
src		src
tests		tests
.cursorrules		.cursorrules
.editorconfig		.editorconfig
.gitignore		.gitignore
.gitmessage		.gitmessage
.pre-commit-config.yaml		.pre-commit-config.yaml
.prettierrc.json		.prettierrc.json
Makefile		Makefile
README.md		README.md
pyproject.toml		pyproject.toml
requirements-dev.txt		requirements-dev.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ML Anomaly Detection System for Production Monitoring

Features (in progress)

Quick start

Project layout

Dataset columns

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ML Anomaly Detection System for Production Monitoring

Features (in progress)

Quick start

Project layout

Dataset columns

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages