Name	Name	Last commit message	Last commit date
parent directory ..
content_consolidation_analyzer.py	content_consolidation_analyzer.py
readme.md	readme.md
requirements.txt	requirements.txt

Name

Last commit message

Last commit date

readme.md

requirements.txt

Content Consolidation Analyzer

Find pages cannibalizing each other by clustering URLs that share significant SERP overlap.

What It Does

Analyzes SERP data to find queries that rank similar pages
Clusters pages using graph-based algorithms (connected components + cliques)
Calculates consolidation scores (0-100) for each cluster
Outputs actionable recommendations for content consolidation

Use Cases

Identify content cannibalization issues
Find pages competing for the same keywords
Make data-driven decisions about merging or consolidating content
Improve internal linking between related pages

Installation

pip install -r requirements.txt

Usage

Basic Usage

python content_consolidation_analyzer.py --input serp_data.csv --output results.csv

With Multiple Files

python content_consolidation_analyzer.py --input "data/*.csv" --output results.csv

Custom Column Names

python content_consolidation_analyzer.py \
    --input serp_data.csv \
    --query-col "keyword" \
    --url-col "url" \
    --min-urls 3

Arguments

Argument	Description	Default
`--input`, `-i`	Input CSV file or pattern	Required
`--output`, `-o`	Output CSV file	`consolidation_results.csv`
`--min-urls`	Minimum shared URLs to cluster	`4`
`--query-col`	Column name for queries	`search.q`
`--url-col`	Column name for URLs	`result.organic_results.link`

Input Format

CSV file with columns for queries and URLs. Example:

search.q,result.organic_results.link
best running shoes,https://example.com/shoes
best running shoes,https://example.com/trainers
running shoe reviews,https://example.com/shoes

Output

The tool outputs a CSV with:

cluster_id: Identifier for the cluster
query: The search query
consolidation_score: 0-100 score indicating consolidation strength
consolidation_recommendation: Human-readable recommendation
cluster_size: Number of pages in the cluster
shared_urls: URLs that appear for multiple queries
And more metrics...

Consolidation Scores

Score	Recommendation
80-100	Strong consolidation candidate
60-79	Good consolidation candidate
40-59	Possible consolidation
20-39	Weak consolidation candidate
0-19	Keep separate

Author

Lee Foot - leefoot.com

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

readme.md

Content Consolidation Analyzer

What It Does

Use Cases

Installation

Usage

Basic Usage

With Multiple Files

Custom Column Names

Arguments

Input Format

Output

Consolidation Scores

Author

FilesExpand file tree

content-consolidation

Directory actions

More options

Directory actions

More options

Latest commit

History

content-consolidation

Folders and files

parent directory

readme.md

Content Consolidation Analyzer

What It Does

Use Cases

Installation

Usage

Basic Usage

With Multiple Files

Custom Column Names

Arguments

Input Format

Output

Consolidation Scores

Author