Reglas de codificación de IA para sitios de contenido SEO

Reglas de AGENTS.md para sitios de contenido centrados en SEO que previenen metadatos duplicados, aplican datos estructurados y evitan que los agentes rompan la capacidad de rastreo.

Coloca esto en la raíz de tu repositorio como AGENTS.md. Está dirigido a cualquier sitio con mucho contenido donde el tráfico de búsqueda orgánica sea el principal motor de crecimiento — blogs, sitios de documentación, sitios de marketing y bibliotecas de recursos.

AGENTS.md

# Project Rules — SEO Content Site

## Stack
- Astro (static) or Next.js (App Router, static export or ISR).
- TypeScript strict. Content schema enforced via Zod (content collections or manual).
- Tailwind CSS for styling.

## Hard rules — SEO correctness
- Every page MUST have a unique `<title>` (50–60 chars) and a unique
  `<meta name="description">` (120–160 chars). Duplicate titles and descriptions
  cause Google to de-rank or rewrite them. Check both before marking a task done.
- Every page MUST render a `<link rel="canonical" href="...">` pointing to its own
  canonical URL. This is required even on pages that are not duplicated — it is a
  signal, not just a deduplication tool.
- Never generate two pages with the same slug or URL path. Before adding a new content
  file or route, confirm the path does not already exist in `src/pages/` or the
  content collection.
- Every blog post or article MUST include JSON-LD structured data: at minimum
  `Article` with `headline`, `datePublished`, `dateModified`, and `author`.
  Product pages need `Product` schema. FAQ pages need `FAQPage` schema.
- Open Graph tags (`og:title`, `og:description`, `og:image`, `og:url`) must be
  present on every page. The `og:image` must be an absolute URL (not a relative path).
- Do NOT use `noindex` on pages that should rank. Do NOT remove `noindex` from pages
  in `src/pages/api/`, `src/pages/admin/`, or any route that should not be crawled.

## URL and routing conventions
- URLs are lowercase, hyphen-separated, no trailing slashes (or consistently with
  trailing slash if the framework default — pick one and enforce it with a redirect).
- Never rename a published URL without adding a 301 redirect from the old path.
  Broken inbound links are ranking signals that are lost permanently.
- Paginated series use `/page/2/` style paths, not query strings (`?page=2`).
  Query-string pagination is not indexed by Google.

## Content and performance
- All images must have descriptive `alt` text that includes the target keyword where
  natural. Empty `alt=""` is only correct for decorative images.
- Images must be served in WebP or AVIF format. No JPEG or PNG without a `<picture>`
  element providing a next-gen fallback.
- Every page must load without render-blocking scripts. No `<script>` without `defer`
  or `async` in the `<head>` unless it is a critical inline script.
- Internal links must use the full path and must not 404. Before adding a link, verify
  the target page exists.

## Definition of done
- `astro check` or `tsc --noEmit` passes.
- `astro build` completes without warnings.
- Running a spot-check: `curl -s <page-url> | grep -c 'canonical'` returns 1.
- No duplicate `<title>` values across built HTML (run `grep -r '<title>'` on dist/).
- JSON-LD is present and valid (use schema.org validator).

Por qué estas reglas

Título y descripción únicos por página es la regla SEO más impactante para sitios de contenido. Los agentes que generan páginas de contenido en masa a menudo reutilizan la misma plantilla de metadatos, produciendo docenas de páginas que son técnicamente distintas pero parecen idénticas a los rastreadores, lo que desencadena penalizaciones por deduplicación suave.
Canónico en cada página, no solo en duplicados es frecuentemente malinterpretado. Los agentes que leen documentación SEO a menudo solo añaden canónicos donde el contenido está claramente duplicado (por ejemplo, paginación). En la práctica, cada página debe auto-referenciar su canónico para evitar que las variantes de rastreo con parámetros dividan la equidad de los enlaces.

Adecuado para

Blogs, sitios de documentación, centros de contenido SEO y sitios de marketing donde la búsqueda orgánica es el principal canal de adquisición.

No es adecuado para

Herramientas internas, paneles de control o aplicaciones donde el SEO es irrelevante — los requisitos de canónico/datos estructurados añaden sobrecarga sin beneficio.

Reglas de codificación de IA para sitios de contenido SEO

AGENTS.md

Por qué estas reglas

Adecuado para

No es adecuado para

Relacionados