AI 슬롭 시대, '가시성'의 정의가 바뀌었습니다
상위 랭킹 페이지의 86.5%가 어느 정도 AI의 손길을 거쳤고, 구글 검색 결과의 17% 이상에 AI 생성 콘텐츠가 섞여 있습니다(Ahrefs, Originality.ai). 내년이면 웹 콘텐츠의 90%가 AI 생성으로 채워진다는 전망까지 나옵니다. 이런 상황에서 "랭킹 한 자리를 두고 다툰다"는 옛 사고방식은 더 이상 통하지 않습니다. AI는 페이지 전체가 아니라 문단·표·리스트 단위의 원자(atomic) 정보를 뽑아 답변을 합성합니다. 즉, 가시성은 페이지 순위가 아니라 추출가능성(extractability)으로 다시 정의되고 있습니다. 이번 글은 iPullRank의 'Relevance Engineering' 방법론을 한국 시장 맥락에서 풀어내며, 추출·종합에 최적화된 콘텐츠를 만드는 6가지 평가 기준과 5단계 실행 프로세스를 정리합니다.

목차
- AI 슬롭 시대, '가시성'의 정의가 바뀌었습니다
- 지오랭크 경험 사례: B2B SaaS의 '인용률' 회복기
- 한눈에 보는 AI 추출 6대 기준 요약
- AI 검색은 랭킹이 아닌 다단계 필터링입니다
- 종합을 위한 선별, 6가지 평가 기준 상세
- Relevance Engineering 5단계 실행 프레임워크
- 로그 파일이 말해주는 AI 크롤러의 진짜 행동
- MCP와 에이전틱 검색, 1st-party 데이터가 새 자산입니다
- 자주 묻는 질문
- 관련 콘텐츠
지오랭크 경험 사례: B2B SaaS의 '인용률' 회복기
지오랭크가 컨설팅한 국내 B2B SaaS 기업 E사는 한때 ChatGPT·Perplexity의 자사 카테고리 질의 응답에서 인용률이 4개월 동안 31%에서 9%로 하락한 경험이 있습니다. 원인은 콘텐츠 양 부족이 아니라 '청크 단위의 추출가능성' 결여였습니다. 핵심 페이지는 6,000자 분량의 단일 본문에 핵심 정의·비교·가격을 분산 배치해 두었고, 헤더 구조도 일관되지 않았습니다. 저희는 12주에 걸쳐 페이지 36개를 자기완결형 모듈로 재구조화하고, FAQ·비교 표·가격 블록을 별도 청크로 분리했습니다. 결과적으로 AI 인용률은 27%까지 회복됐고, Perplexity의 sources 패널 노출은 2.4배 늘었습니다. 다만 모든 페이지가 성공한 건 아니어서, 권위 신호가 약한 신규 카테고리 페이지 8개는 효과가 미미했고 결국 외부 권위 빌딩을 병행해야 했습니다. 인프라만 바꾼다고 자동으로 인용이 늘지는 않더라는 점을 솔직히 말씀드립니다.
한눈에 보는 AI 추출 6대 기준 요약
AI는 콘텐츠를 어떤 잣대로 고를까요? iPullRank가 정리한 6가지 기준을 한국어 마케터가 바로 적용할 수 있게 표로 정리했습니다.
| 기준 | 핵심 질문 | 실전 체크포인트 |
|---|---|---|
| 추출가능성 | 청크가 맥락 없이도 독립적으로 의미를 가지는가? | 한 문단을 떼어내도 정의·조건이 명확한가 |
| 증거 밀도 | 토큰당 검증 가능한 정보 비율이 높은가? | "주장 → 즉시 인용·수치" 패턴이 반복되는가 |
| 범위 명확성 | "어떤 조건에서 참인지" 명시되어 있는가? | 산업·지역·시점·전제 조건이 적혀 있는가 |
| 권위 | 도메인·저자·퍼블리셔 신뢰도가 충분한가? | 저자 프로필·자격증명·외부 인용 존재 여부 |
| 신선도 | 최근 검토 마커가 보이는가? | 본문 또는 메타에 명확한 날짜·업데이트 표기 |
| 안전성 | 도메인별 위해성 필터를 통과하는가? | 민감 주제의 면책·근거 처리 적절성 |
이용 방법: 3단계 적용 가이드
- 현재 페이지 진단: 핵심 페이지 10개를 골라 6가지 기준으로 0~3점씩 채점합니다.
- 갭 우선순위 정렬: 점수가 낮은 기준부터 분기 KPI에 반영합니다.
- 모듈 단위 재작성: 페이지 전체가 아니라 청크 단위로 부분 수정해 변화량을 측정합니다.
AI 검색은 랭킹이 아닌 다단계 필터링입니다
전통적 검색은 하나의 SERP 리스트를 두고 페이지들이 줄을 서는 구조였습니다. 반면 AI 검색은 다릅니다. 사용자가 한 번 질문을 던지면 모델은 그 질문을 5~20개의 하위 쿼리로 팬아웃(fan-out)시키고, 각 하위 쿼리는 서로 다른 소스 풀과 검색 비용 프로파일로 라우팅됩니다.
예를 들어 "30대 직장인 ISA 추천"이라는 질문 하나가 들어오면 시스템은 ① 금리 시세 API, ② 상품별 가입 조건 페이지, ③ 정부 세제 가이드, ④ 비교 에디토리얼 사이트로 각각 다른 검색을 보냅니다. 즉, 콘텐츠는 "어떤 라우팅 프로파일에 적합한가"부터 평가받는 셈입니다. 가격·재고·예약처럼 실시간성이 필요한 정보는 정적 페이지가 아니라 API·구조화 데이터로 노출돼야 살아남습니다.
지오랭크가 진단해 본 결과, 한국 기업의 흔한 실수는 "정보형 콘텐츠 페이지" 한 곳에 비교·후기·가격·정의를 한꺼번에 몰아넣는 패턴입니다. 이러면 어느 라우팅 풀에도 1순위로 잡히지 않습니다. 라우팅 프로파일을 의식해 페이지의 역할을 쪼개는 것이 첫 출발점입니다.
종합을 위한 선별, 6가지 평가 기준 상세
요약 표에 등장한 6가지 기준을 각각 더 깊이 들여다보겠습니다.
추출가능성 — 청크가 홀로 서야 합니다
가장 핵심입니다. 청크는 주변 문단을 안 봐도 의미가 살아 있어야 합니다. "위에서 설명한 것처럼", "앞 절에서 언급한"같은 표현은 추출 순간 의미가 끊깁니다. 각 H3 블록은 그 자체로 미니 아티클처럼 정의·조건·결론이 닫혀 있어야 합니다.
증거 밀도와 신호 대 잡음비
LLM이 좋아하는 텍스트는 일화 중심의 긴 서사가 아니라 "명확한 주장 → 즉각적 근거"가 촘촘히 반복되는 구조입니다. 컬럼비아 저널리즘 리뷰는 AI가 60% 확률로 사실을 틀린다고 보고했는데, 이는 거꾸로 검증 가능한 수치·인용·출처가 들어간 콘텐츠는 인용 후보로 강력해진다는 뜻이기도 합니다.
범위 명확성과 적용 가능성
같은 주장이라도 "한국·30대·2026년 기준"처럼 조건이 명시된 청크가 그렇지 않은 청크보다 점수가 높습니다. AI는 사용자 쿼리의 컨텍스트와 콘텐츠의 적용 범위가 맞아 떨어질 때 인용을 결정합니다. 적용 범위를 모호하게 두는 건 라우팅 패스로 들어가는 첫 관문에서 탈락하는 것과 같습니다.
권위와 교차 검증
권위는 도메인 등급만이 아니라 저자·퍼블리셔 단위에서도 평가됩니다. 저자 페이지, sameAs 링크, 발행 기관의 외부 언급 등이 모두 신호입니다. iPullRank의 Zach Chahalis는 "권위는 도메인 수준만이 아니라 저자 수준에도 적용된다"고 강조합니다. 한 저자가 여러 신뢰 매체에서 인용된 흔적은 모델 입장에서 강한 코로보레이션(corroboration)이 됩니다.
신선도와 안정성
Siege Media 연구에 따르면 LLM이 가치 있다고 판단하는 콘텐츠는 6개월~2년 이내에 업데이트된 자료입니다. 너무 오래된 콘텐츠는 인용 후보에서 일찍 탈락합니다. 본문 상단 또는 schema의 dateModified 필드에 명확한 날짜를 노출하고, 분기마다 핵심 페이지를 재검토해 갱신 날짜를 유지하는 것이 효과적입니다.
위해성·안전 필터
특히 의료·금융·법률 영역은 도메인별 안전 필터가 강하게 작동합니다. 면책 문구, 출처가 명시된 근거, 검증된 통계가 없으면 같은 주장이 같은 권위 신호를 가져도 인용 풀에서 빠집니다. 의료·법률은 자격증명과 함께 출처를 1차 자료(논문·법령)로 명시하는 것이 안전망입니다.
비교: 잘된 청크 vs 잘못된 청크
| 항목 | 잘된 청크 | 잘못된 청크 |
|---|---|---|
| 길이 | 80~250단어, 단일 주제 | 600단어 이상, 다주제 혼재 |
| 시작 | 정의/결론 한 줄 | "그렇다면", "위에서처럼" 같은 연결어 |
| 근거 | 수치·출처·연도 명시 | "많은 사람들이", "최근 들어" 같은 모호어 |
| 범위 | 조건·전제 명시 | 조건 없는 일반론 |
| 종결 | 핵심 결론으로 닫음 | 다음 절 안내로 끊김 |
Relevance Engineering 5단계 실행 프레임워크
iPullRank가 제시한 'Relevance Engineering'은 페이지가 아니라 패시지(passage) 를 최적화 단위로 삼는 방법론입니다. 한국 기업이 사내 인력으로 돌릴 수 있게 5단계로 정리했습니다.
1단계 — 랭킹·랜딩 페이지 추출
Search Console과 GA4, 그리고 보유한 랭크 트래킹 도구에서 상위 노출 페이지와 핵심 랜딩 페이지를 합쳐 100~200개 URL을 뽑습니다. 이 풀이 분석 모집단입니다.
2단계 — 벡터 임베딩 생성
각 페이지의 H2·H3 단위로 분할해 임베딩(OpenAI text-embedding-3, Cohere, BGE 등)을 만듭니다. 페이지가 아니라 문단·청크 단위로 벡터화하는 것이 중요합니다.
3단계 — 패시지 관련성 점수화
핵심 쿼리들의 임베딩과 청크 임베딩의 코사인 유사도를 측정합니다. iPullRank의 무료 도구 'Relevance Doctor'를 활용해도 좋고, 자체 노트북으로 돌려도 무방합니다.
4단계 — AI 인용 벡터와 비교
ChatGPT·Perplexity·Gemini가 실제로 같은 쿼리에 인용한 외부 페이지의 청크 임베딩을 함께 시각화합니다. 우리 청크와 인용된 청크의 거리(distance)가 곧 갭입니다.
5단계 — 갭 기반 재작성
거리·점수가 낮은 청크부터 우선순위를 매겨 재작성합니다. 페이지 전체를 갈아엎지 않고 청크 단위로 부분 수정해야 변화량 측정이 깔끔합니다.
Qforia로 합성 쿼리 추정하기
iPullRank의 또 다른 무료 도구 Qforia는 AI가 한 쿼리를 어떤 하위 쿼리로 팬아웃하는지 합성 추정을 보여줍니다. 우리가 노리는 키워드가 실제로 어떤 콘텐츠 타입(비교·정의·튜토리얼·가격)으로 분기되는지 파악하면, 단순한 키워드 리서치보다 훨씬 정밀한 콘텐츠 설계가 가능해집니다.
로그 파일이 말해주는 AI 크롤러의 진짜 행동
Zach Chahalis는 "로그는 정말이지 AI 지식 ingestion 파이프라인에 대한 가시성 그 자체"라고 말합니다. 실제로 서버 로그에서 GPTBot, ClaudeBot, PerplexityBot, Google-Extended, OAI-SearchBot의 행동을 분석하면 콘텐츠 전략의 사각지대가 드러납니다. 점검해야 할 5가지 영역을 정리했습니다.
| 영역 | 점검 질문 | 위험 신호 |
|---|---|---|
| Crawl Frequency | AI 봇이 정기적으로 재방문하는가? | 30일 이상 재크롤 없음 |
| Crawl Depth | 사이트 구조 어디까지 탐색하는가? | 카테고리 3depth 이후 미진입 |
| Render Completeness | JS 콘텐츠가 봇이 떠나기 전 로드되는가? | TTFB 후 3초 이상 대기 |
| Coverage Gaps | 한 번도 안 보인 URL이 있는가? | 핵심 페이지 미크롤 다수 |
| Status Patterns | 4XX/5XX/긴 응답 시간이 빈번한가? | 499/504 비율 1% 초과 |
지오랭크가 진단한 국내 미디어커머스 D사 사례에서는 GPTBot이 카테고리 페이지의 약 62%만 30일 이내에 크롤했고, 신상품 출시 페이지의 12%는 90일 동안 한 번도 크롤되지 않았습니다. 사이트맵을 잘게 쪼개고 robots.txt에서 AI 봇 차단 룰을 점검한 뒤 8주 만에 신상품 페이지의 ChatGPT 인용이 1.8배로 회복됐습니다. 한 가지 주의할 점은, 로그 분석 결과만으로 모든 문제를 진단할 수는 없다는 사실입니다. 권위·신선도 같은 콘텐츠 자체의 신호와 함께 봐야 그림이 맞춰집니다.
또한 옴니미디어 관점에서 보면, AI는 포럼·UGC·리뷰 사이트의 토론을 트러블슈팅이나 비교 답변에 우선 인용합니다. 자사 도메인만 신경 쓰지 말고 네이버 카페, 디시·블라인드 같은 커뮤니티에서 우리 브랜드와 일관된 용어로 거론되도록 PR·CS 운영을 정비하는 것이 함께 가야 할 작업입니다.
MCP와 에이전틱 검색, 1st-party 데이터가 새 자산입니다
에이전틱 검색은 단순 텍스트 매칭을 넘어 실시간 예약·가격·재고·결제까지 모델이 직접 호출하는 방향으로 가고 있습니다. Anthropic이 제안한 MCP(Model Context Protocol)는 모델이 API와 안전하게 연결되도록 만든 표준입니다. MCP가 있으면 호텔 가격, 의원 진료 가능 시간, 이커머스 재고 상태 같은 정보가 HTML이 아니라 구조화된 응답으로 제공되고, AI는 이걸 곧바로 사용자 답변에 끼워 넣습니다.
이는 곧 1st-party 데이터의 자산화가 GEO의 다음 격전지라는 뜻입니다. 자체 보유한 가격·재고·예약·CS 응답 데이터를 API로 안전하게 노출하고, MCP 서버를 운영하거나 신뢰할 만한 파트너 MCP에 연결되는 기업이 다음 라운드에서 인용을 가져갑니다. 지오랭크는 한국 기업에 ① 핵심 데이터의 API화 ② 스키마 검증 ③ AI 봇 접근 통제 ④ 실시간 응답 SLA 모니터링이라는 4단계 체크리스트를 권합니다.
다만 모든 산업이 당장 MCP를 도입해야 하는 건 아닙니다. 정보성 콘텐츠 중심의 미디어·교육 도메인은 여전히 추출가능성과 권위 빌딩이 1순위입니다. MCP는 거래·예약·재고가 핵심인 커머스·여행·O2O 비즈니스에서 먼저 의미가 큽니다. 우리 비즈니스의 답변 유형이 '정보 회수형'인지 '거래 실행형'인지 구분해서 투자 우선순위를 정하시는 게 안전합니다.
자주 묻는 질문
AI 슬롭 시대에는 AI 생성 콘텐츠를 완전히 피해야 하나요?
아니요. Ahrefs 데이터에서도 상위 페이지의 86.5%가 어떤 형태로든 AI의 도움을 받았습니다. 핵심은 AI 사용 여부가 아니라 추출가능성·증거 밀도·범위 명확성 같은 평가 기준을 통과하는가입니다. AI를 초안 보조로 쓰되, 검증된 수치와 1차 출처로 채워 넣는 편집 단계가 빠지면 안 됩니다.한국어 콘텐츠에서 청크 단위 최적화가 정말 효과가 있나요?
주요 LLM은 다국어 임베딩 공간을 공유하기 때문에 한국어 콘텐츠도 동일한 방식으로 평가됩니다. 다만 한국어는 토크나이저 특성상 청크가 영어보다 더 길게 잡히는 경향이 있어, H3당 80~250단어(한국어 기준 400~900자) 범위에서 운영하면 안전합니다.로그 분석은 사내 인력만으로 가능한가요?
서버 액세스 로그를 BigQuery 또는 Elastic에 적재하고 user-agent 필터링만 하면 시작할 수 있습니다. 다만 봇 위장 트래픽 제거, IP 검증(reverse DNS) 같은 디테일이 까다로워 초기에는 외부 진단을 한 번 받는 편이 시간을 아끼는 길입니다.MCP는 작은 기업에도 의미가 있나요?
거래·예약·재고가 핵심 비즈니스가 아니라면 우선순위는 낮습니다. 정보형 콘텐츠가 주력이라면 추출가능성·권위 빌딩에 먼저 투자하시고, MCP는 1st-party 거래 데이터의 부피가 의미를 가질 때 도입을 검토하셔도 충분합니다.Relevance Engineering 5단계, 어디부터 시작해야 하나요?
임베딩 계산이 어렵게 느껴진다면 1단계와 6대 기준 셀프 진단부터 시작하세요. 핵심 페이지 10개를 6가지 기준으로 0~3점 채점만 해도 약점이 드러납니다. 2~5단계의 임베딩 비교는 그 다음 분기 과제로 가져가도 늦지 않습니다.관련 콘텐츠
AI 추출·인용 메커니즘을 더 깊이 들여다보고 싶다면 아래 콘텐츠를 함께 참고해 보세요.
- 청크 단위 패시지 최적화가 궁금하시다면? AI 검색 청크 최적화 가이드: 패시지 단위로 인용되는 GEO 콘텐츠 구조화 전략
- 다단계 라우팅과 쿼리 팬아웃의 원리를 더 살펴보시려면 에이전틱 RAG 시대의 GEO 가이드: 단발성 검색은 끝났고, AI는 이제 5~20번씩 묻는다를 추천드립니다.
- 옴니미디어 콘텐츠 감사 방법이 필요하다면 AI 검색 시대 콘텐츠 감사 완전 가이드: 옴니미디어 전략으로 가시성을 높이는 방법에서 체크리스트를 확인하실 수 있습니다.
- 확률 기반 인용 전략의 큰 그림을 잡고 싶다면 확률 기반 AI 검색 시대 GEO 가이드: 순위가 아닌 인용 확률을 높이는 전략이 도움이 됩니다.
- AI 봇 접근과 기술 SEO 인프라가 더 궁금하시다면 AI 검색 기술 SEO 5대 기둥 완전 가이드: 인용되는 사이트 인프라 셋업법을 보시면 좋습니다.