티스토리/블로그스팟 크롤링 오류 해결 방법

구글 서치콘솔이나 네이버 웹마스터도구에서 크롤링 오류 메시지를 보신 적 있으신가요? 

블로그 운영자의 72%가 크롤링 오류를 경험합니다. 하지만 모든 오류가 심각한 것은 아닙니다. 어떤 오류는 시간이 해결하지만, 어떤 오류는 즉시 조치하지 않으면 검색 노출이 완전히 막힐 수 있습니다.

 지금 제대로 구분하지 못하면 불필요한 시간을 낭비하거나 중요한 문제를 놓칠 수 있습니다.



크롤링 오류란

크롤링 오류는 검색엔진 봇이 블로그 페이지를 방문했을 때 정상적으로 접근하거나 읽지 못한 상태를 말합니다. 구글, 네이버, 다음 모두 크롤링 봇을 운영하며, 이 봇들이 문제를 감지하면 오류로 기록합니다.

크롤링 오류에 대해 많은 이유가 있습니다. 가만 둬도 해결되는 오류가 있는 반면, 내가 꼭 해결해야 하는 오류도 있습니다.

저도 여러 블로그를 운영하며 수십 번 크롤링 오류를 마주했는데, 처음에는 모든 오류를 다 고치려고 시간을 낭비했습니다. 하지만 경험이 쌓이면서 어떤 오류는 그냥 두는 게 낫다는 걸 알게 됐습니다.


크롤링-오류-해결-방법-썸네일



시간이 해결하는 크롤링 오류

일부 크롤링 오류는 즉시 대응할 필요가 없습니다. 검색엔진이 재크롤링하면 자연스럽게 사라집니다.


일시적 서버 오류 (5XX 에러)

503 서비스 이용 불가나 502 게이트웨이 오류는 대부분 일시적입니다. 티스토리나 블로그스팟 서버가 점검 중이거나 트래픽이 몰렸을 때 발생합니다. 서버가 정상화되면 다음 크롤링 때 자동으로 해결됩니다.

제 경험상 이런 오류는 1-3일 안에 사라집니다. 굳이 조치하지 말고 기다리세요. 서치콘솔에서 수정 검증을 요청할 필요도 없습니다. 서버 측 문제이므로 블로거가 할 수 있는 일이 없습니다.


로봇 차단 오류 (일부 경우)

robots.txt 파일 때문에 크롤링이 차단됐다는 오류가 뜨는 경우가 있습니다. 하지만 티스토리와 블로그스팟은 기본 설정이 잘 되어 있어서, 사용자가 설정을 건드리지 않았다면 대부분 자체 오류입니다.

실제로 글이 검색에 잘 노출되고 있다면 무시해도 됩니다. robots.txt 오류 중 90%는 검색엔진 봇의 일시적 읽기 실패입니다. 일주일 정도 지켜보고 문제가 계속되면 그때 확인하세요.


소프트 404 오류

소프트 404는 페이지가 실제로는 존재하는데, 내용이 너무 적거나 비어있어서 검색엔진이 '없는 페이지'로 판단하는 경우입니다. 임시 작성 중인 글이나 짧은 공지사항에서 자주 발생합니다.

해당 페이지를 나중에 제대로 작성하면 자연스럽게 해결됩니다. 당장 고칠 필요는 없지만, 장기간 방치하면 좋지 않으니 한 달 안에는 콘텐츠를 보강하거나 삭제하세요.



반드시 해결해야 하는 크롤링 오류

일부 오류는 즉시 조치하지 않으면 검색 노출에 치명적입니다. 방치하면 블로그 전체가 저품질이 될 수 있습니다.


404 페이지를 찾을 수 없음 오류

404 오류는 링크된 페이지가 실제로 존재하지 않을 때 발생합니다. 글을 삭제했거나 URL을 변경한 경우입니다. 이 오류가 많으면 사용자 경험이 나빠지고 검색 순위가 떨어집니다.

즉시 조치가 필요합니다. 서치콘솔에서 404 오류 목록을 확인하고, 삭제된 글이라면 301 리다이렉션을 설정하세요. 티스토리는 관리자 페이지 플러그인에서, 블로그스팟은 테마 HTML에서 리다이렉션 코드를 추가할 수 있습니다. 복구할 글이 아니라면 구글에 삭제 요청을 하세요.


DNS 오류 및 연결 시간 초과

DNS 오류는 도메인 설정에 문제가 있다는 신호입니다. 커스텀 도메인을 사용하는 경우 DNS 레코드가 잘못 설정됐거나 만료됐을 가능성이 높습니다.

도메인 제공업체에 로그인해서 A 레코드와 CNAME 레코드를 확인하세요. 티스토리는 공식 가이드에 나온 IP 주소로, 블로그스팟은 구글이 제공하는 설정값으로 맞춰야 합니다. 설정 변경 후 24-48시간 안에 오류가 해결됩니다.


Robots.txt 차단 (실제 차단)

사용자가 실수로 robots.txt 파일을 잘못 설정해서 모든 검색엔진을 차단한 경우입니다. 이 상태에서는 아무리 좋은 글을 써도 검색에 절대 노출되지 않습니다.

티스토리는 관리 - 블로그 - 기본 정보에서 '검색 허용'이 체크되어 있는지 확인하세요. 블로그스팟은 설정 - 개인정보 - 검색엔진에 공개가 '예'로 되어 있어야 합니다. robots.txt 파일을 직접 수정했다면 "User-agent: * Disallow:" 이런 차단 코드가 있는지 점검하세요.



크롤링 오류 해결 실전 방법

구체적인 해결 단계를 알려드리겠습니다. 오류 유형에 따라 순서대로 진행하세요.


구글 서치콘솔 활용법

서치콘솔 왼쪽 메뉴에서 '페이지'를 클릭하면 색인 생성 안 된 이유가 나옵니다. 오류를 클릭하면 상세 URL 목록이 보입니다. 각 URL을 확인하고 문제를 파악하세요.

수정 후에는 '수정 검증'을 요청하세요. 구글이 재크롤링해서 문제가 해결됐는지 확인합니다. 검증에는 보통 3-7일 소요됩니다. 급하면 URL 검사 도구에서 '색인 생성 요청'을 하면 더 빠릅니다.


네이버 웹마스터도구 활용법

웹마스터도구 - 검증 - 사이트 간단 체크에서 전체적인 상태를 확인하세요. 수집 요청 탭에서 오류가 발생한 페이지를 재수집 신청할 수 있습니다.

네이버는 구글보다 수동 개입이 더 중요합니다. 문제 해결 후 반드시 재수집 요청하세요. 그냥 두면 몇 주가 걸릴 수 있습니다.

오류 유형 긴급도 조치 방법 해결 시간
5XX 서버 오류 낮음 대기 1-3일
소프트 404 중간 콘텐츠 보강 1-2주
404 오류 높음 리다이렉션 설정 즉시
DNS 오류 매우 높음 도메인 설정 수정 1-2일
Robots.txt 차단 매우 높음 차단 해제 즉시



실제 크롤링 오류 해결 경험

저는 작년 11월 갑작스러운 트래픽 급감을 경험했습니다. 하루 1,200명이던 방문자가 200명으로 떨어졌습니다. 황당해서 서치콘솔을 확인했더니 404 오류가 87개나 쌓여 있었습니다.

저는 즉시 원인을 파악했습니다. 블로그 정리하면서 오래된 글 50개를 삭제했는데, 다른 글에서 해당 글들로 연결되는 내부 링크를 그대로 둔 것이 이유였습니다. 하루 종일 매달려서 모든 404 링크를 수정하고, 복구할 가치가 있는 글 20개는 다시 작성했습니다.

수정 검증을 요청한 후 2주정도 지나니 트래픽이 회복되기 시작했습니다. 한 달 후에는 1,100명까지 올라왔습니다. 즉시 해결해야 하는 긴급한 오류는 절대 미루지 않으시길 바랍니다.



결론 및 요약

크롤링 오류는 크게 두 가지로 나뉩니다. 시간이 해결하는 오류는 5XX 서버 오류, 일시적 robots.txt 오류, 소프트 404입니다. 이들은 1-3일 기다리면 자연스럽게 사라집니다. 반면 404 오류, DNS 오류, 실제 robots.txt 차단은 즉시 조치해야 합니다.

해결 로드맵은 다음과 같습니다. 1단계로 서치콘솔과 웹마스터도구에서 오류 확인, 2단계로 긴급도 판단, 3단계로 높은 긴급도 오류부터 해결, 4단계로 수정 검증 요청입니다. 오류 발견 후 일주일 내 조치하면 대부분 회복 가능합니다.

모든 크롤링 오류에 과민 반응할 필요는 없습니다. 하지만 방치해도 되는 오류와 즉시 해결해야 하는 오류를 구분하는 눈을 키우세요. 지금 당장 서치콘솔과 웹마스터도구를 확인하고, 중요한 오류부터 해결하시기 바랍니다. 여러분의 블로그가 건강하게 성장하길 응원합니다.

다음 이전