Audit Technical SEO bằng Website Auditor

 

 Audit Technical SEO bằng Website Auditor

Chuẩn bị:

  • Chạy Website Auditor.
  • Chọn bọ Googlebot.
  • Cài plugin Redirection.
  • Tài khoản Google Search Console.
  • Với trang quá lớn, chọn Limit Scan Depth = 2.
  • Cách mở file csv bằng Excel:
    • Mở file bằng NotePad.
    • Save as type, chọn All FilesEncoding, chọn UTF-8.
    • Mở lại bằng Excel.


1. INDEXING AND CRAWLABILITY

Tìm lỗi 4xxx

  • Trong Website Auditor, phần Resource with 4xx status code.
  • Link chi tiết, xem ở phần Links – Broken links.
    • Cột Page chứa link gãy.
    • Cột Link URL là link gãy.
    • Để tìm link gãy, search anchor text, hoặc view source code.
  • Trong Google Search Console – Crawl Errors, cột Not found và cột Soft 404.
  • Tài liệu. 

Sửa lỗi 4xx

  • Plugin hỗ trợ: Redirection (WordPress). 
  • Nếu bài viết cũ đã xóa, và được thay bằng bài viết mới. 301 redirect.
  • Nếu bài viết cần xóa hoàn toàn. 410sTài liệu.
  • Nếu Page sinh ra do Javascript, Flash, cookies, session IDs, frame, mã nhúng embedded, file kỹ thuật… 404s.
  • Nếu chèn link sai do bất cẩn. Sửa lại đường link  / 301 redirect.
  • Không redirect về trang chủ, hoặc chặn index trong robots.txt.  Tài liệu.
  • Chọn Mark as Fixed trong Google Search Console, sau khi sửa lỗi.

Tìm lỗi 5xx

  • Trong Website Auditor, phần Resource with 5xx status code.
  • Trong Google Search Console – Crawl Errors, cột Server error.

Sửa lỗi 5xx

  • Nâng cấp hosting, hoặc đổi nhà cung cấp hosting nếu cần thiết.

Chặn index

  • Download các URL trong phần Resources retricted from indexing.
  • Sort theo cột Robots Instructions để phân loại nhanh.
  • Đánh giá thủ công từng URL.

Setup trang báo lỗi 404

  • WordPress đã tự động setup trang báo lỗi 404.

Kiểm tra robots.txt

  • Kiểm tra trang web đã có file robots.txt hay chưa? (đường dẫn: tenmien.com/robots.txt, ví dụ https://quangsilic.com/robots.txt)
  • Kiểm tra file robots.txt đã khai báo đúng cú pháp hay chưa? (dùng robots.txt Tester trong GMT).
  • Kiểm tra robots.txt có chặn nhầm những trang quan trọng không? Tài liệu.
  • Tham khảo robots.txt của Sen ĐỏWikipedia

Kiểm tra sitemap (.xml)

  • Dùng Yoast SEO / Website Auditor để tạo sitemap.
  • Chèn đường dẫn sitemap vào file robots.txt.
  • Submit và test sitemap bằng Google Search Console.
  • Kiểm tra lại các phần khai báo sitemap trong Yoast SEO (SEO / Search Appearance, phần Media, Taxonomies và Archives).
  • Tài liệu. 

 

2. REDIRECT

www và non-www

  • Kiểm tra phiên bản www và non-www có cùng redirect về cùng một URL không? Ví dụ.
  • Nếu không:
    • Cách 1: Redirect trong file .htaccess. Vào Yoast SEO / Tools, phần .htaccessHướng dẫn.
    • Cách 2: Khai báo cả hai phiên bản www và non-www trong Google Search Console (GSC). Ưu tiên phiên bản chính trong GSC ( Site Setting).
    • Tài liệu. 

HTTP và HTTPS

Nếu dùng HTTP, bỏ qua bước này.  Nếu dùng HTTPS, làm theo các bước sau:

302 redirect

  • Hạn chế 302 redirect, vì không truyền được PageRank.
  • Chỉ dùng 302 redirect để chuyển hướng tạm thời.

301 redirect

  • Dowload các URL có thẻ 301 redirect.
  • Đánh giá sự bất thường.
  • Dùng 301 redirect khi: nâng cấp HTTP lên HTTPS, mua tên miền mới, xóa bài viết, thay đổi URL….
  • Tài liệu. 

Canonical

  • Download các URL có thẻ Canonical.
  • Viết hàm IF để loại bỏ URL trùng lặp cột Page và Canonical URL  (nếu mã nguồn WordPress).
  • Đánh giá thủ công các URL còn lại. Tài liệu.

Còn lại

  • Sửa các lỗi vòng lặp redirect (long redirect chains) nếu có.
  • Thay thế các URL có thẻ meta refresh bằng 302 redirect hoặc thẻ canonical.  Tài liệu.

 

3. ENCODING AND TECHNICAL FACTORS

  • Kiểm tra Mobile Friendly.
  • Kiểm tra HTTPS and mixed content issues.
    • Giải quyết bằng plugin Relly Simple SSL.
    • Nếu còn lỗi, sửa thủ công. Hướng dẫn.
  • Kiểm tra Pages with multiple canonical URLs.
    • Gỡ các thẻ canonical dư thừa, chỉ giữ lại 1 thẻ canonical duy nhất / 1 URL.
  • Kiểm tra Pages with Frames.
    • Hạn chế dùng Frames. Tài liệu.
    • Nếu buộc phải dùng Frames, khai báo thẻ NoFrames.
  • Page with W3C HTML and CSS errors and warnings.
    • Lỗi HTML: làm Google bot không đọc chính xác nội dung.
    • Lỗi CSS: chậm tốc độ tải trang.
    • Đưa lỗi cho đội thiết kế web chỉnh sửa code.
  • Kiểm tra tốc độ.
    • Tool. GTMetrix / Pingdom.
    • Nếu tốc độ < 3s. Tốt.
    • Nếu tốc độ từ 3s – 5s. Trung bình.
    • Nếu tốc độ > 5s. Chậm.
    • Too big pages.  Ưu tiên tối ưu lại tốc độ các Page bị cảnh báo.  Hướng dẫn.

 

Nhận xét

Bài đăng phổ biến từ blog này

Tối ưu nền tảng WordPress

Báo cáo từ khóa