10+ lý do google không index bài viết và cách khắc phục

Thiết kế Web là cả một hành trình dài từ thiết kế, code cho đến lên tất cả ý tưởng content, với mục đích đem lại những trải nghiệm tốt nhất cho người sử dụng.

Vì vậy, thật đáng tiếc nếu như vì sao google không index bài viết được, nhưng đâu mới là lý do chính khiến cho Website của bạn gặp những vấn đề này, hãy thử kiểm tra qua một lần và xem xem Website của chúng ta có phải mắc phải những lỗi sau đây không nhé!

Google Index của là gì?

Chỉ mục của Google chỉ thực tế là danh sách toàn bộ các trang Website mà công cụ tìm kiếm biết. Nếu Google không lập chỉ mục trang Website của bạntrang Web của bạn sẽ không xuất hiện trong kết quả tìm kiếm của Google.

Nó sẽ giống như nếu bạn viết một cuốn sách, mà không có hiệu sách hay thư viện nào lưu giữ cuốn sách đó. Không ai có khả năng tìm thấy cuốn sách. Họ thậm chí có thể không hề biết về sự hiện hữu của nó. Và nếu một độc giả đang tìm kiếm cuốn sách đấy, họ sẽ rất khó tìm được nó.

Tại sao Indexing trang Web lại quan trọng?

Các trang Web không nên lập chỉ mục không có trong cơ sở dữ liệu của Google. Vì thế, công cụ tìm kiếm không thể hiển thị các trang Website này trong các trang chứa kết quả của công cụ tìm kiếm (SERPs).

Để lập chỉ mục các trang Website, trình thu thập dữ liệu Website của Google (Googlebot) cần phải “thu thập dữ liệu” trang Website đó. Tham khảo thêm về sự khác biệt giữa khả năng lấy nội dung và khả năng lập chỉ mục.

google không index bài viết

Như một phần bổ sung, đây là tổng quan nhanh về công thức của công cụ tìm kiếm:

  • Crawling – thu thập thông tin : Các bot của công cụ tìm kiếm lấy dữ liệu trang Web để tìm hiểu coi nó có đáng được lập chỉ mục hay không. Trình lấy dữ liệu Website hay thường được gọi là “Googlebot” luôn lấy dữ liệu Web, theo các liên kết trên các trang Web hiện có để tìm thông tin mới.
  • Indexing – Lập chỉ mục: Công cụ tìm kiếm thêm trang Web vào cơ sở dữ liệu của nó (trong hoàn cảnh của Google là “Chỉ mục”).
  • Ranking – Xếp hạng: Công cụ tìm kiếm thứ hạng trang Website theo các số liệu như mức độ liên quan và cấp độ thân thiện với người dùng.

Lập chỉ mục chỉ có nghĩa là trang Web được lưu giữ trong cơ sở dữ liệu của Google. Không nghĩa là nó sẽ hiển thị ở đầu SERPs. Việc lập chỉ mục được nắm bắt bởi các thuật toán định trước, điều này ảnh hưởng đến các thành phần như nhu cầu của người sử dụng Website và kiểm tra chất lượng.

Bạn có thể tác động đến việc lập chỉ mục bằng cách quản lý cách trình thu thập dữ liệu khám phá thông tin trực tuyến của chúng ta.

Lý do google không index bài viết

1. Website của bạn đã được lập chỉ mục tên miền theo www hoặc không www

Tên miền có chứa www là một tên miền phụ về mặt kỹ thuật, vì thế một tên miền có chứa www và không chứa www là hai đường dẫn không giống nhau.

Vì thê hãy chắc rằng cả hai chỉ số domain này đã được bạn chèn vào trong tài khoản Google Webmaster Tool của bạnHãy xác định cả hai domain có www và không www đã được cài đặt tên miền ưu thích và xác minh quyền sở hữu.

2. Google không tìm thấy website của bạn

Trường hợp này hay xảy ra với những Web mới và chúng ta sẽ phải dành thời gian để Google cập nhật và rà soát dữ liệu. Tuy nhiên nếu Google vẫn không index thông tin cho trang Website của chúng ta thì điều đầu tiên bạn phải là đó là kiểm duyệt xem đã tạo sitemap cho Web chưa và đã khai báo với Google chưa.

Nếu cả hai việc này đã được bạn thực hiện thì bạn buộc phải kiểm duyệt lại tệp sitemap được tạo ra và gởi lên để thông báo với Google coi có gặp trục trặc gì không, nó có hoạt động không. Ngoài những điều ấy ra thì bạn có thể đòi hỏi Google lấy dữ liệu cho Web của mình.

Quá trình này có thể sẽ phải mất 10-15 phút để Google cập nhật, một khi cập nhật thành công thì tiếp tục thực hiện như vậy với đường link khác.

Bên cạnh đó bạn có thể thử nghiệm công cụ Submit URL cá nhân theo đường link sau: https://www/google.com/webmasters/tools/submit-url và chèn url vào ô tương ứng, nhập mã capcha và bấm vào gửi yêu cầu. Khi sử dụng công cụ này, trong một tuần bạn có thể gửi 500 link.

3. Lỗi trong file robots.txt của website sẽ chặn Google lại

Cách dễ nhất để loại bỏ một tệp hoặc cả một thư mục khỏi việc đánh dấu chỉ mục của Google đó là câu lệnh”disallow” trong file robot.txt

Nếu như trang Website của bạn có tệp robots.txt, kiểm tra kỹ file robot.txt để đảm bảo rằng bạn không loại những thư mục mà bạn mong muốn nhìn thấy trên kết quả tìm kiếm của Google.

4. Trang Web của bạn đã có một sitemap.xml chưa?

Mỗi web cần có một sitemap.xml riêng và đây chính là bản kế hoạch giúp Google boot có thể truy cập một cách dễ dàng và cũng là giúp Google tuân theo và lập chỉ mục trang Web của chính bạn. Bạn nên kiểm tra kỹ và kiểm tra lại việc gởi sitemap.xml cho Google một cách nhanh chóng và chuẩn chỉ nhất.

5. Web của bạn có bị lỗi thu thập thông tin?

Google sẽ không thể lập chỉ mục cho Web của bạn trong một vài trường hợp vì lí do Google boot không thể lấy được dữ liệu thông tin trên Web của bạn mặc dù Google boot vẫn nhìn thấy dữ liệu của bạn.

Nếu muốn khắc phục yếu tố này thì các bạn phải vào Google Webmaster Tool => chọn Website của bạn => click mục “thu thập dữ liệu” => “lỗi thu thập dữ liệu”, trong mục này sẽ tổng hợp và thống kê cho các bạn thấy được tất cả link gặp hư hại.

Các bạn nên click trực tiếp từng link sau đấy click tìm nạp như Google để tạo điều kiện cho link bị lỗi của bạn được index trên cơ sở dữ liệu của Google.

6. Web của bạn có quá nhiều thông tin trùng lặp

Nội dung được lặp lại khá nhiều trong một Web có thể sẽ gây nhầm lẫn cho công cụ tìm kiếm và sẽ gây ra hiện trạng Google boot sẽ bỏ lập chỉ mục cho Web của bạn.

Để khắc phục hiện trạng này thì phải sửa nội dungcập nhập nội dungngoài những điều ấy ra bạn có thể sử dụng redirect 301 chuyển hướng những bài viết kém chất lượng sang bài viết có chất lượng. Bản thân bạn có thể sử dụng tool kiểm duyệt trùng lặp nội dung cho trang Websitehiệu quả và nhanh chóng.

google không index bài viết

7. Bạn đã bỏ chế độ riêng tư trên trang Web của mình chưa?

WordPress có tính năng bảo mật theo chế độ riêng tư, tính năng này giúp mọi người có quá trình tạo nội dung mà không index khi chưa có cấu trúc đầy đủ. Để bỏ chế độ này các bạn vào phần quản trị => settings => Search Engine Visibility, bỏ chọn ở công đoạn này là được.

8. Web của chúng ta bị chặn index bởi .htaccess

Tập tin .htaccess thuộc một phần sự tồn tại của trang Web, trong mỗi Website luôn có sự hiện hữu file này, các tập tin .htaccess được biết bằng apache, tập tin này thực sự có ích và tiện dụng vì nó có thể cho chặn index bất kỳ một danh mục nào, ngoài ra còn rất nhiều tính năng khác. Nếu Website bạn đang gặp vấn đề về không index thì đây cũng thuộc một phần để bạn kiểm tra.

google không index bài viết

9. Website của bạn có noindex trong meta tag

Để Web nói không với các robot thì chỉ phải Web của chúng ta có chèn thẻ meta noindex, thường sẽ là

<meta name =”robot” content = ” noindex, nofollow”>

Trong một số trường hợp chúng ta có thể chèn vào Website để thực thi một số hoạt động không giống nhau nhưng vô tình chúng ta bỏ xót đi việc này thì sẽ làm cho nội dung của Website sẽ không được index bởi đã chặn Google boot thu thập thông tin trên Web của các chúng ta. Xóa dòng mã này Website của chúng ta sẽ trở lại bình thường.

google không index bài viết

10. Các đoạn mã AJAX/ JavaScript

Những nguyên nhân Website không index nội dung Web có chứa và dùng các đoạn ngôn ngữ Ajax và JavaScript không được Google nhận xét cao.

11. Tốc độ truy cập trang của bạn quá lâu

Google không thích trang Web nào có thời gian load quá lâu bởi sẽ làm Google boot mất nhiều thời gian để có khả năng thu thập thông tin, nó sẽ rời bỏ trang Web của chúng ta và như thế sẽ không index được nội dung

12. Hosting của chúng ta có vấn đề

Các bạn phải kiểm duyệt xem tốc độ của hosting, bên cạnh đó có những cơ quan cung cấp hosting ngăn chặn sự truy xuất của Google boot. Web của bạn sẽ không thể được index nội dung chỉ vì việc này. Bạn buộc phải kiểm duyệt băng thông của hosting để giải quyết vướng mắc tốc độ của trang Web và đòi hỏi đơn vị mang lại kiểm duyệt cũng giống như loại bỏ tính năng ngăn chặn sự tìm kiếm của Google boot.

google không index bài viết

13. Web của chúng ta bị mất index hoàn toàn

Đây thực sự là trường hợp rất tệ hại bởi có thể trang Website của chúng ta đang bị dính hình phạt của thuật toán, nếu các bạn có một trang Web với lịch sử là trang Web đen, nó cũng sẽ tác động tới việc ngăn chặn index nội dung trên Web của các bạn.

Nếu trang Web của chúng ta đột nhiên giảm tất cả các thông số thì điều đầu tiên là phải kiểm tra lại những Thông báo trong Google Webmaster Tools, tiếp đến là kiểm duyệt rà soát lại các yếu tố như anchor text trỏ về Website, lượng backlink… để có thể tìm ra nguyên nhân chính. Và điều quan trọng hơn cả là bạn phải thực sự nỗ lực làm việc để có thể giúp cho Web index trở lại.

Cách khắc phục lỗi Google không Index bài viết

1. Đăng tải nội dung sáng tạo có giá trị

Những nội dung hữu ích có thành quả íchvới người sử dụng hay được Google đánh giá cao và giúp Website tăng thứ hạng tìm kiếm từ phía người dùng. Nếu bạn bế tắc về nội dung thì có thể đọc thêm các bài trên Google. Mặc dù vậy không nên copy y nguyên vào trong bài mà hãy viết và sáng tạo theo đặc điểm ngôn từ viết của mình.

Cùng với đấy kèm theo hình ảnh mô tả nội dung bên dưới để tăng độ thu hút cho bài viết.

2. Tăng tốc độ tải trang

Bạn có thể hoàn thiện thực trạng load trang chậm dẫn đến thực trạng Google không Index được bài content bằng cách bật bộ nhớ đệm và tối ưu hình ảnh trước khi đăng tải lên trang WebNgoài những điều ấy ra chúng ta có thể giảm bớt số lượng HTTP để tăng độ tải trang cho Website.

3. Hạn chế đường link ngoài Website

Khi trang Website có quá nhiều link dẫn đến quảng bá hay Website khác sẽ liên quan đến trải nghiệm người sử dụng trên trang. Nó không chỉ khiến google không Index được bài viết mà dẫn đến tỉ lệ thoát trang cao.

Còn Nếu bạn muốn để link hãy hướng tới những trang Website hữu ích hoặc tạo ra các backlink chất lượng. Cách này sẽ tăng độ truy cập tự nhiên và tăng tỉ lệ chuyển đổi từ phía người dùng.

google không index bài viết

Backlink chất lượng

4. Kiểm tra file Robots.txt và thẻ Meta Robots

Bạn đang vô tình chặn quyền truy xuất vào một vài trang cụ thể thông qua tệp robot.txt? Hoặc, bạn có đang vô tình làm ra các trang không thể lập chỉ mục? Vì vậy bạn nên kiểm duyệt lại file và mở quyền truy xuất cho người sử dụng và giúp Google nhận diện thông tin dễ dàng hơn.

5. Khai báo lại URL bị hiện trạng noindex trong Google Search Console

Ngoài những cách trên chúng ta có thể truy cập vào Google Search Console copy url bị gắn thẻ noindex và dán vào thanh tìm kiếmtrong search console nhấn tìm kiếm hoặc Enter.

Tiếp đến bấm vào kiểm tra URL đang làm việcphần này nhằm mục đích ép con bot của Google trực tiếp đi vào phân tích url ngay thời điểm đề nghị. Tại đây bạn chỉ việc nhấn Yêu Cầu Lập Chỉ Mục cho Website.

Tổng kết

Toàn bộ những chỉ số chi tiết cang cụ thể thì bạn càng có kế hoạch làm seo dễ dàng hơn, với vướng mắc tại sao google không index bài viết hay như đột nhiên không được index thì các bạn nên mau chóng tìm ra được lý do chính xác, để có được kinh nghiệm cho chính bản thân và có những cách xử lý nhanh nhất nếu bạn gặp phải trường hợp tương tự sau này.