(VNĐ)
Dòng Sản Phẩm: Học Tập Digital Marketing Online
Hỗ trợ mua hàng
(Bán hàng cả Thứ Bảy và Chủ Nhật)
Để Website được tìm thấy trên Google thì trang Web của bạn phải được Google lập chỉ mục hay còn được gọi là Google Index. Nếu trang web của bạn không được lập chỉ mục thì sẽ không ai tìm kiếm được Website của bạn thông qua công cụ tìm kiếm.
Khi Website không thể tìm thấy trên các công cụ tìm kiếm thì Website của bạn sẽ mất đi một lượng truy cập không hề nhỏ. Điều này sẽ không đem lại hiệu quả kinh doanh dù Website của bạn được đầu tư rất nhiều cả về hình thức và nội dung.
Để khắc phục điều này, chúng ta cần phải chuẩn đoán sự cố lập chỉ mục. Dưới đây là các vấn đề thường gặp nhất. Đây cũng là yêu cầu cho một thiết kế website chuẩn SEO bạn cần phải ghi nhớ để yêu cầu đơn vị thiết kế web thực hiện cho bạn. Cùng TENTEN tìm hiểu tại sao không tìm thấy Website trên Google nhé!
Nội dung chính:
Về mặt kỹ thuật thì tên miền www là một tên miền phụ. Ví dụ, Google xem http://example.com và http://www.example.com là khác nhau
Google phên biệt www và non-www
Hãy đảm bảo bạn đã thêm bản ghi đầy đủ, chính xác và đã redirect www về non www hoặc ngược lại. Đòng thời, bạn cũng cho Google biết tên miền nào là tên miền chính cho website của bạn.
Đây là vấn đề thường gặp nhất đối với các trang web mới. Bạn hãy kiên nhẫn chờ vài ngày (ít nhất), nhưng nếu Google vẫn chưa lập chỉ mục trang web của bạn, hãy đảm bảo sitemap của trang web được tải lên và hoạt động đúng.
Sau khi thiết kế web xong, bạn cần tạo hoặc gửi sơ đồ trang web, bạn hãy làm điều này càng sớm càng tốt. Bạn cũng nên yêu cầu Google thu thập dữ liệu và tìm nạp trang web của bạn thường xuyên.
Hướng dẫn submit sitemap lên Google:
Xem hình hướng dẫn bên dưới.
Cách submit sitemap lên Google
Nếu Google không index hoặc index chậm, bạn cũng có thể sử dụng công cụ Kiểm tra URL để gửi các URL riêng lẻ đến chỉ mục của Google. Xin lưu ý rằng nếu có số lượng URL lớn, bạn nên gửi sơ đồ trang web.
Cách submit URL Google:
Đây là bước quan trọng để đăng ký Website lên Google, sau khi làm Website xong, bạn cần thực hiện ngay để Google index được các nội dung trên Website của bạn.
Một vấn đề khác là website của bạn đã chặn index bằng robot.txt. Điều này hoàn toàn có thể sửa dễ dàng. Chỉ cần xóa mục nhập khỏi tệp robots.txt và trang web của bạn sẽ xuất hiện lại trong chỉ mục.
Cấu trúc file robots chuẩn SEO
Mỗi trang web nên tạo trang sitemap, đây là một bản đồ đơn giản để bot của Google đi theo và lập chỉ mục trang web của bạn. Bạn có thể đọc về chính sách Sơ đồ trang web của Google và tạo một chính sách khá dễ dàng .
Nếu bạn đang gặp vấn đề về lập chỉ mục trên bất kỳ phần nào trên trang web của mình, tôi khuyên bạn nên sửa đổi và gửi lại sơ đồ trang web của bạn chỉ để đảm bảo.
Trong một số trường hợp, Google sẽ không lập chỉ mục một số trang trên trang web của bạn vì nó không thể thu thập dữ liệu chúng. Mặc dù đôi khi con bot không thể lập chỉ mục cho website thì nó vẫn có thể nhìn thấy chúng.
Để xác định các lỗi thu thập dữ liệu này, hãy truy cập Google Search Console → Chọn trang web của bạn, → Nhấp vào Kiểm tra URL → Nhấp vào yêu cầu lập chỉ mục. Nếu bạn có bất kỳ lỗi nào thì hệ thống sẽ trả về cho bạn.
Quá trình Yêu cầu lập chỉ mục cũng là cách đưa trang web lên Google miễn phí.
Quá nhiều nội dung trùng lặp trên một trang web có thể gây nhầm lẫn cho các công cụ tìm kiếm và khiến chúng bỏ cuộc khi lập chỉ mục trang web của bạn. Nếu nhiều URL trên trang web của bạn đang trả lại cùng một nội dung, thì bạn có vấn đề trùng lặp nội dung trên trang web của mình. Để khắc phục sự cố này, chọn trang bạn muốn giữ và 301 phần còn lại.
Đôi khi nó có ý nghĩa để chuẩn hóa các trang, nhưng hãy cẩn thận. Một số trang web đã báo cáo rằng một vấn đề chuẩn hóa nhầm lẫn đã ngăn chặn việc lập chỉ mục.
Nếu bạn có một trang web WordPress, bạn đã có thể vô tình click vào phần tương tác với công cụ tìm kiếm. Chuyển đến Quản trị viên → Cài đặt → Đọc để kiểm tra.
Tệp .htaccess của bạn là một phần của sự tồn tại của trang web của bạn trên máy chủ, cho phép tệp này có sẵn trên web trên toàn thế giới. Tệp .htaccess được viết bằng Apache. Mặc dù .htacess rất tiện dụng và hữu ích, nhưng nó có thể được sử dụng để chặn các trình thu thập thông tin và ngăn chặn việc lập chỉ mục.
Một cách để chặn con bot có thể truy cập vào website là có các thẻ meta noindex. Nó thường trông như thế này:
<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
Xóa dòng mã này và bạn sẽ được bot quay lại ngay tức khắc.
10. Bạn có vấn đề AJAX / JavaScript
Google không index JavaScript và AJAX. Nhưng những ngôn ngữ này không dễ lập chỉ mục như HTML. Vì vậy, nếu bạn định cấu hình không chính xác các trang AJAX và thực thi JavaScript, Google sẽ không lập chỉ mục trang .
Google không thích nó nếu trang web của bạn mất thời gian tải quá quá lâu. Nếu trình thu thập thông tin gặp thời gian tải tối đa, có thể nó sẽ không lập chỉ mục trang web.
Nếu trình thu thập thông tin không thể truy cập trang web của bạn, họ sẽ không lập chỉ mục cho nó. Điều này là đủ rõ ràng, nhưng tại sao nó xảy ra? Kiểm tra kết nối của bạn. Nếu máy chủ của bạn ngừng hoạt động thường xuyên, có thể trang web sẽ không được thu thập thông tin. Và đó là lúc bạn nên lựa chọn một nhà cung cấp hosting mới.
Điều này thực sự là một tin vô cùng xấu đối với bạn.
Nếu bạn bị phạt với một hình phạt thủ công và bị xóa khỏi chỉ mục, có lẽ bạn đã biết về nó. Nếu bạn có một trang web có lịch sử mờ ám (mà bạn không biết) thì đó có thể là một hình phạt thủ công ẩn giấu đang ngăn chặn việc lập chỉ mục.
Nếu trang web của bạn bị cấm chỉ mục, bạn sẽ phải làm việc rất chăm chỉ để đưa nó trở lại. Bài viết này sẽ không đi sâu vào việc này.
Một vấn đề quan trọng nữa làm Website không được tìm thấy trên Google là trang web của bạn chưa được SEO. Do đó Website chưa được tối ưu để tìm thấy trên Google. Đây là vấn đề các doanh chủ hay gặp phải.
Hiện nay để thiết kế website có rất nhiều loại ngôn ngữ lập trình khác nhau như: AJAX, Javascript và HTML. Tuy nhiên không phải ngôn ngữ nào cũng tiện lợi cho việc SEO web, cụ thể ở đây chính là việc hỗ trợ cho quá trình Google index.
Do đó để được index nhanh hơn cũng như hạn chế việc bị từ chối index, chúng ta cần sử dụng loại ngôn ngữ lập trình cho phù hợp khi thiết kế website. Với HTML sẽ là ngôn ngữ lập trình được Google index nhanh nhất, còn 2 ngôn ngữ còn lại sẽ có thời gian index lâu hơn.
Lựa chọn ngôn ngữ thiết kế website ảnh hưởng đến việc index bài viết
Do đó, nếu website gặp tình trạng bị từ chối index thì nếu các nguyên nhân khác không có thì có thể xem xét xem website có phải đang được thiết kế bằng ngôn ngữ AJAX hoặc Javascript hay không? Nếu có thì chúng ta cần tạm dừng quá trình index, xem xét chuyển đổi ngôn ngữ lập trình cho website hoặc tối ưu lại cấu trúc trang cho phù hợp.
Việc không có đội ngũ nhân sự hoặc muốn sử dụng thủ thuật để tiết kiệm thời gian làm SEO mà có những SEOer sử dụng các công cụ để can thiệp kỹ thuật vào quá trình làm SEO với các hành động như:
Tất cả các thao tác trên đều bị Google đánh giá là spam, chất lượng không đạt, không đem lại thông tin giá trị cho người dùng, do đó khả năng cao là các bài viết liên quan sẽ không được index.
Cấu trúc nội dung trên website ảnh hưởng đến việc đọc hiểu của Google trong quá trình thu thập dữ liệu.
Với một website có cấu trúc trang lộn xộn, khó hiểu thì khả năng rất cao là sẽ không được Google index trong quá trình tìm kiếm các truy vấn của người dùng.
Ngoài ra, nếu như cấu trúc nội dung trên trang bị sai hoặc gây hiểu lầm còn có thể sẽ bị Google phạt. Do đó cần lưu ý tối ưu cấu trúc trang chuẩn SEO để tạo điều kiện được lập chỉ mục một cách thuận lợi.
Đây là sai lầm phổ biến với cách tư duy cũ khi làm SEO. Nhiều người cho rằng cứ bỏ vào trong bài viết càng nhiều từ khóa thì khả năng lên TOP lại càng cao.
Google đánh giá cao sự tự nhiên và chất lượng cao trong nội dung bài viết chứ không phải là việc nhồi nhét từ khóa.
Do đó với các trang tập trung nhồi nhét từ khóa quá mức sẽ bị Google đánh giá thấp, cho rằng nội dung không có giá trị thì khả năng cao cũng sẽ không được index.
Hãy tối ưu nội dung bài viết chuẩn SEO bằng cách đầu tư thời gian công sức thay vì sử dụng các kỹ thuật nhồi nhét từ khóa nếu muốn được Google index nhanh.
Trong tất cả các nguyên nhân thì đây có lẽ là nguyên nhân nặng nhất làm mất Google index.
Các website có nội dung gây hiểu lầm, lừa đảo, liên quan đến các vấn đề như: tài chính, sức khỏe, phân biệt giới tính, phân biệt chủng tộc, cơ thể người, hàng cấm, chất gây nghiện, quảng cáo sai sự thật…. hay website có chứa các mã độc, bảo mật thấp,… đều được xếp vào diện có khả năng cao vi phạm các chính sách bảo vệ người dùng của Google.
Trong trường hợp này khả năng bị Google bỏ qua index các trang trên website là rất cao.
Website có chứa phần mềm độc hại có khả năng bị dừng index rất cao
Do đó hãy tập trung xây dựng nội dung phù hợp với khách hàng mục tiêu để hạn chế tối đa các trường hợp vi phạm chính sách của Google hay bị Google phạt.
Vì quá trình xây dựng liên kết cùng với nội dung trên website là một trong những một trong những tiêu chí rất quan trọng để Google đánh giá chất lượng một website chuẩn SEO. Do đó việc các liên kết trên trang và các liên kết trở về trang từ bên ngoài có sự bất thường, đặc biệt là chất lượng không tốt cũng là nguyên nhân chính làm cho website bị mất index.
Hiện tại thuật toán Google Penguin sẽ có nhiệm vụ xử lý các vấn đề xoay quanh việc xây dựng liên kết trên trang, với các hành động bên dưới đều bị Google cho là có sự bất thường trong việc xây dựng liên kết:
Như vậy để tránh được việc bị Google từ chối index thì việc xây dựng liên kết chúng ta cũng phải hết sức lưu ý với các hành động đã được đề cập ở trên.
SEO Website không chỉ giúp tối ưu hóa website thân thiện với bộ máy tìm kiếm, mà còn là giải pháp nâng cao chất lượng nội dung website trong mắt người dùng.
Để cuối cùng, mục tiêu của SEO chính là: gia tăng số lượng & chất lượng lưu lượng truy cập (traffic) của người dùng tiềm năng vào website.