Trùng lặp nội dung (duplicate content) là gì ?

Lỗi trùng lặp nội dung (Duplicate content) trên các site đã bị Google phạt nặng, theo đó rất nhiều website đã bị đánh tụt hạng trên công cụ tìm kiếm. Có rất nhiều dạng Duplicate, để hiểu rõ hơn, chúng ta cùng điểm qua những lỗi này. 


nội dung trùng lặp là gì

Trùng lặp nội dung bị Google phạt nặng 

Duplicate content : nghĩa là trùng lặp nội dung giữa các URL khác nhau cùng truy xuất một web page. Ví dụ : 
http://vuivegiaitri.com/index.php


Cả 2 URL trên đều cùng trỏ về trang chủ của vuivegiaitri.com. 

Có 2 loại duplicate content mà bạn nên chú ý. Đó là duplicate trong trang và duplicate ngoài trang. 

1. Duplicate trong trang : 

Nội dung bị trùng lặp bởi các URL cùng thuộc tên miền của trang. Ví dụ phía trên là một dạng duplicate trong trang. Ngoài ra duplicate trong trang còn một số dạng duplicate như sau: 



trung lap noi dung trong site
Duplicate trong trang 

1.1 Session ID :
 

Ví dụ: 
http://example.com/web?ID=123 
http://example.com/web 

Cả 2 cùng trỏ về một nội dung trên website. 

1.2 Tham số thuộc tính trên URL 
Ví dụ : 
http://example.com/web?color=red 
http://example.com/web-red 

Cả 2 cùng trỏ về nội dung web màu đỏ trên website. 

1.3 Thư mục trên URL 
Ví dụ : 
http://example.com/web/design 
http://example.com/design 

Cả 2 cùng trỏ về cùng một nội dung trên website mặc dù đường dẫn thư mục khác nhau. 

1.4 Các tag trên URL 
Ví dụ : 
http://example.com/tag/web-design 
http://example.com/web 

Các 2 cùng trỏ về cùng một nội dung. Chức năng tag này thường được rất nhiều người sử dụng, nhưng nếu không để ý chuyển đổi sang một URL duy nhất thì lỗi duplicate sẽ xuất hiện. 

2. Duplicate ngoài trang: 
Duplicate ngoài trang có 2 trường hợp đáng chú ý. Trường hợp duplicate do trích dẫn lại hoặc duplicate do cố ý spam. 

2.1 Duplicate do trích dẫn : 

Dễ thấy nhất là các trang báo, tin tức hoặc các nội dung hay thường được các trang khác trích dẫn lại. Điều này là tốt nhưng đôi khi cũng gây ra nhiều sự phiền toái. Các search engine không nhận được đâu là bài gốc, thường thì search engine dựa vào độ trust của trang hoặc thời điểm index để xác định nội dung gốc. 

Nhưng cũng sẽ xảy ra trường hợp trang có độ trust cao trích dẫn lại trang có độ trust thấp, làm cho trang chủ nội dung gặp nhiều thiệt thòi trong lỗi duplicate. 

2.2 Duplicate do cố ý spam : 

Một số đối thủ sử dụng thủ thuật làm mờ mắt search engine khi nhân bản ra hàng loạt nội dung giống nhau trên cả trang có độ trust cao cũng như trang có độ trust thấp. 

Bạn cũng biết rằng không phải lúc nào nội dung trên web của bạn cũng được index trước, đôi khi Google vẫn lầm tưởng nội dung mà bạn viết ra chính là duplicate content với các nội dung mà đối thủ mang đi spam. 

Tổng hợp lại, có 2 loại duplicate content : duplicate trong trang và duplicate ngoài trang. Khi bạn nhận diện được chúng, bước tiếp theo là bạn phải suy nghĩ làm thế nào để chuyển đổi các nội dung trùng lập về một phiên bản, giúp các search engine dễ dàng đánh dấu được đâu là nội dung của bạn, việc này vừa giúp bạn nâng cao độ trust của website đồng thời cũng tránh được những sự hiểu lầm không cần thiết của search engine đối với website của bạn. 

Chúc bạn tránh được lỗi Duplicate Content cho website, tránh được những hình phạt của cỗ máy tìm kiếm Google rất khó tính. 

0 nhận xét:

Đăng nhận xét

 
Blogger TemplateTin Hot | Tin Siêu Hot 24/7 © 2013. All Rights Reserved. Powered by Blogger
Top