Khắc phục sự cố phân trang khi thiết kế web chuẩn SEO (Pagination là gì)

Pagination là gì ? đó là phân trang khi bài viết quá dài và việc này dễ bị Google phạt do Dupcontent khi SEO., Vậy làm thế nào để khắc phục sự cố Pagination cho SEO?

Một chủ đề chắc chắn đang khiến nhiều SEOer quay cuồng, tiếp cận và xử lý việc phân trang thoạt đầu có vẻ rất khó khăn, là vấn đề của TMĐT, báo chí cho đến các diễn đàn. Điểm mấu chốt là nếu bạn làm tối ưu on-page, bạn chắc chắn phải đối mặt với các vấn đề về phân trang – có điều là trong thời điểm nào. May mắn là chúng tôi sẽ chỉ cho bạn lời khuyên để bạn bắt đầu, và trả lời một vài câu hỏi thách thức có thể nảy sinh trong những tình huống ngặt nghèo.

Chính xác thì phân trang (đánh số trang – pagination) là gì? Việc phân trang xuất hiện khi website dàn nội dung trên nhiều trang. Trên một trang TMĐT, nó tồn tại dưới dạng thức danh sách sản phẩm và danh mục. Ở các trang tin tức, các bài báo có thể được chia thành nhiều trang hoặc sắp xếp theo dạng trình chiếu. Trên các diễn đàn, nhóm và các chủ đề trao đôi thường trải rộng ít nhất 2-3 trang. Đến các các nhật ký mở với các bài viết sắp xếp từ mới nhất đến cũ nhất sẽ rơi vào các vấn đề phân trang tại trang chủ.

Bạn có thể nghĩ thế này: “Tôi biết là nó xảy ra nhiều rồi, nhưng rút cuộc thì những nội dung phân trang gặp vấn đề gì?” Từ góc độ SEO, sự phân trang có thể tạo ra các vấn đề nghiêm trọng với khả năng lập chỉ mục nội dung site. Hãy khám phá một vài vấn đề tiềm ẩn có thể phát sinh khi bạn phân trang nội dung mà không chuẩn bị hợp lý:

  • Hạn chế thu thập thông tin

Khi Googlebot thu thập thông tin từ website, chiều sâu (các cấp độ click sâu hơn vào nội dung) mà nó đi qua có thể khác nhau dựa trên thẩm quyền của site và các yếu tố khác. Nếu bạn có quá nhiều nội dung phân trang, khả năng Googlebot đi qua hết các nội dung để chạm và lập chỉ mục các trang cuối sẽ giảm đáng kể.

  • Vấn đề trùng lặp

Dựa theo văn cảnh của việc phân trang, thường một số yếu tố xuyên suốt các chuỗi trang có thể chứa các nội dung tương tự hoặc giống nhau. Thêm vào đó bạn thường xuyên thấy các thẻ tiêu đề và mô tả giống nhau lan truyền suốt phạm vi các nội dung phân trang. Nội dung trùng lặp có thể gây rối cho Googlebot để xác định trang nào cần trả lại trong kết quả tìm kiếm.

  • Nội dung mỏng

Trong các trường hợp các bài báo hoặc đánh giá sản phẩm có thể được phân thành nhiều trang, bạn sẽ chịu rủi ro là không cung cấp đủ nội dung nguyên gốc cho từng trang riêng biệt để được lập chỉ mục riêng rẽ. Quan trọng hơn, điều này tạo ra rủi ro tỷ lệ nội dung trên quảng cáo quá thấp, dễ bị dính Panda.

Thế xử lý làm sao với việc phân trang?

Lựa chọn tốt nhất cho bạn luôn luôn là thiết kế trang tối ưu. Có nhiều cách có thể tránh những vấn đề này từ đầu. Khi lên kế hoạch thiết kế một trang TMĐT hoặc tương tự, thử nghĩ đến các phương pháp có thể giảm thiểu những vấn đề về việc phân trang quy mô lớn:

  1. Tăng số danh mục, từ đó giảm độ sâu của từng chuỗi phân trang.
  2. Tăng số sản phẩm 1 trang, giảm tổng số trang trong chuỗi phân trang
  3. Liên kết tất cả các trang trong chuỗi phân trang có thể quản lý từ trang đầu, từ đó giảm các vấn đề dòng chảy thẩm quyền liên kết và thu thập dữ liệu

Tuy nhiên, trong nhiều trường hợp thực tế, hỏng hóc đã xảy ra và việc đại tu cấu trúc trang không còn có hiệu nghiệm. May mắn là Google đã cho chúng ta nhiều phương pháp để chỉ đạo tốt hơn các crawlers thu thập thông tin đào sâu trong nội dung bị phân trang. Nếu làm SEO, bạn có 3 vũ khí để xử lý các vấn đề có thể phát sinh từ việc phân trang:

Cách 1: Xóa nội dung bị phân trang khỏi chỉ mục

Có nhiều tình huống việc bỏ nội dung bị đánh số trang khỏi chỉ mục là giải pháp tốt nhất. Nếu không có ích lợi gì từ việc để nội dung này được lập chỉ mục và có thể tìm kiếm thì cách dễ nhất là thực hiện một thẻ <META NAME=”ROBOTS” CONTENT=”NOINDEX, FOLLOW”> trong mục <head> vào từng trang trong chuỗi phân trang, trừ trang đầu tiên. Bạn sẽ muốn chắc chắn bao gồm cả thẻ “FOLLOW” ở đây nếu đó là một chuỗi danh sách thuộc bất cứ thể loại nào – từ đó sẽ chắc chắn thầm quyền trang sẽ vào trong các trang đích đến riêng lẻ trong danh sách, ngoại trừ chính cái danh sách được loại trừ khỏi chỉ mục Google. Chèn thẻ “FOLLOW” có thể giúp sự ủy quyền liên kết trong chuỗi phân trang để quay lại trang đầu và phần còn lại của site.

Lợi ích

Bất lợi

Giải pháp ít phức tạp nhất. Dù nó giải quyết các vấn đề đánh số trang tiềm ẩn, nó giảm nội dung trong chỉ mục của Google.
Tốt cho những tình huống không cần lập chỉ mục những nội dung đánh số trang.  

Cách 2: Trang View-All và thẻ rel=“canonical”

Lựa chọn đầu tiên được Google ưa chuộng để giải quyết hầu hết các vấn đề phân trang là tạo ra một trang “View-All” riêng tách biệt khỏi chuỗi phân trang và gộp tất cả các thứ trong một trang. Khi bạn đã tạo rat rang View-All, bạn có thể thay thế thẻ rel=”canonical” trong mục <head> của từng trang thành phần chỉ đến trang View-All. (e.g. <link rel=”canonical” href=”http://www.site.com/view-all-page”/>). Việc này sẽ báo cho Google coi từng trang trong chuỗi phân trang là một phần trong trang View-All và các truy vấn sẽ trả lại trang View-All như đối lập với trang thành phần tương ứng trong chuỗi phân trang.

Google phát biểu rằng đó là phương pháp ưa chuộng để dẫn Googlebot đi hết các nội dung phân trang, và những người dùng thường ưa chuộng một trang view-all. Việc người dùng thực sự thích trang view-all hơn hay không vẫn còn đang tranh cãi và chắc chắn tùy hoàn cảnh. Có một điều trở ngại với phương pháp này – trang View-All phải được kiểm soát đủ để tải trong một lượng thời gian hợp lý, thường được kỳ vọng trong khoảng 2-4 giây. Việc này khiến đây là lựa chọn tuyệt vời để tổng hợp các danh sách sản phẩm và danh mục chỉ văn bản tồn tại trong 5-20 trang nội dung phân trang. Đổi lại, đó là lựa chọn tồi để tổng hợp những bài báo phân trang với nhiều ảnh và danh sách sản phẩm hay danh mục với hàng trăm trang.

Lợi ích Bất lợi
Thực hiện đơn giản Không giải quyết được chuỗi nội dung phân trang lớn hoặc nhiều ảnh.
Giải pháp hàng đầu của Google Nhiều doanh nghiệp không sẵn sàng hoặc không thể thực hiện một trang View-All cho danh sách sản phẩm.
Tất cả nội dung trong dãy phân trang sẽ được xuất hiện trên máy tìm kiếm thông qua trang View-All  
Có thể thể hiện một phương pháp điều hướng thân thiện hơn với người dùng  

Cách 3: Rel=“prev”/“next”

Lựa chọn cuối cùng để xử lý vấn đề phân trang có thể phức tạp nhất nhưng được coi là linh hoạt nhất. Google nhận diện thuộc tính HTML rel=“prev” and “next”  như một phương pháp thể hiện một dãy các trang đánh số. Cách thực hiện có thể phức tạp và bạn phải đặc biệt cẩn thận khi áp dụng. Đây là cơ chế hoạt động.

Bạn có 4 trang được đánh số:

Bằng việc sử dụng rel=”prev”/”next”, bạn dễ dàng tạo ra chuỗi giữa các trang với một dãy các tranh đánh số. Bạn bắt đầu chuỗi với trang 1, thêm mã sau vào mục <head> trong phần HTML:

(Page 1):

<link rel=”next” href=”http://www.site.com/page2.html”>

Đó là bước duy nhất chúng ta thực hiện để bắt đầu chuỗi. Giờ chuyển sang trang 2. Giờ coi trang 2 là trung tâm chuỗi, chúng ta phải đính nó vào cả trang trước và sau nó trong dãy. Trang 2 sẽ có mã sau trong <head>:

 (Page 2):

<link rel=”prev” href=”http://www.site.com/page1.html”>

<link rel=”next” href=”http://www.site.com/page3.html”>

Giờ bạn có thể xác định, vì Trang 3 cũng ở trung tâm dãy trang liên kết với nhau, chúng ta bắt đầu thực hiện đoạn mã theo cách tương tự:

(Page 3):

<link rel=”prev” href=”http://www.site.com/page2.html”>

<link rel=”next” href=”http://www.site.com/page4.html”>

Và chúng ta đã đến trang thứ 4, trang cuối cùng trong chuỗi nội dung đánh số. Trang cuối cùng nên chỉ chứa một thuộc tính thẻ rel =”prev” trong <head>, vì không có trang nào đi xa hơn trong dãy nữa:

(Page 4):

<link rel=”prev” href=” http://www.site.com/page3.html”>

Sử dụng chuỗi hoàn thiện các rel=”prev”/”next”, Google có thể tổng hợp nhóm các nội dung đánh số này thành một mục nhập duy nhất trong chỉ mục. Điều đó báo cho Google coi dãy các nội dung đánh số như một mục nhập trong chỉ mục của họ. Thông thường, trang đầu tiên sẽ được trả lại người dùng vì nó thường phù hợp nhất với một truy vấn cho dãy trang đánh số. Tuy nhiên, Google đã chú ý điều này trong tình huống một trang phù hợp hơn trong dãy được trả lại nếu truy vấn đặc biệt trọng tâm xung quanh nội dung trên trang.

Lợi thế Bất lợi
Linh hoạt Việc thực hiện có thể phức tạp
Cho phép giải quyết các vấn đề phân trang không cần trang View-All Yêu cầu thực thi hợp lý để có hiệu quả
Có thể thực thi hợp lý với sự thay đổi nhỏ trong HTML  

Một điều quan trọng chú ý với rel=”prev”/”next”là chúng sẽ đặc biệt hữu ích trong advanced concepts section, đáng để bạn chú ý rằng bạn đang thực hiện sử dụng thẻ self-referential canonical, chúng sẽ có cùng chức năng như trong chuỗi rel=”prev”/”next”.

Các ý tưởng phân trang nâng cao

Chúng ta vừa điểm qua mục găn bản, giờ sẽ nhìn vào những câu hỏi và hoàn cảnh thú vị hơn khi bạn đã thấy an toàn hơn với việc phân trang.

Thiết lập một Điểm chuẩn

Nếu bạn truy cập server logs, rất đơn giản để xác định thành công với những gì Googlebot đang thu thập nội dung phân trang không được điều chỉnh. Trước khi thực hiện thay đổi, chúng tôi gợi ý chọn một vài chuỗi phân trang trong site và xác định sâu bao nhiêu trang trong chuỗi Googlebot thu thập. Khi đã xác định bạn có thể thực hiện các truy vấn đề tìm ra bao nhiêu trong số trang này mà Google chọn để cho vào chỉ mục.

Việc này sẽ cho bạn một điểm chuẩn bắt đầu để giúp bạn xác định thành công của những nỗ lực. Sau khi thực hiện thay đổi, bạn có thể ghé thăm server logs lần nữa khi Googlebot quay lại để xem liệu tỉ lệ đào sâu và lập chỉ mục đã cải thiện hay chưa.

Thiết lập thanh cuộn AJAX và Javascript

Bạn hẳn đã gặp phải những thanh cuộn vô hạn trên các site TMĐT mà nội dung tải liên tục khi bạn kéo xuống cuối màn hình. Dù đó có thể là một trải nghiệm tốt để cải thiện trải nghiệm người dùng, các chức năng điều hướng dựa trên AJAX và Javascript nên được tiến hành sử dụng Progressive Enhancement.

Việc chắc chắn rằng site sẽ hoạt động phù hợp cho người dùng đã vô hiệu hóa không chỉ quan trọng đối với người dùng mà còn cho phép bạn thực hiện các giải pháp phân trang đã thảo luận trong bài này bên dưới các yếu tố trải nghiệm người dùng được cải thiện. Điều này sẽ cho phép Googlebot thu thập và lập chỉ mục nội dung của bạn phù hợp khi bạn cung cấp những tính năng điều hướng Javascript cho khán giả.

Các dấu hiệu về sự phù hợp: View-All Pages và rel=“prev”/“next”

Bạn có thể thấy bạn may mắn vì có thể chọn liệu nên tiến hành trang View-All hay rel=”prev”/”next”. Dù chúng tôi có những dấu hiệu từ Google để gợi ý View-All là phương pháp được ưa chuộng hơn để kiểm soát các vấn đề phân trang, có rất nhiều trường hợp mà thực hiện rel=”prev”/”next” có thể được minh chứng là lợi ích hơn khi các dấu hiệu phù hợp được cân nhắc.

Hãy nhắc lại rằng Google phát biểu cả View-All Page canonicalization và dãy rel=”prev”/”next”điều tổng hợp tất cả các thẩm quyền liên kết đến những trang có khả năng xếp hạng cho những truy vấn liên quan. Trang View-All sẽ tổng hợp một cách tự nhiên qua thẻ canonical chỉ đến nó và xếp hạng các trang trong dãy rel=”prev”/”next”sẽ thừa hưởng quyền liên kết qua những thuộc tính mà Google dùng để liên kết các trang thành phần với nhau trong chỉ mục.

Giờ việc chúng ta đã thiết lập quyền liên kết sẽ tương tự trong cả hai phương pháp, chúng ta còn lại câu hỏi: Thế các dấu hiệu phù hợp khác ảnh hưởng đến khả năng xếp hạng của trang là gì? Điều gì xảy ra cho các URL độc nhất, các thẻ tiêu đề, mô tả, H1, H2 hay các yếu tố nào khác? Chúng ta biết rằng canonicalization xuất hiện khi sử dụng phương pháp View-All sẽ giải quyết hiệu quả các yếu tố này – Google biết cách xem xét trang canonical để tìm các nội dung này.

Nhưng nếu một loạt trang liên kết với nhau qua rel=”prev”/”next”chứa các thẻ tiêu đề và URL độc nhất, và bất cứ trang nào có cơ hội được xếp hạng cho một truy vấn dựa trên chúng, chúng sẽ giữ những dấu hiệu phù hợp này so với việc quét hết chúng đi thông qua canonicalization.

Rõ ràng, không thể nghĩ đến việc một danh sách phân trang sản phẩm hoặc danh mục đơn giản với nội dung tương tự trong suốt dãy trang. Không có yếu tố phù hợp độc nhất nào có thể thấy giữa “page1.htm” so với “page2.htm”, và không có lợi thế nào đối với “Dresses Page 1” so với “Dresses Page 2”. Nhưng một tình huống thế này thì sẽ ra sao?

 

Sự thật là, không ai biết chính xác Google coi dãy rel=”prev”/”next”trong chỉ mục như thế nào. Tuy nhiên nếu chúng ta biết rằng ít nhất trong một vài trường hợp, các trang sâu hơn trong dãy so với trang đầu sẽ trả lại trong SERP, sẽ an toàn để cho rằng URL, thẻ tiêu đề và các yếu tố khác sẽ vẫn có một vài vấn đề trong việc quyết định sự phù hợp đối với bất cứ truy vấn nào đưa ra,

Các tham số và rel=“prev”/“next”

Trong nhiều trường hợp khi giải quyết rel=”prev”/”next”, URL phân trang sẽ chứa các tham số mà không thay đổi nội dung trang, ví dụ như những ID phiên độc nhất. Một chuyên gia SEO sẽ bảo với bạn những điều này là tin xấu – nếu bạn không cho Google những hướng dẫn cụ thể về cách xử lý với tình huống này bạn có thể khuấy lên các vấn đề về nội dung trùng lặp.

Bạn luôn có lựa chọn là chỉ báo Googlebot không thu thập những URL cụ thể sử dụng các tham số URL trong WMT, nhưng sẽ ra sao nếu bạn muốn bảo vệ quyền liên kết đến với các URL đã đánh tham số? Chúng ta có thể để điều đó xảy ra, sử dụng rel=”prev”/”next”kết nối với thẻ canonical.

Đầu tiên bạn phải đảm bảo tất cả các trang trong chuỗi phân trang rel=”prev”/”next” đang sử dụng cùng tham số. Thứ hai, mỗi URL đánh tham số có thể canonicalize với bản không đánh giam số của URL. Ví dụ, chúng ta có 4 trang như nhau của nội dung phân trang, nhưng lần này người dùng được theo dõi qua session ID là 55.

 

Nội dung Lọc và rel=“prev”/“next”

Giờ hãy nói bạn đang làm việc với các tham số lọc nội dung trong một chuỗi đánh số. Ví dụ, giả dụ chúng ta có một tham số trên một bộ các danh mục sản phẩm được phân trang và được lọc theo thương hiệu, ví dụ:

Page 1: http://www.site.com/page1.html?brand=nike

Trong trường hợp này, nội dung trên từng trang sẽ phụ thuộc vào biến này. Ví dụ:

Page 1: http://www.site.com/page1.html?brand=adidas

Page 2: http://www.site.com/page2.html?brand=adidas

Sẽ trả lại một bộ sản phẩm hoàn toàn khác so với:

Page 1: http://www.site.com/page1.html?brand=reebok

Page 2: http://www.site.com/page2.html?brand=reebok

Nếu bạn tin vào giá trị trong việc lọc loại sản phẩm trong chỉ mục của Google, kế hoạch hành động tốt nhất là tạo ra các dãy phân trang riêng rẽ cho từng lọc thương hiệu. Bạn sẽ không sử dụng thẻ canonical trong trường hợp này vì nội dung sẽ duy nhất tùy vào tham số. Đây là ví dụ về cách giải quyết trường hợp này:

Nội dung sắp xếp và rel=“prev”/“next”

Loại URL gắn tham số cuối cùng chúng ta xem xét là nội dung sắp xếp. Bạn dễ thấy loại tham số này trong thiết lập diễn đàn hoặc blog, mặc dù chúng cũng xuất hiện thường xuyên hơn trên các site TMĐT. Ví dụ:

Khi bạn lần đầu ghé thăm trang, URL có thể thế này:

Page 1: http://www.news-site.com/page1.html?order=oldest

Nhưng có tùy chọn xem bài mới trước, dẫn đến URL này:

Page 1: http://www.news-site.com/page1.html?order=newest

Có nhiều tranh cãi trong cộng đồng SEO là xử lý thế nào với tình huống này. Mặc dù một vài người gợi ý một dãy rel=”prev”/”next” riêng cho cả URL phương pháp sắp xếp “mới nhất” và “cũ nhất”, theo quan điểm của chúng tôi rất quan trọng để chỉ ra cho Google biết bạn muốn chúng lập chỉ mục các dãy phân trang khác nhau của một nội dung giống nhau. Sự khác nhau duy nhất giữa hai nhóm phân trang này là nội dung hiển thị theo thứ tự khác nhau, vẫn dẫn bạn đến rủi ro về nội dung trùng lặp.

Ayima khuyên nên chọn con đường an toàn, và dẫn ra chỉ một dãy phân trang sắp xếp cho Google lập chỉ mục. Phương pháp sắp xếp mặc định chứa phương pháp phân trang rel=”prev”/”next”:

Phương pháp sắp xếp thay thế, trong trường hợp này là mới nhất, cần phải bị chặn khỏi việc lập chỉ mục. Việc này có thể làm được nhanh bằng việc sử dụng công cụ URL Parameters trong Webmaster Tools, chỉ ra thông số và cho phép Googlebot chỉ bò những giá trị mặc định.

Những giải pháp này có thể phức tạp lúc đầu, nhưng rất dễ quản lý nếu bạn đã chỉ ra từng trường hợp phân trang riêng biệt và áp dụng quy tắc phù hợp cho từng hoàn cảnh. Sẽ rất hữu ích để tham khảo biểu đồ này để đơn giản hóa quá trình đưa ra quyết định.

Chúng tôi đã thấy nhiều trường hợp mà rel=”prev”/”next” được thực hiện không đúng, vì thế hay kiểm tra nhiều lần dãy của bạn khi hoàn thành. Xử lý các vấn đề này rất đau đầu, nhưng nếu lên kế hoạch kỹ và thực hiện toàn diện bạn sẽ dẫn Google đi trong site của bạn một cách suôn sẻ trước khi việc phân trang có cơ hội phá làm hỏng ngày đẹp tươi của bạn.

Bạn muốn xem Bản có hình minh họa kỹ lưỡng xin liên hệ VINALINK SEO - Dịch vụ SEO chuẩn Quốc tế >>
Hoặc đi học Khóa Học SEO PRO tại đây

VN:F [1.9.12_1141]
Rating: 4.6/10 (5 votes cast)
VN:F [1.9.12_1141]
Rating: +1 (from 3 votes)
Khắc phục sự cố phân trang khi thiết kế web chuẩn SEO (Pagination là gì), 4.6 out of 10 based on 5 ratings

Google+ Comments

About Vinalink Design

Vinalink design là công ty thuộc Vinalink media - Doanh nghiệp 14 năm kinh nghiệm thiết kế web cao cấp cho hơn 1000 công ty trong đó có Yamaha, Lifan, Toyota, Vietinbank, VNPT, Marine Time Bank, Thiên Đường Bảo Sơn, Thể Công, HUD, Lilama, Honda.... Không chỉ đơn giản là thiết kế web, Vinalink Design tư vấn web theo tiêu chuẩn SEO, SMO, CRO, UI, UX... để đảm bảo quý khách sẽ tăng được ít nhất 50% lượng đặt hàng qua website ! Chúng tôi sẵn sàng cam kết điều này nếu quý vị gọi điện đặt lịch tư vấn : 04-382.12345 (Hanoi). TPHCM, Đà nẵng hay ngoài giờ? : 0915157599. Email : vinalink@gmail.com