Google Penguin là gì? Các nguyên nhân và cách thoát khỏi thuật toán Google Penguin

Mình là Phúc

SEO tại MINIMO SEO

Đã hơn 10 năm kể từ khi Google giới thiệu về thuật toán Penguin, nó đã dần hoàn thiện qua từng giai đoạn, và hiện tại đã trở thành 1 trong những thuật toán cốt lõi của Google. Nếu không thật sự hiểu rõ về nó, trang web của bạn có khả năng sẽ bị phạt và sụt giảm thứ hạng mà bạn không hiểu nguyên nhân đấy. Chính vì vậy, hãy cùng Minimo tìm hiểu về Google Penguin là gì nhé!

Google Penguin là gì?

ý nghĩa của Google Penguin
Thuật toán Google Penguin được xuất hiện.

Vào năm 2012, Google chính thức tung ra “bản cập nhật thuật toán webspam”, được người đứng đầu nhóm webspam của Google thời điểm đó – Matt Cutts gọi tên là thuật toán Penguin.

Trước khi thuật toán Penguin xuất hiện, liên kết là một yếu tố quan trọng để Google thu thập, lập chỉ mục, phân tích và xác định điểm của trang web.

Bạn có thể hiểu rằng, một trang web nội dung chất lượng thấp cũng có thể xuất hiện ở những vị trí nổi bật trong Organic Search Results (kết quả tìm kiếm không phải trả tiền) vì Google chấm điểm dựa trên việc xây dựng liên kết.

Nhận thấy vấn đề đó, Google Penguin đã ra đời nhằm khen thưởng các trang web chất lượng cao bằng cách tăng thứ hạng, cũng như làm giảm sự hiện diện trên trang kết quả của công cụ tìm kiếm (SERP) của các trang web kém chất lượng với những chiêu trò nhồi nhét từ khóa hay lôi kéo liên kết.

Matt Cutts đã phát biểu tại hội nghị SMX Advanced 2012:

“We look at it something designed to tackle low-quality content. It started out with Panda, and then we noticed that there was still a lot of spam and Penguin was designed to tackle that.”

(Tạm dịch: Chúng tôi đang xem xét việc thiết kế ra thứ gì đó nhằm giải quyết những nội dung chất lượng thấp. Bắt đầu với Panda, nhưng chúng tôi nhận thấy vẫn còn rất nhiều spam và Penguin ra đời để giải quyết vấn đề đó)

Lần đầu tiên triển khai thuật toán Penguin vào tháng 4/2012, nó đã ảnh hưởng đến 3,1% kết quả tìm kiếm theo ước tính của Google. Một điều bạn cần biết đó là Google Penguin chỉ xem xét các liên kết trỏ đến trang web được đề cập và hoàn toàn không xem xét các liên kết đi từ trang web đó.

Vậy, bạn có biết?

Google Penguin phạt các hành vi nào của website?

Google Penguin phạt website như thế nào?
Những hành vi “xấu” mà Google Penguin sẽ phạt.

Link Schemes (lược đồ liên kết): quá trình mà 1 website thực hiện hành vi mua, phát triển, thuê, các backlink từ các trang web kém chất lượng hoặc trang web có nội dung không liên quan, tạo ra một bức tranh giả về mức độ phổ biến của website đó nhằm cố gắng thao túng Google về thứ tự xếp hạng.

Ví dụ: Một công ty bán nội thất xuất hiện tràn ngập trên Internet và thổi phồng một cách quá đáng với nội dung “Công ty nội thất hàng đầu Việt Nam” bằng những cách khác nhau như Spam Blog Comment, Spam thư mục, Spam bài viết,… Hay với cách khác, công ty này sẽ trả tiền để được xuất hiện với liên kết có Anchor Text là “Công ty nội thất hàng đầu Việt Nam” trên một trang web có nội dung không liên quan như 5 Cách để tỏ tình với Crush bao dính.

Keyword Stuffing (nhồi nhét từ khóa): đây là hành động cố gắng đưa vào 1 trang web số lượng lớn từ khóa, hoặc từ khóa chính lặp đi lặp lại nhiều lần nhằm thao túng thứ hạng từ khóa.

Một ví dụ về sự lặp đi lặp lại các từ khóa một cách không tự nhiên mà bạn có thể tham khảo:

“Thợ thông cống ở Thành phố Hồ Chí Minh, anh Nguyễn Văn A là một thợ thông cống có tiếng mà người dân ở thành phố Hồ Chí Minh tin rằng một khi nhà họ có sự cố khi cống bị nghẹt bởi rác thải và họ cần một thợ thông cống ở thành phố Hồ Chí Minh, anh thợ thông cống Nguyễn Văn A sẽ ngay lập tức xuất hiện và giải quyết tình trạng nghẹt cống ở nhà họ.”

Hoặc, anh thợ này cố gắng nhồi nhét lượng lớn tên địa danh vào trong trang web của anh ta:

“Dịch vụ thông cống của công ty anh Nguyễn Văn A sáng lập đã có mặt tại hầu hết các tỉnh thành: TP Hồ Chí Minh, Hà Nội, Tiền Giang, Vĩnh Long, Trà Vinh, Bến Tre, Hậu Giang, Bắc Ninh, Bình Dương, Bình Định, Nghệ An, Thừa Thiên Huế, Vinh, Cần Thơ, Vũng Tàu, Ninh Bình, Kiên Giang, Cà Mau.”

Vậy Google Penguin nhắm đến những đối tượng nào?

đối tượng Penguin hướng dến
Các đối tượng mà Google Penguin nhắm đến.

Trước khi thuật toán này xuất hiện, các SEOer bắt đầu tạo ra những liên kết và chiến thuật đáng ngờ nhằm tăng thứ hạng. Do đó, Penguin sẽ tập trung vào những đối tượng như:

  • Các trang web có liên kết tăng đột biến (Google sẽ nghi đây là sự thao túng).
  • Các trang web có mục đích duy nhất là đặt liên kết hay bán liên kết.
  • Các liên kết được xây dựng bởi những con Bot hay công cụ, Google không tìm được dấu hiệu cho thấy con người có thể đọc những liên kết này.
  • Các trang web có chất lượng bài viết thấp, không quan tâm đến việc cung cấp chủ đề rõ ràng cho người đọc, mà chỉ muốn có được liên kết.
  • Website tham gia vào chương trình hoặc nhóm trao đổi liên kết.
  • Các diễn đàn, blog bị giảm chất lượng do có nhiều người spam comment nhằm mục đích dẫn người đọc về website của mình.
  • Trang web liên kết đến tất cả các trang nội bộ của website với mục đích tạo nhiều liên kết, nhưng lại cản trở trải nghiệm người dùng.

Các bản cập nhật của Google Penguin qua nhiều năm

các bản cập nhật của Google Penguin
Lịch sử cập nhật của Google Penguin qua từng năm.

Kể từ khi ra mắt vào năm 2012, thuật toán Penguin đã có một số chỉnh sửa và hoàn thiện như:

THỜI GIANĐẶC ĐIỂM
Google Penguin 1.024/4/2012Đây là lần đầu thuật toán này ra mắt. Vì để tránh sai sót trong lần đầu tiên thực hiện, Google đã lập một biểu mẫu dành cho những người dùng nếu thấy Penguin phạt nhầm thì có thể khiếu nại, và một biểu mẫu để người dùng báo cáo các trang web spam.
Google Penguin 1.126/5/2012Tác động ít hơn 0,1% các truy vấn. Trong lần này, các trang web ban đầu bị phạt và chủ động xóa những liên kết không tốt đã nhận thấy sự hồi phục nhất định, và những trang web kém chất lượng may mắn thoát trong lần bắt đầu tiên của Penguin cũng dần được tìm ra.
Google Penguin 1.25/10/2012Lần làm mới dữ liệu này có ảnh hưởng đến các truy vấn tiếng Anh và những truy vấn quốc tế khác với con số hơn 0,3%
Google Penguin 2.022/5/2013Penguin 2.0 đã tác động đến khoảng 2,3% truy vấn, lần đầu tiên xem xét sâu hơn trang chủ của trang web và các trang danh mục cấp cao nhất để tìm bằng chứng về việc spam liên kết được chuyển hướng đến trang web.
Google Penguin 2.14/10/2013Lần làm mới này ảnh hưởng đến khoảng 1% truy vấn. Mặc dù không nhận được lời khẳng định từ Google, nhưng qua dữ liệu cho thấy, lần này Penguin đã thu thập dữ liệu và phân tích trang web sâu hơn về việc có chứa các liên kết spam hay không.
Google Penguin 3.017/10/2014Ở lần làm mới dữ liệu này với sự ảnh hưởng ít hơn 1% các truy vấn tìm kiếm, Google Penguin cho phép những người bị ảnh hưởng bởi các bản cập nhật trước đó dần phục hồi, và tiếp tục tìm kiếm những trang web có hành vi spam liên kết.
Google Penguin 4.023/9/2016Ở bản cập nhật thuật toán này, Penguin chính thức trở thành một phần của thuật toán cốt lõi. Khác với những lần trước, Google Penguin sẽ đánh giá dựa trên thời gian thực, khi đi link hay gỡ link kém chất lượng, bạn sẽ nhìn thấy kết quả ngay lập tức.

Làm sao bạn biết được mình có đang bị Penguin tấn công hay không?

Penguin sẽ tấn công web của bạn khi nào?
Cách nhận biết khi nào Google Penguin sẽ “tấn công” website.

Bạn cần phải phân biệt 2 khái niệm sau mới có thể biết được website của mình có đang bị phạt hay không:

  • Penguin: bộ lọc thuật toán của Google áp dụng cho tất cả các trang web.
  • Hình phạt tác vụ thủ công đối với liên kết không tự nhiên: dành riêng cho 1 trang web mà người dùng báo cáo hoặc Google xác định là trang web spam. Người ta suy đoán rằng, Google có thể giám sát thủ công một số ngành đặc thù (như công ty cho vay ngắn hạn) hơn so với các ngành khác (tiệm gà nướng).

Nếu bạn nhận thấy trang web bị sụt giảm thứ hạng hay lưu lượng truy cập vào một ngày mà Penguin cập nhật hoặc làm mới, rất có thể bạn đã bị ảnh hưởng bởi bộ lọc này.

Bên cạnh đó, bạn hãy chủ động trong việc kiểm tra các vấn đề trong trang web của mình như nội dung còn quá ít, nhồi nhét từ khóa quá mức, hay những vấn đề về liên kết từ những trang không liên quan, spam liên kết, thao túng thứ hạng,…

Bạn có thể thông qua các công cụ như Ahrefs, Bing, SEMrush,… để lấy danh sách liên kết của mình.

Vậy nếu lỡ như bạn đã bị phạt, thì phải làm sao? Hãy theo dõi tiếp

Những cách phục hồi khi bị phạt Penguin

Không phải một trang web bị Google Penguin phạt thì sẽ không thể nào lên top được nữa. Bạn chỉ cần cố gắng khắc phục những vấn đề trong trang web ấy, một thời gian sau, trang web bạn có thể sẽ được phục hồi.

1. Disavow

Disavow là hành động mà bạn gửi một tệp từ chối (A Disavow File) đến Google và yêu cầu họ bỏ qua tất cả liên kết ở trong tệp bạn đã liệt kê để chúng không còn tác động nào đến với trang web của bạn.

Khắc phục bằng cách Disavow File.

Như vậy, những liên kết kém chất lượng sẽ không còn gây cho trang web của bạn vấn đề rớt hạng. Nhưng điều đó cũng đồng nghĩa với việc, nếu bạn đưa nhầm những liên kết chất lượng cao vào Disavow File, các liên kết đó sẽ không giúp ích cho việc xếp hạng cho trang web của bạn nữa.

Disavow File chỉ cần có những liên kết là được, vì Google không đọc bất kỳ những ký hiệu nào mà bạn đưa vào đó. Khi bạn đã tải lên Disavow File, Google sẽ gửi cho bạn xác nhận.
Mặc dù Google xử lý tệp từ chối của bạn ngay lập tức, nhưng trang web của bạn sẽ không thể phục hồi ngay sau khi bạn gửi tệp.

Có một điều bạn phải lưu ý, nếu trước đây bạn đã gửi 1 tệp từ chối A cho Google, và bây giờ bạn gửi thêm 1 tệp từ chối B, Google sẽ dùng tệp B thay thế cho tệp A mà không phải là thêm tệp B bên cạnh tệp A. Chính vì vậy, những liên kết mà bạn đã viết trong tệp A, phải viết lại bên trong tệp B.

Bạn có thể lên Google Search Console để tải xuống bản sao của Disavow File.

2. Từ chối liên kết riêng lẻ so với Domain

Bạn nên từ chối các liên kết ở cấp độ domain (tên miền) thay vì từ chối các liên kết riêng lẻ.

Khắc phục Google Penguin bằng cách: từ chối liên kết lẻ.

Tất nhiên, trong một vài trường hợp, ví dụ như trong một trang web lớn có sự kết hợp giữa trang web chất lượng và trang web kém chất lượng, bạn sẽ muốn từ chối các liên kết riêng lẻ.

Nhưng đối với phần lớn các liên kết, bạn có thể thực hiện từ chối dựa trên tên miền. Google chỉ cần thu thập dữ liệu một trang trên trang web đó để liên kết đó được giảm giá trị trên trang web của bạn.

Thực hiện từ chối dựa trên tên miền cũng giúp bạn không cần lo lắng về việc liên kết đó được lập chỉ mục là gì, vì nếu bạn chọn từ chối dựa trên tên miền, Google cũng sẽ xét đến yếu tố này.

thuật toán của Google Penguin
Kiểm tra toàn bộ liên kết.

Bạn cần thực hiện kiểm tra toàn bộ liên kết và xóa hoặc từ chối các liên kết spam hoặc chất lượng thấp nếu bạn nghi ngờ trang web của mình đã lọt vào tầm ngắm của Google Penguin. Như Minimo đã đề cập ở bên trên, Google Search Console sẽ cho chủ sở hữu trang web một danh sách backlink, nhưng nó bao gồm các Dofollow link và Nofollow Link.

Nếu là Nofollow Link, tất nhiên nó sẽ không có tác động đến trang web của bạn. Nhưng hãy lưu ý rằng, trang web có thể xóa nofollow đó trong tương lai mà không cảnh báo cho bạn.

Ngoài ra, cũng có những công cụ bên thứ 3 sẽ hiển thị những liên kết đến trang web của bạn. Tuy nhiên, cũng có một số trang web chặn bot của các công cụ này thu thập dữ liệu trang web của họ, nên chúng không thể hiển thị mọi liên kết trỏ đến trang web của bạn.

Có 2 loại trang web muốn chặn các bot của những công cụ thứ 3 này:

  • Các trang web nổi tiếng chất lượng cao không muốn lãng phí băng thông trên các bot đó.
  • Một số trang web spam sử dụng để che giấu các liên kết chất lượng thấp của họ khỏi bị báo cáo.

Bạn cũng đừng lo lắng những SEO tiêu cực sẽ dùng những liên kết spam để hại trang web của bạn vì Google khá giỏi trong việc nhận ra điều này.

Do đó, việc thực hiện một Disavow File khi không chắc chắn rằng trang web của mình bị phạt là một hành động khá hay ho, bạn phải xem xét thật kỹ lưỡng từng tên miền liên kết để chắc chắn không bị nhầm lẫn vào tệp từ chối những liên kết chất lượng.

Một cuộc thăm dò do SEJ thực hiện vào tháng 9/2017 cho thấy, 38% SEOer không bao giờ từ chối những backlink. Đây là một kết quả khá thú vị.

4. Liên hệ đến những trang web có liên kết muốn loại bỏ

Google khuyên bạn nên cố gắng tiếp cận các trang web và quản trị viên web có liên kết xấu và yêu cầu xóa chúng trước khi bạn bắt đầu từ chối những liên kết đó. Google cũng khuyên rằng, bạn không cần phải trả phí để yêu cầu xóa liên kết, chỉ cần đưa những liên kết đó vào tệp từ chối và chuyển sang bước tiếp theo là xóa liên kết đó.

Một điều chắc chắn rằng, xóa bỏ liên kết xấu là một cách hiệu quả để khắc phục sau khi bị phạt, nhưng không phải là cách duy nhất. Thuật toán Penguin cũng xem xét đến số lượng liên kết tự nhiên và chất lượng cao để tăng thứ hạng trang web của bạn.

Do đó, việc theo dõi backlink không chỉ giúp bạn xóa bỏ những liên kết kém chất lượng, mà còn giúp bạn tìm ra những liên kết tốt để tối ưu.

5. Đánh giá chất lượng liên kết

Đây là một quá trình khá khó khăn. Vẫn còn rất nhiều người nghĩ rằng, 100% các liên kết từ trang .edu đều chất lượng. Có rất nhiều sinh viên spam liên kết đến trang web cá nhân của họ trên miền .edu.

Tương tự, có nhiều trang web trong các miền .edu có liên kết chất lượng thấp. Bạn nên thực hiện quá trình tự đánh giá cá nhân thay vì đưa ra những suy nghĩ mặc định về các miền .edu hay những TLD và ccTLD khác.

6. Không quá tin tưởng vào những liên kết từ trang web được cho là chất lượng cao

Khi bạn được những trang web nổi tiếng đi backlink trỏ về trang web của mình, đừng vội vui mừng mà hãy xem xét kỹ lưỡng. Vì có thể trong mắt bạn, đó là những liên kết chất lượng cao, nhưng đối với Google thì không.

Nhiều SEOer đã xác nhận rằng, những loại liên kết từ các trang web chất lượng cao này thực sự có chất lượng thấp, vì nhiều trang trong số đó đang bán liên kết.

Những suy nghĩ sai lầm về Google Penguin

Do Google không công bố quá nhiều về Penguin đã dẫn đến một số lầm tưởng sai lầm về thuật toán này.

1. Penguin là một hình phạt

Minimo đã giúp bạn phân biệt thuật toán Penguin và tác vụ thủ công đối với các liên kết không tự nhiên ở bên trên.

Hồi phục từ Penguin cần nhiều kinh nghiệm.

Penguin là một thuật toán rà soát trang web rất nghiêm ngặt. Google không thể gỡ bỏ nó theo cách thủ công. Mặc dù thực tế là thuật toán và hình phạt đều có thể gây ra sự sụt giảm lớn về thứ hạng trang web, nhưng có một số khác biệt khá lớn giữa chúng.

Google áp dụng hình phạt thủ công với một trang web khi nhân viên đánh giá của Google xác định được rằng các trang trên trang web này không tuân thủ chính sách của Google về spam.

Khi bạn gặp phải một hình phạt thủ công, bạn không chỉ cần xem lại các backlink của mình và gửi Disavow File đối với những liên kết spam đi ngược lại nguyên tắc của Google mà bạn còn cần gửi yêu cầu xem xét lại đến nhóm web spam của Google. Nếu thành công, hình phạt sẽ được thu hồi; và nếu không thành công thì quay lại xem xét hồ sơ backlink.

Penguin xảy ra mà không có bất kỳ sự tham gia nào của thành viên nhóm Google. Tất cả đều được thực hiện theo thuật toán. Trước đây, bạn sẽ phải chờ thời gian làm mới hoặc cập nhật thuật toán, nhưng giờ đây, Penguin chạy real-time nên việc khôi phục thứ hạng có thể diễn ra nhanh hơn rất nhiều nếu bạn đã thực hiện đủ công việc khắc phục.

2. Google sẽ thông báo cho bạn nếu Penguin đến và kiểm tra trang web của bạn.

Google sẽ thông báo cho bạn biết nếu Penguin đến.

Thật không may, điều này không phải sự thật. Search Console sẽ không thông báo cho bạn rằng thứ hạng của bạn đã giảm xuống do áp dụng Penguin.

Điều này cũng cho thấy sự khác biệt giữa thuật toán và hình phạt. Vì nếu bạn bị phạt tác vụ thủ công, bạn sẽ được thông báo trong Google Search Console.

3. Từ chối các liên kết xấu (Disavow) là cách duy nhất phục hồi khi bị ảnh hưởng của Penguin

Mặc dù cách này sẽ loại bỏ rất nhiều liên kết chất lượng thấp nhưng nó hoàn toàn tốn thời gian và có thể gây lãng phí tài nguyên. Google Penguin xem xét tỷ lệ phần trăm các liên kết chất lượng tốt so với các liên kết có tính chất spam.

Vì vậy, bạn hãy tập trung vào việc tăng số lượng liên kết chất lượng cao mà trang web bạn đang có.

4. Bạn không thể phục hồi từ Penguin

Phục hồi cần nhiều kinh nghiệm để giải quyết.

Tất nhiên là bạn sẽ có thể hồi phục, nhưng đòi hỏi phải có kinh nghiệm trong việc giải quyết chúng. Bạn càng nhận được nhiều liên kết chất lượng cao thì việc giải phóng trang web của bạn khỏi sự kìm kẹp của Penguin càng dễ dàng.

Như vậy, bạn đã tìm hiểu xong những điều cần biết về Google Penguin. Hy vọng nếu không may bị vướng vào thuật toán này, bạn sẽ có kinh nghiệm xử lý chúng.

Bài viết tham khảo

Mình là Phúc
im.dohoangphuc tên đầy đủ là Đỗ Hoàng Phúc, sinh ra và lớn lên tại Sài Gòn, tốt nghiệp tại trường Đại học Khoa Học Tự Nhiên Thành Phố Hồ Chí Minh chuyên ngành địa chất. Phát hiện niềm đam mê với Marketing, đặc biệt là SEO. Phúc đã dành khoảng thời gian từ 2018 để tìm hiểu, thực hành và áp dụng SEO vào doanh nghiệp của mình.

Nhận file Audit website trong 48h

Đằng nào cũng SEO, tại sao không để Minimo thử Audit cho bạn

Hãy để Minimo SEO làm bạn bất ngờ vì những giá trị bạn nhận được. Tất cả đều miễn phí

124 đường số 6 KDC Cityland Park Hill, Phường 10, Quận Gò Vấp, HCM