Free Shipping on orders over US$39.99 How to make these links

Cách ngăn chặn đánh cắp nội dung website (web scraping)

Cách ngăn chặn đánh cắp nội dung website (web scraping)

Nạn đánh cắp nội dung website hay còn gọi là web scraping đang ngày càng mở rộng trên môi trường internet hiện nay. Rất nhiều chủ website phải đau đầu vì bao nhiêu công sức và chất xám của họ bỏ ra lại bị người khác đánh cắp và thậm chí còn lên top hơn website gốc nhờ nội dung đó. Hôm nay, Lucid Gen sẽ chia sẻ với các bạn một vài mẹo để ngăn chặn việc đánh cắp nội dung website, khiến cho kẻ trộm phải ngán ngẩm và muốn từ bỏ.

Tham khảo thêm

Cần đọc trước khi quyết định

Ban đầu khi bị đánh cắp nội dung website, bạn thường sẽ nóng lòng tìm cách ngăn chặn triệt để. Nhưng bạn nên biết “triệt để” là không thể. Bạn hãy đọc qua các nội dung dưới đây để hiểu bản chất vấn đề và chọn phương hướng hành động phù hợp.

Web scraping là gì?

Web scraping là quá trình thu thập và trích xuất dữ liệu từ một website cụ thể, nhằm phục vụ cho các mục đích của người sử công cụ này. Các mục đích tốt thường là để nắm bắt thông tin, tuy nhiên có nhiều người xấu đã lợi dụng cách này để đánh cắp nội dung website của người khác.

Công việc này được các web scraping bot thực hiện liên tục từng ngày, giờ, phút để nhanh chóng phát hiện ra nội dung mới nhất và mang chúng về cho người sử dụng. Người dùng bình thường khó phát hiện ra scraping bot này, nhưng hãy yên tâm, Lucid Gen sẽ chỉ cho bạn cách nhận diện ra chúng.

Vì sao họ lại đánh cắp nội dung website của bạn?

Có rất nhiều lý do, nhưng phổ biến nhất chính là “không muốn làm mà muốn có ăn”. Muốn có traffic nhưng lười động não viết bài, không tiền thuê nhân viên content xịn nên họ đánh cắp chất xám của người khác cho nhanh.

Kiểu thứ 2 là đi học các “thầy” dạy mấy khóa học kiếm tiền bằng “Auto blog”. Nói thẳng ra là tạo một cái website rồi cài một vài plugin đi đánh cắp nội dung bài viết của các website khác rồi chờ có tiền từ Adsense. Mà mấy thầy ở Việt Nam thì các bạn biết rồi, giàu thật thì để dòng họ các thầy ăn còn không đủ, các thầy chỉ dạy những cách làm giàu đã sắp hết thời thôi. Bạn nào mà thấy mấy khóa này thì bỏ đi để làm người nha, không dễ ăn vậy đâu bạn ạ.

Còn một số kiểu khác nữa. Mà các bạn yên tâm, cái kết thường không tốt đẹp gì đâu. Một cái website chuyên đi cóp nhặt nội dung của website khác thì Google sẽ đánh giá nó rất thấp, có khi cũng chẳng duyệt Adsense. Cóp nhặt lâu ngày thì trở thành thói quen, về sau tụi này cũng không sáng tạo được gì, mãi đi sau bạn thôi.

Họ đánh cắp nội dung website bằng cách nào?

Theo Lucid Gen tìm hiểu thì hiện nay 3 kiểu đánh cắp nội dung website phổ biến. Mình sẽ sắp theo thứ tự từ dễ ngăn chặn đến khó ngăn chặn nhất nhé.

Đánh cắp nội dung thông bằng RSS Feed

Các web scraping bot sẽ truy cập vào các URL RSS Feed của bạn để phát hiện ra bài viết mới nhất. Sau đó nó sẽ đi đến bài viết mới để trích xuất nội dung trên website của bạn rồi đem về máy chủ của nó. Các URL RSS Feed thường có dạng như sau:

Đối với dạng đánh cắp nội dung website này thì rất dễ ngăn chặn, bạn chỉ cần trì hoãn cập nhật RSS Feed và chặn IP các web scraping bot là khá ổn rồi. Cụ thể hơn thì Lucid Gen sẽ làm rõ ở phần dưới nhé.

Đánh cắp nội dung bằng HTML

Các web scraping bot sẽ truy cập vào trang blog và danh mục bài viết của bạn rồi phân tích HTML để phát hiện ra bài viết mới. Sau đó chúng sẽ truy cập bài viết mới để trích xuất nội dung rồi đem về máy chủ của chúng.

Đối với dạng đánh cắp nội dung website này, các web scraping bot không truy cập các URL RSS Feed nên chúng ta sẽ khó phát hiện ra chúng hơn. Nhưng cũng có cách, Lucid Gen sẽ nói rõ hơn trong phần giải pháp ngăn chặn nhé.

Đánh cắp nội dung thủ công

Dạng này thì kẻ trộm nội dung website có tính “cần cù bù siêng năng” hơn, họ sẽ đi “Copy Paste” bằng tay. Gặp dạng này thì không thể ngăn chặn bằng công cụ được. Chỉ có một cách là bạn phải “cần cù” hơn kẻ trộm, thêm nhiều liên kết nội bộ, chèn watermark vào ảnh, sử dụng tên riêng nhiều hơn…

Sửa nội dung, sửa tên, xóa liên kết thì dễ với tụi này (có khi chúng quên sửa luôn), nhưng tạo lại hình ảnh phù hợp với nội dung mà không có watermark thì khá là mệt đấy.

Lợi ích tiềm ẩn khi bị đánh cắp nội dung

Lucid Gen muốn nói với bạn một cách nhìn khác về vấn đề này. Trong nhiều trường hợp, việc bị đánh cắp nội dung cũng mang lại lợi ích cho website gốc đấy nhé.

Google đánh giá cao website của bạn

Một website mà được các webstie khác sao chép lại nội dung thì chắc chắn website đó có nội dung hay, có giá trị cho người dùng. Google dư sức biết được đâu là bài viết gốc, đâu là trang sao chép lại nội dung. Vậy nên, nếu như họ đánh cắp nội dung website của bạn mà họ không giành được vị trí xếp hạng của bạn thì cũng đừng quá lo lắng.

Hãy theo dõi thêm một thời gian, cứ cho họ đánh cắp đi, đến khi nào bạn thấy có dấu hiệu giành vị trí xếp hạng với bạn rồi thì “trảm”. Bạn hãy tưởng tượng 30-50% nội dung website của họ là sao chép từ bạn, bạn trảm một phát bay sạch 30-50% đó luôn thì sướng hơn là trảm 1-2 bài đúng không.

Nhận được backlink từ đối thủ

Một số nơi sao chép nội dung nhưng vẫn giữ nguyên các liên kết nội bộ của bạn, có thể họ quên xóa hoặc cố tình để lại cho đẹp lòng nhau. Thế là bạn vô tình được tăng thêm backlink rồi.

Nếu như họ không mang lại backlink cho website của bạn, bạn hãy thử gửi yêu cầu chèn link bài viết gốc của bạn vào website của họ. Nếu họ đồng ý thì bạn có backlink, nếu họ không đồng ý thì “trảm”.

Trảm: Là tố cáo vi phạm bản quyền lên DMCA và Google. Những trang nào bị tố cáo thành công thì sẽ gánh nhiều hậu quả nặng nề với xếp hạng trên Google tìm kiếm đấy nhé.

Có nên dùng plugin chống sao chép thủ công?

Theo quan điểm của Lucid Gen thì không nên. Vì nhiều lý do như sau:

  • 99% traffic của bạn là người dùng bình thường, chỉ có 1% là kẻ trôm thủ công thôi. Bạn đừng vì 1% này mà làm khó 99% người dùng còn lại. Đôi khi người ta cần sao chép nội dung, hình ảnh từ website của bạn cho mục đích tốt hơn như học thuật, chỉ dẫn cho bạn bè…
  • Bản thân Lucid Gen cũng cảm thấy khó ưa khi vào mấy trang không cho sao chép, không có click chuột phải. Mình có cảm giác là chủ của các website này hơi ít kỷ.
  • Chỉ cần cài một tiện ích như Enable Copy là có thể dễ dàng vô hiêu hóa tính năng cấm sao chép rồi. Dân thường thì không biết chứ dân chuyên đi trộm nội dung thì biết hết trơn rồi bạn.
  • Làm nặng website của bạn thêm.

Vậy nên bạn khỏi cài mấy cái plugin chặn sao chép nội dung nha. Không có tác dụng với kẻ trộm đâu, chỉ làm người dùng khó chịu thôi à.

Cách ngăn chặn việc đánh cắp nội dung website

Lướt qua phần trên chắc bạn đã hiểu vấn đề đánh cắp nội dung website là như thế nào. Vấn đề này ảnh hưởng nghiêm trọng đến website của bạn ở mức độ nào thì hãy chọn giải pháp phù hợp theo mức độ đó. Hoặc tốt nhất là sử dụng cùng lúc tất cả giải pháp luôn nhé.

Lucid Gen khẳng định rằng, tuy không thể giúp bạn xử lý “triệt để” vấn đề này. Nhưng nếu bạn áp dụng tất cả biện pháp dưới đây thì chắc chắn nạn đánh cắp nội dung website sẽ giảm với website của bạn. Nếu có biện pháp hiệu quả mới thì mình sẽ cập nhật thêm vào bài viết này.

Cách ngăn chặn đánh cắp nội dung website

Chặn IP của web scraping bot

Để làm được cách này thì bạn phải xem cách cài đặt Wordfence Premium. Chúng ta sẽ nhờ Wordfence ghi chép lại lịch sử IP, Hostname và User-agent đã truy cập vào website của bạn. Từ đó lọc ra các web scraping bot để chặn chúng.

Bước 1: Bạn cài đặt chế độ Live Traffic. Bạn vào Wordfence > Tools rồi cài đặt như sau.

  • Amount of Live Traffic data to store (Số lượng nhật ký truy cập): 500-5000 tùy traffic website của bạn, có thể chọn một số bằng 1/4 traffic của bạn.
  • Maximum days to keep Live Traffic data (Thời gian lưu trữ nhật ký): 7-14 ngày.
  • Traffic logging mode (Chế độ nhật ký traffic): ALL TRAFFIC (Tất cả traffic).
Dùng Wordfence để chặn IP các web scraping bot đang đánh cắp nội dung website của bạn
Dùng Wordfence để chặn IP các web scraping bot đang đánh cắp nội dung website của bạn

Bước 2: Bạn lọc ra các bot scraping bot để chặn chúng. Bạn nhấp vào Show Advanced Filters (Hiển thị bộ lọc nâng cao) > Chọn URL > contains > feed để xem các web scraping bot nào đã truy cập vào URL RSS Feed của bạn.

Đặc điểm nhận dạng của các web scraping bot như sau:

  • User-agent thường là Bot, bạn thấy bot chắc chắn là nó rồi đó. Một số công cụ đánh cắp nội dung có thể tạo ra User-agent là Human (người thường), trường hợp này hơi phức tạp, mình sẽ chỉ ở đoạn dưới.
  • Thường xuyên truy cập vào website của bạn với thời gian rất đều đặn, ví dụ như cứ 5-10-15-20-25 phút 1 lần.
  • Hostname và User-agent có chứa các từ: feed, content, newspaper…

Lưu ý tránh nhầm lẫn với các scraping bot thân thiện:

  • Bot của Google sẽ có Hostname là crawl-X.googlebot.com, trong đó X sẽ trùng với IP của bot. Còn những Hostname nào có chữ “google” nhưng không phải googlebot.com thì có thể là giả mạo nha anh em.
  • Bot của các trang mà bạn đã tạo bookmark hoặc backlink thì tên bot sẽ thường chứa luôn tên website hoặc tên miền website đó, bạn tạo bookmark hay backlink ở trang nào thì bạn nhớ để đối chiếu nhé.

Bây giờ bạn chỉ việc nhấp vào nút BLOCK IP để chặn các web scraping bot này. Để ý đặc hiểm nhận dạng của chúng như dải IP, tên Hostname, tên User-agent để làm thêm các bước nâng cao.

Block IP và tìm đặc điểm chung của các web scraping bot đang đánh cắp nội dung website của bạn
Block IP và tìm đặc điểm chung của các web scraping bot đang đánh cắp nội dung website của bạn

Bước 3: Bạn thêm lệnh chặn các web scraping bot khi có đặc điểm nhận dạng ở bước 2. Bạn vào Wordfence > Blocking > Custom Pattern vào cấu hình như sau.

Lưu ý: Bạn chỉ điền IP Address Range hoặc Hostname hoặc User-agent cho mỗi lệnh chặn nhé. Điền hết cả 3 thì có nghĩa là phải đúng cả 3 đặc điểm này thì mới bị chặn.

  • Block Reason: đặt một cái tên chung cho bạn dễ nhớ là được, Web scraping bot chẳng hạn.
  • IP Address Range: các công cụ đánh cắp nội dung website thường đổi IP lắm. Bạn hãy chặn nó bằng cách thay số cuối thành 0/24 nhé. Ví dụ IP mà bạn đã block là 192.168.200.200, nó có thể đổi thành 192.168.200.201 để tiếp tục đánh cắp nội dung của bạn, vậy thì bạn hãy chặn 192.168.200.0/24
  • Hostname và User-agent: bạn điền *từ khóa*, ví dụ có con bot nào mà Hostname hay User-agent của nó thường chứa từ “newspaper” thì bạnh sẽ điền *newspaper*. 2 dấu sao có nghĩa là cho dù phía trước hay phía sau từ khóa này có thêm từ nào hay không thì cũng bị chặn.
Thêm lệnh tự động chặn các web scraping bot đánh cắp nội dung website của bạn
Thêm lệnh tự động chặn các web scraping bot đánh cắp nội dung website của bạn

Vậy phải làm sao với các web scraping bot có Hostname và User-agent như người bình thường?

  1. Bạn biết website nào đánh cắp nội dung của bạn đúng không? Hãy tìm IP của các website đó và chặn cả dải IP. Các plugin đánh cắp nội dung website trong WordPress sẽ bó tay với bạn. Thỉnh thoảng bạn kiểm tra lại các website này có đổi sang máy chủ mới hay không để tiếp tục thêm dải IP mới vào lệnh chặn. Kẻ trộm sẽ không vì trộm nội dung của bạn mà sắm nhiều máy chủ đâu, tiền đó để thuê content xịn còn hơn.
  2. Dựa vào tần suất truy cập, như mình có nói ở phần đặc điểm nhận dạng, các web scraping bot sẽ truy cập theo thời gian đều đặn 5-10-15-20-25… phút 1 lần. Nếu bạn phát hiện được IP nào có tần suất truy cập như vậy thì hãy chặn dải IP đó. Trong phần Live Traffice bạn nghi ngờ IP nào thì nhấp vào SEE RECENT TRAFFIC để xem tất cả traffic của IP đó có giống bot không. Hiện tại mình chưa tìm cách nào hay hơn, tuy nhiên mình tin có là cách để đếm các IP truy cập nhiều trong ngày, bạn tìm hiểu về chống click tặc Google Ads thì có thể tìm ra giải pháp.

Cách này Lucid Gen thấy đơn giản mà hiệu quả với dạng đánh cắp nội dung thông qua RSS Feed. Mục tiêu là để cho kẻ trộm index sau bạn, mà index sau thì Google biết là sao chép của bạn rồi.

Bạn chèn đoạn code này vào trong file functions.php của giao diện. Sửa số và đơn vị tính thành khoản thời gian trì hoãn cập nhật RSS Feed mà bạn muốn. Ví dụ trong code này là trì hoãn 12 giờ, nếu website của bạn index chậm thì bạn có thể tăng lên vài ngày.

//Delay RSS Feed by LucidGen.com
function publish_later_on_feed($where) {
    global $wpdb;
    if ( is_feed() ) {
        $now = gmdate('Y-m-d H:i:s');
 
        $wait = '12'; // integer
        $device = 'HOUR'; //MINUTE, HOUR, DAY, WEEK, MONTH, YEAR
 
        $where .= " AND TIMESTAMPDIFF($device, $wpdb->posts.post_date_gmt, '$now') > $wait ";
    }
    return $where;
}
add_filter('posts_where', 'publish_later_on_feed');
Trì hoãn cập nhât RSS Feed khiến cho bên đánh cắp nội dung website index chậm hơn
Trì hoãn cập nhât RSS Feed khiến cho bên đánh cắp nội dung website index chậm hơn

Lucid Gen biết bạn sẽ tự hỏi “vậy thì tăng lên vài tháng hoặc tắt luôn RSS Feed có phải ngon hơn không?” (vì mình cũng từng nghĩ như thế mà).

Nhưng bạn không nên làm vậy, trong phim hay có câu “Rút dây động rừng”. Cứ để kẻ trộm dùng cách đơn giản thì bạn ngăn chặn cũng đơn giản. Nếu chúng vào RSS Feed không được hoặc thấy thiếu quá nhiều bài mới đang có trên website của bạn, chúng có thể nghi ngờ và tìm cách nào đó VIP PRO hơn thì bạn mệt mỏi hơn đấy.

Hãy nhớ mục tiêu của cách này là: Để cho những trang sao chép nội dung của bạn thông qua RSS Feed phải index sau bạn.

Cách này thì xưa rồi, web scraping bot bây giờ đã tự truy cập vào bài viết để đánh cắp nội dung chứ không phải chỉ lấy từ trong RSS Feed nữa. Nhưng mà bạn cứ cài đặt cho nó đầy đủ vậy. Bạn vào Settings (Cài đặt) > Reading (Đọc) và chọn chế độ Excerpt (Tóm tắt) cho RSS Feed nhé.

Rút ngắn nội dung trong RSS Feed là cách cũ để hạn chế bị đánh cắp nội dung website
Rút ngắn nội dung trong RSS Feed là cách cũ để hạn chế bị đánh cắp nội dung website

Random class trong HTML trang nội dung

Cách này mình nghe các cao nhân trong các hội nhóm bình luận. Chứ còn làm sao thì mình cũng chưa làm được. Random class trong HTML thì không khó, nhưng phần CSS cũng random theo thì có vẻ hơi căng. Mình sẽ nghiên cứu rồi cập nhật vào bài viết sau vậy. Cách này là giải pháp cực mạnh chống được dạng ăn cắp nội dung từ HTML. Ví dụ như Facebook, Google cũng đang sử dụng random class.

Thêm nhiều liên kết nội bộ trong nội dung

Cách này thì dễ làm, khi viết bài bạn hãy chèn nhiều liên kết nội bộ có liên quan đến nội dung chính. Mục đích chính là để người đọc tham khảo thêm thông tin từ bài viết khác nhưng hỗ trợ cho bài viết chính. Mục đích phụ là làm giảm chất lượng nội dung sau khi bị đánh cắp.

Sau khi đánh cắp thì kẻ trộm thường xóa liên kết nội bộ của bạn. Vậy bạn hãy tưởng tượng xem, có những phần trong bài viết gốc chỉ dẫn cho người đọc xem thêm một bài viết khác để có thêm thông tin, thì bài viết được đánh cắp lại không có các liên kết này. Người đọc sẽ khó chịu và có thể nhận ra đây là nội dung bị đánh cắp. Về tổng thể thì sức mạnh của backlink nội bộ trong bài viết bị đánh cắp không bằng bài viết gốc, nên không hỗ trợ SEO bằng bài viết gốc được.

Thêm watermark (logo) vào hình ảnh

Nếu bạn để ý, bạn sẽ thấy tất cả hình ảnh trên website Lucid Gen đều có watermark. Nếu kẻ trộm sử dụng ảnh gốc của bạn thì chẳng khác nào đang quảng bá website giùm bạn. Cách làm thì rất dễ, bạn có thể xem cách chèn logo vào ảnh hàng loạt để làm cho nhanh nha.

Lucid Gen muốn bạn lưu ý một điều, “đừng chèn logo vào một góc”. Những kẻ trộm sẽ chèn logo của chúng to hơn và đè lên logo của bạn, hoặc là chúng sẽ cắt bỏ phần có logo của bạn luôn. Chèn làm sao mà không ảnh hưởng nhiều đến người dùng nhưng làm cho kẻ trộm không thể nào che dấu được logo của bạn nhé. Chèn như Lucid Gen là chắc cú, mấy anh ShutterStock hay Freepik cũng vậy đó.

Sử dụng DMCA và tố cáo các trang đánh cắp nội dung

Nhiều bác bảo là dùng DMCA làm gì, tụi nó vẫn đánh cắp nội dung như thường, lại còn cho DMCA backlink miễn phí. Nghe có vẻ hợp lý nhưng không thuyết phục được mình.

  1. Bạn cho DMCA backlink: DMCA cũng cho bạn lại backlink mà, bạn cũng có thể sửa code thành nofollow nếu bạn thích, nhưng nofollow thì làm sao bot của Google đi qua đó để lấy backlink cho bạn. Vì thế đừng ít kỷ quá.
  2. Bạn vẫn bị đánh cắp nội dung: Đúng rồi, DMCA chỉ giúp bạn ở khâu tố cáo thôi.
  3. Tố cáo lên Google thì không cần DMCA: Chưa đúng, một số trường hợp Google sẽ yêu cầu bạn cung cấp thêm bằng chứng để thuyết phục. Cái đơn giản nhất để bạn gửi cho Google là liên kết DMCA đó. Mình từng tố cáo 180 URL sao chép nội dung của Lucid Gen trong 1 đơn, Google đã yêu cầu mình cung cấp thêm chứng cứ, mình đã gửi liên kết DMCA cho Google và sau đó 180 URL đó đã bốc hơi khỏi kết quả tìm kiếm. Có nhiều cách để DMCA giúp bạn (chẳng hạn như tố cáo lên nhà cung cấp hosting, áp dụng với nước ngoài), cơ bản nhất thì nó cũng cho Google thấy thời gian bảo vệ bài viết của bạn cao hơn của bên ăn cắp, hoặc nếu bên ăn cắp không có DMCA thì nó thua luôn.

Vậy thì: Nên dùng DMCA, miễn phí cũng được, nâng cấp lên Pro càng tốt (Pro để kẻ trộm và Google cảm thấy bạn “không phải dạng vừa đâu” và có thêm vài tính năng khác). Sau khi vừa đăng bài viết xong thì bạn tự nhấp vào DMCA ít nhất 2 lần để nó tạo trang bảo vệ bài viết mới cho bạn.

Bài viết này mình không nói thêm về DMCA quá nhiều, bạn hãy truy cập dmca.com để tạo một tài khoản > lấy mã DMCA > quay lại WordPress > Appearance (Giao diện) > Widgets để thêm mã DMCA vào chân website của bạn.

Widget để thêm mã DMCA vào chân trang” class=”wp-image-18131″ data-lazy-src=”https://lucidgen.com/wp-content/uploads/2021/09/9-cach-ngan-chan-danh-cap-noi-dung-website-web-scraping.png”>
Vào Giao diện > Widget để thêm mã DMCA vào chân trang

Nếu bạn không thương lượng được với bên sao chép nội dung của bạn về việc gỡ nội dung vi phạm hoặc thêm backlink cho bạn thì bạn mới làm cách này nhé. Từ bi một chút biết đâu được backlink.

Bước 1: Bạn truy cập trang Google Copyright Removal và điền các thông tin như sau.

  • Tên: tên của bạn.
  • Họ: họ của bạn.
  • Tên công ty: có thể bỏ trống.
  • Chủ bản quyền mà bạn đại diện: Bản thân người dùng. Tích vào dấu xác nhận.
  • Địa chỉ email: email của bạn, tốt nhất là Gmail đang quản lý Google Search Console cho website của bạn.
  • Quốc gia/Vùng: Việt Nam.
  • Thông tin đã gửi có liên quan đến hành vi truyền trực tuyến trái phép một sự kiện trực tiếp sắp diễn ra không: Không đúng.
Điền thông tin cơ bản để gửi report cho Google
Điền thông tin cơ bản để gửi report cho Google

Bước 2: Điền thông tin các URL sao chép nội dung của bạn bạn. Bao gồm 3 phần như sau.

  • Xác định và mô tả tác phẩm có bản quyền: bạn dán lại đoạn nội dung bị sao chép tại đây, có thể dán cả URL hình ảnh của bạn, tối đa 500 ký tự.
  • Chúng tôi có thể xem mẫu được cấp phép của tác phẩm ở đâu: URL chứa nội dung gốc trên website của bạn.
  • Vị trí của tài liệu vi phạm: URL chứa nội dung sao chép trên website của kẻ trộm.
Điền thông tin về nội dung bị đánh cắp để gửi report cho Google
Điền thông tin về nội dung bị đánh cắp để gửi report cho Google

Bước 3: Bạn tích hết vào các điều khoản bên dưới, điền ngày gửi đơn tố cáo và Tên Họ của bạn vào chữ ký rồi gửi.

Tích vào các ô điều khoản, điền ngày và chữ ký rồi gửi report cho Google
Tích vào các ô điều khoản, điền ngày và chữ ký rồi gửi report cho Google

Bạn có thể theo dõi kết quả tố cáo tại trang Legal Removal Dashboard, đồng thời theo dõi hộp thư của bạn xem Google có gửi email yêu cầu thêm thông tin gì không.

Yêu cầu Google Index bài viết ngay khi vừa viết xong

Đây là vấn đề quan trọng, bạn phải khai báo cho Google biết bài viết mới của bạn ngay khi bạn vừa đăng nó. Bạn truy cập vào Google Search Console > Dán URL bài viết mới vào ô tìm kiếm > Kiểm tra URL > Yêu cầu index.

Yêu cầu Google Index bài viết ngay khi vừa viết xong
Yêu cầu Google Index bài viết ngay khi vừa viết xong

Nếu bạn đang dùng WordPress, bạn hãy sử dụng thêm plugin Instant Indexing for Google để gửi index ngay khi vừa nhấp nút Đăng nhé.

Nhờ Google thông báo các trang có nội dung của bạn

Google có rất nhiều tiện ích thụ vị mà chúng ta chưa khám phá hết. Bạn có thể nhờ Google Alerts gửi thông báo cho bạn mỗi khi trên kết quả tìm kiếm xuất hiện một URL mới có chứa nội dung mà bạn cần.

Bước 1: Bạn truy cập trang Google Alerts > điền một câu nào đó trong bài viết của bạn vào ô tìm kiếm rồi Enter.

Nhờ Google thông báo khi có ai đó đánh cắp nội dung website của bạn
Nhờ Google thông báo khi có ai đó đánh cắp nội dung website của bạn

Bước 2: Bạn cài đặt cách thông báo cho bạn như sau.

  • Tần suất: Ngay lặp tức / Tối đa một lần mỗi ngày
  • Nguồn: Tự động
  • Ngôn ngữ: Tiếng Việt
  • Vùng: Mọi vùng
  • Số lượng: Tất cả kết quả
  • Gửi tới: email của bạn
Cài đặt chế độ gửi thông báo cho Google Alerts
Cài đặt chế độ gửi thông báo cho Google Alerts

Sử dụng tên riêng thay vì “tôi” và “mình”

Bạn hãy sử dụng tên riêng của bạn hoặc tên thương hiệu website của bạn nhiều hơn, thay vì chỉ dùng các đại từ nhân xưng như “tôi” và “mình”. Điều này giúp cho người đọc nhận ra đây là nội dung lấy từ website của bạn, nếu như kẻ trộm quên sửa chúng hoặc sửa mà còn xót.

Lời kết

Tóm lại cách bị động là anh em viết bài xong thì tạo liên kết cho DMCA và gửi Google index liền, nội dung thì chèn liên kết nội bộ, ảnh thì chèn watermark,…. Cách chủ động là chặn IP, trì hoãn cập nhật RSS Feed, radom class, tố cáo lên DMCA và Google. Áp dụng hết bộ kỹ năng này thì mình tin là nạn đánh cắp nội dung trên website của bạn sẽ được giảm đáng kể.

TOP44 - top1copy.top1vietnam.vn
Logo
Compare items
  • Total (0)
Compare
0
Shopping cart