5 thuật ngữ SEO phổ biến của Google

Thảo luận trong 'Tài nguyên Seo' bắt đầu bởi ntphong, 24/1/15.

5 thuật ngữ SEO phổ biến của Google

Tài nguyên Seo, 24/1/15. Trả lời: 2, Đọc: 1,142.

ntphong ntphong
Bạn đang xem:

5 thuật ngữ SEO phổ biến của Google

Coppy cùng chia sẻ nhé bạn!
  1. ntphong

    ntphong Administrator Staff Member

    Tham gia ngày:
    25/12/14
    Bài viết:
    49,740
    Trang chủ:

    Những Cảnh Đẹp Của Việt Nam Qua Góc Nhìn Từ FlyCam PhanTom 3 Professional (Video 4K)

    Bấm Youtube để đăng ký xem video nhé!


    (Thegioiseo) - Có rất nhiều các thuật ngữSEO được sử dụng trong ngành công nghiệp tìm kiếm. Tất cả những thuật ngữ này đều rất phổ biến khi nói đến SEO và làm thế nào bạn thực thi chiến lược của bạn. Tuy nhiên, đa số những thuật ngữ này thường được sử dụng không chính xác. Đôi khi nếu làm đúng thì nó sẽ không gây ra bất kỳ thiệt hại nào, tuy nhiên, nếu hiểu sai thì nó sẽ gây ra những sai lầm đáng tiếc chẳng hạn như lưu lượng truy cập, vị trí và chuyển đổi. Vì vậy, chúng ta hãy xem một số thuật ngữ gây ra hiểu lầm trong tìm kiếm của Google.

    1. Robots.txt

    Thông thường nó hay được hiểu sai. Hầu hết mọi người nghĩ rằng tập tin robots.txt được sử dụng để ngăn chặn nội dung từ công cụ tìm kiếm. Nhưng đó không phải là cách làm việc của robots.txt.

    Robots.txt được sử dụng để ngăn chặn một trang hoặc một phần của một trang web thu thập thông tin và index nhưng không phải là URL của chính nó. Vì vậy, các chủ sở hữu trang web sẽ có bảng liệt kê này trong kết quả tìm kiếm của Google.

    [​IMG]

    Google nói gì?

    Webmaster và chủ sở hữu trang web sẽ thêm các trang và thư mục vào tập tin robots.txt, điều này có nghĩa là trang đó sẽ không được index. Sau đó, họ nhìn thấy URL trong SERPs và họ tự hỏi làm thế nào nó có mặt ở đó.

    Robots.txt sẽ không chặn URL index mà chỉ nội dung của trang mới được index. Nếu Google biết về các trang liên kết đến một trang thì nó sẽ index URL cùng với thông tin mô tả “page cannot be displayed".

    [​IMG]

    Vậy làm thế nào để ngăn chặn một trang web được index?

    Để ngăn chặn một trang hoặc tập các trang có URL được index, bạn hãy đưa trang đó ra khỏi tập tin robots.txt và thêm một thẻ noindex đến khu vực có chứa tiêu đề của trang mà bạn muốn chặn. Nếu bạn có trang cụ thể trong robots.txt thì spider sẽ không đọc được trang và điều này có nghĩa là thẻ noindex của bạn vẫn không được Google nhìn thấy và rất có khả năng URL sẽ được index.

    Google nói rằng: "Để ngăn chặn hoàn toàn nội dung của một trang được liệt kê trong việc index của Google ngay cả khi các trang khác liên kết đến nó, sử dụng thẻ noindex meta hoặc thẻ x-robots-tag. Miễn là Googlebot nạp trang thì nó sẽ thấy thẻ noindex meta và ngăn chặn trang này hiển thị trong chỉ mục web. Các tiêu đề x-robots-tag HTTP đặc biệt hữu ích nếu ban muốn hạn chế việc index các tập tin không phải là HTML như hình ảnh hoặc các tài liệu khác.

    Tham khảo thêm các nguồn liên quan:
    - http://www.robotstxt.org/
    - https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt

    2. Google DNS

    Nhiều người nhầm lẫn rằng nếu đưa trang web lên máy chủ mà không cần thẻ noindex thích hợp hoặc điều khiển đăng nhập và cho rằng Google không thể tìm thấy trang web trước khi có một liên kết đến nó.

    Google nói gì?

    Google là một DNS và registrar. Điều này có nghĩa là Google biết việc các trang web khi chúng online. Nó thực sự hoạt động như một máy chủ cung cấp độ phân giải tên miền cho bất kỳ máy chủ trên Internet.

    Vì vậy, nếu bạn đang bắt đầu một trang web mới hoặc một cái gì đó bạn không muốn Google index, bạn hãy đăng nhập vào điều khiển hoặc thẻ noindex/nofollow hoặc noindex HTTP header - đây là 3 phương pháp sẽ giữ cho các URL không được index.

    3. Các hình phạt, Penguin và Panda

    Nhiều chủ sở hữu trang web nghĩ rằng hình phạt Panda hay Penguin đã làm cho trang web của họ bị mất thứ hạng đôi khi còn gây ra một thiệt hạn lớn. Tuy nhiên, Google chỉ có các hình phạt dành cho những hành động thủ công. Vậy Chim cánh cụt và Gấu trúc là gì?

    [​IMG]

    Google nói gì?

    Google không sử dụng từ "hình phạt" với các bản phát hành và thích cập nhật thuật toán. Trong thực tế, nếu bạn đang nói chuyện với một kỹ sư của Google thì họ sẽ nói cho bạn các hình phạt chỉ là sử dụng cho các hành động thủ công.

    Mặc dù họ cảm thấy đó là hình phạt và họ cho rằng các thuật toán Chim cánh cụt và Gấu trúc đã thay đổi và đã gây ra những thiệt hại cho họ và sự thay đổi này đôi khi được gọi là "thay đổi thuật toán" chứ không phải là hình phạt.

    4. Lọc nội dung trùng lặp

    Nhiều người hiểu rằng nội dung trùng lặp là sao chép chính xác từng từ và từng đoạn văn từ một trang sang một trang mới. Họ cũng nghĩ rằng đó là một hình phạt nhưng thực ra là không phải.

    Google có một cách phức tạp hơn để xác định nội dung là "bản sao" và khi họ tìm thấy hai bản sao của cùng một vấn đề thì họ sẽ lọc ra một.

    [​IMG]

    Google nói gì?

    Nội dung trùng lặp chỉ là lấy từ trang này sang trang khác và sau đó Google thấy điều này và lọc ra một trong những kết quả đó là không phải. Google gọi đây là "phương pháp ngây thơ" để so sánh tài liệu.

    Vậy Google làm những gì? Theo bằng sáng chế ban đầu của họ (US 8.015.162 B2), phát hiện nội dung trùng lặp bằng cách sử dụng 2 thuật toán (Broder và Charikar), nó làm việc bằng cách xác định dấu vân tay tài liệu - phương pháp này được phát triển bởi M. Rabin.

    Google nói rằng: "Cả hai thuật toán Broder và Charikar, mỗi trang HTML được chuyển thành một mã chuỗi thông báo. Hai thuật toán này chỉ khác nhau ở cách chúng chuyển đổi các mã chuỗi thông báo thành một chuỗi bit đại diện cho một trang.

    Để chuyển đổi một trang HTML vào một mã chuỗi thông báo, tất cả các đánh dấu HTML trong trang được thay thế bằng khoảng trắng. Sau đó, mỗi dãy chữ và số tối đa được coi là một thuật ngữ và được băm bằng cách sử dụng chương trình vân tay Rabin để tạo ra thẻ với hai trường hợp ngoại lệ.

    Cả hai thuật toán tạo ra một chuỗi bit từ trình tự mã thông báo của một trang web và sử dụng nó để xác định bản sao gần đúng cho một trang".

    Hành động tạo ra dấu vân tay cho mỗi tài liệu có thể được thực hiện bằng cách (i) giải nén từ các tài liệu, (ii) băm tất cả các phần để xác định một số định trước trong danh sách, (iii) đối với mỗi danh sách sẽ tạo ra một dấu vân tay.

    Lưu ý: các từ "keyword shingles" được xuất phát từ chương trình dấu vân tay Rabin "Dấu vân tay Rabin có kết quả là một chuỗi số (n-k+1) được gọi là "shingles"

    Phương pháp cải tiến

    Phát hiện sự trùng lặp và các tập tin gần như trùng lặp (USA 7366718 B1).

    Phương pháp này xuất hiện khái niệm fingerprinting như một bước tiến xa hơn và các thuật toán khác như PageRank, Freshness...

    Google nói rằng:

    Bằng sáng chế có thể có chức năng tạo ra các cụm văn bản gần như trùng lặp. Mỗi tài liệu có thể định danh để xác định một cụm có liên quan. Trong phương án này, để đáp ứng với truy vấn tìm kiếm nếu hai tài liệu thuộc cùng một nhóm và nếu hai tài liệu phù hợp với truy vấn như nhau thì chỉ có một tài liệu được coi là có khả năng liên quan được trả về nhiều.

    Bộ lọc sẽ làm việc thêm một bước nữa. Trang có thể không được index. Điều này đã được nhìn thấy trong tự nhiên đặc biệt là với một số loại SEO tiêu cực.

    Các sáng chế hiện tại cũng có thể được sử dụng sau khi thu thập dữ liệu nếu có nhiều hơn một tài liệu là bản sao và sau đó chỉ một tài liệu là được index. Các sáng chế có thể sử dụng để đáp ứng một truy vấn, trong trường hợp người dùng không khó chịu với kết quả tìm kiếm gần như trùng lặp.

    Rất thú vị khi nó cũng có thể được sử dụng để "sửa chữa các liên kết bị phá vỡ".

    Các sáng chế cũng có thể được sử dụng để "sửa chữa các liên kết bị phá vỡ", nghĩa là nếu một tài liệu (ví dụ một trang web) không tồn tại một địa chỉ hoặc URL cụ thể , một liên kết đến một trang gần trùng lặp có thể được cung cấp.

    Hiện nay các bằng sáng chế không bao gồm phần cuối này, nhưng điều đáng chú ý là nếu bạn chuyển nội dung của bạn đến một trang web mới và nó rất giống một trang web khác và Google xác định đây là những trang web tương tự, các liên kết cũ có thể được chuyển tiếp đến một trang web mới của bạn. Trong trường hợp những liên kết này đã bị phạt và việc chuyển giao các hình phạt là rất tốt.

    Vì vậy, về cơ bản phương pháp nhóm các trang web giống nhau hoặc gần giống nhau và sau đó xem trang nào bị từ chối để loại bỏ khỏi danh sách hoặc không được lập chỉ mục hoặc lọc ra các truy vấn bị từ chối. Dù bằng cách nào thì bạn cũng không nên dừng lại ở đó và trang web của bạn sẽ không nhận được lượng truy cập.

    Lời khuyên: bạn cần phải lặp lại nội dung trên các trang web để đảm bảo trang web của bạn có ít nhất là 40% khác nhau. Sự khác nhau không phải chỉ là trong cách diễn đạt tuy nhiên, bạn chỉ nên làm điều này khi sao chép nội dung trên các trang web chỉ vì 40% bạn sẽ thay đổi.

    5. PageRank
    Các vị trí từ 0 đến 10 được Google chỉ định cho thấy trang web của bạn đang đề cập đến các thuật toán. Đây không phải là PageRank và nó cũng không thực sự có giá trị. PageRank là một giá trị phải đối mặt với công chúng và nếu bạn đang đi xuống thì trang web của bạn đã gặp phải một tiêu cực nào đó và nếu tăng quy mô đó lên thì đó là một hiện tượng tích cực.

    Google nói gì?

    Đầu tiên, bạn thấy PageRank và Google sử dụng nó là hai việc khác nhau. Một trong những gì bạn nhìn thấy được gọi là "Toolbar PageRank". Thứ hai là, báo cáo PageRank sẽ theo thời gian, vì vậy các bản cập nhật được tiếp tục. Google nghĩ mọi người có quá nhiều các giải pháp, vì vậy họ đang dùng nó để tập trung sự chú ý của các chủ sở hữu trang web dựa trên các số liệu mà họ nghĩ rằng nó sẽ là tốt hơn.

    Bây giờ là gì?

    Đó là về các liên kết đến trang web của bạn. PageRank chỉ nhìn vào các liên kết và chất lượng của các liên kết không liên quan đến nội dung hoặc các yếu tố khác. Bạn hãy xem video của Matt Cutts dưới đây. Nó là một dấu hiệu đặc trưng về sức mạnh, không phải là biện pháp tuyệt đối.


    Đối với Google:

    "PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)) trong đó:
    - PR(A) là PageRank của trang
    - PR(Ti) là PageRank của các trang Ti mà liên kết đến trang A
    - C(Ti) là số liên kết outbound trên trang
    - d là một yếu tố có thể được thiết lập giữa 0 và 1.

    Vì vậy, trước hết chúng ta thấy rằng PageRank không xếp hạng các trang web như một tổng thể nhưng nó được xác định cho mỗi trang cá nhân".

    Học hỏi từ Google

    [​IMG]

    SEO đã được học hỏi từ Google bằng nhiều cách giống như kiểu học một ngôn ngữ mới. Những hiểu biết góp phần đảm bảo bạn không mắc phải sai lầm khi áp dụng một chiến lược vào trang web của bạn theo cách mà bạn không thể thực hiện.

    Có rất nhiều các thuật ngữ khác để học hỏi, chúng được chọn vì chúng rất phổ biến và thường áp dụng sai.

    Nguồn: thegioiseo.com
     
    Diễn đàn Ntphong index siêu nhanh!

    Diễn đàn Seo

    Tiêu đề: 5 thuật ngữ SEO phổ biến của Google

    Ghi nguồn bài viết www.ntphong.com khi đăng tải lại bài viết này.

  2. Quảng cáo Thành viên VIP


    Những Cảnh Đẹp Của Việt Nam Qua Góc Nhìn Từ FlyCam PhanTom 3 Professional (Video 4K)

    Bấm Youtube để đăng ký xem video nhé!

  3. vanhuyen

    vanhuyen New Member

    Tham gia ngày:
    29/1/16
    Bài viết:
    3
    Trang chủ:
    cảm ơn bạn chia sẻ thông tin hữu ích này :3
     
    Diễn đàn Ntphong index siêu nhanh!
  4. Nice

    Nice New Member

    Tham gia ngày:
    30/3/16
    Bài viết:
    12
    Thông tin hữu ích dành cho tất cả mọi người tham khảo thêm thông tin
     
    Diễn đàn Ntphong index siêu nhanh!

Link hữu ích: @@ giàn phơi thông minh, giàn phơi quần áo, giàn phơi quần áo thông minh, giàn phơi quần áo, thùng rác, sim tra sau, giàn phơi thông minh, Toyota camry 2017, Mật Ong Rừng, Mật Ong Rừng Nguyên Chất, @@
=