Các yếu tố thân thiện với công cụ tìm kiếm

Thân thiện với công cụ tìm kiếm

Công cụ tìm kiếm còn bị hạn chế trong cách họ thu thập dữ liệu website và luận giải nội dung. Một trang web không phải lúc nào cũng giống nhau cho bạn và cho mình khi xem trên một công cụ tìm kiếm. Trong phần này, chúng ta sẽ tập trung vào các khía cạnh kỹ thuật cụ thể của việc xây dựng (hoặc sửa đổi) các trang web để nó được cấu trúc phù hợp cho cả công cụ tìm kiếm và người truy cập. Bạn có thể chia sẻ phần hướng dẫn này tới các lập trình viên, những người xây dựng nội dung, và những nhà thiết kế website của bạn, để những phần mà tham gia cấu thành một site đạt được sự tối ưu đồng bộ nhất.

Xem thêm Series các bài viết “SEO cho người mới bắt đầu” của mình:

  1. SEO là gì? Tại sao cần tận dụng SEO?
  2. Các công cụ tìm kiếm hoạt động như thế nào?
  3. Người dùng tương tác với Công Cụ Tìm Kiếm như thế nào?
  4. Chiến lược SEO quan trọng với Marketing Online như thế nào?
  5. Các yếu tố thân thiện với công cụ tìm kiếm
  6. Nghiên cứu từ khóa cho SEO
  7. …(Cập nhật sau khi bạn đọc sang mục số 6)…

Lập chỉ mục nội dung (Index)

Để trình bày tốt hơn trong danh sách của công cụ tìm kiếm, nội dung quan trọng nhất của bạn phải ở trong định dạng văn bản HTML. Hình ảnh, các tập tin Flash, Java applet, và nội dung phi văn bản khác thường bị bỏ qua hoặc không có giá trị thu thập cho công cụ tìm kiếm, bất chấp những tiến bộ trong công nghệ thu thập dữ liệu.

google kho khan khi doc du lieu dang flash

Bot cuả Google gặp khó khăn trong việc đọc dữ liệu dạng Flash

Cách dễ nhất để đảm bảo rằng các từ và cụm từ bạn muốn hiển thị mà người truy cập có thể nhìn thấy trong các công cụ tìm kiếm là đặt chúng trong văn bản HTML. Tuy nhiên, các phương pháp tiên tiến hơn dưới đây đã giúp chúng ta hiển thị định dạng đa dạng hơn mà vẫn đảm bảo các công cụ tìm kiếm thu thập được dữ liệu:

  • Cung cấp “alt text” cho hình ảnh. Gán thuộc tính “alt text” trong các file định dạng ảnh gif, jpg, png trong HTML để cung cấp cho công cụ tìm kiếm một đoạn văn bản mô tả nội dung ảnh.
  • Bổ sung cho ô tìm kiếm (search boxes) khả năng điều hướng và các đường link (hỗ trợ công cụ tìm kiếm thu thập dữ liệu).
  • Bổ sung cho Flash hay Java plug-ins bằng văn bản trên trang.
  • Cung cấp một văn bản sao chép nội dung từ video và âm thanh nếu các từ và cụm từ được sử dụng có ý nghĩa và cần được lập chỉ mục từ công cụ tìm kiếm.

Bạn hãy xem cách thức mà một công cụ tìm kiếm nhìn vào trang web của bạn

Nhiều trang web có vấn đề nghiêm trọng với lập chỉ mục nội dung, vì vậy nên kiểm tra chéo để đánh giá. Bằng cách sử dụng các công cụ như bộ nhớ cache của Google, SEO-browser.com, và MozBar bạn có thể nhìn thấy những yếu tố nào bên trong nội dung của bạn được các công cụ tìm kiếm nhìn thấy và lập chỉ mục. Bạn hãy thử nhìn vào bộ nhớ cache của Google về bài viết bạn đang đọc bây giờ. Xem nó khác nhau như thế nào nhé?

Google Cache

Bạn có thấy ngạc nhiên không! Điều mà chúng ta nhìn thấy trông như thế nào?

Sử dụng tính năng bộ nhớ cache của Google, chúng ta có thể thấy rằng với một công cụ tìm kiếm, trang chủ của JugglingPandas.com trong hình ví dụ dưới đây không chứa tất cả các thông tin phong phú mà chúng ta thấy. Điều này làm cho công cụ tìm kiếm khó nhận biết nội dung ở trang có phù hợp với người dùng hay không.

robot-no-reader-flash

Bạn vừa đi qua điều gì thú vị?

Thông qua bộ nhớ cache của Google, chúng ta có thể thấy rằng trang JugglingPandas.com là một “vùng đất hoang cằn cỗi”. Thậm chí không có văn bản cho chúng ta biết trang này có chứa con khỉ cầm cái rìu.

Cả trang web được xây dựng hoàn toàn bằng Flash, nhưng buồn thay, công cụ tìm kiếm không thể lập chỉ mục tất cả mọi loại nội dung văn bản, hoặc thậm chí các liên kết đến các trò chơi khác. Nếu không có văn bản HTML, trang này sẽ mất một thời gian rất lâu nữa mới được xếp hạng trong kết quả tìm kiếm.

Như vậy, nếu không chắc chắn, bạn hãy sử dụng các công cụ SEO mà mình đã giới thiệu ở trên để kiểm tra lại các trang bạn đang xây dựng có được các công cụ tìm kiếm nhìn thấy hay không.

Công cụ tìm kiếm thu thập dữ liệu qua cấu trúc liên kết (crawl)

Giống như khi công cụ tìm kiếm cần nhìn thấy nội dung để liệt kê các trang của bạn vào trong chỉ mục dựa trên từ khóa khổng lồ của họ, công cụ tìm kiếm cũng cần phải nhìn thấy liên kết để đi tìm nội dung. Một cấu trúc liên kết có thể cho phép các trình thu thập dữ liệu bò/trườn qua các lối đi của một trang web-đây là điều quan trọng để nó tìm kiếm và đi đến tất cả các trang trên một website. Hàng trăm hàng ngàn các trang web đã sai lầm lớn trong việc cơ cấu điều hướng trong website của họ theo những cách mà công cụ tìm kiếm không thể truy cập, làm cản trở khả năng các trang của họ được liệt kê trong danh mục của công cụ tìm kiếm.

Dưới đây, chúng ta sẽ mô tả các vấn đề có thể xảy ra:

Giản đồ lập chỉ mục

Trong ví dụ trên, trình thu thập thông tin của Google đã đi đến trang A và thấy các liên kết đến các trang B và E. Tuy nhiên, mặc dù C và D có thể là trang quan trọng trên website, nhưng trình thu thập thông tin không có cách nào để tiếp cận các trang đấy (hoặc thậm chí không biết chúng tồn tại) . Điều này là do không có chỉ dẫn, liên kết có khả năng giúp trình thu thập dữ liệu đi đến trang C và D. Theo như con mắt của Google, chúng không tồn tại! Nội dung rất tốt, nhắm mục tiêu từ khóa tốt, và tiếp thị thông minh sẽ không tạo ra bất kỳ sự khác biệt nào nếu các trình thu thập dữ liệu không thể tiếp cận các trang của bạn ngay từ đầu.

Giải phẫu liên kết (LINK)

<a href=”http://trungvanhoang.com”>Kiếm Tiền Online</a>

Các thẻ của liên kết có thể chứa hình ảnh, văn bản, hoặc các đối tượng khác, giúp người dùng có thể click chuột vào và di chuyển đến một trang khác. Các liên kết này là những yếu tố điều hướng thời kỳ đầu của Internet – được gọi là các siêu liên kết (hyperlink). Trong hình minh họa ở trên, thẻ “<a” là sự khởi đầu của một link. URL http://trungvanhoang.com thông báo cho các trình duyệt (và các công cụ tìm kiếm) biết nơi mà đường link trỏ đến. Tiếp theo, phần mà người truy cập nhìn thấy đường link, gọi là “anchor text” trong thế giới SEO, mô tả ngắn về trang mà đường Link trỏ tới. Anchor text ở ví dụ này là “Kiếm Tiền Online”.  Thẻ “</a>” đóng link để tách biệt một đường Link với các yếu tố khác trên trang.

Và chúng ta được đường Link như dưới:

Kiếm Tiền Online

Đây là định dạng cơ bản nhất của một link, và nó làm nổi bật với mắt người dùng và dễ hiểu đối với công cụ tìm kiếm. Các trình thu thập thông tin biết rằng nó nên thêm link này tới biểu đồ liên kết của website, sử dụng nó để tính toán (như PageRank của Google), và theo đó là lập chỉ mục nội dung cho các trang được tham chiếu.

Một số lý do phổ biến khiến cho một số trang không được trình thu thập dữ liệu đi tới.

Form yêu cầu điền thông tin

Nếu bạn yêu cầu người dùng điền thông tin vào một form trực tuyến trước khi truy cập vào một nội dung nào đó, rất có thể là công cụ tìm kiếm sẽ không bao giờ nhìn thấy những trang được bảo vệ đó. Form có thể là một đăng nhập yêu cầu mật khẩu bảo vệ hoặc một servey thu thập thông tin. Trong cả hai trường hợp, trình thu thập thông tin thường sẽ không cố gắng gửi thông tin tới form, vì vậy bất kỳ nội dung hoặc liên kết mà có thể truy cập thông qua form là vô hình đối với các công cụ tìm kiếm.

Công cụ tìm kiếm không đọc được liên kết trong JavaScript

Nếu bạn sử dụng JavaScript cho các liên kết, bạn có thể thấy rằng công cụ tìm kiếm gần như không thể thu thập thông tin hoặc không có một trọng số nào cho các link được nhúng bên trong. Liên kết dạng HTML tiêu chuẩn nên thay thế JavaScript (hoặc đi kèm với nó) trên bất kỳ trang nào mà bạn muốn trình thu thập thông tin bò qua được.

Liên kết trỏ đến các trang bị chặn bởi thẻ Meta Robot tag hoặc robots.txt

Thẻ Meta Robots và tập tin robots.txt, cả hai cho phép chủ sở hữu website hạn chế trình thu thập dữ liệu của công cụ tìm kiếm truy cập vào một trang nào đó trên Websie. Cần cảnh báo rằng nhiều webmaster đã vô tình hoặc lạm dụng sử dụng các lệnh này như một nỗ lực để ngăn chặn truy cập của chương trình giả mạo, vô tình nó cũng đã ngăn chặn Robot của trình thu thập dữ liệu đang đi thu thập thông tin.

Frame hoặc iFrame

Về mặt kỹ thuật, liên kết trong cả Frame và iFrame có thể được thu thập, nhưng cả hai đều gây ra vấn đề khó khăn khi thu thập thông tin cho các công cụ tìm kiếm. Trừ khi bạn là một người pro với sự hiểu biết tốt về kỹ thuật, cách thức mà công cụ tìm kiếm lập chỉ mục và theo các liên kết trong Frame và iFrame. Tốt nhất là bạn nên hạn chế hoặc không sử dụng liên kết (link) trong Frame và iFrame.

Robot không sử dụng các form tìm kiếm

Đây là một vấn đề phổ biến đã được nhắc đến nhiều. Một số webmaster tin rằng nếu họ đặt một hộp tìm kiếm trên trang web của họ, công cụ tìm kiếm sẽ có thể tìm thấy tất cả mọi thứ mà khách truy cập tìm kiếm. Thật không may, trình thu thập thông tin không thực hiện tìm kiếm để tìm nội dung.

Liên kết trong Flash, Java, và các plugin khác

Các liên kết được nhúng bên trong trang web của Panda Juggling (từ ví dụ trên) là điển hình của vấn đề này. Mặc dù hàng chục con gấu trúc được liệt kê và được liên kết trên trang, nhưng không có con bọ thu thập dữ liệu nào có thể tiếp cận được thông qua cấu trúc liên kết này của trang web, làm cho các công cụ tìm kiếm không nhìn thấy chúng và và không thể trả về trong các truy vấn tìm kiếm của người dùng.

Trang có hàng trăm hoặc hàng ngàn Links

Công cụ tìm kiếm sẽ chỉ thu thập thông tin một lượng liên kết nhất định trên một trang. Hạn chế này là cần thiết để giảm bớt Spam và bảo vệ bảng xếp hạng. Các trang với hàng trăm liên kết sẽ không được thu thập và lập chỉ mục cho tất cả các liên kết đó.

Nếu bạn muốn tránh được những cạm bẫy trên, bạn nên chỉ để các liên kết trong HTML, điều này cho phép các trình thu thập dữ liệu dễ dàng truy cập đến các trang nội dung khác của bạn.

Rel = “nofollow”

Rel = “nofollow” được sử dụng theo cú pháp sau:

<a href=”https://trungvanhoang.com” rel=”nofollow”> Kiếm Tiền Online </a>

Liên kết có thể có rất nhiều thuộc tính. Các công cụ tìm kiếm bỏ qua gần như tất cả các thuộc tính đấy, ngoại trừ một số thuộc tính như rel = “nofollow”. Trong ví dụ trên, thêm thuộc tính rel = “nofollow” cho thẻ liên kết để các công cụ tìm kiếm biết rằng chủ sở hữu trang web không muốn các con bọ đi theo đường link này.

Nofollow, hiểu theo nghĩa đen, chỉ thị cho công cụ tìm kiếm không bò theo một liên kết (mặc dù thực tế một số con Robot vẫn đi theo). Thẻ nofollow xuất hiện như là một phương pháp để giúp ngăn chặn bình luận blog tự động, và các liên kết tiềm ẩn spam. Với Nofollow, các công cụ tìm kiếm hiểu là nó không nên đi theo hoặc giảm giá trị trọng số với liên kết dạng này.

Link Nofollow là xấu?

Mặc dù liên kết Nofollow không có giá trị trọng số cao như liên kết follow, nhưng liên kết nofollow là một phần tự nhiên của một hồ sơ liên kết đa dạng. Một trang web với rất nhiều liên kết trỏ về sẽ tích lũy nhiều liên kết nofollow, và đây không phải là một điều xấu. Trong thực tế cho thấy rằng các trang web xếp hạng cao có xu hướng có tỷ lệ cao các liên kết nofollow trỏ về hơn so với các web xếp hạng thấp.

Link Nofollow trong con mắt của Google

Google nói rằng trong hầu hết các trường hợp, họ không theo liên kết nofollow, cũng không tạo giá trị đánh giá PageRank hay anchor text. Liên kết nofollow không mang giá trị và được hiểu là văn bản HTML (coi như là các liên kết không tồn tại).

Link Nofollow trong con mắt của Bing & Yahoo!

Bing ( được trang bị từ kết quả tìm kiếm của Yahoo), cũng đã tuyên bố rằng họ không đưa các liên kết nofollow vào trong biểu đồ liên kết, mặc dù trình thu thập thông tin của họ vẫn có thể sử dụng liên kết nofollow để khám phá các trang mới. Như vậy, Bing/Yahoo! vẫn đi theo các liên kết, nhưng không sử dụng chúng trong tính toán bảng xếp hạng .

Cách sử dụng từ khóa và hướng mục tiêu

Từ khóa là nền tảng cho quá trình tìm kiếm. Trong thực tế, toàn bộ khoa học về truy vấn thông tin (bao gồm cả công cụ tìm kiếm trên web như Google) được dựa trên các từ khóa. Như với các công cụ tìm kiếm thu thập dữ liệu và lập chỉ mục nội dung các trang trên website, theo dõi những trang web trong chỉ mục dựa trên từ khóa thay vì lưu trữ tất cả 25 tỷ trang web trong một cơ sở dữ liệu. Hàng triệu và hàng triệu cơ sở dữ liệu nhỏ hơn, mỗi trung tâm dựa trên một thuật ngữ hoặc cụm từ khoá cụ thể, cho phép với các công cụ tìm kiếm lấy dữ liệu cần thiết trong một phần nhỏ của một giây.

Rõ ràng, nếu bạn muốn trang web của bạn có cơ hội xếp hạng trong kết quả tìm kiếm cho từ khóa “con mèo”, hãy đảm bảo đảm bảo từ khóa “con mèo” có trong phần nội dung của bạn.

Sự chi phối của từ khóa trong kết quả tìm kiếm

Từ khóa chi phối kết quả tìm kiếm như thế nào, chúng ta truyền đạt ý định tìm kiếm và tương tác với với các công cụ tìm kiếm. Khi chúng ta nhập cụm từ tìm kiếm, công cụ tìm kiếm sẽ dựa theo những từ chúng ta nhập vào để đưa ra các trang phù hợp. Thứ tự của các từ (“pandas juggling” hay “juggling pandas”), chính tả, dấu câu cũng cung cấp thông tin bổ sung để công cụ tìm kiếm dựa vào đó đưa ra các trang phù hợp cho người dùng.

Lạm dụng từ khóa

Kể từ những ngày khởi đầu của công nghệ tìm kiếm trực tuyến, nhiều người làm SEO đã lạm dụng từ khóa để tương tác với các công cụ tìm kiếm. Điều này liên quan đến việc “nhồi nhét” từ khoá vào văn bản, URL, các thẻ meta, và các liên kết. Thật không may, chiến thuật này hầu như gây hại nhiều hơn là có lợi cho trang web của bạn.

Trong những ngày đầu, công cụ tìm kiếm dựa trên việc sử dụng từ khóa làm một tín hiệu quan trọng. Ngày nay, mặc dù công cụ tìm kiếm vẫn không thể đọc và hiểu các văn bản như một con người, nhưng trí thông minh nhân tạo đã cho phép các công cụ tìm kiếm có thể hiểu nhiều hơn nội dung văn bản và đánh giá được chất lượng nội dung của trang đó.

Tốt nhất là bạn nên sử dụng các từ khóa một cách tự nhiên và có chiến lược. Nếu trang của bạn hướng đến các cụm từ khóa “Eiffel Tower”, bạn có thể cho từ khóa đó vào 1 cách tự nhiên bằng cách đưa các nội dung thông tin liên quan đến tháp Eiffef như lịch sử của tháp, hoặc thậm chí lời khuyên về chọn khách sạn nào ở Paris. Còn nếu bạn chỉ đơn giản là nhồi nhét những từ “Eiffel Tower” với nội dung không thích hợp lên một trang, chẳng hạn như một trang về nuôi chó, rồi bạn cố gắng xếp hạng cho từ “Eiffel Tower”, điều đó không tốt cho bạn. Khi sử dụng các từ khóa không phải cố để được xếp hạng cao cho tất cả các từ khóa, mà là xếp hạng cao cho các từ khóa quan trọng mà người dùng đang tìm kiếm, và họ đang cần những cái mà trang web của bạn sẽ cung cấp cho họ.

Lầm tưởng về mật độ từ khóa

Theo Edel Garcia “mật độ từ khóa không phải là một phần của thuật toán xếp hạng hiện đại”.

Kết luận:

Mật độ từ khóa không giúp chúng ta đánh giá nội dung, chất lượng, ngữ nghĩa, và sự liên quan. Buộc công cụ tìm kiếm sử dụng các yếu tố xếp hạng khác thay vì dùng mật độ từ khóa để đánh giá chất lượng nội dung bài viết có phù hợp với người tìm kiếm hay không

Tối ưu hóa On Page

Sử dụng từ khóa vẫn đang là một phần quan trọng trong thuật toán xếp hạng của công cụ tìm kiếm, và chúng ta có thể áp dụng một số kỹ thuật hiệu quả khi sử dụng từ khóa để giúp tạo các trang được tối ưu hóa.

tối ưu hóa nội dung on-pager

Tối ưu hóa nội dung On-page

Dưới đây là quá trình tối ưu từ khóa trên trang Site bạn nên xem xét áp dụng:

  • Trong thẻ tiêu đề có chứa từ khóa ít nhất một lần. Cố gắng để cụm từ khóa càng gần đầu thẻ tiêu đề càng tốt. Chi tiết về thẻ tiêu đề mình sẽ nói sau trong phần này.
  • Xuất hiện một lần gần đầu trang.
  • Thêm ít nhất hai hoặc ba lần, bao gồm cả các biến thể, trong phần thân nội dung của trang. Có thể nhiều lần hơn nữa nếu nội dung văn bản dài. Bạn cũng có thể bổ sung thêm nhiều biến thể của từ khóa hơn.
  • Ít nhất một lần sử dụng thuộc tính alt text cho hình ảnh trên trang. Điều này không chỉ tốt với tìm kiếm web, mà còn tốt cho tìm kiếm hình ảnh, đôi khi có thể mang lại lưu lượng truy cập có giá trị.
  • Từ khóa xuất hiện một lần trong phần URL. Nguyên tắc bổ sung từ khóa cho các URL được thảo luận sau trong bài viết này.
  • Từ khóa xuất hiện ít nhất một lần trong thẻ “Meta description”. Lưu ý rằng các thẻ Meta description không được các công cụ tìm kiếm sử dụng để xếp hạng, nhưng nó giúp thu hút nhấp chuột của người tìm kiếm khi họ đọc nó trên trang kết quả tìm kiếm, công cụ tìm kiếm sử dụng thẻ Meta description như là một đoạn trích dẫn ngắn khi hiển thị trên kết quả tìm kiếm.
  • Và khi bạn đang tối ưu một từ khóa trên trang, bạn không nên sử dụng từ khóa đó trong anchor text của link để trỏ đến các trang khác trên website của bạn, nó không tốt cho trang mà bạn đang tối ưu, vì từ khóa trong anchor text sẽ được tính cho trang được trỏ đến. Hay nói cách khác, nếu bạn đưa từ khóa đó vào Anchor text của link là bạn đang tối ưu nhiều bài viết cho cùng một từ khóa. Như thế không tốt cho SEO. Xem thêm bài viết Có nên tối ưu cùng một từ khóa với nhiều trang bài viết trên website? của bạn Linh Vũ

Thẻ Tiêu đề

Tiêu đề của một trang được hiểu là một đoạn mô tả ngắn gọn về nội dung của trang. Nó rất quan trọng cho cả trải nghiệm người dùng và tối ưu hóa công cụ tìm kiếm

.the tieu de

Thẻ tiêu đề có thể giúp người dùng hiểu được nội dung đang được nói đến trong bài viết

Vì thẻ tiêu đề là một phần quan trọng của tối ưu hóa công cụ tìm kiếm, bạn nên quan tâm đến các hướng dẫn quan trọng sau đây khi tạo thẻ tiêu đề.

Quan tâm đến chiều dài

Công cụ tìm kiếm chỉ hiển thị 65-75 ký tự đầu tiên của thẻ tiêu đề trong kết quả tìm kiếm (các ký tự còn lại, các công cụ hiển thị một dấu chấm lửng “…” – để cho người dùng biết thẻ tiêu đề đã được cắt bỏ). Đây cũng là giới hạn cho phép chung của hầu hết các trang mạng xã hội, do đó cần bám vào giới hạn này. Tuy nhiên, nếu bạn đang nhắm mục tiêu nhiều từ khóa (hoặc một cụm từ khóa đặc biệt dài), và cần thiết có trong thẻ tiêu đề để xếp hạng, thì bạn có thể để cho thẻ tiêu đề viết dài hơn cũng được.

Đặt từ khóa quan trọng ở gần đầu thẻ tiêu đề

Từ khóa quan trọng của bạn càng gần đầu thẻ tiêu đề, càng tốt cho việc xếp hạng, và người dùng càng có nhiều khả năng sẽ để bấm chuột vào nó trong trang kết quả tìm kiếm.

Bao gồm thương hiệu

Kết thúc mỗi thẻ tiêu đề với một tên thương hiệu, có thể giúp nâng cao nhận thức thương hiệu, và có thể tăng tỷ lệ nhấp chuột từ những người thích và quen thuộc với thương hiệu đó. Đôi khi nó có ý nghĩa khi đưa thương hiệu của bạn ở phần đầu của thẻ tiêu đề, chẳng hạn như trang chủ của bạn, vì những từ bắt đầu trong thẻ tiêu đề sẽ có trọng số cao hơn những từ đi sau, hãy chú ý đến những gì bạn đang cố gắng để xếp hạng.

Xem xét khả năng đọc và tác động cảm xúc

Thẻ tiêu đề là tương tác đầu tiên một mà khách truy cập mới tiếp cận tới thương hiệu của bạn và bạn nên gây ấn tượng tích cực nhất có thể. Tạo một thẻ tiêu đề hấp dẫn sẽ giúp bạn lấy sự chú ý trên các trang kết quả tìm kiếm, và thu hút nhiều khách truy cập vào trang web của bạn. Điều này nhấn mạnh rằng khi làm SEO, không chỉ đơn giản là tối ưu hóa và sử dụng từ khóa chiến lược, mà nó còn là trải nghiệm người dùng.

Thẻ Meta

Thẻ Meta trước đây đã từng được sử dụng để đánh giá nội dung Website. Một vài kiến thức cơ bản của thẻ Meta cùng với mô tả cách sử dụng như dưới đây:

Meta Robot

Thẻ Meta Robot có thể sử dụng để kiểm soát các hoạt động thu thập thông tin của công cụ tìm kiếm ở cấp độ từng trang. Có một vài cách để sử dụng:

  • index/noindex cho công cụ tìm kiếm biết là trang đó có nên được thu thập và lập chỉ mục hay không. Nếu bạn dùng “noindex”, trang đó sẽ không được lập chỉ mục (index). Mặc định, công cụ tìm kiếm sẽ lập chỉ mục cho tất cả các trang, nên không cần dùng “index”
  • follow/nofollow nói cho công cụ tìm kiếm biết có nên thu thập đường link ở trên trang đấy không. Nếu bạn dùng “nofollow”, công cụ tìm kiếm sẽ không để ý tới đường link đó hoặc không dùng để xếp hạng hoặc cả hai. Theo mặc định, tất cả các trang đều được giả thiết là dùng thuộc tính “follow”. Ví dụ:

<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>

  • Noarchive được dùng để hạn chế công cụ tìm kiếm lưu trữ trang vào trong bộ nhớ cache. Mặc định là công cụ tìm kiếm sẽ duy trì sao chép tất cả các trang mà đã được lập chỉ mục, người dùng tìm kiếm có thể truy cập qua đường link đã được lưu trong bộ nhớ cache trong kết quả tìm kiếm
  • Nosnippet thông báo cho công cụ tìm kiếm hạn chế hiển thị đoạn văn bản mô tả (Snippet) bên cạnh tiêu đề trang và URL trong kết quả tìm kiếm
  • noodp/noydir là các thẻ chuyên sâu báo công cụ tìm kiếm không lấy snippet mô tả về một trang từ Open Directory Project (DMOZ) hoặc thư mục Yahoo! để hiển thị trong kết quả tìm kiếm

Thẻ X-Robot cũng sử dụng các đối tượng ở trên một cách tương tự cho nôi dung bên trong file mà không có định dạng HTML (như hình ảnh).

Meta Description

Thẻ “Meta Description” tồn tại như một đoạn mô tả ngắn về nội dung trên trang. Công cụ tìm kiếm không sử dụng thẻ này để xếp hạng, nhưng “Meta Description” là một snippet văn bản được hiển thị bên dưới tiêu đề trong kết quả tìm kiếm

Thẻ “Meta Description” thực hiện chức năng là một copy quảng cáo, lôi kéo người đọc tới site của bạn từ kết quả tìm kiếm. Nó thật sự quan trọng trong marketing tìm kiếm. Làm sao để đoạn mô tả dễ đọc, có sức thuyết phục, sử dụng các từ khóa quan trọng (để ý cái cách mà Google bôi đậm các từ khóa mà người dùng sử dụng tìm kiếm trong phần “Meta Description”) có thể dẫn dắt người dùng tăng khả năng click tới trang site của bạn.

“Meta Description” có thể dài, nhưng công cụ tìm kiếm sẽ cắt đến 160 ký tự, vì thế bạn nên để ý để hiển thị phần nào quan trọng nhất của “Meta Description”

Nếu không có “Meta Description”, công cụ tìm kiếm sẽ tự động trích mô tả từ trang. Đối với trang đang tối ưu nhiều từ khóa hoặc chủ đề, “Meta Description” là công cụ rất tuyệt vời cho bạn

Các thẻ Meta không quan trọng

Thẻ Meta Keyword: thẻ này trước đây từng có giá trị xếp hạng, nhưng bây giờ không được sử dụng để tối ưu hóa công cụ tìm kiếm nữa.

Thẻ Meta Refresh, Meta Revisit-after, Meta Content-type, và các thẻ khác: mặc dù những thẻ này có thể dùng để tối ưu công cụ tìm kiếm, nhưng kém quan trọng hơn.

Cấu trúc URL

URL-địa chỉ cho các tài liệu trên web có giá trị lớn ở khía cạnh tìm kiếm, xuất hiện ở nhiều vị trí quan trọng.

Từ khi công cụ tìm kiếm hiển thị URL trong kết quả tìm kiếm, URL có thể tác động đến khả năng nhấp chuột. URL cũng được sử dụng trong việc xếp hạng.

url-google-trungvan-hoang

URL xuất hiện trong thanh địa chỉ của trình duyệt web, tuy cái này thường ít có tác động với công cụ tìm kiếm, nhưng cấu trúc và thiết kế URL kém có thể dẫn đến trải nghiệm người dùng không tốt.

url-bar-trungvanhoang

URL ở trong hình dưới được là các link anchor text trỏ đến các trang bài viết khác trên blog này.

url-blog-trungvan-hoang

Hướng dẫn xây dựng URL

Tạo sự đồng cảm

Đặt mình trong tâm trí của một người sử dụng và nhìn vào URL của bạn. Nếu bạn có thể dễ dàng dự đoán chính xác nội dung mà bạn đang muốn tìm kiếm trên trang web, thì chứng tỏ URL của bạn đã mô tả phù hợp. Bạn không cần phải giải thích rõ từng chi tiết trong URL, nhưng phần ý tưởng sơ bộ trong URL là một điểm khởi đầu tốt cho trang nội dung của bạn.

Càng ngắn càng tốt

Tuy mô tả URL là quan trọng, nhưng bạn nên tối ưu giảm thiểu độ dài các URL để dễ dàng sao chép và dán hơn (vào email, blog bài viết, tin nhắn văn bản, …) và sẽ có thể nhìn thấy đầy đủ đường Link trong kết quả tìm kiếm.

Nên sử dụng từ khóa trong URL (nhưng lạm dụng là nguy hiểm)

Nếu trang của bạn đang nhắm mục tiêu một thuật ngữ hoặc cụm từ cụ thể, cố gắng đưa nó vào trong URL. Tuy nhiên, không đi quá đà bằng cách nhồi nhét nhiều từ khóa vào URL cho mục đích SEO, nhồi nhét quá mức sẽ dẫn đến URL ít sử dụng được và có thể đi vào bộ lọc thư rác.

Sử dụng URL tĩnh

Các URL tốt nhất cho người dùng là các URL có thể đọc hiểu được và không có nhiều con số và các ký hiệu khó hiểu. Sử dụng các công nghệ như mod_rewrite của Apache và ISAPI_Rewrite của Microsoft, bạn có thể dễ dàng chuyển đổi các URL động như thế này https://trungvanhoang.com/blog?id=123 thành một phiên bản tĩnh dễ đọc hơn như thế này: https://trungvanhoang.com/blog/cong-cu-tim-kiem. Thậm chí các tham số động đơn lẻ trong một URL có thể gây bất lợi cho việc xếp hạng tổng thể và lập chỉ mục.

Sử dụng dấu gạch nối để tách rời các từ

Không phải tất cả các ứng dụng web giải nghĩa chính xác dải phân cách như dấu gạch dưới (_), cộng với ký hiệu (+), hoặc cách từ, do đó, nên sử dụng dấu gạch ngang (-) để tách các từ trong một URL, như “cong-cu-tim-kiem” trong URL ví dụ trên.

Canonical và các phiên bản nội dung trùng lặp

Nội dung trùng lặp là một trong những vấn đề gây nhiều tranh cãi và phiền hà nhất mà bất kỳ trang web cũng có thể phải đối mặt. Trong vài năm qua, công cụ tìm kiếm đã gán các trang có nội dung trùng lặp thứ hạng thấp hơn.

Canonicalization sẽ xảy ra khi hai hay nhiều phiên bản trùng lặp của một trang web xuất hiện trên các URL khác nhau. Điều này là rất phổ biến với các hệ thống quản trị nội dung hiện đại. Ví dụ, bạn có thể cung cấp một phiên bản hoàn chỉnh của một trang và một phiên bản tối ưu hóa để in ấn. Nội dung trùng lặp thậm chí có thể xuất hiện trên nhiều trang web khác nhau. Đối với công cụ tìm kiếm, điều này là một vấn đề lớn: câu hỏi phiên bản nội dung nào nên được hiển thị cho người tìm kiếm? Trong giới SEO, vấn đề này thường được gọi là trùng lặp nội dung, mình sẽ mô tả chi tiết hơn trong một bài viết khác.

Các công cụ tìm kiếm không thích việc có nhiều phiên bản trùng lặp cho cùng một nội dung. Để cung cấp trải nghiệm tìm kiếm tốt nhất, nó sẽ không hiện nhiều phiên bản trùng lặp nội dung, và thay vào đó nó chọn phiên bản rất có thể là bản gốc. Kết quả cuối cùng là tất cả các nội dung trùng lặp có thể xếp hạng thấp hơn.

Canonicalization là hoạt động sắp xếp nội dung của bạn theo một cách sao cho mỗi nội dung duy nhất có một và chỉ một URL. Nếu bạn để lại nhiều phiên bản nội dung trên một trang web (hoặc các trang web), bạn có thể kết thúc với một kịch bản “cái nào là bản gốc đây?”

Thay vào đó, nếu chủ sở hữu trang web lấy ba trang đó và sử dụng 301-redirect, các công cụ tìm kiếm sẽ chỉ chọn một trang site mạnh để hiển thị trong danh sách tìm kiếm.

Khi nhiều trang có tiềm năng để xếp hạng tốt được kết hợp với nhau thành một trang duy nhất. Chúng không chỉ tránh cạnh tranh lẫn nhau, mà trang được kết hợp có khả năng được xếp hạng cao hơn. Điều này sẽ tác động tích cực đến khả năng xếp hạng tốt trong công cụ tìm kiếm.

Thẻ Canonical!

Một tùy chọn khác từ công cụ tìm kiếm, được gọi là Thẻ Canonical URL, là một cách khác để làm giảm các trường hợp nội dung trùng lặp trên một trang site. Thẻ Canonical cũng có thể được sử dụng trên các trang web khác nhau, từ một URL của một tên miền đến một URL của một tên miền khác.

dùng thẻ Canonical để xử lí nội dung trùng lặp

Dùng thẻ Canonical URL để xử lí vấn đề nội dung trùng lặp trên website

Sử dụng các thẻ canonical với các trang có chứa nội dung trùng lặp. Mục đích của thẻ canonical là để chỉ điểm URL chính mà bạn muốn xếp hạng.

<link rel=”canonical” href=”https://trungvanhoan.com/blog”/>

Thẻ canonical trong ví dụ trên cho công cụ tìm kiếm biết rằng trang đang được đề cập được xem là một bản sao của URL https://trungvanhoang.com/blog và tất cả thước đo về nội dung và các liên kết sẽ đều hướng về địa chỉ URL đấy.

Từ góc độ SEO, thuộc tích thẻ Canonical URL tương tự với điều hướng 301 (301 redirect). Về bản chất, bạn đang nói với các công cụ tìm kiếm là mặc dù nhiều trang nhưng chỉ coi là một (giống như điều hướng 301), nhưng mà không cần phải điều hướng người truy cập vào URL mới. Như vậy, bạn không cần đau đầu xem xét đưa thêm một nhân viên phát triển làm vấn đề này cho bạn

Thông tin đặc biệt (Snippet)!

Đã bao giờ bạn nhìn thấy một đánh giá 5 sao trong kết quả tìm kiếm? Rất có thể rồi, các công cụ tìm kiếm nhận được thông tin đó từ đoạn mã nhúng trên các trang web. Đoạn mã là một kiểu dữ liệu có cấu trúc cho phép các quản trị web đánh dấu nội dung theo những cách khác nhau để cung cấp thêm thông tin đặc biệt cho công cụ tìm kiếm.

Việc sử dụng các thông tin đặc biệt Snippet không phải là một yếu tố yêu cầu cần thiết để thân thiện với công cụ tìm kiếm, nhưng người quản trị web có thể sử dụng nó để có được lợi thế trong một số trường hợp.

Bạn sẽ cần cấu trúc dữ liệu để đánh dấu phần nội dung sao cho công cụ tìm kiếm có thể dễ dàng xác định loại nội dung đó là gì. Schema.org cung cấp một số ví dụ về dữ liệu có thể có lợi từ cấu trúc dữ liệu, bao gồm cả con người, sản phẩm, đánh giá/reviews, các doanh nghiệp, công thức nấu ăn, và các sự kiện.

Thường thì các công cụ tìm kiếm bao gồm cấu trúc dữ liệu trong kết quả tìm kiếm, chẳng hạn như trong trường hợp ý kiến người dùng (ngôi sao) và hồ sơ tác giả (ảnh). Có một số nguồn tài nguyên tốt để các bạn học thêm về thông tin đặc biệt Snippet này, có thể xem tại Schema.org và Công cụ kiểm tra mã đa dạng Snippet của Google.

Giả dụ bạn đang thông báo một hội nghị SEO trên blog của bạn. Trong HTML thông thường, mã của bạn có thể trông như thế này:

<div>
SEO Conference<br/>
Learn about SEO from experts in the field.<br/>
Event date:<br/>
May 9, 8:00pm
</div>

Bây giờ, bằng cách cấu trúc lại dữ liệu, chúng ta có thể nói với các công cụ tìm kiếm thông tin cụ thể hơn về loại dữ liệu. Kết quả cuối cùng có thể trông như thế này:

<div itemscope itemtype=”http://schema.org/Event”>
<div itemprop=”name”>SEO Conference</div>
<span itemprop=”description”>Learn about SEO from experts in the field.</span>
Event date:
<time itemprop=”startDate” datetime=”2012-05-09T20:00″>May 8:00pm</time>
</div>

Bảo vệ uy tín trang web của bạn

Làm thế nào những con sói đang ăn cắp thứ hạng của bạn

Thật không may, các web rác với các trang web vô đạo đức có hình thức kinh doanh và traffic phụ thuộc tất cả vào nội dung từ các trang web khác và tái sử dụng nó (đôi khi theo những cách biến đổi lại) vào domain riêng của họ. Điều này thực tế là lấy nội dung của bạn và tái xuất bản và “những con sói” hoạt động khá tốt trong bảng xếp hạng của công cụ tìm kiếm, và nhờ tối ưu tốt hơn nên đã vượt thứ hạng các trang site gốc.

Khi bạn xuất bản nội dung trong bất kỳ loại định dạng dữ liệu nào, chẳng hạn như RSS hoặc XML, hãy chắc chắn ping các blog chính và dịch vụ theo dõi (Google, Technorati, Yahoo!, …). Bạn có thể tìm thấy hướng dẫn dịch vụ ping như Google và Technorati trực tiếp từ trang web của họ, hoặc sử dụng một dịch vụ như Pingomatic để tự động hóa quá trình này. Nếu phần mềm xuất bản có khả năng tùy chỉnh, nó rất phù hợp cho các nhà phát triển nếu muốn thực hiện việc ping tự động khi xuất bản nội dung.

Tiếp theo, bạn có thể tận dụng sự lười biếng “những con sói ” để chống lại chúng. Hầu hết “những con sói” trên web sẽ tái xuất bản nội dung mà không cần chỉnh sửa. Vì vậy, bằng cách thêm các liên kết đến trang Site của bạn, và các bài cụ thể mà bạn đã là tác giả, bạn có thể đảm bảo rằng các công cụ tìm kiếm nhìn thấy hầu hết các liên kết về với bạn (nhận ra nguồn của bạn có lẽ là người sáng tạo nội dung đó). Để làm điều này, bạn sẽ cần phải sử dụng đường link tuyệt đối, hơn là đường link tương đối trong cấu trúc liên kết nội bộ của bạn. Vì vậy, thay vì liên kết tới trang chủ mà sử dụng:

<a href=”../”>Home</a>

Thay vào đó bạn nên sử dụng:

<a href=”https://trungvanhoang.com”>Home</a>

Bằng cách này, khi một “con sói” sao chép nội dung, liên kết vẫn trỏ đến trang Site của bạn.

Có nhiều cách nâng cao hơn để chống lại “những con sói”, nhưng không có cái nào là hoàn toàn hoàn hảo. Bạn nên hy vọng website của bạn sẽ phổ biến hơn với người dùng, thường khi Website càng phổ biến, bạn sẽ thấy nội dung của bạn bị “những con sói” tái xuất bản lại nội dung của bạn. Nếu ít lần, bạn có thể bỏ qua vấn đề này: nhưng nếu nó rất nghiêm trọng, và bạn thấy “những con sói” đang lấy đi thứ hạng và lưu lượng truy cập của bạn, bạn có thể xem xét sử dụng một quá trình pháp lý gọi là gỡ bỏ DMCA.

mm

Chinh Nguyễn

Chuyên viên SEO công ty ASC. Đam mê công nghệ-kinh doanh.

You may also like...

1 Response

  1. November 8, 2015

    […] phần mục “Lầm tưởng về mật độ từ khóa” trong bài viết “Các yếu tố thân thiện với công cụ tìm kiếm” của bạn Chinh […]

Leave a Reply

Your email address will not be published. Required fields are marked *