DSO - DIỄN ĐÀN SINH VIÊN ĐÀ LẠT

Bạn có muốn phản ứng với tin nhắn này? Vui lòng đăng ký diễn đàn trong một vài cú nhấp chuột hoặc đăng nhập để tiếp tục.

DIỄN ĐÀN SINH VIÊN ĐẠI HỌC ĐÀ LẠT


    Thuật toán tìm kiếm của google, yahoo, bing...

    thienthan
    thienthan
    Giám sát viên
    Giám sát viên


    Giới tính : Nữ
    Tổng số bài gửi : 739
    Tuổi : 34
    Cảm ơn : 251

    Thuật toán tìm kiếm của google, yahoo, bing... Empty Thuật toán tìm kiếm của google, yahoo, bing...

    Bài gửi by thienthan 2009-12-12, 11:32

    Google công bố 1 bài kết quả nghiên cứu về đánh giá hiệu quả của Sitemaps trong qui trình tìm kiếm "Research study of sitemap", trong đó họ đã hé lộ phần nào qui trình tìm kiếm như sau:

    Thuật toán tìm kiếm của google, yahoo, bing... Untitled

    Qui trình index của Google

    - Discovery :
    đây là quá trình khai phá các trang web mới. Quá trình này được thực hiện thường xuyên. Tuy nhiên các con bọ không phải chạy theo các liên kết 1 cách lung tung hết từ trang web này nhảy qua trang web khác mà đi theo 1 thứ tự ưu tiên: Google trước hết sẽ ‘mò’ ra 1 bộ các trang web ‘nổi tiếng’ (cái này chắc nghĩa là PR cao), xong sẽ róc toàn bộ các liên kết ngoài từ các trang web nổi tiếng đó, cho vào 1 sọt riêng cấp1. Các trang web cấp 1 này lại được róc tiếp toàn bộ liên kết ngoài cho sọt cấp 2. Đám url cấp trên hết sẽ được ưu tiên quăng sang quá trình tiếp theo là Spam Filter.

    - Sitemaps:

    song song quá trình Discovery, Google cũng phát hiện web mới bằng cách xem xét các url được submit lên từ các qui trình submit Sitemaps, ví dụ như bằng robot.txt files, HTTP request hay Google Webmaster Tool.


    - Spam Filter :
    kết quả từ 2 quá trình trên đều được đưa vào bộ lọc spam, có nhiệm vụ phát hiện và loại bỏ các liên kết spam từ các bộ liên kết nhận được rồi mới chuyển sang quá trình kế tiếp.

    - Web Crawler :

    các con bọ của google sẽ nhận được bộ url sạch từ spam filter chuyển
    qua, tạo ra các HTTP request theo yêu cầu ping Google của các website
    rồi bắt đầu thực hiện quá trình thu (retrieve) dữ liệu trên các trang
    đó. Lúc này các links lại tiếp tục được róc ra cho vào các sọt thứ cấp
    chuyển trở lại bước Discovery. Tại đây con bọ web cũng bảo đảm sẽ quay
    trở lại update trang web đã crawl theo yêu cầu về mặt tần suất.

    - Indexer/Server :

    tại đây, bộ phận index sẽ chịu trách nhiệm phân các trang được đưa sang thành từng nhóm khác nhau dựa trên các thông số chất lượng và xây dựng nên dữ liệu index cho các trang này.

    - Server:
    các dữ liệu index sẽ được lưu trữ tại đây để phục vụ cho yêu cầu của người dùng khi họ truy cập và tìm kiếm 1 từ khóa.
    Ta rút ra được gì từ bài viết này của Google nhỉ? Theo tôi thì rất rất nhiều!
    Đây chỉ mới là một đoạn ngắn trong báo cáo kết quả nghiên cứu
    “Sitemaps : above and beyond the crawl duty” – một bài thật hấp dẫn!
    Thuật toán tìm kiếm của google, yahoo, bing... Picture



    Bạn nên hay không nên theo đuổi thuật toán của các bộ máy tìm kiếm ?

    Đây là một vấn đề luôn được đặt ra. Các chuyên gia về SEO thường bỏ ra rất nhiều thời gian để cố gắng “phá vỡ” thuật toán tìm kiếm của bộ máy tìm kiếm. “Nếu tôi có thể tìm ra thuật toán của Google, các trang web của tôi sẽ chiếm lĩnh vị trí đầu tiên trên kết quả tìm kiếm!”

    Hãy nhìn vào một số bất lợi trong cách tư duy này.

    Hãy hình dung những kỹ sư Google sẽ thay đổi ngay thuật toán ngay khi bạn “nghĩ” bạn đã “crack” được thuật toán. Vị trí xếp hạng trang web của bạn có thể bị suy giảm, và bạn sẽ phải tìm hiểu những gì đang diễn ra với bộ máy tìm kiếm ngay lập tức. Nói cách khác, các xếp hạng của bạn sẽ chẳng lâu dài.

    Thay vì việc sử dụng phần lớn thời gian cố gắng gây ấn tượng với một bộ máy tìm kiếm bằng một trang web hoàn hảo, tại sao không gây ấn tượng đối với độc giả mục tiêu…các khách hàng của bạn. Có phải Google, MSN hay Yahoo! Search từng mua bất cứ thứ gì từ bạn? Họ không phải là độc giả mục tiêu. Các khách hàng của bạn là độc giả mục tiêu. Tạo các trang có nội dung dành cho họ.

    Khi bạn bỏ ra rất nhiều công sức để theo đuổi các thuật toán, bạn thường tập trung vào chỉ một vài nhân tố ảnh hưởng tới xếp hạng; những nhân tố này đang tiến triển đúng hướng và bạn hy vọng sẽ mang cho những trang web của bạn cơ hội tốt nhất để thành công. Người ta cho rằng Google có hơn 100 nhân tố xếp hạng ảnh hưởng tới việc xếp hạng và sự liên quan. Một số nhân tố rất quan trọng. Nhưng việc tập trung vào chỉ một hoặc hai nhân tố chính và việc giảm những nhân tố còn lại có thể tác động tai hại đến một website.
    Thuật toán tìm kiếm của google, yahoo, bing... Seo

    Một cách tiếp cận khác…

    Bạn sẽ không đạt được những xếp hạng hàng đầu và giữ chúng ở đó để đạt được doanh số nhất định?

    Cuối cùng, thứ hạng đó không mang lại doanh số mà bạn mong muốn ? Nếu những xếp hạng này không cung cấp những đủ những traffic tạo ra doanh số, bạn sẽ mất tất.


    5 bước cơ bản để giành lấy các thứ hạng hàng đầu mà không cần theo đuổi các thuật toán.


    1. Hãy quên các bộ máy tìm kiếm đi. Vâng, bạn hãy nghe tôi. Các bộ máy tìm kiếm không phải và chưa bao giờ là “độc giả mục tiêu lý tưởng” của bạn. Họ không mua hàng hóa và dịch vụ của bạn. Họ không phải là người mà bạn đang cố gắng làm vừa lòng bằng các trang web của bạn. Thay vào đó, hãy đưa nội dung lên website cho các độc giả mục tiêu.


    2. Đừng quên các điều cơ bản. Dù điều gì xảy ra chăng nữa trong các thuật toán tìm kiếm, thì hãy cứ tiếp tục sử dụng cụm từ khóa chính đầy hứa hẹn trong thẻ tiêu đề, thẻ mô tả META và thẻ từ khóa, link text, phần thân bài viết, thẻ heading… Theo cách đó, khi thuật toán thay đổi, bạn sẽ không phải làm bất cứ sự thay đổi nào trong tất cả các trang. Bạn sẽ luôn luôn sẵn sàng.

    3. Tập trung vào các thẻ chứa từ khóa và phần text ở thân bài đối với chỉ một cụm từ khóa. Mỗi trang nên tập trung vào một cụm từ khóa và mỗi trang nên có các thẻ riêng của nó.

    4. Viết nội dung cẩn thận cho các trang web của bạn, và thêm nội dung mới với tần suất thường xuyên. Nếu nội dung là vua thì ngữ cảnh là hoàng hậu. Tập trung vào cụm từ khóa của bạn, từ đồng nghĩa và các từ liên quan và đoạn text bao quanh. Sử dụng một chương trình như ThemeMaster nếu bạn cần sự trợ giúp quyết định những từ hỗ trợ.

    5. Nhớ rằng nhân tố trên trang (on-page) và nhân tố bên ngoài trang web (off-page) đều quan trọng. Đừng hy sinh cái này để chỉ đạt được cái kia. Các nhân tố on-page là các thẻ tags, phần text ở thân bài, sự nhấn mạnh, tính liên quan…Các nhân tố off-page là sự phổ biến đường link (chất lượng và số lượng của các đường link bên trong) và sự mô tả đường link (những gì đường link bên trong “nói” về trang web của bạn khi họ link đến bạn)

    6. Những nghiên cứu về bộ máy tìm kiếm, điều này không quan trọng sao?


    Điều này rất quan trọng.

    Hãy để tôi lấy cho bạn một ví dụ. Vào đầu năm nay, các trang web bắt đầu không được Google lập chỉ mục. Thông qua nghiên cứu, chúng tôi đã cho rằng đây là vấn đề phức tạp. Bằng việc sở hữu mã thích hợp, các spider (bọ tìm kiếm) của máy tìm kiếm dễ dàng hơn để thu thập nội dung.

    Giải pháp ư? Hãy đảm bảo rằng bạn sử dụng một thẻ DOCTYPE và trình bày bộ ký tự ISO ở đầu của mỗi trang web.

    Ví dụ:

    Nếu bạn không biết về các vấn đề tương thích, bạn có thể thay đổi trang web của mình mà lẽ ra không cần phải làm và lãng phí rất nhiều thời giờ thử cái này hay cái khác.

    Việc nghiên cứu giúp đảm bảo bạn duy trì vị trí tiên phong trong lĩnh vực tìm kiếm. Đó là những gì làm bạn khác biệt với những chuyên gia SEO khác. Bạn ra quyết định dựa vào nghiên cứu và thực tế, chứ không phải sự suy đoán và lý thuyết.
    Thuật toán tìm kiếm của google, yahoo, bing... Seo
    Kết luận…

    Jerry West của tờ WebMarketingNow nói: “Kết luận của người đã từng làm việc trong lĩnh vực này suốt 9 năm và nghiên cứu tỉ mỉ các thuật toán là - đừng theo đuổi các thuật toán. Bạn nói rằng website của bạn đứng thứ 2 đối với một cụm từ khóa nhất định mà chỉ riêng nó mang lại 550 người truy cập vào site mỗi ngày ? Tuyệt. Trong thời gian bạn bỏ ra để đạt được thứ hạng đó, tôi đã viết được 285 trang nội dung độc đáo, giành được 821 đường liên kết...và tổng cộng tôi đã có được hơn 1300 khách truy cập mỗi ngày”.

    Nói cách khác, bằng việc tập trung nhiều việc hơn là chỉ chú tâm theo đuổi các thuật toán, bạn sẽ có tiềm năng có một website thành công nhiều hơn.

      Hôm nay: 2024-11-15, 13:29