Công cụ tìm kiếm hay Search Engine (SE), có thể tạm hiểu nó là một cỗ máy hỗ trợ đắc lực trong việc tìm kiếm thông tin. Có một số cỗ máy lớn mà chúng ta có thể điểm danh qua một chút như:
- Bing - Đứa con bé bỏng của Microsoft
- Yahoo! Search - Vang bóng một thời
- Google - Gã khổng lồ thực sự
Hay.... - Cốc Cốc - Hàng Việt Nam, chất lượng cao!
Nói chung là khi nhắc đến SE thì đa phần các SEOer đều nghĩ ngay đến Google. Đơn giản vì đó là "sân chơi tập thể" của tất cả họ. Thành ra một khi tham gia "chơi" cùng Google thì cũng nên hiểu nó là cái gì đã. Đặc biệt đối với những Newbie, việc hiểu rõ được Google hoạt động sẽ hỗ trợ rất tốt cho quá trình hiểu hơn về việc làm SEO.
Vì vậy chúng ta sẽ cùng tìm hiểu về SE thông qua Series bài viết: "Công cụ tìm kiếm hoạt động như thế nào?". Hôm nay sẽ là EP1. Bắt đầu thôi nào.
Làm thế nào để mọi người tìm được thông tin nào đó trên mạng?
Có hai điều mà bất cứ SE nào cũng phải làm được và làm thật tốt!Công cụ tìm kiếm phổ biến nhất, không nghi ngờ gì, đó là Google. Ngoài ra cũng có thể kể thêm về Bing. Xong Bing thường được sử dụng trong một pham vi lĩnh vực nhỏ hẹp hơn, ví dụ như: Y tế hay học tập.
Công việc chính của SE như Google đó là tìm những nội dung phù hợp với truy vấn của người dùng và trả ra kết quả tìm kiếm. Truy vấn của người dùng thì vô cùng đa dạng. Và để nhập truy vấn thì người dùng sẽ gõ các ký tự vào hộp thoại tìm kiếm sau đó nhấp tìm kiếm.
Ví dụ bạn muốn tìm kiếm kết quả trận đấu bóng đá giữa ManU và ManCity, bạn muốn tìm kiếm ngôi nhà phù hợp với túi tiền của bạn, bạn muốn tìm kiếm các tài liệu học tập, một bộ phim, hoặc một người bạn online, kiến thức lịch sử? Chúng ta vẫn thường có một câu để trêu nhau rằng: "Dân ta phải biết sử ta/ Nếu mà không biết thì tra...google".
Rất đơn giản và rất nhanh chóng phải không nào? Đó chính là cách mà chúng ta vẫn thường sử dụng để tìm kiếm thông tin trên mạng. Sử dụng các công cụ tìm kiếm, SE. Nhưng các SE sử dụng cái gì để có thể thu nhập dữ liệu khổng lồ trên internet rồi trả về kết quả chính xác nhất cho bạn?
Tất cả đều nhờ vào bọ tìm kiếm.
Những chú bọ tìm kiếm - Robot hay Crawlers:
SE sử dụng một thứ được gọi là bọ tìm kiếm hay Crawler, Spider. Nhiệm vụ của những con bọ này đó là đi lang thang trên mạng lưới internet để thu thập dữ liệu. Bạn còn nhớ www là viết tắt của gì chứ? World Wide Wed, tất nhiên. Tất cả hệ thống mạng trên toàn thế giới được kết nối với nhau thông qua những liên kết (links). Đó cũng chính là đường đi của những con robot. Chúng sẽ đi theo các liên kết để thu thập dữ liệu dưới dạng chữ trên trang web. Đồng thời cũng sẽ đánh giá trang web đó luôn.Tất cả những dữ liệu được bọ tìm kiếm thu thập được sẽ được gửi về database (DB) của SE để lập chỉ mục (index). Một DB khổng lồ! Chắc chắn là phải thế rồi. Các bạn thử tưởng tượng lượng thông tin trên thế giới to lớn đến như thế nào. Vậy bạn thử đoán xem con số index của Google mỗi ngày là bao nhiêu không?
"Chúng tôi đã lập chỉ mục 4.556.797.934.111 trang trong một ngày"Quá đáng kinh ngạc phải không nào? Vậy với một số lượng dữ liệu khổng lồ như thế, làm thế nào SE có thể sàng lọc ra những thông tin tốt nhất để tạo nên bảng xếp hạng tìm kiếm? Có phải chúng được sắp xếp một cách rất ngẫu nhiên hay có một chỉ số nào đó để giúp SE sắp xếp các nguồn thông tin?
Câu trả lời sẽ có trong phần hai của bài viết. Còn bây giờ, có lẽ chúng ta nên trầm trồ thêm một lần nữa về Google vì những con số đáng nể mà họ đã làm được.
Thật tuyệt vời!
PhongViet hy vọng bài viết có ích với cách bạn. Chúc các bạn thành công!


No comments:
Post a Comment