Công cụ tìm kiếm so với thư mục
Số lượng lớn thông tin có sẵn trên internet tạo ra một vấn đề cho người dùng internet. Nội dung đôi khi có thể gây hiểu nhầm và quá khó hiểu. Nếu người dùng đang tìm kiếm một chi tiết cụ thể, với lượng nội dung quá lớn này, việc tìm kiếm thông tin chính xác, lọc và chọn các tài nguyên hữu ích nhất là một nhiệm vụ đầy thách thức. Để giảm thiểu các biến chứng này và giúp người dùng dễ dàng tìm thấy tài nguyên cần thiết hoặc nội dung, các tài nguyên và nội dung của chúng được phân loại. Hai trong số các dịch vụ biên mục phổ biến nhất có sẵn trên internet là các công cụ tìm kiếm và các thư mục web.
Tìm hiểu thêm về Công cụ tìm kiếm
Công cụ tìm kiếm là một ứng dụng web để tìm kiếm và định vị thông tin hoặc tài nguyên trên World Wide Web. Với sự tăng trưởng của các tài nguyên trên www, việc lập chỉ mục nội dung theo cách dễ dàng truy cập ngày càng trở nên khó khăn hơn. Giải pháp được đưa ra cho vấn đề này là công cụ tìm kiếm web.
Công cụ tìm kiếm web hoạt động theo ba bước sau. Thu thập dữ liệu trên web, Lập chỉ mục và tìm kiếm. Thu thập dữ liệu trên web là quá trình thu thập thông tin và dữ liệu có sẵn trên World Wide Web. Điều này thường được thực hiện với phần mềm tự động được gọi là trình thu thập dữ liệu web (còn được gọi là nhện). Trình thu thập dữ liệu web là một chương trình thực thi thuật toán để truy xuất thông tin mỗi trang web và tự động theo các liên kết liên quan. Thông tin được truy xuất sẽ được lập chỉ mục và lưu trữ trong cơ sở dữ liệu cho các truy vấn sau này. Trình thu thập thông tin truy xuất và lập chỉ mục thông tin về nội dung của trang, chẳng hạn như các từ trong văn bản, URL cho các siêu liên kết và trường đặc biệt trong trang được gọi là thẻ meta.
Khi một yêu cầu hoặc truy vấn tìm kiếm được thực hiện cho một chi tiết cụ thể hoặc một trang trên web, thông qua trình duyệt web, công cụ tìm kiếm sẽ lấy thông tin liên quan từ cơ sở dữ liệu được lập chỉ mục và hiển thị kết quả dưới dạng danh sách các tài nguyên liên quan trên trình duyệt web.
Thêm thông tin về thư mục web
Một thư mục web là một danh mục phân cấp của các trang web được xuất bản trên internet. Các trang web có thể gửi để lập danh mục cho các thư mục này và chúng được liệt kê dưới các trường có liên quan trong thư mục. Thông thường các thư mục được duy trì bởi các biên tập viên của con người và một trang web chỉ được liệt kê nếu trang web đáp ứng một tiêu chí nhất định đảm bảo tính xác thực và chất lượng của trang web. Ví dụ về các thư mục web phổ biến là Yahoo! Thư mục và mở dự án trực tiếp. Một số thư mục tính phí để liệt kê trang web, trong khi một số miễn phí để liệt kê. Trong cả hai trường hợp, người dùng có quyền truy cập vào thư mục mà không phải trả bất kỳ khoản phí nào.
Công cụ tìm kiếm so với thư mục
• Công cụ tìm kiếm là ứng dụng web hiển thị danh sách các tài nguyên có liên quan có sẵn bằng cơ sở dữ liệu được tạo từ thông tin lập chỉ mục được thu thập bởi trình thu thập dữ liệu web
• Thư mục web hiển thị danh sách các tài nguyên có liên quan theo cơ sở dữ liệu được tạo bởi danh mục phân cấp của các trang web được gửi để liệt kê, trong đó các trang web được xem xét bởi các biên tập viên của con người.
• Công cụ tìm kiếm tự động thu thập thông tin về một trang web để lập chỉ mục, trong khi các thư mục Web yêu cầu gửi từ trang web để được liệt kê trong thư mục.
• Trang web phải tuân thủ một tiêu chí nhất định để được liệt kê trong thư mục, để đảm bảo tiêu chuẩn và chất lượng, trong khi công cụ tìm kiếm sẽ tự động liệt kê bất kể chất lượng của nội dung. Mặc dù các công cụ tìm kiếm sử dụng các thuật toán đặc biệt để lọc và cung cấp thông tin hữu ích và phù hợp nhất cho người dùng.
• Một số thư mục tính phí cho danh sách trong thư mục, trong khi công cụ tìm kiếm không tính phí từ nhà xuất bản.