Vậy làm thế nào để Google tìm được chính xác cái bạn cần trên Internet, cần phải biết khai thác tốt các chức năng tìm kiếm nâng cao mà Google cung cấp.
Thu hẹp phạm vi
Chức năng tìm kiếm nâng cao (Advanced Search) của Google giúp người dùng giới hạn kết quả tìm kiếm trong phạm vi hẹp hơn thay vì phải xem một danh sách kết quả dài dằng dặc những mục không ăn nhập gì với cái cần tìm. Ví dụ, nếu muốn tìm những bài viết đề cập đến nhà bác học Albert Einstein mà chỉ đơn thuần nhập vào từ khóa là Albert Einstein thì chúng ta sẽ nhận được đủ thứ trên trời dưới biển, từ hình ảnh, tiểu sử đến thân thế, sự nghiệp... vì đều có từ Einstein. Để thu hẹp kết quả tìm kiếm thì ngoài cụm từ “Albert Einstein” chúng ta phải thêm vào những từ khóa bổ sung, Google cho phép tối đa là 10 từ. Ở ví dụ vừa nêu, ta chỉ cần nhập thêm vài từ khóa nữa như “bằng sáng chế” hay “thuyết tương đối” thì sẽ tìm được các bài viết về quá trình lao động để dẫn đến phát minh của ông. Tuy nhiên cũng có trường hợp không tìm thấy cái cần tìm hay kết quả chỉ là những trang liệt kê từ vựng như từ điển. Để tránh tình trạng này nên gom các cụm từ đặc trưng lại với nhau bằng dấu ngoặc kép, ví dụ như “Albert Einstein” thay vì Albert Einstein thì Google sẽ loại bỏ những bài viết đề cập đến một người Tom Einstein nào đó.
Nếu nhập từ khóa có kèm theo * thì Google sẽ tìm kiếm các trang có liên quan xoay quanh từ khóa nhập vào. Vì dụ nếu như chúng ta nhập: Einstein “* thuyết tương đối” thì Google sẽ cung cất tất cả các bài viết có liên quan đến Einstein, thuyết tương đối và các thuyết khác liên quan.
Tìm chính xác hơn
Thêm, bớt cụm từ và dùng các ký tự đại diện như dấu ngoặc kép, dấu sao là những chức năng tìm kiếm cơ bản. Google còn cung cấp cho người dùng những chức năng tìm kiếm nâng cao, nhấn chọn vào liên kết có nhãn Advanced Search, vùng “Find results” màu xanh dương nằm bên trên cùng trình bày các chức năng tìm kiếm cơ bản như đã đề cập ở trên. Ví dụ: Nếu nhập từ khóa tìm kiếm vào ô có nhãn “with all of the words” có ý nghĩa tương tự như ta nhập cụm từ cần tìm vào ô tìm kiếm của Google. Nhập từ khóa tìm kiếm vào ô có nhãn là “with the exact phrase” có ý nghĩa như gom cụm từ tìm kiếm trong dấu ngoặc. Nhập từ khóa tìm kiếm vào ô có nhãn “with at least one of the words” có nghĩa là tìm những trang web có nội dung chứa một trong các từ cần tìm. Nhập từ khóa tìm kiếm vào ô có nhãn “without the words” có nghĩa là tìm những trang web không chứa một trong các từ cần tìm. Nội dung như trong hình 1, có nghĩa là tìm những trang web có hiện diện từ “Einstein” (khoảng 44 triệu trang) và cụm từ “theory of relativity” (kết quả sẽ giảm xuống còn 1,8 triệu trang), ngoài ra còn phải có từ “special” hoặc “general” (kết quả sẽ giảm xuống còn khoảng 1 triệu trang). Kế đến, với nội dung trong ô “without the words” đã loại trừ những trang web đề cập đến vấn đề triết học, tôn giáo, chính trị thì kết quả sẽ còn khoảng nửa triệu trang mà thôi.
Cũng với yêu cầu tìm kiếm như trên nhưng thực hiện bằng dòng lệnh thì chúng ta phải nhập nội dung vào ô tìm kiếm của Google như sau: Einstein special OR general “theory of realtivity” –religion –politic –phylosophy.
Nhưng với kết quả tìm thấy là nửa triệu trang web cũng vẫn là quá nhiều. Giả sử như bạn chỉ biết tiếng Anh thì chúng ta có thể sàng lọc bớt bằng cách chọn English trong hộp chọn có nhãn là Language. Tiếp tục, giả sử bạn chỉ cần những tài liệu do các trung tâm khoa học, các trường đại học, viện nghiên cứu mới phát hành, viết bằng tiếng Anh, lưu dưới dạng PDF, nghiên cứu về quan điểm của Anhxtanh sau khi tìm ra thuyết tương đối khoảng mươi, mười lăm năm thì bổ sung các điều kiện tìm kiếm như sau: Thêm từ khóa definition vào ô có nhãn là “with all of the words”; Trong dòng có nhãn “File Format” chọn “Only” và “Adobe Acrobat PDF (.pdf)”; Chọn “past 6 months” trong mục có nhãn “Date”; Nhập giá trị 1905 và 1916 (năm Anhxtanh viết bài công bố thuyết tương đối) vào mục có nhãn “Numeric Range”; Nhập từ khóa .edu vào mục có nhãn “Domain” (xem hình 1). Nhấn chuột vào nút bấm “Google Search”, kết quả sẽ chỉ còn lại 18 tài liệu do các trường đại học, viện nghiên cứu phát hành như Harvard, Princeton, MIT...
Nếu dùng chức năng tìm kiếm bằng dòng lệnh thì nhập nội dung như sau: Einstein definition special OR general “theory of relativity” -religion -politics -philosophy site:.edu filetype:pdf 1905..1916. Tương tự như vậy, nếu muốn tìm trên địa chỉ Internet của tạp chí PC World trong mấy năm gần đây các bài viết về phần mềm sao lưu thích hợp cho Windows XP, trừ Windows Vista, tác giả có tên là Scott thì nội dung dòng lệnhh tìm kiếm sẽ là: backup software Scott Dunn OR Spanbauer “Windows XP” -Vista site:pcworld.com 2004..2007 filetype:.ht*.
Tham số site: và filetype: là 2 tham số tìm kiếm duy nhất được Google hỗ trợ. Ví dụ: Nếu muốn tìm trong tiêu đề và địa chỉ Internet của trang web (mặc định, Google chỉ tìm kiếm trong phần nội dung của trang web) có cụm từ “Denver Broncos” mà không có cụm từ “Oakland Raiders” thì nhập cụm từ “Denver Broncos” vào mục có nhãn là “with all of the words” và cụm từ “Oakland Raiders”, vào mục có nhãn “without the words”. Tiếp theo chọn “in the title of the page” trong mục “Occurrences”, cuối cùng nhấn chọn phím Google Search. Tương đương, khi muốn tìm kiếm bằng dòng lệnh thì nhập: Denver Broncos -Oakland –Raiders.
Hình 2: Giao diện của Google khi muốn tìm kiếm tập tin theo khoảng thời gian (Numeric Range) và nguồn cung cấp thông tin.
|
|
Tìm kiếm tập tin
Tìm kiếm bằng dòng lệnh là cách duy nhất để Google thực hiện chức năng tìm kiếm song song trên nhiều đoạn văn bản của trang web cùng một lúc (tìm kiếm trong Advanced Search Google vẫn là tìm kiếm tuần tự từng địa chỉ một). Tìm tập tin có định dạng khác HTML (trang web) là một thế mạnh nổi trội nhất của Google. Thực hiện tìm kiếm bằng dòng lệnh thì Google có thể tìm bất cứ loại tập tin nào, không giới hạn như trong mục tìm kiếm Advanced Search. Ví dụ nếu muốn tìm thư mục chứa các tập tin nhạc dạng MP3 của Louis Armstrong để tải về nghe thì nội dung dòng lệnh là: -inurl:htm -inurl:html intitle:”index of” mp3 “Louis Armstrong”. Nên cẩn thận khi dùng chức năng này, vì khi bản tải tập tin về cũng có nghĩa là bạn có nguy cơ bị nhiểm vi rút máy tính ẩn trong tập tin tải về. Tham khảo các thông số, toán tử dùng để tìm kiếm trong Google tại địa chỉ find.pcworld.com/59186.
Hình 3: Một cách thể hiện kết quả tìm kiếm theo tiến trình thời gian của Google (chưa phát hành)
|
|
Cách thể hiện kết quả tìm kiếm mới của Google
Cách thể hiện kết quả tìm kiếm hiện nay của Google khá tẻ nhạt, đơn thuần chỉ là một danh sách từ trên xuống dưới, hết trang này sang trang khác. Hiện nay Google đang thử nghiệm một vài cách thể hiện kết quả tìm kiếm thích hợp hơn trong dự án Google Experimental Search (find.pcworld.com/59187). Kết quả tìm kiếm sẽ được trình bày theo nhiều cách khác nhau, theo thời gian, theo bản đồ địa lý... Thao tác di chuyển con trỏ, chuột, menu cũng được cải tiến, có nhiều phím tắt giúp người dùng truy cập nhanh đến chỗ cần thiết...
Tiện ích hỗ trợ trong tìm kiếm
Tiện ích Ksoft (tải về sử dụng tại địa chỉ find.pcworld.com/59352) ngăn ngừa Google thu thập các từ khóa bạn hay sử dụng khi tìm kiếm trên Google. Công cụ này cũng ngăn chức năng Analytics của Google thu thập địa chỉ các trang web bạn hay tham khảo nhất. Tiện ích Google Hacks (tải về sử dụng tại địa chỉ find.pcworld.com/59353) giúp người dùng khai thác chức năng tìm kiếm nâng cao trên Google thuận tiện hơn, chỉ cần nhập từ khóa và chọn mục tìm kiếm. Ngoài ra nếu muốn biết rõ cách thức đánh giá xếp hạng trang web của Google, tham khảo bài viết “Search Engine Ranking Factors”của SEOmoz.org (find.pcworld.com/59355).
Van Thu - PC World Mỹ