Friday, May 9, 2008

Hu nhau bang Google

Hù nhau bằng Google

Nguyễn Vạn Phú

Dạo này có khá nhiều bài viết, phát biểu hay nhận xét bắt đầu bằng một câu, đại ý nếu vào Google, gõ dòng chữ xxx, thì xuất hiện cả ngàn (chục ngàn hay cả triệu) trang.

Ví dụ, đây là câu mở đầu bài viết “Gu thời trang của MC Thanh Bạch” trên tờ Thời Trang Trẻ: “Cho đến hôm nay, khi nhắc đến Thanh Bạch, báo chí dường như không bỏ sót bất kỳ một chi tiết nào có liên quan đến anh. Chỉ cần gõ từ khóa "Thanh Bạch" và search trên Google, bạn sẽ thấy có 353.000 kết quả chỉ trong 0,19 giây”.

Còn đây là câu đầu tiên của bài “Há cảo” trên tờ Sài Gòn Tiếp Thị: “Vào Google gõ một cái thì há cảo tràn ra cả mấy chục trang”. Tờ Nghề báo số mới nhất cũng có bài bắt đầu theo lối này: “Vào Google, gõ vào dòng chữ “Công ty truyền thông”, trong vòng 0,33 giây, công cụ tìm kiếm trực tuyến này sẽ cho ra 1.440.000 trang web có chuỗi ký tự ấy”.

Nói vậy mà không phải vậy

Có lẽ điều đầu tiên nhiều người sử dụng Google đã biết là khi tìm một cụm từ, nếu chúng ta để cụm từ này trong ngoặc kép, kết quả sẽ khác hẳn so với không để ngoặc kép. Ví dụ với cụm từ “công ty truyền thông”, nếu tìm theo cách thứ nhất, kết quả chỉ là 676.000 trang so với 1.630.000 trang nếu tìm theo cách thứ hai. Vì khi không để trong ngoặc kép, Google sẽ tìm bất kỳ trang web nào có chứa các từ đó, bất kể chúng ở xa nhau tít mù. Xem một trang ngẫu nhiên trong danh sách tìm kiếm theo cách thứ hai, chúng ta sẽ thấy các từ được tìm nằm trong các cụm từ không liên quan gì, như “thông thường”, “dữ liệu truyền”, “có công”…

Thứ nữa, Google là một công cụ tìm kiếm thông tin rất thông minh - nó trả về kết quả theo thói quen của những người tìm kiếm trước đó (tìm cụm từ “Nguyễn Việt Tiến”, nó sẽ cho kết quả ở những trang đầu tiên liên quan đến ông Nguyễn Việt Tiến, nguyên Thứ trưởng Bộ Giao thông Vận tải chứ không phải một Nguyễn Việt Tiến bất kỳ vì chính đây là tên được nhiều người trước đó tìm kiếm nhiều). Tuy nhiên, chính điều này làm kết quả tìm kiếm sai lạc không thỏa mãn người cần tìm thông tin. Ví dụ, với từ “há cảo”, đa phần các trang kết quả nói về hệ điều hành Hacao Linux (đây là cụm từ được tìm nhiều hơn món ăn há cảo). Và khi “tiền sử” tìm kiếm của mọi người là như nhau, không có một xu hướng nào vượt trội thì kết quả không phân biệt nghĩa của từ này với từ khác. Trong 353.000 trang có cụm từ “Thanh Bạch”, sẽ có rất nhiều trang có cụm từ này nhưng dùng với nghĩa “trong sạch và giữ được tiết tháo”. Chú ý, nếu dùng Google bình thường kết quả sẽ khác với khi dùng Google Toolbar. Với Google Toolbar, kết quả dựa vào các lần tìm kiếm trước đó nhiều hơn bội lần.

Như vậy chúng ta có thể kết luận các cách nói như minh họa ở đầu bài không chính xác, không có ý nghĩa thống kê gì hết cho dù cụm từ được tìm kiếm đã được cẩn thận bỏ trong ngoặc kép. Tốt nhất nên bỏ lối so sánh này vì nó rất sai lạc mà lại thường được dùng để chứng minh cho một điểm nào đó.

Tìm là thấy

Với những người dùng Google để tìm kiếm thông tin thật sự, những thủ thuật nhỏ, những mánh lới khai thác Google sẽ giúp họ tìm ra thông tin cần tìm nhanh hơn, hiệu quả hơn. Nếu cụm từ mà chúng ta bỏ trong ngoặc kép để tìm càng dài, càng chi tiết, khả năng tìm đúng ngay thông tin chúng ta cần sẽ cao hơn. Nếu chúng ta thêm thành cụm từ “món há cảo”, kết quả sẽ trả về toàn những trang có nhắc đến món thức ăn này. Cũng có những trang nhắc đến “món há cảo” trong một bút ký hay truyện ngắn, không phải là trang chúng ta cần tìm. Nếu mở rộng thành hai cụm “món há cảo” và “cách chế biến” (cả hai đều để trong ngoặc kép) thì chúng ta sẽ tìm thấy một trong các trang đầu tiên bàn đúng đến thông tin chế biến món ăn này.

Tương tự, với nghệ sĩ “Thanh Bạch”, nếu chúng ta thêm từ MC thành “MC Thanh Bạch”, kết quả sẽ chính xác hơn nhiều. Nói khái quát, chúng ta nên xác định thông tin cần tìm là gì, hình dung trong trang web cần tìm chắc chắn sẽ có những cụm từ nào, xong rồi gõ càng nhiều cụm như thế càng tốt (trong ngoặc kép), cơ hội tìm ra thông tin sẽ nhanh hơn. Nếu cần nên kết hợp nhiều cụm từ, thêm bớt nhiều lần để tinh chỉnh kết quả. Nhiều lúc phải dùng một lúc nhiều thủ thuật (xem chi tiết ở bài bên cạnh) mới tìm ra điều chúng ta cần tìm. Nhiều người cũng hay quên Google có công cụ tìm ảnh riêng, nên vào đây khi muốn tìm ảnh và khi muốn tìm thông tin mang tính thời sự nên vào news.google.com sẽ tìm nhanh hơn, chính xác hơn.

Cũng nên lưu ý, tìm ngay trong các trang web cụ thể, kết quả sẽ chính xác hơn dùng Google. Ví dụ chúng ta biết chắc thông tin cần tìm nằm trong trang web của báo Tuổi Trẻ điện tử, nên vào chính ngay trang này và sử dụng công cụ tìm kiếm của chính trang đó.



Các thủ thuật Google
Các thủ thuật này đã phổ biến trên nhiều trang web, xin tóm tắt những thủ thuật thường dùng nhất. Lúc nào không nhớ hết những thủ thuật này, chúng ta có thể vào phần Google Advanced Search là dễ nhất.
- Dùng dấu -: Đôi lúc Google trả về kết quả theo xu hướng tìm kiếm nên không thỏa mãn nhu cầu của chúng ta. Gặp trường hợp này, nên dùng dấu - trước cụm từ không muốn xuất hiện. Ví dụ muốn tìm người bạn cũ tên “Hồ Ngọc Hà” mà không phải là cô ca sĩ nổi tiếng, cứ thử gõ thêm -“ca sĩ” xem sao.
- Tìm trong tiêu đề: Khi biết chắc thông tin cần tìm xuất hiện trong tiêu đề trang web, chúng ta nên sử dụng cách gõ: intitle:“thông tin cần tìm”.
- Tìm trong một trang web cụ thể: Đôi lúc chúng ta chỉ tìm thông tin trong một trang web đã xác định, lúc đó nên gõ: “thông tin cần tìm” site:địa chỉ của trang web đó. Nhớ là sau dấu hai chấm không có dấu cách.
- Tìm trong một loại tập tin cụ thể: Nếu chúng ta biết mình chỉ cần tìm thông tin đó trong tập tin Microsoft Word (.doc) hay Acrobat (.pdf) thì hãy gõ: filetype:doc “Thông tin cần tìm” hay filetype:pdf “Thông tin cần tìm”.
- Dùng Google như một máy tính bỏ túi: Nếu cần chúng ta cứ gõ ngay vào ô tìm kiếm của Google (ví dụ 2+3 hay 2^20), Google sẽ cho ra kết quả tính toán ngay. Tương tự, nếu chúng ta gõ “3 USD in Vietnamese dong” sẽ thấy trang web này tính toán chuyển đổi ngoại tệ luôn cho chúng ta.