Guanxi Nghệ Thuật Tạo Dựng Quan Hệ Kinh Doanh
9. Cuộc chiến công cụ tìm kiếm
Tháng 3 năm 2003 – Tháng 3 năm 2005
Chúng tôi không còn lựa chọn nào ngoài cách đứng lên và chiến đấu với Google.
—HARRY SHUM
Một buổi sáng ảm đạm tháng 3 năm 2003, khoảng sáu tháng trước khi tiếp quản Trung tâm Công nghệ cao, HongJiang Zhang đến văn phòng Microsoft tại Bắc Kinh để nhận email của Bill Gates. Bức thư được gửi từ tối hôm trước cho một số phó chủ tịch và giám đốc điều hành nghiên cứu của Microsoft. Bức thư dài một trang, chia thành những đoạn ngắn với một hoặc hai câu – phong cách viết thư đặc trưng của vị chủ tịch tập đoàn. Tuy nhiên, nội dung bức thư rất rõ ràng. Trong thư, Gates nhận định Google, công ty tìm kiếm thông tin qua mạng là đối thủ chính của Microsoft và ông yêu cầu các thành viên ban quản trị phải nghĩ ra chiến lược để đánh bại Google. Ông cũng khiển trách nhân viên đã không đánh giá đúng được tầm quan trọng của các trang Web tìm kiếm như là một cơ hội kinh doanh. Một giám đốc cao cấp nói: “Gates điên mất rồi!”
Không có vẻ như Microsoft đã ra khỏi cuộc chơi nhưng nó đã tụt lại phía sau khá xa. Trở lại Mỹ, tất cả mọi người đều nói về việc tìm kiếm. Google không còn đơn thuần là một trang Web để mọi người tra cứu tài liệu trên mạng. Doanh thu của công ty đã tăng đến 348 triệu đô- la vào năm 2002 và dự tính năm 2004 khi công ty cổ phần, doanh thu sẽ dao động ở mức 3,2 tỷ đô-la. Nguồn thu chủ yếu là nhờ vào quảng cáo trên mạng – mô hình kinh doanh mà rất nhiều người cho rằng không thể thành công. Khi đó, Yahoo đang trong tiến trình đàm phán mua công cụ tìm kiếm Inktomi với giá 235 triệu đô- la và xác định vị trí của mình nhằm đạt được thỏa thuận mua công ty quảng cáo trên mạng Overture với giá 1,6 tỷ đôla. Vụ mua bán này dự kiến có thể ngã giá vào tháng 7. Vào thời điểm đó, Inktomi cung cấp phương tiện tra cứu cho cổng thông tin MSN (Microsoft.net) của Microsoft, còn Overture cung cấp hệ thống quảng cáo trả trước, dịch vụ, chỉ áp dụng với mô hình kinh doanh vừa và nhỏ. Dù những công nghệ có bản quyền kinh doanh đảm bảo trong lĩnh vực này, nguồn vốn đầu tư cho nghiên cứu đã lên quá cao. Microsoft cần phải phát triển công nghệ của chính mình và tích hợp công nghệ đó vào sản phẩm để bắt kịp.
Tình trạng này lặp lại mối đe dọa bởi trình duyệt Web của Netscape vào giữa những năm 1990 – trình duyệt này đã nhằm vào những yếu kém liên tiếp của Microsoft để nắm lấy cơ hội kinh doanh về Web. Trong nền kinh tế mạng bùng nổ, việc tìm kiếm đóng vai trò nền tảng cho quản lý thông tin, vượt xa những gì mà hệ điều hành Windows hay những trình duyệt Web có thể làm được. Về mặt kỹ thuật, nó phong phú hơn, phức tạp hơn và thật sự là mối đe dọa đối với hoạt động kinh doanh của Microsoft. Hơn thế nữa, Google đã bắt đầu tập trung vào nghiên cứu công nghệ này từ bốn năm trước và trở thành một điểm nóng thu hút các nhân tài – điều khiến Gates phải bực mình. Tại Diễn đàn Kinh tế Thế giới ở Davos, Thụy Sĩ, Gates xuất hiện trên mặt báo khi nói rằng: “Google đã hất cẳng chúng tôi” và “Chúng tôi thật ngu ngốc”.
Khi đọc lại email của ngài chủ tịch, HongJiang Zhang nghĩ: “Chúng ta phải làm một điều gì đó.” Trợ lý giám đốc của Trung tâm Nghiên cứu Bắc Kinh suy nghĩ một lúc rồi gọi điện thoại cho Wei Ying Ma, một đồng nghiệp lâu năm của ông – trưởng nhóm quản trị truyền thông của Trung tâm.
Lĩnh vực chuyên môn của Wei Ying là phục hồi thông tin và khai thác dữ liệu, bao gồm thuật toán để tìm ra những ẩn số từ hệ thống cơ sở dữ liệu kỹ thuật số khổng lồ – vốn là trở ngại lớn cho việc nghiên cứu. HongJiang đưa Wei Ying xem email của Gates và ông nhanh chóng đã nắm bắt được vấn đề.
HongJiang Zhang hỏi: “Ông có thể biến nó thành một cơ hội không?”, “Ông có thể làm chủ được nó không?”
Wei Ying Ma gật đầu dứt khoát.
HongJiang Zhang chỉ đạo: “Hãy cố gắng hết sức và làm bất cứ điều gì có thể.”
Cuộc chiến tìm kiếm đã được công bố ở Trung tâm Bắc Kinh. Nhưng thực tế, công việc này đã được bắt đầu từ bốn năm trước, năm 1999. Người ngoài và thậm chí rất nhiều người trong tập đoàn Microsoft không hề biết gì về việc này. Một nhóm của HongJiang Zhang đã tiến hành công việc này trên nền tảng những thuật toán dùng khai thác dữ liệu và phục hồi thông tin trên Web.
Đến giữa năm 2000, số nhân viên của nhóm đã tăng lên 12 người. Tuy nhiên, đó cũng là thời điểm các loại Web.com, dịch vụ quảng cáo trên mạng và các dịch vụ khác có mức chi phí ít ỏi phá sản. Mọi người bắt đầu ngần ngại cống hiến hết mình cho trang Web. HongJiang Zhang thuật lại: “Chúng tôi được biết có quá nhiều người đang làm việc trong lĩnh vực khai thác thông tin. Đây là một tin buồn.” Vì thế, nhóm của ông lại phải cắt giảm một nửa số nhân viên. “Cho đến tận bây giờ, những quan chức cấp cao vẫn khẳng định rằng vào thời điểm đó, chúng tôi không tìm ra hướng giải quyết. Chúng tôi không tin rằng quảng cáo trên mạng có thể kinh doanh được.”
Tuy nhiên, nhóm người ít ỏi này vẫn tiếp tục công việc của mình dưới cái vỏ là chuyên viên nghiên cứu về truyền thông đa phương tiện. Đầu năm 2001, HongJiang Zhang tuyển Wei Ying vào làm việc tại phòng nghiên cứu. Ông đã biết rõ về Wei Ying. Khi còn làm việc ở phòng nghiên cứu HP tại Palo Alto, Zhang đặc biệt tập trung vào các hệ thống nhằm phục hồi hình ảnh từ cơ sở dữ liệu và ông đã tuyển dụng Santa Barbara – một nghiên cứu sinh trẻ của trường Đại học California. Quay trở về Bắc Kinh, ông để Wei Ying Ma giữ vị trí quản lý nhóm quản trị truyền thông, một trong ba nhóm mà ông đang phụ trách. Hơn hai năm sau, nhóm của Wei Ying Ma đã thực hiện thành công nghiên cứu về sự phục hồi hình ảnh và băng video. Tuy nhiên, đó vẫn chỉ là một vị trí thấp trong công ty.
Email của Gates đã thay đổi tất cả. Wei Ying nhanh chóng đưa ra bảng tóm tắt của những dự án liên quan đến tìm kiếm của phòng nghiên cứu. Ông giải thích: “Tại Microsoft, chưa một nhóm nào thực hiện tìm kiếm trên diện rộng. Chúng tôi nhận ra rằng không ai có chuyên môn trong lĩnh vực này.” Đó là đặc điểm chung của mọi người – trong cả lĩnh vực phát triển, kiểm tra và tiếp thị sản phẩm – chứ không chỉ riêng lĩnh vực nghiên cứu. Tuy nhiên, nghiên cứu là lĩnh vực có vai trò đóng góp đặc biệt. Mặc dù nhóm của Wei Ying Ma gần đây đã tập trung vào tìm kiếm truyền thông đa phương tiện – những thuật toán để tìm kiếm hình ảnh, video và ca nhạc trên mạng nhưng những nguyên tắc tương tự có thể áp dụng với việc tìm kiếm trang Web có nội dung văn bản. Vì vậy, Wei Ying bắt đầu xác định những lĩnh vực mà nhóm của ông có thể nhanh chóng thiết lập ngôn ngữ lập trình.
Vào một ngày lập xuân cuối tháng đó, các nhà quản lý của Trung tâm Nghiên cứu Bắc Kinh đã bay tới Tô Châu. Thành phố với 5 triệu dân, nằm ở phía đông Thượng Hải này nổi tiếng với những sản phẩm tơ lụa, mạng lưới kênh đào dày đặc và những cây cầu uốn cong. Nơi đây được mệnh danh là thành Venice của Trung Quốc, là địa điểm phù hợp để cùng nhau thảo luận về công nghệ tìm kiếm trên mạng. HongJiang Zhang, Wei Ying Ma và những người khác cùng dạo quanh một trong những công viên đẹp nhất thành phố và thưởng thức một buổi hòa nhạc cổ điển. Lúc này tại Bắc Kinh đang là mùa đông dài và giá lạnh, còn các nhà nghiên cứu đang thưởng ngoạn không khí ấm áp tại Tô Châu. Rất ít người trong số họ biết rằng còn rất lâu nữa họ mới lại được đi du lịch như thế này. Dịch SARS chuẩn bị tấn công Trung Quốc, đầu tiên là các tỉnh phía nam, sau đó lan tới thành phố Bắc Kinh và các thành phố khác.
Đề tài thảo luận được quan tâm nhất trong cuộc họp tổ chức tại phòng hội nghị của khách sạn là email của Bill Gates. Với sự hậu thuẫn của Microsoft về lĩnh vực tìm kiếm, làm sao để Trung tâm Nghiên cứu Bắc Kinh có thể đóng góp nhiều nhất cho công ty? Đâu là những lĩnh vực chuyên môn? Cần thêm những nguồn lực mới nào? Từ cuộc họp đó, nhiệm vụ của Wei Ying là phải tuyển dụng thêm những nhà nghiên cứu mới, nhân đôi đội quản lý truyền thông hiện có và đặt lại tên cho cuộc tìm kiếm trên mạng và khai thác thông tin. Trong vòng sáu tháng, nhóm nghiên cứu đã lớn mạnh lên với 15 nhân viên chính thức và trở thành bộ phận chủ chốt đóng góp cho sự phát triển của công ty trong lĩnh vực tìm kiếm.
Microsoft đang huy động tất cả mọi nguồn lực để đối phó với những thử thách hiện tại. Là kẻ đến sau trong bữa tiệc tìm kiếm, không còn nghi ngờ gì nữa – họ đã bị Yahoo và nhất là Google vượt rất xa. Tuy nhiên, một khi Microsoft đã thức tỉnh và tổ chức lại, nó sẽ có đủ quy mô, tốc độ và tài năng để bắt kịp nhanh chóng với cuộc đua này. Trước đó, Microsoft từng sáng chế lại trình duyệt. Bây giờ, nó sẽ sáng chế lại ngành công nghiệp tìm kiếm.
Trung tâm Nghiên cứu Bắc Kinh sẽ là vũ khí bí mật của họ.
Mùa hè là thời gian để đi cắm trại – một trại hè tìm kiếm. Những chuyên viên nghiên cứu và thiết kế của Microsoft cần được huấn luyện một số kỹ năng cơ bản để chuẩn bị cho cuộc cạnh tranh toàn lực với Yahoo và Google. Với mục đích đó, phòng nghiên cứu ở Redmond đã tổ chức một trại hè tìm kiếm đầu tiên của MSN trong sáu tuần với những hoạt động: tổ chức các cuộc họp chuyên sâu, các dự án nhóm và bài phát biểu hàng tuần của các khách mời. Khoảng 40 nhân viên – phần lớn là những chuyên viên nghiên cứu, một vài chuyên viên thiết kế chính của MSN và một số nhóm phát triển sản phẩm khác – được yêu cầu cam kết tham gia cuộc cắm trại này trong một khoảng thời gian nhất định. Mục tiêu của cuộc cắm trại này là khơi dậy mọi nỗ lực nhằm đưa Microsoft vượt lên dẫn đầu trong cuộc chiến công cụ tìm kiếm. Bước đầu tiên, trại hè tổ chức các cuộc thảo luận giữa các chuyên viên nghiên cứu và các kỹ sư của MSN về cách thức thiết lập những công cụ tìm kiếm mới của công ty. Tạo ra một công cụ tìm kiếm mới trong một mớ phức tạp là nhiệm vụ không đơn giản.
Người tổ chức trại hè là Eric Brill – một chuyên viên nghiên cứu cao cấp, đứng đầu nhóm khai thác văn bản, tìm kiếm và điều hướng vừa mới thành lập. Rick Rashid và Dan Ling cũng nhận ra tầm quan trọng của công tác nghiên cứu trong cuộc chiến công cụ tìm kiếm và đề nghị Brill hợp tác với những nhà nghiên cứu tại các trung tâm nghiên cứu Redmond, Mountain View, Anh và Trung Quốc. Từng là giáo sư thuộc Đại học Johns Hopkins, Brill nổi tiếng với cống hiến về xử lý ngôn ngữ tự nhiên – đặc biệt là thuật toán “Brill Tagger” – một thuật toán có thể hiển thị tự động các từ và ngữ pháp trong một văn bản để máy tính có thể nhận biết được ý nghĩa của mỗi câu.
Trong trại hè, Wei Ying Ma đã phối hợp với nhóm nhân viên từ Bắc Kinh. Những hiểu biết của ông về khai thác dữ liệu đã kết hợp hoàn hảo với chuyên môn về ngôn ngữ tự nhiên của Brill. Hai người đã làm việc với nhau rất ăn ý. Wei Ying giải thích: “Chúng tôi chỉ vừa mới bắt đầu hiểu được những vấn đề về công nghệ trong cuộc chiến công cụ tìm kiếm. Qua trại hè này, chúng tôi đã học được rất nhiều điều và rất nhiều người đã biết về nhau. Nó cũng thật sự khơi dậy những nỗ lực nghiên cứu của các thành viên trong công ty.” Sáu nhân viên nghiên cứu trong nhóm của Wei Ying Ma cũng tham gia trại hè. Đó là vào tháng 7 năm 2003, tổ chức Y tế Thế giới vừa dỡ bỏ lệnh cấm du lịch đến Trung Quốc.
Các thành viên tham gia trại hè được chia thành bốn đội, mỗi đội phụ trách một nhiệm vụ trong các dự án nghiên cứu. Đội “xếp hạng phù hợp” làm việc để tạo ra danh sách kết quả đường dẫn tới những trang web liên quan – việc này rất có ý nghĩa đối với thắc mắc của người sử sử dụng và đây cũng là thử thách cơ bản tại trại hè. Đội “giao diện người dùng” làm việc để thiết kế những trang tìm kiếm và trình bày kết quả theo cách tiện dụng hơn so với danh sách dài nhiều trang của Google và những phương tiện tra cứu khác. Đội “phân tích bảng câu hỏi” giải quyết vấn đề làm thế nào để phân tích dữ liệu dựa trên thiên hướng của người sử dụng – họ tìm kiếm với mục đích gì và những trang web liên kết nào mà họ chọn nhằm cải thiện thuật toán tìm kiếm. Cuối cùng, đội “truyền thông đa phương tiện” phát triển những phương pháp tìm kiếm đặc biệt dựa trên nội dung trang Web, ví dụ tranh ảnh và âm nhạc. Brill, Wei Ying và các chuyên viên nghiên cứu cấp cao khác được phân vào bốn nhóm để giúp đỡ các đội thống nhất những biện pháp kỹ thuật và đảm bảo mỗi nhóm đều hiểu được tình hình chung của công việc. Mỗi nhóm thường xuyên báo cáo lại cho toàn trại hè và cùng tạo ra một mẫu sản phẩm như một phần của lễ bế mạc.
Đoàn Bắc Kinh đã tổ chức thành công một trại hè của riêng mình, trùng với trại hè ở Redmond. Đầu xuân năm đó, các khoa công nghệ máy tính khắp Trung Quốc đều nhận được tờ quảng cáo từ Trung tâm Nghiên cứu Bắc Kinh. Trang quảng cáo được trang trí logo bốn màu của Microsoft với nội dung: “Chúng tôi đang tìm kiếm 20 sinh viên tốt nhất trong cả nước làm việc trong lĩnh vực tìm kiếm trên mạng cho MSR Châu Á.”
Quảng cáo đó có sức hấp dẫn kỳ lạ. Khi thông báo của Trung tâm đã được gửi đi khắp các trường đại học tại Trung Quốc thì “Trại hè tìm kiếm” Bắc Kinh đã thu hút được rất nhiều sinh viên tài năng trên khắp đất nước. Wei Ying Ma đã tuyển dụng được 20 sinh viên đứng đầu các trường đại học ở Bắc Kinh. Phần lớn những sinh viên này chưa từng đặt chân đến Trung tâm – thậm chí nhiều người còn chưa tới Bắc Kinh. Tuy nhiên, bây giờ họ được làm việc ba tháng tại phòng thí nghiệm với mức lương cao.
Ban đầu, trại hè đã bị hoãn lại do dịch SARS bùng phát. Tuy nhiên, vào tháng 7, khi trại hè tìm kiếm Redmond đang diễn ra thì cuộc sống tại Bắc Kinh cũng trở lại bình thường và sinh viên bắt đầu đi cắm trại. Đó cũng là lúc MSR Châu Á chào mừng những sinh viên thực tập quay trở lại Trung tâm sau thời gian về quê tránh dịch bệnh.
Wei Ying rất ấn tượng trước những đóng góp của nhóm sinh viên do ông phụ trách. Họ là những người xuất sắc nhất trong số rất nhiều sinh viên. Tuy nhiên, có một vài sinh viên đặc biệt không được tuyển dụng khiến ông rất ngạc nhiên. Một sinh viên nữ có tên là Trịnh Phong Bình đến từ Đại học Bắc Kinh đã không đạt kết quả tốt trong lần phỏng vấn và đã không được nhận. Tuy nhiên, cô đã gửi email cho Wei Ying Ma và xin làm việc tình nguyện không lương – cô chỉ muốn có cơ hội để tham dự trại hè mà thôi. Wei Ying thật sự ấn tượng và đã cho cô cơ hội làm một sinh viên thực tập không công. Trịnh Phong Bình đã trở thành nhân viên xuất sắc tại trại hè và sau đó cô trở thành trợ lý nghiên cứu của Trung tâm. Wei Ying Ma nhớ lại: “Thông qua chương trình này, chúng tôi đã xác định được một số sinh viên rất có tiềm năng. Họ đã cho tôi thấy niềm đam mê và cả sự cam kết. Vì thế tôi đã cho họ cơ hội để thử sức.”
Mùa hè năm đó tại Redmond, Wei Ying và một số thành viên trong nhóm đã phải làm việc gấp đôi, bất kể ngày đêm ở trại hè để bắt kịp với Bắc Kinh và quản lý những sinh viên vừa được tuyển dụng. Để khuyến khích sinh viên Trung Quốc tham gia trại hè, hàng ngày, Wei Ying và nhóm của ông gửi các ý kiến phản hồi, lời động viên qua email hoặc điện thoại và tổ chức hội nghị bằng video ít nhất một tuần một lần.
Wei Ying Ma sẽ tổ chức lại các trại hè vào hai mùa hè tới bởi sau mỗi lần tổ chức, các nhóm tìm kiếm phát triển sản phẩm ngày càng liên kết chặt chẽ với nhau hơn và có nhiều thiết bị tốt hơn để sinh viên có thể “thực hiện nhanh chóng thí nghiệm và ý tưởng này”. Trại hè cũng là một cách để thúc đẩy những thứ mà Trung tâm Nghiên cứu Bắc Kinh đang thực hiện: vươn xa tới một thế giới mới để tìm kiếm nhân tài có khả năng giúp Microsoft cạnh tranh. Wei Ying giải thích: “Qua những trại hè này, chúng tôi đào tạo những sinh viên tại Bắc Kinh để đáp ứng nhu cầu nghiên cứu.” Mùa hè năm 2003, sau khi trở về từ trại hè đầu tiên ở Redmond, Wei Ying Ma tự tin rằng nhóm của ông có thể tạo nên những đóng góp chính cho hoạt động kinh doanh tìm kiếm và khai thác thông tin của Microsoft. Đối với những nhân viên mới, nhóm của ông đã có bốn bài luận được chấp nhận vào SIGIR trong năm tới, đây là một hội nghị nổi tiếng về khai thác dữ liệu và phục hồi thông tin.
Cùng lúc đó, nhóm phát triển sản phẩm của MSN bắt đầu thu được kết quả từ dự án tìm kiếm vượt cấp với quy mô lớn. Christopher Payne – một người gốc Bắc Mỹ – Phó chủ tịch của MSN chịu trách nhiệm dẫn dắt nhóm phát triển những công cụ tìm kiếm sẵn có của công ty. Thử thách đầu tiên là xây dựng Web Crawler – một chương trình phần mềm cho phép tìm kiếm và thu thập các trang Web để có thể phân loại và phân tích bằng công cụ tìm kiếm. Đến giữa năm 2003, phần mềm Crawler của Microsoft đã thành công với danh mục 500 triệu trang Web. Đây là một khởi đầu tốt đẹp, tuy nhiên Google đã có đến vài tỷ trang web trong danh mục và sẽ còn tiếp tục tăng. Payne biết rằng đội của ông còn chặng đường dài phía trước để vượt qua và bắt kịp với các đối thủ cạnh tranh – những người không bao giờ dừng lại. Mùa hè năm đó, khi Wei Ying đang tập huấn nhóm của mình tại Trung tâm Nghiên cứu Bắc Kinh, Payne đã tiến đến việc xác định tên mã cho bộ máy tìm kiếm MSN là hình ảnh tượng trưng cho tính rời rạc của nhóm ông: Underdog.
Từ sau trại hè tìm kiếm năm 2003, Trung tâm Nghiên cứu Bắc Kinh đã đưa ra ba công nghệ chính đi đầu trong cuộc chiến công cụ tìm kiếm. Mỗi công nghệ đều dựa trên thuật toán cơ bản của việc khai thác dữ liệu và phục hồi thông tin, đồng thời xuất phát từ nghiên cứu hướng tới mục tiêu là sản phẩm. Và điều quan trọng nhất, mỗi công nghệ đều có thể tham gia vào kênh cung cấp của MSN trong vòng hai năm, để chuẩn bị ra mắt vào năm 2006 hoặc 2007.
Nhân tố cơ bản nhất của những công nghệ này được gọi là: “việc phân tích đường dẫn dựa trên sự hạn chế”. Về mặt kỹ thuật nghe có vẻ phức tạp, song ý tưởng đằng sau nó lại rất đơn giản. Việc phân tích phải được kết hợp với sự xếp loại tương ứng – làm sao để các trang Web sắp xếp theo tầm quan trọng – điều này quyết định thứ tự hiển thị của các đường dẫn khi người sử dụng có nhu cầu tìm kiếm. Sự phối hợp của Google là các kỹ thuật phức tạp tinh xảo có tên PageRank, hoạt động trên cơ sở sắp xếp thứ tự các trang theo mức độ ưa chuộng và tính liên kết với các trang Web khác. Phương pháp này coi mỗi trang web là một mắt xích trong mạng lưới và sử dụng những thuật toán để tính toán trật tự của mỗi trang Web trong mối tương quan với những trang khác. Một trang Web về máy tính Apple có liên kết với 50 trang khác sẽ được xếp vị trí cao hơn những trang có ít sự liên kết hơn. Môn toán học rất chặt chẽ – mỗi trang web có khoảng 20.000 thông số để xem xét. Tuy nhiên, đó là thực chất của sự kết hợp và nó hoạt động khá tốt.
Vấn đề ở đây là liệu tính phổ biến của trang Web có thật sự liên quan tới câu hỏi của người sử dụng không. Hai chuyên viên nghiên cứu trẻ của Trung tâm Nghiên cứu Bắc Kinh, Ji – Rong Wen và Deng Cai đã phát hiện rằng (trên Google và các phương tiện tìm kiếm khác) có một số trang web được hiển thị mà không liên quan tới yêu cầu tìm kiếm của người sử dụng bởi chủ đề mà họ đang tìm kiếm được xuất hiện trên quảng cáo hay những mục khác tách biệt với nội dung chính của trang. Điều này đã giúp các chuyên gia máy tính nảy sinh ý tưởng về phương pháp sắp xếp các trang web theo cách chi tiết, thuận tiện hơn.
Xây dựng trên cơ sở những nghiên cứu mà trưởng nhóm – Wei Ying Ma đã thực hiện từ nhiều năm trước, Wen và Cai đã phát triển một phương pháp tính toán cho những phần khác nhau của một trang Web. Họ gọi đó là “các khối”. Sử dụng kỹ thuật dự đoán của máy tính – một thế mạnh của Trung tâm mà các chuyên viên đã tạo nên – phần mềm khảo sát từng trang và phân bổ chúng vào những khối hoặc khu vực riêng biệt, dựa vào những tiêu chí như đường phân chia ngang hay dọc, màu sắc hoặc sắc thái nền, mật độ của văn bản và hình ảnh. Một trang tin tức như trang chủ CNN có thể được phân chia theo tiêu đề, biểu ngữ, ảnh, quảng cáo và các đường liên kết liên quan tới chủ đề. Đối với mỗi trang, các khối được xếp thứ tự theo tầm quan trọng. Tiếp đó, thuật toán dùng thông tin của khối để tính toán việc sắp xếp thứ tự cho trang đó bằng cách phân tích hệ thống mối liên kết giữa các khối riêng với những trang Web khác. Thuật toán PageRank được cải tiến mà nhân tố cơ bản là một khối chứ không phải một trang Web đã có tác dụng mang lại kết quả tốt hơn cho mỗi trang Web.
Trong hai bài luận SIGIR phát hành năm 2004, nhóm Bắc Kinh đã chỉ ra rằng việc phân tích dựa vào khối đã đem lại những cải tiến vượt bậc so với phương pháp sắp xếp trang cũ. Điều đó vừa có ý nghĩa quan trọng về mặt thống kê vừa nhận được những lời khen ngợi của một số người dùng thử nghiệm. Các nhà nghiên cứu đã đưa ra nguyên lý trên thông qua việc thực hiện thí nghiệm tìm kiếm 15 trang Web tốt nhất cho những từ khóa tìm kiếm khác nhau và so sánh mối liên quan của trang Web khi có sự phân tích và khi không có phân tích khối. Những kết quả rất tốt đủ để thuyết phục Microsoft xây dựng việc phân tích khối cho thiết bị tìm kiếm mới, nhằm xây dựng cho trang mua sắm MSN. Thiết bị tìm kiếm mới được chuyên biệt hóa để tìm kiếm những món đồ được mua bán trực tuyến và dự kiến được chính thức công bố vào năm 2006. Rộng hơn nữa, Wei Ying cho biết phương pháp phân tích khối đã hỗ trợ cho một số thuật toán đang được Trung tâm Nghiên cứu MSN thử nghiệm để có thể kết hợp với những công cụ tìm kiếm chung của công ty vào năm 2007.
Thành công thứ hai của cuộc chiến công cụ tìm kiếm được mở đầu với một trong những câu chuyện hấp dẫn nhất của Trung tâm Nghiên cứu Bắc Kinh. Zheng Chen là một tiến sĩ xuất sắc, tốt nghiệp trường Đại học Thanh Hoa, được tuyển dụng vào năm 1999 và trở thành nhân viên nghiên cứu chính thức hai năm sau đó. Harry Shum từng bộc lộ suy nghĩ về Zheng Chen: “Rất ít người có thể đạt đến đỉnh cao thành công từ bậc tiểu học cho đến khi hoạt động nghiên cứu”. Trong một chuyến đi Singapore, Shum đã đưa Chen đi cùng và giới thiệu ông với nhiều vị hiệu trưởng các trường đại học. Shum cười: “Sinh viên số một của tỉnh, sinh viên số một của trường Đại học Thanh Hoa. Và gần như là nhân viên số một tại MSR Châu Á. Tôi nói gần như vì tôi không muốn xúc phạm đến những người khác. Nếu như tôi có mười Zheng Chen thì tôi có thể ngủ ngon hàng ngày.”
Một dự án của Chen, được thực hiện với nhóm của Wei Ying Ma cùng sự giúp đỡ của các nhà toán học tại Đại học Bắc Kinh là làm việc với đặc tính quyết định của việc tìm kiếm – giao diện người sử dụng để duyệt qua kết quả. Thông thường, khi bạn tìm kiếm thông tin ở bất kỳ trang chuẩn nào, kết quả luôn là một danh sách dài các đường dẫn – từ trang này đến trang khác. Bạn sẽ phải lướt qua từng trang và đọc một vài dòng nội dung để biết đó có phải là trang mà bạn đang tìm kiếm hay không. Nếu thuật ngữ mà bạn tìm kiếm có nhiều nghĩa thì vấn đề lại càng phức tạp. Kết quả của việc kết hợp nhóm của Zheng Chen đã đưa ra hướng giải quyết cho vấn đề không rõ nghĩa này.
Để giải thích khái niệm kết quả tìm kiếm nhóm, Chen giới thiệu một phiên bản mẫu tìm kiếm từ máy tính để bàn và đánh vào chữ “jaguar”. Từ khóa này có nghĩa là người sử dụng quan tâm tìm kiếm những trang Web về động vật, ôtô hay hệ thống điều hành của Apple cùng tên. Một công cụ tìm kiếm trước đây thường đưa ra danh sách kết quả trước khi biết được người sử dụng đang tìm kiếm cái gì.
Phương pháp kết hợp nhóm đã làm thay đổi tất cả. Bên trái màn hình của Chen nổi lên một danh sách gồm có sáu nhóm kết hợp, phân loại và những trang liên kết khác nhau, gồm: “ôtô jaguar,” “những con mèo lớn” và “hệ thống điều hành Mac OS”. Người sử dụng có thể phân loại những kết quả mà họ đang tìm kiếm và chỉ tập trung vào những trang liên kết của mục đó. Đây hoàn toàn không phải là một khái niệm mới – những trang Web khác như Clusty đã có những đặc tính tương tự – tuy nhiên tất cả còn phụ thuộc vào độ chính xác, sự tiện ích của nhóm phân loại và ý nghĩa của chúng.
Bí quyết nằm ở những cụm từ có nghĩa trong danh sách các trang Web và đánh giá về tính hữu dụng của tên nhóm phân loại. Chen và các đồng nghiệp sử dụng kỹ thuật thống kê học – một thế mạnh khác của Trung tâm, giống như kỹ thuật dự đoán của máy tính để kiểm tra kết quả của phần mềm. Bằng cách nhận biết cụm từ nào là hữu ích (và không hữu ích) từ các trang Web, phần mềm phân tích các mẫu để phân loại ra các trang mới.
Một ứng dụng thiết thực của phương pháp kết hợp khối là hỗ trợ mọi người nhận ra mạng lưới của những mối quan hệ xã hội và nghề nghiệp. Chẳng hạn, điều này thật sự rất hữu ích trong việc tìm kiếm công ty hay các chuyên gia trong một lĩnh vực kỹ thuật nào đó. Trong mẫu chạy thử, Chen cùng đánh tên “Ya-Qin Zhang” và “Kai – Fu Lee” vào phần từ khóa và thấy các nhóm phân loại hiện ra phía bên trái màn hình: Chủ tịch điều hành của MSR Châu Á, nhân viên của Microsoft, Phó chủ tịch của Microsoft và rất nhiều những hiệp hội, hội nghị về công nghệ. Đó là tất cả những điểm chung của Zhang và Lee. Việc biết được những thông tin này trước khi tiếp cận họ là rất hữu ích. Nếu Chen đánh thêm từ “Harry Shum” vào từ khóa thì nhóm phân loại phó chủ tịch sẽ biến mất.
Trước khi được chuyển sang nhóm tìm kiếm MSN, công nghệ kết hợp nhóm của Chen cũng đã có được một bài luận ở SIGIR năm 2004. Hội nghị được tổ chức tại thành phố thép Sheffield, Anh. Không chỉ là một diễn đàn trao đổi các ý tưởng khoa học, đây còn là mảnh đất tuyển dụng màu mỡ cho vị trí nghiên cứu tại Google, Microsoft và một số công ty hàng đầu khác trong lĩnh vực tìm kiếm và truyền thông kỹ thuật số. Năm đó, hội nghị đã diễn ra cuộc chạy đua giữa các công ty (có cả Microsoft) để thu hút nhân sự. Chen nhớ lại: “Lúc đó, giám đốc Trung tâm Nghiên cứu NEC Trung Quốc luôn tìm cách tiếp cận với những thành viên trong nhóm và lần nào cũng vậy, Wei Ying Ma đứng giám sát những gì diễn ra.”
Sau hội nghị, nhóm Bắc Kinh lên tàu đến Cambridge thăm Trung tâm Nghiên cứu Microsoft trước khi bay tới London. Đó là một chuyến đi thành công. Các chuyên gia nghiên cứu mong muốn được nghỉ ngơi chút ít và sau đó lại tiếp tục những quan hệ mới và những phản hồi nhận được từ hội nghị.
Cuối cùng, việc nghiên cứu có ảnh hưởng trực tiếp tới hoạt động kinh doanh tìm kiếm của Microsoft lại không hề thấy trong bất kỳ một luận văn hay hội nghị khoa học nào. Tại hội nghị TechFest, Wei Ying Ma đã có một bài giảng về những công nghệ tiên tiến trong việc khai thác văn bản và thuật toán thống kê giúp máy tính có khả năng liên kết những nhóm từ thông qua ngữ nghĩa của chúng – một ý tưởng hứa hẹn giúp việc tìm kiếm trên các trang Web chính xác hơn. Ngồi lẫn trong khán giả là Ying Li, chủ tịch của iDSS, nhóm phát triển sản phẩm MSN phụ trách việc quảng cáo trên mạng. (iDDS: Intelligent Decision Support System – hệ thống hỗ trợ quyết định thông minh; nhóm phát triển từ nền tảng nhóm kinh doanh thông minh tại MSN).
Là chuyên gia trong lĩnh vực truyền thông đa phương tiện và khai thác dữ liệu, Ying Li đã tạo dựng tên tuổi của mình tại Microsoft nhờ những nghiên cứu về các mẫu “click-through” của người sử dụng tại các trang Web. Cô đã phát triển một phương pháp để xác định tỷ lệ phần trăm số người sử dụng nhấn chuột vào các vị trí và các nhánh khác nhau của trang MSN, đồng thời trang Web được kết cấu như thế nào để người sử dụng và các nhà quảng cáo yêu thích. Khi nghe Wei Ying Ma trình bày, Ying Li lập tức nhận ra nhóm phát triển sản phẩm của cô có thể sử dụng kỹ thuật khai thác văn bản của Wei Ying để nâng cao hiệu quả hoạt động cho hệ thống quảng cáo. Một cuộc trao đổi ngắn gọn tại đó và tại một hội nghị SIGIR ở Toronto sau đó vài tháng, hai bên đã đồng ý hợp tác trong một dự án bí mật, có tên mã là Moonshot – một mô hình quảng cáo của Microsoft đang được chuẩn bị để thay thế hệ thống Overture trên MSN.
Mùa hè năm đó, thiên tài Zheng Chen trong nhóm của Wei Ying tiếp tục làm việc với Ying Li ở Redmond. Trong khóa nghiên cứu về kết hợp nhóm, Chen làm việc trên các trang Web phân loại, một loạt những kỹ thuật mà chúng cho phép phần mềm phân loại số lượng lớn các trang Web theo nội dung và ý nghĩa của chúng. Li hỏi Chen liệu có phương pháp nào để hệ thống có thể tự động đánh giá một từ hay cụm từ bất kỳ có liên quan thế nào tới nội dung của trang Web – một nhân tố có thể khiến MSN kinh doanh các quảng cáo hiệu quả hơn. Ý thức được cơ hội ngàn vàng đối với công việc kinh doanh của công ty, Chen đã đồng ý và cam kết sẽ đưa ra sản phẩm mẫu trong vòng một tháng. Ông giải thích: “Chúng tôi nhận ra rằng để đánh giá lạc quan về doanh thu cho MSN và những nhà quảng cáo thật sự là vấn đề về toán học và công nghệ máy tính. Nhiều người sử dụng hơn, nhiều trao đổi hơn, có nghĩa là nhiều tiền hơn.” Chen và các cộng sự đã làm việc ngày đêm để hoàn thành phần mềm đúng hạn.
Họ đang xử lý những vấn đề cơ bản trong lĩnh vực tìm kiếm thu phí, được gọi là “xác định mối liên hệ” – một đặc tính về mối liên hệ được sử dụng trong tìm kiếm. Những công ty muốn quảng cáo với MSN hay muốn tài trợ cho các trang liên kết tới trang Web của họ thì phải trả một khoản chi phí cho những từ khóa cụ thể. Người sử dụng có thể sắp xếp một từ hay một cụm từ khóa, một quảng cáo hoặc đường dẫn tới trang Web của họ ở phía trên, dưới hoặc bên phải của màn hình hiển thị kết quả dưới những thanh tiêu đề như “quảng cáo mất phí” hay “những trang tài trợ”. Việc trả phí tương ứng với số tiền mà công ty đồng ý trả cho MSN cho mỗi lần truy cập – mặc dù sẽ không có tính phí trao đổi cho tới khi người sử dụng truy cập vào trang Web của nhà quảng cáo. Trả giá càng cao, vị trí liên kết hiện trên trang web càng nổi bật.
Tuy nhiên, vẫn có một số công ty mua những từ khóa không liên quan tới lĩnh vực kinh doanh mà đơn giản là họ muốn khuếch trương. Chen đưa ra một ví dụ tiêu biểu, một hệ thống trả phí tự động có thể cho phép một công ty máy tính mua từ khóa là “running shoe” (giày chạy). Đối với một quảng cáo bán thiết bị tìm kiếm, điều này là không tốt vì hai lý do. Đầu tiên, người sử dụng sẽ không nhấn chuột vào quảng cáo máy tính nếu họ đang muốn tìm giày, vì vậy doanh thu sẽ không cao. Thứ hai, nếu điều đó xảy ra, người sử dụng có thể cảm thấy bực mình và ngừng không sử dụng phương tiện tìm kiếm, điều này thậm chí còn tệ hơn. Xác minh mối liên hệ là một phương pháp tự động kiểm tra xem từ khóa có liên quan tới một trang Web cụ thể hay không. Đây giống như việc tìm kiếm ngược (và xếp hạng sự liên hệ), đó là khi bạn biết trang Web nhưng lại phải đánh giá mức độ liên quan giữa từ khóa và trang Web đó. Thực hiện một công việc phức tạp như vậy không đơn thuần là quyết định xem những từ khóa nào xuất hiện trên trang Web vì trang web có thể có nội dung không bao gồm những từ chính xác. (Ví dụ, một quảng cáo về sách dạy nấu ăn xuất hiện bởi từ khóa “Julia Child”, có thể liên kết tới trang Web có những công thức nấu ăn của người này mà không cần nhắc đến tên đó).
Microsoft đặc biệt quan tâm tới những chi tiết cụ thể liên quan đến công nghệ. Tuy nhiên, lý do chính là thuật toán của Chen đã kết hợp các trang Web phân loại, công cụ nhận biết và lập trình ngôn ngữ tự nhiên giúp phần mềm hiểu được ngữ nghĩa của trang Web và so sánh nó với những từ khóa để kiểm tra xem chúng ăn khớp với nhau ra sao. Sau đó, các chuyên viên nghiên cứu kiểm tra tỷ lệ kết hợp này bằng cách thức giống với sự kết hợp giữa từ khóa với trang Web và đánh giá những cài đặt của thuật toán tương ứng. Nguyên mẫu cuối cùng hoàn toàn tự động và nhanh chóng, tạo ra những quyết định hợp lý về sự liên hệ chỉ với một phần nghìn giây.
Mùa thu năm 2003, công nghệ hoàn chỉnh Moonshot của Trung tâm Nghiên cứu Bắc Kinh đã được chuyển giao thành công cho ATC như một trong bảy dự án chính. HongJiang Zhang, giám đốc điều hành của ATC, tươi cười nói: “Đó là thời khắc xúc động khi chúng tôi có được dự án đó.” Công nghệ Moonshot bao gồm việc xác minh tính phù hợp và một thuật toán liên quan tới quá trình kiểm tra mối liên hệ của “quảng cáo theo ngữ cảnh” trên một trang Web bất kỳ. Sau này nó liên quan tới sự phát triển nhanh chóng của lĩnh vực kinh doanh thiết bị tìm kiếm kết hợp quảng cáo của khách hàng với nội dung cụ thể trên trang Web bất kỳ.
Sáu tháng sau email “nổi tiếng” của Gates, Trung tâm Nghiên cứu Bắc Kinh đã tự tin ghi điểm trong lĩnh vực kinh doanh tìm kiếm đang lớn mạnh của Microsoft và hy vọng thành công trong cuộc chiến công cụ tìm kiếm.
Các công ty về tìm kiếm như Google và Yahoo có đội ngũ biên tập viên đông đảo kiểm tra mối liên hệ của các trang tài trợ và quảng cáo theo ngữ cảnh. Việc đó đòi hỏi rất nhiều thời gian và công sức. Hệ thống xác minh mối liên hệ của Chen và Ma có thể tự động làm việc đó, điều đó đã mang lại cho MSN lợi thế trong lĩnh vực quảng cáo. Wei Ying hài hước nói: “Tự động hóa cả quy trình là lợi thế vượt trội của chúng tôi so với Google.”
Cho đến năm 2004, phần lớn nỗ lực tìm kiếm của Trung tâm Bắc Kinh vẫn là bí mật đối với người ngoài. Tại thời điểm này, việc Ya- Qin Zhang được đề bạt vào vị trí phó chủ tịch đang là tâm điểm của Trung tâm. Vị cựu giám đốc điều hành của Trung tâm chuyển đến Redmond vào tháng 1 năm đó, Harry Shum đảm nhiệm việc quản lý Trung tâm và HongJiang Zhang trở thành người đứng đầu dự án phát triển sản phẩm của Trung tâm Công nghệ cao. Họ cùng nhau trở thành lực lượng mũi nhọn trong chiến lược công nghệ tìm kiếm của Microsoft ở Trung Quốc. Để thành công và phát triển nhanh chóng, Trung tâm Nghiên cứu và Trung tâm công nghệ cao phải thắt chặt mối quan hệ của họ và kết hợp hiệu quả việc nghiên cứu và phát triển. HongJiang Zhang giải thích: “Harry sẽ là trợ lý của tôi và tôi sẽ là trợ lý của ông ấy.”
Nhưng về mặt nghiên cứu, Harry Shum thấy ông cần phải học hỏi nhiều. Nhưng bù lại, Shum trở thành vị lãnh đạo nghiêm khắc và khắt khe hơn so với hai người tiền nhiệm, ít nhất là vẻ bên ngoài. Kết quả là không có chuyện chơi game trong Trung tâm. Nhưng ông lại có thiên hướng xã hội, hay kể chuyện cười hơn Lee và Zhang, thường tổ chức đấu bóng rổ với sinh viên trường Đại học Thanh Hoa. Trong khi A-Qin ít khi tham gia hát karaoke, Shum có thể uống rượu – đặc biệt là rượu gạo của Trung Quốc – rất cừ. HongJiang khẳng định: “Harry là nhân vật của những bữa tiệc.”
Với một trung tâm nghiên cứu lớn và trưởng thành hơn, những gì mà Shum thừa hưởng đã vượt quá mong đợi so với những đóng góp của Trung tâm cho Microsoft. Shum nói: “Trái ngược với vẻ bề ngoài, tôi khá bảo thủ.” Điều này có nghĩa là ông đã lo lắng nhiều hơn những người tiền nhiệm để đảm bảo các dự án nghiên cứu của Trung tâm phải liên quan tới hoạt động kinh doanh của công ty. Ông giải thích: “Bây giờ chúng tôi hiểu nhiều hơn về công ty… Nhưng là một trung tâm nghiên cứu ở quá xa trụ sở, chúng tôi không thể chỉ ăn trưa với nhóm phát triển sản phẩm. Vì vậy chúng tôi phải cố gắng gấp hai, gấp ba lần. Chúng tôi phải tập trung hơn vào các dự án. Chúng tôi nghĩ, khi có cơ hội, hãy đóng góp thật nhiều.”
Trung tâm của Shum đã tập trung vào mọi vấn đề kinh doanh của công ty, từ Xbox đến Windows và mạng không dây. Nhưng không có lĩnh vực nào quan trọng và rõ ràng hơn lĩnh vực tìm kiếm. Tháng 7 năm 2004, khi cuộc chiến công cụ tìm kiếm của công ty nhanh chóng trở thành ưu tiên hàng đầu, Trung tâm Shum chính thức công bố trước dư luận về dự án này.
Tại buổi họp báo ở Bắc Kinh với khoảng 50 nhà báo Trung Quốc và một số lãnh đạo các trường đại học, ông chính thức tuyên bố triển khai dự án mới, lĩnh vực nghiên cứu thứ năm của Trung tâm có tên là “khai thác và tìm kiếm thông tin” – dự án được tiến hành song song với giao diện của người sử dụng, truyền thông đa phương tiện, mạng không dây, đồ họa và giải trí. Ông xác định: “Công tác tìm kiếm sẽ trở thành một phần quan trọng của Trung tâm”. Lúc đó, công bố này không gây ngạc nhiên với các nhà quan sát, nhưng nó nhấn mạnh đến tầm quan trọng của Trung tâm Nghiên cứu Bắc Kinh trong chiến lược tìm kiếm của công ty.
Cũng tại thời điểm đó, Shum giới thiệu hai trợ lý giám đốc điều hành. Người thứ nhất là Hsiao -Wuen Hon, một nhân viên kỳ cựu từ Redmond đã kết hợp chặt chẽ với Trung tâm ngay từ những ngày đầu. Hsiao-Wuen Hon sau này đứng đầu bộ phận chủ chốt trong dự án tìm kiếm của Microsoft tại Trung Quốc. Người thứ hai là Kurt Akeley, chuyên viên nghiên cứu nước ngoài đầu tiên được đề bạt vào vị trí lãnh đạo của Trung tâm Nghiên cứu Bắc Kinh. Tại buổi họp báo, Shum đã rất tinh tế chào đón Akeley, ông hài hước giới thiệu việc anh kết hôn với một phụ nữ Trung Quốc: “Thưa các quý ông, quý bà! Cho phép tôi giới thiệu với quý vị nhà nghiên cứu đồ họa nổi tiếng, thành viên của Hội Kỹ sư Quốc gia Mỹ – và quan trọng hơn cả, đó là con rể của Trung Quốc – Tiến sĩ Kurt Akeley.”
Sự xuất hiện của Hsiao-Wuen Hon và Akeley – những người có kinh nghiệm trong việc phát triển sản phẩm là dấu hiệu cho thấy Trung tâm Nghiên cứu Bắc Kinh, tuy cách xa trụ sở, nhưng đã tiến từng bước vững chắc tới tầm cao mới trong Microsoft, đánh dấu vai trò ngày càng lớn đối với hoạt động kinh doanh của Microsoft và có thể kết hợp chặt chẽ hơn với ATC.
Cuối mùa hè, nhóm của Shum và HongJiang Zhang trong Trung tâm Nghiên cứu và ATC dường như bị đốt cháy trong mọi lĩnh vực, phối hợp thành công với nhóm sản phẩm của MSN và chuyển đổi nhiều công nghệ tìm kiếm vào dây chuyền sản phẩm. Phần mềm phân tích theo khối của nhóm nghiên cứu Wei Ying Ma được chuyển giao cho MSN Search. Giao diện lập nhóm của Zheng Chen cũng được chuyển giao không lâu sau đó. Cùng thời điểm đó, các chuyên viên ở Redmond cũng đang chuẩn bị cho MSN Search sẵn sàng khởi chạy bản beta, dự kiến sẽ được công bố vào tháng 11. Về phía ATC, một nhóm gồm 40 nhân viên do kỹ sư Baogang Yao đứng đầu đã cải tiến và thử nghiệm mã sử dụng để xác minh mối liên hệ của các từ khóa trong năm cuối cùng. Phần mềm đã sẵn sàng để hợp nhất với nền quảng cáo Moonshot, có tên gọi chính thức là Trung tâm Quảng cáo MSN, nơi đã đề cử bản beta vào cuối năm 2005, trước tiên là ở Singapore và Pháp. Microsoft sẽ bố trí những điểm phát hành trên toàn cầu nhằm chuyển đổi hệ thống quảng cáo Overture cũ.
Đặc biệt, công tác tìm kiếm đã giúp Trung tâm Nghiên cứu Bắc Kinh có được một câu lạc bộ người hâm mộ trong các nhóm phát triển sản phẩm tại Redmond. Yusuf Mehdi – Phó chủ tịch của MSN, người giám sát toàn bộ hoạt động kinh doanh tìm kiếm và tương lai có thể được đề bạt vào vị trí phó chủ tịch cấp cao, đã ghi nhận điều này. Trước đó, Mehdi đã lãnh đạo hoạt động marketing của Internet Explorer, một trình duyệt Web của Microsoft từng đánh bại Netscape. Sau khi phê duyệt ngân sách cho năm tài chính tiếp theo, với việc kêu gọi tăng ngân sách cho dự án tìm kiếm tại Bắc Kinh của nhóm sản phẩm MSN, Mehdi đã gửi email thông báo cho cả Shum và HongJiang Zhang. Ông viết: ‘Tôi rất hâm mộ những gì mà MSR Châu Á và ACT đã làm để cải thiện Moonshot – mọi sự hỗ trợ về tài chính và điều kiện làm việc chính là sự ủng hộ thiết thực nhất của tôi đối với các bạn.”
Đối với Harry Shum và HongJiang Zhang, những lời khen ngợi đó càng nhấn mạnh tầm quan trọng của việc nghiên cứu trong cuộc chiến công cụ tìm kiếm của Microsoft. Đầu năm 2005, khi nhận được tin vui là 12 đề tài của Trung tâm Bắc Kinh đã được chấp nhận tại SIGIR – trong tổng số 74 đề tài tại hội nghị, Shum đã mời tất cả chuyên viên nghiên cứu một bữa tối thịnh soạn tại nhà hàng địa phương. Trong bữa ăn, ông nâng cốc chúc mừng thành công và nói rằng: “Tôi thật sự kỳ vọng vào năm tới.”
TechFest năm 2005 là tiêu điểm đang được chú ý. Tại tòa nhà Số 33 – trung tâm hội nghị lớn phía bắc Redmond, các chuyên viên nghiên cứu và trợ lý kỹ thuật đang tập hợp để đưa ra những điều chỉnh cuối cùng cho phòng trưng bày mẫu sản phẩm. Tất cả 150 mẫu sản phẩm tìm kiếm và khoảng 600m rèm xanh dùng để dựng phòng lấp đầy tầng trệt của các phòng trưng bày – chúng đều được đặt tên theo các ngọn núi địa phương như Rainier, Hood, St. Helen Mc Kinley.
Lối vào của phòng trưng bày bị kiểm tra nghiêm ngặt. Tất cả nhân viên đều phải trình phù hiệu cho bảo vệ trước khi vào phòng trưng bày. Trên băng rôn quảng cáo của Microsoft viết: “Tất cả những tài liệu trưng bày tại TechFest là tuyệt mật. Nghiêm cấm sử dụng máy ảnh hay những thiết bị thu khác.”
Hội nghị TechFest thường niên lần thứ năm cũng là hội nghị công nghệ lớn nhất từ trước tới nay. Sự kiện kéo dài hai ngày này, đã thu hút khoảng 6 nghìn lượt người tới tham quan, bao gồm cả các quan chức cấp cao của tập đoàn và Bill Gates. Mặc dù, đây là một sự kiện nội bộ nhưng tầm quan trọng của việc nghiên cứu toàn cầu và sử dụng nhân tài được thể hiện rõ hơn bao giờ hết. Chỉ sáu tuần trước, công ty đã tuyên bố thành lập Trung tâm Nghiên cứu Microsoft Ấn Độ tại Bangalore. Sáu thành viên của trung tâm nghiên cứu mới, được dẫn dắt bởi Padmanabhan Anandan – chuyên viên nghiên cứu tương lai máy tính nổi tiếng từng làm việc nhiều năm tại Redmond – đã cùng tham gia với các đồng nghiệp tại Bắc Kinh, Cambridge, San Francisco và Moutain View để đưa những mẫu sản phẩm đến cuộc trưng bày. Khoảng 400 nhà nghiên cứu đến từ ba châu lục đã tham dự hội nghị này. Rick Rashid, người đứng đầu đế chế rộng lớn này phát biểu: “Tính đa dạng thật là thú vị. Nghiên cứu thật sự là một sự nghiệp toàn cầu. Lúc nào cũng vậy, giống như mọi người trên khắp thế giới, các nhà nghiên cứu đều muốn làm việc đó tại Mỹ.”
Vì thị trường toàn cầu đã thay đổi rất nhiều, TechFest cũng phải nâng cao vốn hiểu biết về văn hóa và thị trường công nghệ của nước ngoài. Kevin Schofield, người quản lý chính về chiến lược và thông tin liên lạc của Microsoft, một trong những người tổ chức chính, cảnh báo: “Sẽ là một hiểm họa nếu không suy xét kỹ khi tham gia vào thị trường toàn cầu.” Giữ vai trò liên lạc giữa nhóm nghiên cứu và nhóm phát triển sản phẩm toàn cầu, ông tuyên bố: “Nếu như bạn đang thiết kế sản phẩm cho các quốc gia khác nhau trên thế giới, cách tốt nhất là bạn nên làm việc với những người đến từ các quốc gia đó.”
Đoàn Bắc Kinh đã mang đến hội nghị 39 mẫu sản phẩm, gồm cả ba sản phẩm mẫu của ATC – trung tâm có một gian trưng bày riêng. Sáu sản phẩm mẫu liên quan tới công nghệ tìm kiếm là của Trung tâm Nghiên cứu Bắc Kinh, gồm một gian trưng bày công nghệ khai thác dữ liệu văn bản có thể áp dụng cho các quảng cáo Web bằng ngữ cảnh. Và một vài công nghệ khai thác dữ liệu thường sử dụng trong nghiên cứu – những thuật toán thống kê nhằm phân tích các mẫu cơ bản trong dữ liệu, giống như tìm kim trong đống cỏ kỹ thuật số – đã được áp dụng trong các lĩnh vực khác như an ninh phần mềm. (Các mẫu sản phẩm chính gồm một mẫu tìm kiếm vắc xin chữa HIV và một mẫu truy tìm dấu vết tin tặc thông qua việc kiểm soát các chat room – đều dựa trên thuật toán tìm kiếm) . Tuy nhiên, mẫu sản phẩm tìm kiếm được biết đến nhiều nhất là mẫu về cách thức lập nhóm của đoàn Bắc Kinh, đã được thử nghiệm qua từ khóa “jaguar” của Zheng Chen. Một vài vị phó chủ tịch tập đoàn, gồm cả Dan Ling, đã ghé thăm phòng trưng bày và gửi ý kiến phản hồi cho Shum và Zhang.
Bên cạnh phòng trưng bày với các mẫu sản phẩm, TechFesh còn có những buổi thảo luận về các chủ đề chính mang “tầm quan trọng chiến lược”. Ngày đầu tiên, Wei Ying Ma có bài nói chuyện với tiêu đề: “Hướng tới việc phục hồi thông tin của thế hệ trang Web trong tương lai”. Hai năm trước đó, ông từng có bài nói chuyện về khai thác dữ liệu; bây giờ chuyên môn của ông trong lĩnh vực tìm kiếm đã được cải thiện đáng kể. Trong khán phòng gần khu vực trưng bày, có khoảng 400 người đang theo dõi bài phát biểu của ông. Wei Ying hướng quan điểm của mình tới việc làm thế nào Microsoft có thể xác định những điều mà ông gọi là thế hệ thứ ba của công nghệ tìm kiếm – sau Alta Vista, công nghệ tìm kiếm tiên phong được xây dựng bởi các nhà nghiên cứu của Tập đoàn Digital Equipment Corp vào năm 1995 và sau Google. Đơn giản, Wei Ying Ma nói: “Tìm kiếm là từ trong nguồn gốc.”
Để chứng minh, ông giới thiệu một mẫu sản phẩm tìm kiếm trong giới học viện có tên là Libra. Công cụ này giúp chúng ta dễ dàng xác định mạng lưới xã hội của các giáo sư và tầm ảnh hưởng của họ – thước đo chủ quan về vai trò của họ trong lĩnh vực chuyên môn, dựa vào các công trình nghiên cứu và mối liên hệ với những người khác. Mẫu sản phẩm đã giới thiệu bước tiến đầu tiên trong cấp độ cao hơn của việc tìm kiếm, nơi mà có thể tìm thấy bất kể thứ gì. Rộng hơn, Wei Ying nói về việc phát triển một công nghệ tìm kiếm có khả năng hiểu câu hỏi của người sử dụng thông qua ngôn ngữ tự nhiên.
Sau bài phát biểu, các nhà sáng chế hàng đầu của MSN Search bước lên chúc mừng Wei Ying Ma về những công nghệ mà nhóm của ông đã tạo ra và thảo luận nhiều hơn về sự hợp tác trong tương lai. Nói chung, cuộc chiến công cụ tìm kiếm của Microsoft đang trở thành ưu tiên số một. MSN Search beta – Underdog – đã được thiết lập trên trang chủ của MSN vài tháng trước; các nhóm của MSN đang bận thu thập dữ liệu của người sử dụng từ bản cắt nghĩa câu hỏi. Tháng tiếp theo, phiên bản giao diện lập nhóm của Trung tâm Nghiên cứu Bắc Kinh sẽ được cài đặt vào Sandbox trang Web của MSN để trưng bày những nét đặc trưng và các nguyên mẫu. Những chuẩn bị cuối cùng được tiến hành ở Redmond và Bắc Kinh là giới thiệu mô hình trung tâm quảng cáo của MSN. Tất cả những khâu chuẩn bị này là để chính thức giới thiệu sản phẩm vào thị trường cuối năm 2005.
Ngay sau hội nghị TechFest, ban lãnh đạo của Trung tâm Nghiên cứu Bắc Kinh đã tham gia một cuộc họp kín với các phó chủ tịch MSN là Yusuf Mehdi và Christopher Payne. Họ cùng đưa ra những chi tiết nhỏ nhất cho các kế hoạch nhằm tạo ra một sự kết hợp chắc chắn giữa MSN và MSR. Đó sẽ là cơ quan đầu não không chỉ của Redmond hay Thung lũng Sillicon, mà còn xuyên Thái Bình Dương đến Bắc Kinh – thủ đô đang lớn mạnh trong cuộc chiến công cụ tìm kiếm.
Bạn có thể dùng phím mũi tên để lùi/sang chương. Các phím WASD cũng có chức năng tương tự như các phím mũi tên.