Khôn Ngoan Không Lại Với Giời
Chương 5: Những định luật tay đôi về số lớn và số nhỏ
Trong các công trình nghiên cứu của mình, Cardano, Galileo và Pascal thừa nhận các khả năng liên quan trong bài toán họ giải quyết. Ví dụ, Galileo cho rằng xác suất một xúc xắc rơi trên bất cứ mặt nào là như nhau. Nhưng “tri thức” như vậy đáng tin đến mức nào? Xúc xắc của vị công tước có lẽ không được thiết kế để thiên vị bất cứ mặt nào, nhưng điều đó không có nghĩa là chúng ta sẽ đạt được sự công bằng thực sự. Galileo đã có thể kiểm tra giả thiết của mình bằng cách quan sát nhiều lần tung và ghi lại mức độ xuất hiện thường xuyên của từng mặt. Nếu thử vài lần, thì ông có thể tìm ra sự phân bổ khác nhau dù rất nhỏ trong mỗi lần, và thậm chí sự chênh lệch nhỏ cũng quan trọng, đem lại những khác biệt mà ông cần phải giải thích. Để có được những nghiên cứu ban đầu về tính ngẫu nhiên, có thể áp dụng trong thế giới hiện đại, vấn đề phải giải quyết là: Điều gì kết nối giữa những xác suất cơ bản với các kết quả quan sát được? Từ quan điểm thực tế, nếu chúng ta nói khả năng viên xúc xắc ngửa mặt 2 điểm là 1/6 thì điều đó có nghĩa là gì? Nếu nó không phải là cứ 6 lần thì có một lần trong bất cứ loạt tung nào viên xúc xắc cũng ngửa mặt 2 điểm, thì chúng ta không có cơ sở tin rằng cơ hội ném được 2 điểm thực sự là 1/6? Và nếu vị bác sỹ nói rằng công dụng của một viên thuốc là 70% hoặc có 1% tác dụng phụ trong tất cả các trường hợp hoặc khi cuộc bầu cử tìm ra một ứng viên được ủng hộ với 36% phiếu bầu thì chúng ta phải hiểu nó ra sao? Đó là những câu hỏi sâu sắc, rất có ý nghĩa với khái niệm ngẫu nhiên, một khái niệm mà các nhà toán học vẫn còn đang tranh cãi.
Gần đây tôi có tham gia một cuộc thảo luận trong một ngày mùa xuân ấm áp với nhà thống kê Moshe thuộc Đại học Hebrew. Ông ngồi đối diện với tôi trong trưa tại Caltech (Đại học Công nghệ California). Vừa nhấm nháp những thìa sữa chua không đường, Moshe vừa tán thưởng quan điểm rằng các số ngẫu nhiên thực sự không tồn tại. “Làm gì có thứ như thế,” ông nói, “Ôi, họ công bố các biểu đồ và viết chương trình máy tính, nhưng họ đang lừa ngạt chính mình. Không ai tìm ra một phương pháp tạo ra sự ngẫu nhiên tốt hơn việc ném một xúc xắc, và ném viên xúc xắc thì không làm được điều đó.”
Moshe khua khoắng chiếc thìa kim loại trắng trước mặt tôi. Ông ta đang rất kích động. Tôi quan sát thấy mối liên hệ giữa cảm xúc của ông ta về sự ngẫu nhiên và những lý lẽ tôn giáo. Moshe là một người Do Thái chính thống, và tôi biết nhiều người theo đạo có suy nghĩ Chúa trời có thể cho phép sự ngẫu nhiên xảy ra. “Giả sử bạn muốn một dãy N số ngẫu nhiên từ 1 đến 6,” ông ta bảo tôi, “Bạn ném xúc xắc N lần và ghi lại dãy N số đạt được. Đó có phải là một dãy ngẫu nhiên?”
Không, ông ta khẳng định, bởi vì không ai có thể tạo ra một viên xúc xắc hoàn hảo. Luôn có khả năng một số mặt sẽ dễ ném hơn và một số khó ném hơn. Có thể ném 1.000 lần để thấy sự khác biệt, hoặc 1 tỷ lần, nhưng cuối cùng bạn sẽ nhận thấy điều đó. Số lần 4 điểm bạn ném được hơn số lần 6 điểm hoặc ngược lại. Bất kỳ thiết bị nhân tạo nào cũng có sai sót, ông ta nói, bởi con người không đạt được tới sự hoàn hảo. Điều đó có thể, nhưng do tự nhiên tạo ra, và các sự kiện ngẫu nhiên thực sự xuất hiện ở cấp nguyên tử. Thực tế, đó là nền tảng của Thuyết lượng tử, và do đó chúng tôi dành thời gian còn lại của bữa trưa để thảo luận về các khía cạnh lượng tử.
Ngày nay, những máy lượng tử tiên tiến tạo ra những số ngẫu nhiên thực sự từ việc tung con xúc xắc lượng tử hoàn hảo của Thiên nhiên. Trong quá khứ, sự hoàn hảo cần thiết để có sự ngẫu nhiên thực sự là mục tiêu khó nắm bắt. Một trong những phương pháp sáng tạo nhất đến từ nhóm tội phạm Harlem của thành phố New York khoảng năm 1920. Hàng ngày, để có các số ngẫu nhiên có 5 chữ số để thực hiện giải sổ xố phi pháp, mấy tên cướp này đã chế nhạo các nhà chức trách bằng cách sử dụng 5 chữ số cuối cùng trong số dư của Kho bạc Mỹ. (Trong bài viết này chính phủ Mỹ đang nợ 8.995.800.515.946,50 đô-la, tức 29.679,02 đô-la trên đầu người, do vậy những kẻ cướp có thể lấy 5 chữ số từ số nợ trên đầu người!) Sổ xổ Kho bạc (tạm gọi như vậy) vi phạm không chỉ luật hình sự, mà còn cả luật khoa học, vì theo một quy luật gọi là Luật Benford, các con số không những xuất hiện theo cách tích dồn không ngẫu nhiên mà còn ưu tiên các số bé hơn.
Định luật Benford không do học giả Benford phát hiện ra mà do nhà thiên văn học người Mỹ Simon Newcomb phát hiện. Khoảng năm 1881, Newcomb nhận thấy các trang sách về lô-ga liên quan tới các con số bắt đầu bằng số 1 thường bẩn hơn và sờn hơn các trang có các số bắt đầu bằng số 2, và tương tự, cho tới số 9 thì những trang này trông mới và sạch hơn. Tổng kết trong một thời gian dài, sự hao mòn tỷ lệ với số lần sử dụng, nên Newcomb kết luận từ quan sát của bản thân rằng các nhà khoa học mà trong những công trình nghiên cứu của mình, họ sử dụng chung những dữ liệu phản ánh sự phân bố của các chữ số. Tên hiện tại của định luật xuất hiện sau khi Frank Benford cũng nhận ra điều đó vào năm 1938, khi ông đang chăm chú nghiên cứu các bảng lô-ga tại phòng thí nghiệm General Electric Research Laboratory tại Schenectady, New York. Nhưng ông này cũng không chứng minh định luật. Định luật chỉ được chứng minh vào năm 1995 trong nghiên cứu của Ted Hill, một nhà toán học thuộc Viện Công nghệ Georgia.
Theo định luật Benford, không phải tất cả 9 chữ số đều có tần suất xuất hiện bằng nhau, mà chữ số thứ nhất là chữ số 1 có tỷ lệ 30%; chữ số 2 có tỷ lệ khoảng 18%, và tương tự, đến chữ số 9 thì tần suất xuất hiện ở vị trí chữ số thứ nhất là 5%. Định luật tương tự, nhưng ít phổ biến hơn, áp dụng cho các chữ sau tiếp theo. Rất nhiều loại dữ liệu tuân theo định luật Benford, đặc biệt là dữ liệu tài chính. Thực tế, định luật này hoàn toàn thích hợp để phát hiện lượng lớn dữ liệu tài chính giả tạo.
Một ứng dụng quan trọng liên quan tới một doanh nhân trẻ tên Kevin Lawrence, người đã huy động 91 triệu đô-la để thành lập một chuỗi các câu lạc bộ sức khỏe công nghệ cao. Lawrence lao vào hành động, thuê một nhóm giám đốc điều hành và sử dụng tiền của các nhà đầu tư nhanh như lúc anh ta huy động nó. Chuyện này hẳn đã tốt đẹp ngoại trừ một chi tiết: anh ta và đội quân của mình đang đổ hầu hết số tiền vào các hạng mục cá nhân. Và vì khó có thể giải thích cho việc chi tiêu phục vụ công ty bằng cách mua vài ngôi nhà, 20 du thuyền cá nhân, 47 chiếc ôtô (bao gồm 5 chiếc Hammer, 4 chiếc Ferraris, 3 chiếc Dodge Viper, 2 chiếc DeTomaso Panteras, và 1 chiếc Lamborghini Diablo), 2 chiếc đồng hồ Rolex, một chiếc lắc tay kim cương 21 cara, một thanh kiếm Samurai 200.000 đô-la, và một máy làm bánh cao cấp, nên Lawrence và đồng bọn tìm cách xóa dấu vết bằng cách chuyển tiền của các nhà đầu tư qua một trang mạng phức tạp gồm các tài khoản ngân hàng và các công ty ma để tạo vẻ nhộn nhịp và sự phát triển cho công việc kinh doanh. Không may cho họ, một kế toán pháp lý, Darrell Dorrell, cảm thấy nghi ngờ nên đã tập hợp danh sách trên 70.000 số trong các tờ séc đủ loại và giao dịch chuyển khoản và so sánh sự phân bổ của các chữ số theo Định luật Benford. Các con số đã không qua được cuộc kiểm tra. Tất nhiên, đó chỉ là giai đoạn khởi đầu của cuộc điều tra, nhưng diễn biến thế nào thì ai cũng biết, trước lễ Tạ ơn năm 2003, trong bộ quần áo tù màu xanh nhạt và với sự tấn công của các luật sư, Kevin Lawrence lĩnh án 20 năm tù mà không có cơ hội tại ngoại. IRS (Sở thuế vụ) cũng đã nghiên cứu Định luật Benford để xác định sự lừa đảo về thuế. Một nhà nghiên cứu từng áp dụng định luật vào bản kê khai hoàn thuế của Bill Clinton trong 13 năm. Bill cùng những người khác đã qua cuộc kiểm tra.
Có lẽ cả nghiệp đoàn Harlem cũng như các khách hàng đều không nhận ra các quy luật trong các con số sổ xố của mình. Nhưng nếu những người như Newcomb, Benford, hoặc Hill chơi xổ số, về nguyên tắc thì họ đã sử dụng quy luật Benford để tạo ra những vụ cá cược ưu việt, kiếm về một khoản kha khá thêm vào lương học giả của mình.
Năm 1947, các nhà khoa học tại Rand Corporation (Viện Chính sách và Công nghệ Mỹ) cần một bảng lớn các số ngẫu nhiên để thực hiện mục tiêu đáng ngưỡng mộ hơn: giúp tìm ra các đáp án xấp xỉ cho các phương trình toán học sử dụng kỹ thuật gọi là phương pháp Monte Carlo. Để thiết lập các chữ số, họ sử dụng tiếng ồn điện tử, một loại cò quay điện tử. Tiếng ồn điện tử là ngẫu nhiên? Đó là câu hỏi khó định nghĩa như chính định nghĩa về bản thân sự ngẫu nhiên.
Năm 1896, nhà triết học người Mỹ Charles Sanders Peirce viết rằng một mẫu ngẫu nhiên là một “mẫu lấy theo phương pháp hoặc quy tắc đã được áp dụng hết lần này đến lần khác một cách không xác định, về lâu dài việc làm này sẽ dẫn đến việc chọn lấy bất kỳ tập hợp phần tử nào trong quần thể cũng như bất kỳ tập hợp phần tử có cùng số lượng có xác suất như nhau.” Đó gọi là cách diễn giải theo tần suất của ngẫu nhiên. Quan điểm cơ bản khác với nó được gọi là cách diễn giải chủ quan. Trong khi bạn đánh giá một mẫu theo cách giải thích tần suất từ kết quả, thì trong diễn giải chủ quan bạn đánh giá một mẫu theo cách nó được chọn. Theo diễn giải chủ quan, số lượng hay tập hợp các số được coi là ngẫu nhiên nếu chúng ta không biết hoặc không thể đoán trước quá trình lựa chọn nó.
Sự khác biệt giữa hai cách diễn giải có nhiều sắc thái hơn ta thấy. Ví dụ, trong một thế giới hoàn hảo, viên xúc xắc được coi là ném ngẫu nhiên theo quan niệm đầu tiên nhưng không được coi là ngẫu nhiên theo quan niệm thứ hai, vì tất cả các mặt có thể có xác suất bằng nhau nhưng chúng ta (trong thế giới hoàn hảo) có thể sử dụng hiểu biết xác thực về các điều kiện vật lý và các định luật vật lý để khẳng định chính xác trước mỗi lần ném cách viên xúc xắc sẽ rơi xuống. Tuy nhiên, trong thế giới thực không hoàn hảo, việc ném xúc xắc là ngẫu nhiên theo quan niệm thứ hai chứ không phải theo quan niệm thứ nhất. Bởi vì, như Moshe đã chỉ ra, do sự không hoàn hảo, viên xúc xắc không nằm trên mỗi mặt với tần suất bằng nhau; tuy nhiên, do giới hạn hiểu biết, chúng ta không có đủ khả năng để biết mặt nào sẽ chiếm ưu thế hơn mặt nào.
Để quyết định xem bảng số của mình có ngẫu nhiên không, các nhà khoa học Rand thực hiện nhiều thí nghiệm. Với sự giám sát chặt chẽ, hệ thống của họ có một số xu hướng, giống như xúc xắc không hoàn hảo nguyên mẫu của Moshe. Các nhà khoa học Rand đã thực hiện một số cải tiến cho hệ thống nhưng chưa bao giờ thử bỏ qua hoàn toàn các quy tắc. Như Moshe nói, sự hỗn loạn hoàn toàn chính là sự hoàn hảo đầy mỉa mai. Do đó các số Rand đã chứng minh được sự ngẫu nhiên hữu dụng này, và công ty công bố chúng năm 1955 dưới các tựa lôi cuốn Một triệu chữ số ngẫu nhiên (A Million Random Digits).
Trong nghiên cứu, các nhà khoa học Rand đã gặp phải bài toán về bánh cò quay từng được tóm lược bởi một người Anh, Joseph Jagger, gần một thế kỷ trước. Jagger là một kỹ sư và là một thợ máy trong công ty sợi tại Yorkshire, do đó anh ta có trực giác về năng lực – hoặc sai sót – của máy móc. Một ngày, năm 1873, anh ta đã biến trực giác và đầu óc phong phú của mình thành tiền. Anh ta băn khoăn các cò quay tại Monte Carlo hoạt động thực sự hoàn hảo đến mức nào?
Cò quay – được phát minh bởi Blaise Pascal khi ông có ý định chế tạo chiếc máy chuyển động không ngừng, ít nhất là truyền thuyết nói vậy – về cơ bản là một chiếc bát lớn với các bộ phận (gọi là các phím) có hình như các lát bánh mỏng. Khi chiếc bánh xe quay tròn, một viên bi đá đầu tiên thình lình nảy vào cạnh của chiếc bát và sau cùng dừng lại ở một trong các phím được đánh số từ 1 đến 36, cộng với 0 (hoặc 00 nếu là bánh cò quay của Mỹ). Việc của người đặt cược rất đơn giản: đoán xem viên bi sẽ dừng lại ở ngăn nào. Sự tồn tại của các bánh cò quay là một minh chứng chứng minh các thầy bói chính thống không có thực, vì tại Monte Carlo nếu bạn cá 1 đô-la vào một ngăn và viên bi dừng ở đó, thì nhà cái sẽ trả bạn 35 đô-la (cộng với 1 đô-la ban đầu của bạn). Nếu các thầy bói tồn tại, bạn sẽ gặp họ ở những nơi như vậy, hú hét và nhảy múa và đẩy những xe đầy ắp tiền chạy xuống đường, và các trang mạng không còn tự gọi mình là Zelda Biết Tuốt và Hiểu Tuốt, cung cấp những chương trình tư vấn trực tuyến về tình yêu miễn phí 24 giờ nhằm cạnh tranh với 1,2 triệu trang mạng khác về bói toán (theo Google). Đối với tôi, cả tương lai và quá khứ đều mờ mịt trong màn sương dày. Nhưng tôi biết một điều: các khả năng thua tại cò quay châu Âu là 36/37; và cơ hội thắng là 1/37. Nghĩa là đối với mỗi 1 đô-la tôi cá cược, sòng bạc nắm phần thắng (1/37 x 37 đô-la) – (36/37 x 1 đô-la). Kết quả là 1/37 của 1 đô-la, tức 2,7 xu. Phụ thuộc vào trạng thái trí tuệ, đó có thể là cái giá tôi phải trả cho việc tham gia vào trò chơi ngắm viên bi nhỏ chạy quay chiếc bánh xe lớn sáng chói hoặc có thể là cái giá tôi trả cho cơ hội tỏa sáng của chính mình (trong kịch bản lạc quan). Chí ít đó là cách thức nó hoạt động.
Có đúng là như vậy? Jagger nghĩ, chỉ khi bánh cò quay cân bằng hoàn hảo và anh ta đã sử dụng đủ loại máy móc để đưa ra quan điểm như Moshe. Anh ta sẵn sàng cá cược rằng chúng không như vậy. Do vậy, anh ta thu vén khoản tiết kiệm, đi tới Monte Carlo, và thuê 6 người phụ tá, mỗi người phụ trách một chiếc cò quay của sòng bạc. Mỗi ngày các phụ tá của anh ta quan sát chiếc bánh xe, ghi lại mọi con số xuất hiện trong 12 giờ mở cửa của sòng bạc. Hàng đêm, trong căn phòng khách sạn, Jagger phân tích các con số. Sau sáu ngày, anh ta không tìm ra bất cứ thiên hướng nào của 5 chiếc bánh quay, nhưng tại chiếc bánh quay thứ 6, có 9 số thường xuyên xuất hiện hơn các số khác. Và do vậy ngày thứ bảy anh ta tới sòng bạc và bắt đầu đánh cược rất lớn vào 9 số ưu thế: 7, 8, 9, 17, 18, 19, 22, 28 và 29.
Khi sòng bạc đóng cửa đêm đó, Jagger đã thu được tới 70.000 đô-la. Chiến thắng của anh ta không thể không gây sự chú ý. Những khách hàng khác vây quanh bàn của anh ta, đặt cược tiền để mong nhận được sự may mắn. Những giám sát của sòng bạc chú ý cả vào anh ta, cố gắng giải mã cách chơi của anh ta, hoặc đúng hơn là tìm ra sự gian lận. Tới ngày thứ tư cá cược, Jagger đã thu về 300.000 đô-la, và các quản lý sòng bạc tuyệt vọng không thể tống cổ gã này, hoặc ít nhất là ngăn chặn hắn. Cứ tưởng một anh chàng vạm vỡ đến từ Brooklyn mới làm được việc này. Nhưng sau đó các nhân viên Casino đã làm gì đó thông minh hơn nhiều.
Vào ngày thứ 5, Jagger bắt đầu thua. Việc anh ta bị thua, cũng như khi chiến thắng, không phải là điều gì đó có thể phát hiện ra ngay. Trước đây, dù mánh lới của sòng bạc có thế nào, anh ta đều thắng một số và thua một số, chỉ có điều giờ đây anh ta thua nhiều hơn thắng. Với số đặt lề nhỏ của sòng bạc, thì chỉ có những tay cá cược siêu năng mới có thể rút cạn tiền của Jagger, nhưng sau bốn ngày rút tiền sòng bạc, anh ta không có vẻ muốn dừng lại. Tới lúc vận may thay đổi. Jagger đã thua nửa gia tài. Ta có thể tưởng tượng ra tâm trạng của anh ta – không nói đến tâm trạng của những kẻ theo đóm ăn tàn – thực sự rất tồi. Làm sao kế hoạch của anh ta có thể đột ngột thất bại như vậy được?
Cuối cùng, Jagger đã quan sát tinh vi hơn. Trong những ngày anh thắng, anh ta đã chú ý đến một vết xước nhỏ trên chiếc bánh cò quay. Vết xước này giờ không còn ở đây. Sòng bạc đã sửa nó? Jagger đoán không phải và kiểm tra các bánh xe khác. Một trong số chúng có vết xước. Quản lý sòng bạc đã đoán chính xác thành công những ngày qua của Jagger có liên quan gì đó tới chiếc bánh quay mà anh ta chơi, và đêm qua họ đã đổi những chiếc bánh quay. Jagger thay đổi vị trí đặt tiền và lại bắt đầu thắng. Sau khi bắt đầu chiến thắng lại, anh ta lại thắng gần nửa triệu đô-la.
Không may cho Jagger, quản lý sòng bạc, đã chú ý vào hành động của anh ta, và tìm ra một cách mới để cản trở. Họ quyết định chuyển các phím mỗi đêm sau khi đóng cửa, xếp chúng theo bánh quay để mỗi ngày chiếc bánh quay sẽ tạo ưu thế cho các số khác nhau, các con số mà Jagger không biết. Jagger bắt đầu thua mãi và cuối cùng đành bỏ cuộc. Sự nghiệp cờ bạc của anh ta kết thúc. Anh ta rời khỏi Monte Carlo với 325.000 đô-la trong tay, tức khoảng 5 triệu đô-la theo tỷ giá hiện tại. Trở về nhà, anh ta bỏ việc tại nhà máy và đầu tư tiền vào bất động sản.
Những tưởng kế hoạch của Jagger là một điều chắc chắn, nhưng không phải vậy. Thậm chí đối với một chiếc bánh xe quay cân bằng hoàn hảo cũng sẽ không xuất hiện số 0, 1, 2,… với tần suất bằng nhau, như thể các con số dẫn đầu sẽ lịch sự chờ các số chậm chạp hơn đuổi kịp. Thay vào đó, một số số sẽ có khả năng xuất hiện nhiều hơn mức bình thường và một số số khác sẽ ít xuất hiện hơn. Và do vậy thậm chí sau sáu ngày quan sát, Jagger vẫn có khả năng sai. Tần suất cao hơn của một số mà anh ta quan sát được có thể do tình cờ và không đồng nghĩa với xác suất cao hơn. Điều đó nghĩa là Jagger cũng phải giải quyết bài toán chúng ta nêu ra ở đầu chương này: với một tập hợp xác suất cơ bản, bạn kỳ vọng sự quan sát của mình về một hệ thống tuân theo các xác suất này chặt chẽ đến mức nào? Giống như công việc của Pascal đã làm trong bầu không khí của cuộc cách mạng (khoa học), bài toán sẽ được giải vào giai đoạn giữa cuộc cách mạng, một phát minh toán học – giải tích.
Năm 1680, một sao chổi lớn bay qua hành tinh ‘‘hàng xóm’’ của chúng ta trong Hệ mặt trời, đủ gần, để những tia sáng nhỏ nó phát ra cũng làm sáng bầu trời đêm trên hành tinh chúng ta. Đó là vào tháng 11, theo quỹ đạo Trái đất khi sao chổi này lần đầu được phát hiện, và trong nhiều tháng sau nó vẫn là đề tài được bàn luận sôi nổi, đường đi của nó được ghi chép lại rất chi tiết. Năm 1687, Isaac Newton sử dụng những dữ liệu này làm ví dụ cho Định luật nghịch đảo bình phương về trọng lực. Và trong một đêm trăng sáng tại vùng đất mang tên Basel, Thụy Điển, một người đàn ông khác cũng đang chú ý đến vấn đề này. Anh ta là một chuyên gia thần học trẻ tuổi, nhìn chằm chằm vào ánh sáng mơ hồ và rực rỡ của sao chổi, và nhận ra rằng toán học, chứ không phải nhà thờ, mới chính là thứ anh ta muốn cống hiến cả đời mình. Từ nhận thức đó, không chỉ sự nghiệp của Jakob Bernoulli thay đổi mà từ đó đã tạo ra cây gia đình vĩ đại nhất trong lịch sử toán học: trong một thế kỷ rưỡi từ khi Jakob ra đời và vào năm 1800 gia đình Bernoulli đã sinh ra rất nhiều người con, và một nửa trong số họ đều tài năng, bao gồm 8 nhà toán học ưu tú, và ba người ngày nay được coi là một trong những nhà toán học vĩ đại nhất trong lịch sử (Jakob, em trai Johann, và con trai Johann là Daniel).
Tại thời điểm đó sao chổi được các nhà thần học và đông đảo dân chúng coi là dấu hiệu giận dữ của thánh thần, và Chúa hẳn phải rất giận nên mới tạo ra vật này – nó chiếm giữ hơn nửa bầu trời. Một nhà thuyết giáo gọi nó là “sự cảnh báo của đấng toàn năng và thánh thần, được viết và đặt trước những đứa con yếu đuối và tội lỗi của người.” Ông ta viết, nó báo trước “sự thay đổi đáng nhớ về tinh thần hoặc các vấn đề trần thế” đối với đất nước hoặc thành phố. Jakob Bernoulli có quan điểm khác. Năm 1861, ông xuất bản một cuốn sách mỏng tựa Phương pháp mới về cách tính đường đi của Sao chổi theo các định luật cơ bản và đoán trước sự xuất hiện của nó.
Bernoulli đã hành động trước Newton trong việc nghiên cứu các vấn đề liên quan đến sao chổi khoảng 5 năm. Đương nhiên, nếu lý thuyết của Newton đúng thì hẳn ông cũng hành động trước. Nhưng không phải vậy, và việc khẳng định trước công chúng rằng sao chổi tuân theo định luật tự nhiên và không phải ý muốn của Chúa thực sự là một việc làm dũng cảm, đặc biệt khi trước đó – gần 50 năm sau khi Galileo bị hành quyết – giáo sư toán học của Đại học Basel, Peter Megerlin, đã bị tấn công bởi các nhà thần học vì chấp nhận chủ nghĩa Copernicus và bị đình chỉ dạy học tại trường. Sự ly giáo kinh khủng đặt giữa các nhà khoa học – toán học và các nhà thần học ở Basel, và Bernoulli kiên quyết đứng về phía các nhà khoa học.
Tài năng của Bernoulli sớm tỏa sáng trong cộng đồng toán học, và khi Megerlin mất, vào cuối năm 1686, Bernoulli kế tục ông, trở thành giáo sư toán học. Cho tới lúc này Bernoulli đang nghiên cứu các bài toán liên quan tới các trò chơi ngẫu nhiên. Một trong những người có ảnh hưởng lớn tới ông là một nhà toán học, nhà khoa học người Hà Lan, Christiaan Huygens – người đã cải tiến kính viễn vọng, là người đầu tiên hiểu về các vòng tròn của Sao Thổ, tạo ra chiếc đồng hồ quả lắc đầu tiên (dựa trên ý tưởng của Galileo), và giúp xây dựng lý thuyết sóng ánh sáng, đã viết một cuốn sách vỡ lòng về xác suất lấy cảm hứng từ các tư tưởng của Pascal và Fermat.
Đối với Bernoulli, sách của Huygens là một nguồn cảm hứng. Tuy nhiên, ông cũng thấy một số hạn chế trong lý thuyết mà Huygens trình bày. Nó có thể đủ đối với các trò chơi xác suất, nhưng về các khía cạnh của cuộc sống thì nó mang nhiều tính chủ quan. Làm thế nào bạn có thể quy một xác suất xác định thành một bằng chứng hợp pháp đáng tin cậy? Hoặc ai là người chơi golf giỏi hơn, Vua Charles I của Anh hay Mary, Nữ hoàng của Scotlen? (Cả hai đều là những tay golf giỏi.) Bernoulli tin rằng trong việc ra quyết định, cần phải có một cách thức toán học và đáng tin cậy để tính các xác suất. Quan điểm của ông phản ánh văn hóa của các thời đại: kiểm soát vấn đề theo một cách thức kiên định với kỳ vọng xác suất được coi là dấu hiệu của một người hiểu biết. Nhưng nó không mang tính chủ quan khiến hạn chế lý thuyết cũ về xác suất. Ông cũng nhận ra rằng lý thuyết không được xây dựng cho các tình huống ngu ngốc trong đó các xác suất của các kết quả được xác định theo nguyên tắc mà không tồn tại trong thực tế. Đó là vấn đề mà tôi đã thảo luận cùng Moshe và cũng là bài toán Jagger phải giải: Tỷ lệ một viên xúc xắc không hoàn hảo sẽ đem lại điểm 6 là bao nhiêu? Khả năng bạn mắc bệnh là bao nhiêu? Tính xác suất áo giáp ngực của bạn chịu được nhát kiếm dài của kẻ thù? Trong cả tình huống chủ quan và không chắc chắn, Bernoulli tin rằng sẽ là ‘‘mất trí’’ nếu kỳ vọng có được loại tri thức ưu tú hơn về xác suất trong sách của Huygens.
Bernoulli tìm thấy đáp án trong cùng điều kiện như Jagger sau này: thay vì phụ thuộc vào các xác suất có trong tay, ta nên phân biệt chúng bằng quan sát. Là một nhà toán học, ông kiếm tìm quan điểm chính xác. Giả sử bạn thấy một số cò quay, làm thế nào bạn xác định các xác suất cơ bản một cách chính xác, và với mức độ tự tin nào? Chúng ta sẽ quay lại các câu hỏi đó trong chương tới, nhưng đó không phải câu hỏi mà Bernoulli có thể trả lời. Thay vào đó, ông trả lời một câu hỏi có liên quan chặt chẽ: Các xác suất cơ bản phản ánh các kết quả thực tế chính xác đến mức nào? Bernoulli quan điểm rõ ràng rằng chúng ta biện minh bằng kỳ vọng rằng khi tăng số lần thử nghiệm, tần suất quan sát được sẽ phản ánh – càng chính xác hơn – các xác suất cơ bản. Chắc chắn ông không phải là người đầu tiên tin điều này. Nhưng ông là người đầu tiên giải quyết vấn đề một cách chính thức, và đưa quan điểm ra chứng minh, và định lượng nó, thử hỏi bao nhiêu thử nghiệm là cần thiết, và chúng ta chắc chắn đến mức nào. Ông cũng là một trong những người đầu tiên công nhận tầm quan trọng của một lĩnh vực mới về giải tích học để giải các bài toán này.
Năm Bernoulli được phong giáo sư tại Basel được coi là một năm trọng đại trong lịch sử toán học: Đó là năm Gottfried Leibniz xuất bản công trình mang tính cách mạng về các nguyên tắc của phép tính tích phân, bổ sung thêm vào công trình năm 1684 về phép tính vi phân. Newton cũng công bố một phiên bản riêng về đề tài này năm 1687, trong cuốn Philosophiae Naturalis Principa Mathematica, tức Các nguyên tắc toán học về Triết học tự nhiên, hay thường được gọi đơn giản là Nguyên tắc (Principia). Những tiến bộ này rất quan trọng đối với công trình của Bernoulli về xác suất.
Cho tới lúc họ công bố, cả Leibniz và Newton đã nghiên cứu đề tài này nhiều năm, nhưng ấn phẩm công bố đồng thời này gây ra tranh cãi về việc người nào xứng đáng được ghi nhận thành quả đó. Nhà toán học nổi tiếng Karl Pearson (chúng ta sẽ gặp lại ông trong chương 8) nói rằng danh tiếng của các nhà toán học “đại diện cho phần lớn thế hệ sau không chỉ về điều họ làm mà còn về cái mà người đương thời quy cho họ.” Có lẽ Newton và Leibniz sẽ đồng ý về điều này. Trong bất cứ trường hợp nào, nó đều không phải là một cuộc tranh cãi có kết quả, và trận chiến xảy ra là trận chiến nổi tiếng khắc nghiệt. Thời điểm kết quả bị xáo trộn. Người Đức và người Thụy Sĩ học giải tích từ công trình của Leibniz, và người Anh và nhiều người Pháp học từ Newton. Theo quan điểm hiện đại, cả hai lý thuyết tồn tại rất ít sự khác biệt, nhưng về dài hạn đóng góp của Newton có ảnh hưởng hơn vì ông thực sự đưa ra quan điểm trước và bởi vì trong Principia ông sử dụng phát minh của mình trong lĩnh vực vật lý hiện đại, khiến Principia trở thành cuốn sách khoa học vĩ đại nhất trong lịch sử. Tuy vậy, Leibniz xây dựng lời dẫn giải tốt hơn, và những ký hiệu của ông cũng thường được sử dụng trong giải tích ngày nay.
Cả hai tác phẩm đều không dễ đọc. Không chỉ là cuốn sách vĩ đại nhất về khoa học, cuốn Principia của Newton còn được gọi là “một trong những cuốn sách khó hiểu nhất.” Và tác phẩm của Leibniz, theo người viết tiểu sử của Jakob Bernoulli, thì “không ai hiểu nổi”; nó không chỉ không rõ ràng mà còn đầy lỗi in ấn. Em trai Johann của Jakob gọi nó là “một điều bí ẩn chứ không phải lời giải”. Thực tế, cả hai cuốn sách khó hiểu đến nỗi các học giả đã tự biện minh rằng cả hai tác giả dường như có ý định khiến tác phẩm của mình trở nên khó hiểu để những kẻ nghiệp dư không đua đòi. Tuy vậy, đặc trưng khó hiểu là một lợi thế đối với Jakob Bernoulli, bởi vì nó đã phân biệt cái hay cái dở, và trí tuệ của ông được xếp vào hạng trên. Do vậy, ngay khi ông giải mã được tư tưởng của Leibniz, ông đã sở hữu được một vũ khí chỉ một số ít người trên toàn thế giới nắm giữ, và với nó ông có thể dễ dàng giải các bài toán quá khó đối với những người khác.
Hệ thông khái niệm trọng tâm trong giải tích và công trình Bernoulli là dãy, chuỗi và giới hạn. Thuật ngữ dãy đối với các nhà toán học cũng như bất kỳ ai cũng đều cùng nghĩa: các phần tử liên tiếp có trật tự, như các điểm hoặc các số. Một chuỗi đơn giản là tổng của một dãy số. Và nếu các phần tử của một dãy luôn hướng tới đâu đó – tới một điểm cuối cùng nào đó hoặc một số nào đó – thì đó được gọi là giới hạn của dãy.
Mặc dù giải tích trình bày một sự tinh tế mới trong hiểu biết về các dãy, nhưng tư tưởng này, giống như rất nhiều tư tưởng khác, đã trở nên quen thuộc với người Hy Lạp. Vào thế kỷ V trước Công nguyên, nhà triết học người Hy Lạp Zeno đã sử dụng một dãy kỳ lạ để tạo ra một nghịch biện mà vẫn còn gây tranh cãi giữa các sinh viên triết học ngày nay, đặc biệt là sau vài chầu bia. Nghịch biện của Zeno như sau: Giả sử một sinh viên muốn bước qua cánh cửa cách đó 1 m. (Ta sử dụng 1 m vì lý do thuật tiện, vì cùng luận điểm này có thể sử dụng 1 dặm hoặc các thước đo khác.) Trước khi cô tiến đến đó, cô phải đi qua trung điểm. Nhưng để đi qua trung điểm đó, trước hết cô phải đi nửa đường để tới được trung điểm, tức điểm 1/4 đường. Và tiếp tục như vậy đến vô cùng. Nói cách khác, để đến được đích, cô ta phải vượt qua dãy các khoảng cách: 1/2m, 1/4m, 1/8m, 1/16m,… Zeno lý luận rằng dãy đó sẽ kéo dài mãi, cô ta phải vượt qua vô hạn số các khoảng cách xác định. Điều đó mất vô hạn thời gian. Zeno kết luận: Bạn không thể đi tới bất cứ đâu.
Qua hàng thế kỷ, các nhà triết học từ Aristotle tới Kant đã tranh luận bài toán khó này. Diagenes đưa ra phương pháp theo lối kinh nghiệm: anh ta chỉ bước vài bước, và chỉ ra rằng thực tế mọi thứ có thể di chuyển. Đối với những người không phải là sinh viên triết học, đó có vẻ là một câu trả lời khá hay. Nhưng nó sẽ không thuyết phục Zeno. Zeno hiểu những mâu thuẫn giữa chứng cứ logic và bằng chứng giác quan; không như Diagenes, cái Zeno tin chính là logic. Và Zeno đã không chỉ quay các bánh xe của mình. Thậm chí Diagenes sẽ phải thừa nhận rằng hành động của ông ta khiến chúng ta gặp một bài toán khó (và hóa ra là rất sâu sắc): Nếu chứng cứ giác quan đúng, thì logic của Zeno sai ở chỗ nào?
Hãy cùng nghiên cứu dãy số khoảng cách của Zeno: 1/2m, 1/4m, 1/8m, 1/16m… (các số gia nhỏ dần). Dãy này là một tập hợp số vô hạn, do đó chúng ta không thể tính tổng nó bằng cách cộng tất cả lại. Nhưng chúng ta lưu ý rằng mặc dù số dãy số là vô hạn, thì các số kế tiếp nhỏ dần. Do vậy có lẽ có sự cân bằng xác định giữa sự kéo dài vô hạn của các số và kích thước nhỏ dần vô hạn của các số? Đó chính xác là bài toán ta có thể giải nhờ sử dụng khái niệm về dãy, chuỗi, và giới hạn. Muốn biết làm như thế nào, thay vì cố tính xem sinh viên đó đi bao xa trong những khoảng giữa vô hạn của Zeno, hãy lấy từng trung điểm để nghiên cứu. Sau đây là quãng đường người sinh viên di chuyển sau vài trung điểm đầu tiên:
Qua trung điểm đầu tiên: 1/2 m
Qua trung điểm thứ hai: 1/2 m + 1/4 m = 3/4 m
Qua trung điểm thứ 3: 1/2 m + 1/4 m + 1/8 m = 7/8 m
Qua trung điểm thứ 4: 1/2 m + 1/4 m + 1/8 m + 1/16 m = 15/16 m
Đó là quy luật trong các con số này: 1/2 m, 3/4 m, 7/8 m, 15/16 m… Mẫu số được lũy thừa 2, và tử số ít hơn mẫu số 1 đơn vị. Chúng ta có thể đoán từ quy luật này sau 10 trung điểm mà người sinh viên đi được 1,023/1,024 m; sau 20 trung điểm, quãng đường là 1.048.575/1.048.576 m; v.v… Quy luật ta thấy rõ rằng Zeno đúng ở chỗ càng nhiều trung điểm, thì tổng các khoảng cách càng lớn. Nhưng Zeno không chính xác khi nói rằng tổng đó tiến đến vô hạn. Thay vào đó, các con số đang tiến dần tới 1; tức như một nhà toán học sẽ nói, 1 m là giới hạn của dãy các khoảng cách này. Điều đó đúng, bởi vì mặc dù Zeno chia nhỏ quãng đường thành vô hạn số trung điểm, nhưng rốt cuộc, cô ta chỉ di chuyển khoảng 1 m.
Nghịch biện của Zeno liên quan đến thời gian để đi qua quãng đường, không phải về mặt chiều dài. Nếu sinh viên buộc phải bước để đi qua mỗi trung điểm của Zeno, thì thực sự cô ấy sẽ gặp rắc rối (chưa đề cập đến việc khó mà có thể bước những bước nhỏ hơn cả mm)! Nhưng nếu cô ấy được phép bước với tốc độ cố định mà không phải dừng lại ở các điểm tưởng tượng của Zeno – và tại sao không chứ? – thì thời gian để đi qua mỗi trung điểm tỷ lệ với quãng đường chứa trung điểm đó, và do vậy tổng quãng đường là hữu hạn, tổng thời gian di chuyển cũng vậy – thật may mắn.
Mặc dù khái niệm hiệm đại về giới hạn vẫn chưa được đưa ra cho tới một thời gian dài sau thời đại của Zeno, và thậm chí tới thời đại của Bernoulli – vào thế kỷ XIX – khái niệm này thể hiện linh hồn của giải tích học, và trong linh hồ đó, Jakob Bernoulli đi sâu vào phân tích mối quan hệ giữa xác suất và sự quan sát. Cụ thể, Bernoulli tìm hiểu điều gì xảy ra trong giới hạn của số lượng lớn những quan sát lặp đi lặp lại. Hãy tung một đồng xu 10 lần và bạn có thể gặp 7 lần ngửa, nhưng tung nó hàng tỷ lần, chắc chắn bạn sẽ đạt được rất sát 50% lần ngửa. Vào những năm 1940, một nhà toán học người Nam Phi tên John Kerrich quyết định kiểm chứng điều này trong một thí nghiệm thức tế, tung một đồng xu hàng tỷ lần – thực tế là 10.000 lần – và ghi lại các kết quả của mỗi lần tung. Bạn sẽ nghĩ Kerrich nên làm gì đó tốt hơn, nhưng thời gian đó anh ta đang ở tù, sau khi gặp vận đen trở thành khách mời của Copenhagen lúc người Đức xâm chiếm Đan Mạch vào tháng 4 năm 1940. Theo số liệu của Kerrich, sao 100 lần ném anh ta chỉ có được 44% mặt ngửa, nhưng khi anh ta ném được 10.000 lần, con số này gần tới một nửa: 50,67%. Làm sao bạn định lượng được hiện tượng này? Câu trả lời cho câu hỏi chính là thành quả của Bernoulli.
Theo nhà lịch sử và triết học về khoa học Ian Hacking, công trình của Bernoulli “xuất hiện trước công chúng với điềm báo sáng rực về tất cả những thứ chúng ta đã biết về nó: sự uyên thâm toán học, những ứng dụng thực tế vô cùng, tính đối ngẫu khó hiểu và sự mời gọi tranh luận. Xác suất đã hiện diện đầy đủ.” Theo lời nói khiêm nhường hơn của Bernoulli, nghiên cứu của ông là một trong “tính mới, cũng như … tính thiết thực cao.” Đó là một sự nỗ lực, Bernoulli viết, tìm hiểu “cái khó vô cùng”. Ông viết nó trong 20 năm.
JAKOB BERNOULLI gọi đỉnh cao trong nỗ lực 20 năm của mình là “định luật vàng.” Các phiên bản hiện đại được phân biệt bằng các sắc thái kỹ thuật mang nhiều tên khác nhau: Định luật Bernoulli, quy luật của các số lớn, và quy luật yếu về các số lớn. Cụm từ Quy luật về các số lớn được sử dụng bởi vì như chúng ta đã nói Định luật Bernoulli liên quan tới cách thức kết quả phản ánh các xác suất nền tảng khi chúng ta thực hiện rất nhiều lần quan sát. Nhưng chúng ta cũng gắn với thuật ngữ của Bernoulli và gọi định luật của ông là định luật vàng vì chúng ta sẽ bàn tới nó theo nguyên gốc.
Mặc dù Bernoulli muốn có những ứng dụng trong thế giới thực, nhưng một số ví dụ yêu thích của ông lại đề cập đến một thứ không được tìm thấy trong đa số gia đình: một chiếc bình đầy đá thạch anh màu. Trong một kịch bản, ông tưởng tượng chiếc bình đựng 3.000 đá thạch anh trắng và 2.000 viên đá thạch anh đen, tỷ lệ 60% viên trắng và 40% viên đen. Trong ví dụ này, bạn tạo ra một chuỗi ngẫu nhiên từ chiếc bình “với sự thay thế” – nghĩa là, thay đổi mỗi viên thạch anh trước khi lấy viên tiếp theo để không làm thay đổi tỷ lệ 3:2. Các khả năng tiên nghiệm việc lấy ra một viên đá màu trắng là 3/5, khoảng 60%, và do vậy trong ví dụ này bài toán của Bernoulli trở thành: Bạn kỳ vọng tỷ lệ các viên đá trắng được lấy là đạt 60% chặt chẽ đến mức nào? Và với xác suất bao nhiêu?
Ví dụ về chiếc bình là một ví dụ hay bởi vì cùng bài toán mô tả việc lấy các viên thạch anh từ một chiếc bình có thể được sử dụng để mô tả bất cứ chuỗi thử nghiệm nào trong đó mỗi thử nghiệm có hai khả năng xảy ra, miễn là những khả năng này ngẫu nhiên và các thử nghiệm độc lập với nhau. Ngày nay, những thử nghiệm như vậy gọi là thử nghiệm Bernoulli, chuỗi các thử nghiệm Bernoulli gọi là quy trình Bernoulli. Vì một thử nghiệm ngẫu nhiên có hai kết quả có thể xảy ra, một kết quả được gọi là “thành công”, còn kết quả khác là “thất bại”. Các tên này không được ghi thành văn, và đôi khi cũng không liên quan gì đến nghĩa ngày nay của những từ này – tuy nhiên, cứ hiểu rằng nếu bạn không thể trì hoãn việc đọc, cuốn sách này là một thành công, và nếu bạn đang dùng sách để giữ bản thân và trái tim ấm áp giống như một chiếc lò sưởi hết gỗ, thì đó là một thất bại. Tung đồng xu, quyết định bầu cho ứng viên A hoặc ứng viên B, sinh con trai hay con gái, mua hay không mua một sản phẩm, chữa bệnh hay không chữa bệnh, thậm chí chết hay sống là các mẫu thí nghiệm của Bernoulli. Các hành động có các kết quả phức tạp cũng được mô hình hóa trong thí nghiệm của Bernoulli, nếu câu hỏi bạn gặp có thể diễn đạt theo cách có thể trả lời “có” hoặc “không”, như “viên xúc xắc hiện mặt 4 điểm không? Hoặc “có còn băng ở Bắc cực không? Và do vậy, mặc dù Bernoulli viết về các viên thạch anh và cái bình, nhưng tất cả các ví dụ đều có thể áp dụng cho những câu hỏi này và nhiều trường hợp tương tự khác.
Từ đó, chúng ta trở lại với chiếc bình, 60% các viên thạch anh là màu trắng. Nếu bạn lấy 100 viên thạch anh ra khỏi chiếc bình (đồng thời thay viên khác vào), bạn có thể thấy rằng chính xác 60% trong số chúng là màu trắng, nhưng bạn cũng có thể chỉ lấy được ra 50 hoặc 59 viên màu trắng. Xác suất bạn sẽ lấy được từ 58% tới 62% viên đá trắng là bao nhiêu? Xác suất bạn sẽ lấy được từ 59% tới 61% là bao nhiêu? Mức độ tin cậy thế nào nếu thay vì 100, bạn lấy 1000 viên đá hoặc 1 triệu? Bạn có thể không bao giờ đúng 100%, nhưng liệu bạn có thể lấy đủ số viên đá để có xác suất chắc chắn 99,9999% rằng bạn sẽ lấy được từ 59,9 đến 60,1% đá trắng? Định luật vàng của Bernoulli giải các bài toán như vậy.
Để áp dụng lý thuyết vàng, bạn phải lựa chọn hai lần. Đầu tiên, bạn phải xác định sự khoan dung của bản thân trước sai lệch. Tỷ lệ cơ bản của 60% mà bạn đang cần chính xác đến mức nào với kết quả chuỗi thí nghiệm? Bạn phải chọn một điểm giữa, như cộng hoặc trừ 1% hoặc 2% hoặc 0,00001%. Thứ hai, bạn phải xác định sự khoan dung của bản thân trước sự không chắc chắn. Bạn không thể chắc chắn 100% rằng thử nghiệm sẽ đem lại kết quả mà bạn mong đợi, nhưng bạn có thể chắc chắn rằng bạn sẽ có kết quả thỏa mãn 99/100 hoặc 999/1000.
Định luật vàng cho bạn biết rằng để luôn lấy đủ các viên thạch anh mà hầu như chắc chắn phần trăm số đá trắng bạn lấy gần bằng 60% là điều có thể cho dù bạn muốn xác định cụ thể về định nghĩa hầu như chắc chắn và gần bằng như thế nào. Việc làm này cũng cho ta một công thức số học để tính số lượng thử nghiệm “đủ”, với những định nghĩa đó.
Phần đầu tiên của định luật là một thành tựu về khái niệm, đó là phần duy nhất vẫn còn tồn tại trong các phiên bản hiện đại của Định luật. Về phần thứ hai – công thức Bernoulli – mặc dù định luật vàng xác định đủ số lượng các thí nghiệm để thực hiện mục tiêu một cách chính xác và tin cậy, thì Bernoulli không khẳng định rằng bạn không thể đạt được những mục tiêu này với ít thí nghiệm hơn. Điều này không ảnh hưởng tới phần đầu của định lý, vì nó khẳng định rằng số lượng các thí nghiệm là hữu hạn. Nhưng Bernoulli có ý định dùng các con số từ công thức của mình để sử dụng trong thực tế. Thật không may, trong hầu hết các ứng dụng thực tế mọi chuyện lại không như vậy. Ví dụ, đây là một ví dụ số hóa mà chính Bernoulli nghiên cứu, mặc dù tôi đã thay đổi nội dung: Giả sử 60% người bỏ phiếu ở Basel ủng hộ thị trưởng. Bạn cần phải lấy phiếu từ bao nhiêu người để có xác suất là 99% rằng bạn sẽ chứng minh được 58% đến 62% số phiếu sẽ ủng hộ thị trưởng – nghĩa là kết quả chính xác cộng trừ 2%? (Giả sử, để nhất quán với Bernoulli, những người bỏ phiếu được chọn ngẫu nhiên, nhưng có thay thế. Nói cách khác, bạn có thể bỏ phiếu cho một người hơn một lần.) Đáp án là 25.550, vào thời đại của Bernoulli con số đó gần bằng toàn bộ dân số của Basel. Ông cũng hiểu rằng những tay cờ bạc thành công có thể dùng trực giác để đoán cơ hội thành công trong một trò chơi mới dựa trên mẫu của chưa tới hàng nghìn trò chơi thử.
Lý do khiến những ước tính số lượng của Bernoulli chưa tối ưu là dẫn chứng của ông dựa trên quá nhiều số xấp xỉ. Nguyên nhân khác là do ông đã chọn 99,9% làm tiêu chuẩn cho sự chắc chắn – nghĩa là ông yêu cầu phải có đáp án sai (một đáp án khác biệt khoảng 2% từ đáp án đúng) ít nhất là 1 lần trong 1.000 lần. Đó là một tiêu chuẩn rất khắt khe. Bernoulli gọi đó là sự chắc chắn đạo đức, nghĩa là mức độ chắc chắn mà một người hiểu biết sẽ đòi hỏi để đưa ra một quyết định hợp lý. Nó có thể là thước đo thời đại đã thay đổi như thế nào khi ngày nay chúng ta đã bỏ qua ý niệm sự chắc chắn đạo đức để thiên vị thứ mà chúng ta sẽ gặp trong chương cuối cùng, ý nghĩa thống kê, nghĩa là đáp án của bạn sẽ sai ít hơn 1/20.
Với phương pháp toán học ngày nay, các nhà thống kê chỉ ra rằng trong một cuộc bầu cử như tôi đã trình bày, bạn có kết quả ý nghĩa thống kê với độ chính xác sai số khoảng 5% với 370 người bỏ phiếu. Và nếu bạn có 1.000 người bầu cử, bạn sẽ đạt 90% khả năng tiến gần hơn 2% kết quả chính xác (60% việc trúng cử của thị trưởng Basel). Nhưng cho dù có các giới hạn, nhưng định luật vàng của Bernoulli vẫn là một phát kiến trọng đại bởi vì nó chỉ ra, ít nhất là về mặt nguyên tắc, một mẫu đủ lớn để phản ánh gần như chắc chắn sự cấu thành nền tảng của tổng số lượng mẫu.
TRONG ĐỜI THỰC, chúng không quen quan sát hoạt động của người hay vật hàng nghìn lần. Do vậy nếu Bernoulli đòi hỏi một tiêu chuẩn chắc chắn quá chặt chẽ, chúng ta sẽ mắc những lỗi ngược lại trong nhiều tình huống đời thực: chúng ta thừa nhận rằng một mẫu hay một chuỗi phép thử mang tính đại diện cho tình huống đang nghiên cứu không đáng tin cậy. Ví dụ, nếu bạn bỏ phiếu tại 5 điểm cư trú tại Basel vào thời của Bernoulli, phép tính như ta đã nhắc tới trong Chương 4 sẽ chỉ ra xác suất là 1/3 khả năng bạn chứng minh được 60% của mẫu (3 người) ủng hộ thị trưởng.
Chỉ 1/3? Tỷ lệ thực số người ủng hộ cho thị trưởng này sẽ là kết quả chắc chắn nhất nếu bạn thu số mẫu này? Thực tế 1/3 là kết quả chắc chắn nhất: tỷ lệ tìm ra 0,1, 2, 3, 4 hoặc 5 người ủng hộ ít hơn tỷ lệ tìm ra 3 người. Tuy nhiên, tìm ra 3 người ủng hộ không chắc chắn: bởi vì có quá nhiều những xác suất không có tính đại diện, tỷ lệ phức hợp của chúng cộng lại gấp 2 lần tỷ lệ bầu cử chính xác với số dân. Và do vậy, trong cuộc bỏ phiếu gồm 5 người, 2/3 khả năng bạn sẽ sai. Thực tế, khoảng 1/10 khả năng bạn sẽ thấy tất cả cử tri thống nhất là thích hay không thích thị trưởng. Do vậy, nếu bạn chú ý tới mẫu gồm 5 cử tri, bạn sẽ đánh giá quá mức hoặc đánh giá thấp trầm trọng sự mến mộ của cử tri dành cho thị trưởng.
Quan niệm sai – hoặc trực giác sai – cũng rất phổ biến. Điều này chỉ ra rằng mẫu nhỏ phản ánh chính xác các xác suất cơ bản; đến mức Kahneman và Tversky đặt cho nó cái tên: quy luật về các số nhỏ. Quy luật về các số nhỏ không thực sự là một quy luật. Đó là một cái tên châm biếm mô tả những nỗ lực sai lầm nhằm áp dụng định luật các số lớn khi mà số chưa đủ lớn.
Nếu người ta áp dụng định luật (không đúng) về các số nhỏ chỉ với những cái bình, sẽ không có nhiều hệ quả, nhưng như ta đã nói, nhiều sự kiện trong đời sống là quy trình Bernoulli, và do vậy trực giác của chúng ta thường khiến chúng ta hiểu sai cái chúng ta thấy được. Đó là lý do tại sao, như tôi đề cập trong Chương 1, khi người ta quan sát một số ít năm thành công hơn hoặc kém thành công hơn của Sherry Lansings và Mark Cantons, họ khẳng định rằng hiệu quả làm việc kém trong quá khứ dự báo chính xác hiệu quả làm việc trong tương lai.
Hãy áp dụng những tư tưởng này cho ví dụ tôi đã đề cập qua trong Chương 4: tình huống trong đó hai công ty hoặc hai nhân viên cùng một công ty cạnh tranh. Bây giờ hãy nghĩ tới các CEO trong các công ty của Fortune 500. Giả sử, dựa trên kinh nghiệm và khả năng của mình, mỗi CEO có một xác suất thành công nào đó trong mỗi năm (tuy nhiên công ty của anh ta/cô ta hiểu rõ điều đó). Để cho đơn giản, hãy giả sử đối với những CEO này những năm thành công xuất hiện với cùng tần suất như các viên đá thạch anh trắng hoặc những người ủng hộ của thị trưởng: 60%. (Con số thực có thể lớn hơn và nhỏ hơn chút xíu cũng không ảnh hưởng gì tới luận điểm.) Liệu điều đó nghĩa là ta nên kỳ vọng rằng một CEO sẽ có chính xác 3 năm thành công, trong khoảng thời gian là 5 năm?
Không, như phân tích trước đã chỉ ra, thậm chí nếu tất cả CEO có tỷ lệ thành công chính xác là 60%, xác suất trong khoảng thời gian 5 năm thành công của một CEO sẽ phản ánh tỷ lệ trên chỉ là 1/3! Chuyển tới trường hợp Fortune 500, điều này nghĩa là trong 5 năm vừa rồi khoảng 333 CEO đã làm việc mà không thể hiện khả năng thực sự của họ. Thêm vào đó, chúng nên kỳ vọng, chỉ tình cờ thôi, khoảng 1/10 các CEO sẽ có 5 năm thắng lợi hoặc thất bại liên tiếp. Điều này cho chúng ta biết gì? Phân tích khả năng con người thay vì nhìn vào bảng số là cách đáng tin cậy hơn để đánh giá con người. Hoặc như Bernoulli đã từng viết, “Người ta không nên khen ngợi hành động của một người dựa trên kết quả.”
Việc chống lại Định luật các số nhỏ đòi hỏi cần có nghị lực. Nếu như bất cứ ai cũng có thể ngồi lại và chỉ ra điểm mấu chốt cũng như sự đánh giá và tiếp cận chứ không phải tri thức và khả năng thực sự của một người sẽ đem lại sự tin cậy, tư duy và sự can đảm. Bạn không thể chỉ đứng trong cuộc họp với đồng nghiệp và hô lên: “Đừng sa thải cô ấy. Cô ấy vừa mới ở điểm cuối ‘sai’ của một chuỗi Bernoulli.” Bạn cũng không chắc sẽ thắng được bạn bè nếu chỉ đứng dậy và nói lời của một kẻ ta đây – người vừa bán nhiều chiếc Toyota Camry hơn bất cứ ai trong lịch sử bán hàng, “Đó chỉ là sự dao động ngẫu nhiên.” Và do vậy, điều đó cũng hiếm xảy ra. Thời kỳ thành công của các giám đốc quản trị được quy vào tài năng của họ, có hiệu lực từ một thời điểm trong quá khứ qua cách nhìn chua cay. Và khi người ta không thành công, ta thường cho rằng thất bại đó phản ánh chính xác tỷ lệ mà tài năng và khả năng của họ.
Một quan điểm nhầm lẫn liên quan tới định luật các số lớn là quan điểm cho rằng một sự kiện chắc chắn hoặc ít chắc chắn xuất hiện bởi vì nó đã hoặc chưa xảy ra gần đây. Quan điểm tỷ lệ của một sự kiện với một xác suất cố định tăng hoặc giảm phụ thuộc vào sự xuất hiện gần đây của sự kiện gọi là ngụy biện của người cá cược. Ví dụ, nếu Kerrich có 44 lần ngửa trong 100 lần tung đầu tiên, thì đồng xu sẽ không có xu hướng sấp để theo kịp tỷ lệ! Đó được coi là gốc rễ của những ý tưởng như kiểu “vận may của cô ấy hết rồi” và “anh ta gặp thời.” Điều đó không xảy ra. Nếu đúng vậy, thì quả là “tái ông thất mã”. Do vậy, ngụy biện của người cá cược tác động tới nhiều người hơn bạn tưởng, không ở một mức độ tỉnh táo thì sẽ ở trong tình trạng vô thức. Người ta kỳ vọng vận tốt sẽ theo sau vận xấu, tức họ cũng lo lắng vận xấu sẽ nối gót vận tốt.
Tôi nhớ là đã chứng kiến một người đàn ông béo mập trên một chuyến viễn dương vài năm trước, vã mồ hôi khi anh ta thả đô-la vào máy chơi xèng nhanh như cách nó nuốt tiền. Bạn của anh ta nhận thấy tôi đang nhìn họ, chỉ giải thích đơn giản, “anh ta gặp thời.” Mặc dù định chỉ ra rằng, không, anh ta không gặp thời, nhưng tôi vẫn bước qua. Sau vài bước, tôi dừng lại vì những ánh sáng bất chợt lóe lên, nhưng lúc đó tôi lại nghe thấy tiếng chuông reo lên, những tiếng rú không nhỏ của hai anh chàng kia, và tiếng leng keng của dòng đồng 1 đô-la chảy ra từ khe máy của chiếc máy trong gần một phút. Bây giờ tôi biết rằng một chiếc máy xèng hiện đại được vi tính hóa, phần thưởng được điều tiết bằng một máy quay số ngẫu nhiên, trong đó cả định luật và quy tắc phải vận hành thực sự, như tôi đã quảng cáo, các số ngẫu nhiên! Mỗi lần kéo cần điều khiển tạo ra các số hoàn toàn độc lập với những lần kéo trước đây. Tuy nhiên,…chỉ có thể nói rằng ngụy biện của người chơi cờ bạc là sự ảo tưởng đầy quyền lực.
BẢN THẢO trong đó Bernoulli trình bày định luật vàng kết thúc bất ngờ mặc dù ông đã khẳng định trước trong các công trình nghiên cứu của mình rằng ông sẽ đưa ra những ứng dụng cho rất nhiều bài toán trong các vấn đề xã hội và kinh tế. Như thể “Bernoulli hoàn toàn từ bỏ sau khi tìm được con số 25.550,” theo lời của một nhà nghiên cứu lịch sử thống kê Stephen Stigler. Thực tế, Bernoulli đang trong quá trình công bố bản thảo thì ông mất “do một trận sốt dài ngày” vào tháng 8 năm 1705, năm 50 tuổi. Nhà xuất bản yêu cầu Johann Bernoulli hoàn thành cuốn sách, nhưng Johann từ chối, nói là ông quá bận. Điều đó có vẻ kỳ lạ, nhưng gia đình Bernoulli vẫn luôn thế, họ luôn là một gia đình kỳ lạ. Nếu bạn được yêu cầu chọn ra một nhà toán học khó ưu nhất từ trước đến nay, bạn sẽ không sai nếu bạn chỉ ra Johann Bernoulli. Ông đã từng được mô tả rất nhiều trong các sách lịch sử là một người đố kỵ, kiêu ngạo, dễ tự ái, cứng đầu, hay cáu bẳn, khoác lác, bất lương và là một kẻ nói dối trắng trợn. Ông đạt được nhiều thành công trong toán học, nhưng ông cũng nổi tiếng vì có cậu con Daniel bị đuổi khỏi Académie des Sciences (Viện khoa học) sau khi Daniel đạt được giải thưởng mà chính Johann cũng từng cạnh tranh, nổi tiếng vì đã ăn cắp tư tưởng của cả anh trai mình và Leibniz, và vì đã ăn cắp ý trong cuốn sách của Daniel về thủy động lực học và làm giả ngày xuất bản để cuốn sách của ông ta trông có vẻ đã xuất bản trước.
Khi được yêu cầu hoàn thành bản thảo của người anh quá cố, ông từ Đại học Groningen, Hà Lan, trở về Basel, không mang danh hiệu là nhà toán học mà là một giáo sư của Hy Lạp. Jakob thấy sự thay đổi sự nghiệp này rất đáng nghi ngờ, đặc biệt vì trong hiểu biết của ông Johann không biết tiếng Hy Lạp. Ông đã viết cho Leibniz, điều ông nghi ngờ là Johann đã về Basel để chiếm lấy vị trí của Jakob. Và thực vậy, sau cái chết của Jakob, Johann đã có được nó.
Johann và Jakob không hòa thuận lắm trong suốt thời thanh niên. Họ thường lăng mạ qua lại lẫn nhau trong những công trình toán học và trong những bức thư, đến nỗi một nhà toán học đã viết, “họ nhảy dựng lên, và giành cho nhau những ngôn từ như ‘dân chợ búa’”. Do vậy khi cần phải hiệu chỉnh bản thảo, Jakob thường giao việc trong nội bộ gia đình cho cháu trai của Jakob là Nikolaus (Jakob cũng còn một cháu trai tên Nikolaus khác, con của một trong những người em trai khác cuả Jakob). Nikolaus ít tuổi hơn lúc đó mới 18 tuổi, nhưng ông là một học trò của Jakob. Thật không may, cậu không đủ sức để hiệu chỉnh bản thảo, có lẽ một phần vì cậu hiểu sự đối nghịch của Leibniz đối với các tư tưởng của chú mình về những ứng dụng của lý thuyết này. Do vậy, bản thảo nằm im trong 8 năm. Sau cùng, cuốn sách được xuất bản năm 1713 dưới tựa Ars conjectandi, tức Nghệ thuật phỏng đoán. Giống như cuốn Pensées của Pascal, cuốn sách này ngày nay vẫn được phát hành.
Jakob Bernoulli đã chỉ ra rằng qua phân tích toán học người ta có thể hiểu các xác suất ẩn bên trong, làm nền tảng cho hệ thống tự nhiên được phản ánh trong dữ liệu mà hệ thống đó tạo ra. Đối với bài toán mà Bernoulli không giải – câu hỏi làm thế nào suy ra xác suất cơ bản của các sự kiện từ các dữ liệu có sẵn – lời giải cũng không xuất hiện trong vài thập kỷ nữa.
Bạn có thể dùng phím mũi tên để lùi/sang chương. Các phím WASD cũng có chức năng tương tự như các phím mũi tên.