Litecoin

Làm thế nào những người bình thường có thể bắt đầu giao dịch định lượng vào năm 2026?

2026/04/03 02:13
🌐vi

Giúp bạn nắm vững các công cụ cốt lõi như xác suất, thống kê và đại số tuyến tính từ đầu theo đúng thứ tự và xây dựng lợi thế chiến lược của riêng bạn.

Làm thế nào những người bình thường có thể bắt đầu giao dịch định lượng vào năm 2026?
Tiêu đề gốc: Làm thế nào tôi có thể trở thành nhà định lượng nếu tôi phải bắt đầu lại vào ngày mai
Tác giả gốc: gemchanger, người sáng lập coldvision
Dịch và chú thích: MrRyanChi, insiders.bot

Năm 2026 Năm nay, giao dịch định lượng là phẩm chất cơ bản của mọi nhà giao dịch

Tuần trước, tôi đã được Hiệp hội Quản lý và Trí tuệ Nhân tạo mời Đại học Hồng Kông (@camo_hku) để chia sẻ các phương pháp kiếm tiền thời đại đại lý. Sau toàn bộ hoạt động, lợi ích lớn nhất của tôi là một điều, đó là:

Kỷ nguyên của AI = kỷ nguyên của quyền bình đẳng trong công nghệ

Trước đây, định lượng là lĩnh vực độc quyền của một số ít tổ chức. Giờ đây, vô số hãng phim và thậm chí cả cá nhân đang tham gia vào quá trình tạo ra các chiến lược định lượng và thu được lợi nhuận bền vững. Nói cách khác, nếu không hiểu bản chất của việc định lượng, bạn sẽ gặp bất lợi rất lớn trên thị trường.

Trong kỷ nguyên OpenClaw ngày nay, bất kỳ ai cũng có thể kiếm tiền thông qua việc định lượng. Nhưng điều này đòi hỏi hai điều kiện tiên quyết.

Đầu tiên là cơ sở hạ tầng. Đây chính xác là những gì chúng tôi tại @insidersdotbot đang cố gắng đạt được bằng cách tạo ra nền tảng, cơ sở dữ liệu và Kỹ năng giao dịch dựa trên thuật toán và Đại lý. Chức năng kiểm tra lại dựa trên Đại lý của phiên bản chính thức cũng sẽ là một phần của hệ sinh thái này.

Thứ hai và quan trọng nhất với tư cách cá nhân là khả năng thiết kế kiến ​​trúc và chiến lược. Chiến lược không cần chính xác 100% nhưng phải độc đáo và tinh tế để bạn có thể nắm bắt được những cơ hội lớn mà người khác không biết tới.

Miễn là bạn có chiến lược của riêng mình + cơ sở vật chất cơ bản tuyệt vời, thì với sự trao quyền của Vibe Coding, bạn sẽ không còn xa tự do tài chính nữa.

Đối với chiến lược học tập và kiến ​​trúc, bài viết gốc của @gemchange_ltd là "Bản đồ kiến ​​thức giao dịch định lượng" đầy đủ nhất mà tôi từng thấy cho đến nay. Nó lấy thị trường dự đoán làm nguồn cảm hứng và giải thích mọi mảnh ghép cần thiết để trở thành nhà giao dịch định lượng hàng đầu (nhà giao dịch định lượng/Số lượng) cùng một lúc theo đúng thứ tự học tập.

Tôi tin rằng sau khi đọc nó, ngay cả khi bạn là người mới, bạn sẽ có thể hiểu cách bắt đầu giao dịch định lượng và cách thiết kế chiến lược của riêng mình.

Nếu bạn là một nhà giao dịch dự đoán thị trường thì đây là một bài viết phải đọc.

Nếu bạn là người giao dịch các tài sản khác, nhiều ý tưởng trong bài viết này rất phổ biến và tôi tin rằng bạn cũng có thể hưởng lợi từ chúng.

Bài viết gốc rất cứng rắn và mang tính học thuật. Tôi đã viết lại và bổ sung rất nhiều để bất kỳ ai mới biết đến Polymarket đều có thể hiểu được hoặc thậm chí không có bất kỳ nền tảng toán học nào. Tôi cho rằng bạn không biết gì về toán học phức tạp, vì vậy tôi đã thêm 20 sơ đồ hoàn toàn bằng tiếng Trung Quốc và sử dụng các phép loại suy phổ biến, bản ngữ thực tế nhất và các ví dụ thực tế để giúp bạn chia nhỏ từng khái niệm.

Nếu bạn muốn kiếm tiền lâu dài từ thị trường dự đoán thay vì trở thành một con bạc, bài viết này là điểm khởi đầu của bạn.

Nhân tiện, bài viết này được tối ưu hóa về mặt cấu trúc cho Tác nhân. Cứ như thể nền tảng insiders.bot được tối ưu hóa cho cả nhà giao dịch con người và AI. Vì vậy, mọi người đều có thể cung cấp bài viết này cho OpenClaw, Manus, Claude hoặc bất kỳ AI nào của bạn và bắt đầu xây dựng mô hình định lượng của bạn ngay lập tức.

Lời nói đầu: Có bạn giao dịch hay đánh bạc?

Hãy để tôi hỏi bạn một câu hỏi trước.

Bạn thấy một hợp đồng trên Polymarket, giá CÓ của "Trump thắng cử" là 0,52 USD. Bạn cho rằng anh ta có xác suất thắng cao hơn nên bạn chi 520 USD để mua 1.000 cổ phiếu CÓ.

Bạn có cảm giác như mình đang thực hiện một thỏa thuận. Nhưng thực sự thì bạn chỉ đang đánh bạc. Bởi vì bạn chưa trả lời những câu hỏi sau:

* Bạn tính 52% của mình như thế nào?

* Nguồn thông tin của bạn có tốt hơn những người chơi khác trên thị trường không?

* Nếu một mẩu tin tức xuất hiện vào ngày mai, ước tính xác suất của bạn nên được cập nhật như thế nào?

* Bạn nên mua bao nhiêu vị thế để tránh bị thanh lý vị thế của mình "trong trường hợp bạn đoán sai"?

Những câu hỏi này không thể trả lời bằng "cảm giác". Họ yêu cầu toán học.

Vào năm 2025, những người quản lý cấp độ đầu vào tại các công ty định lượng hàng đầu (Jane Street, Citadel, HRT) sẽ kiếm được từ 300 nghìn đô la đến 500 nghìn đô la mỗi năm. Tuyển dụng tài chính cho AI và học máy đã tăng 88% so với cùng kỳ năm ngoái. Không phải vì những công ty này thích các nhà toán học. Đó là vì toán học thực sự kiếm tiền nhờ những mô hình định giá chính xác hơn.

Polymarket là một thị trường giao dịch tích hợp hoàn hảo tất cả các khái niệm cốt lõi của tài chính định lượng: Lý thuyết xác suất, lý thuyết thông tin, tối ưu hóa lồi và lập trình số nguyên, tất cả đều có thể được sử dụng.

Chương 1: Xác suất, ngôn ngữ duy nhất của thế giới không chắc chắn

Hầu hết mọi người đều hiểu lầm rất lớn về giao dịch định lượng. Họ cho rằng giao dịch định lượng là "chọn cổ phiếu" và có cái nhìn sâu sắc độc đáo về một sự kiện nhất định.

Không hề.

Bản chất của giao dịch định lượng = toán học thuần túy.

Cụ thể hơn, điều bạn đang tìm kiếm là:

* Tương quan thống kê

* Sự kém hiệu quả về giá

* Lợi thế về mặt cấu trúc.

Những lợi thế này tồn tại bởi vì thị trường là một hệ thống phức tạp được tạo thành từ con người và con người luôn mắc phải những sai lầm mang tính hệ thống.

Trong thế giới tài chính định lượng, tất cả các câu hỏi cuối cùng có thể được rút gọn thành một câu hỏi: Tỷ lệ cược là bao nhiêu và tỷ lệ cược này có lợi cho tôi như thế nào?

Vậy trước hết bạn phải hiểu sâu sắc bản chất của “xác suất”.

Tư duy có điều kiện: Nói lời tạm biệt với đúng sai tuyệt đối

Người bình thường thích suy nghĩ theo đúng sai tuyệt đối. Hoặc có điều gì đó xảy ra hoặc nó không xảy ra.

Nhưng quant lại suy nghĩ có điều kiện.

Họ hỏi: Khả năng điều đó xảy ra như thế nào với những thông tin nhất định?

"Xác suất khi biết được thông tin nào đó" là xác suất có điều kiện.

Nói một cách dễ hiểu: khi bạn có được manh mối mới, xác suất ban đầu sẽ thay đổi như thế nào?

Nghe có vẻ hơi phức tạp? Hãy xem một ví dụ thực tế trên Polymarket.

Giả sử bạn đang giao dịch một hợp đồng về việc "liệu một mã thông báo nào đó có tăng giá hôm nay hay không." Dữ liệu lịch sử cho thấy xác suất đồng tiền này tăng hàng ngày là 60%. Đây là xác suất cơ bản (Tỷ lệ cơ bản). Tuy nhiên, nếu khối lượng giao dịch của đồng xu này vượt quá mức trung bình trong lịch sử ngày hôm nay thì khả năng nó tăng sẽ là 75%.

Xác suất có điều kiện 75% là "tín hiệu" thực sự. Và 60% bị cô lập đó chỉ là dữ liệu nền đầy nhiễu.

Hãy lấy một ví dụ khác trực quan hơn. Xác suất có mưa là 30%. Nhưng nếu bầu trời đã đầy mây đen thì sao? Khả năng có mưa có thể lên tới 85%. "Đám mây đen" là thông tin tình trạng của bạn, khiến ước tính xác suất của bạn tăng từ 30% lên 85%. Đây là bản chất của xác suất có điều kiện.

Định lý Bayes: Cách cập nhật niềm tin của bạn theo thời gian thực

Định lý Bayes là linh hồn của giao dịch định lượng. Nó trả lời câu hỏi: Khi bạn có được dữ liệu mới, bạn nên cập nhật niềm tin ban đầu của mình như thế nào?

Công thức như sau:

P(A|B) = P(A∩B) / P(B)

* P(A|B): Cho rằng B đã xảy ra, xác suất xảy ra A xảy ra

* P(A∩B): Xác suất A và B xảy ra cùng lúc

* P(B): B Xác suất xảy ra

Logic của Định lý Bayes về cơ bản là thế này:

* Trước tiên, bạn có một ước tính trong đầu (ví dụ: tôi nghĩ có 50% xác suất điều này xảy ra).

* Đột nhiên, bạn nhìn thấy một bằng chứng mới (ví dụ: một tin tốt).

* Hãy tự hỏi bản thân hai câu hỏi: Nếu điều này thực sự xảy ra, khả năng tin tức này được công bố là bao nhiêu? Nếu điều này không bao giờ xảy ra thì khả năng tin tức này sẽ xuất hiện là bao nhiêu?

* Dựa trên câu trả lời cho hai câu hỏi này, bạn điều chỉnh ước tính tinh thần của mình (ví dụ: từ 50% lên 58%).

Chúng tôi sử dụng kịch bản Polymarket để hiểu.

Mô hình của bạn tính toán rằng mức giá hợp lý cho một thị trường nhất định phải là 0,5 đô la (nghĩa là bạn cho rằng xác suất điều này xảy ra là 50%). Đây là niềm tin trước đây của bạn.

Đột nhiên, một tin tức nóng hổi được đưa ra. Dữ liệu kinh tế tốt hơn 3% so với dự kiến.

Với công thức Bayesian, bạn có thể tính toán chính xác niềm tin mới của mình. Giả sử điều đó đạt tới 58%. Khi đó mức giá hợp lý mới của bạn là 0,58 USD.

Trên thị trường, ai hoàn thành việc cập nhật xác suất này nhanh nhất và chính xác nhất sẽ kiếm được nhiều tiền nhất. Đây là lý do tại sao các nhóm định lượng chi hàng triệu đô la để xây dựng các hệ thống có độ trễ thấp. Không phải vì họ thích nhanh mà vì nhanh hơn 0,1 giây nghĩa là có thêm hàng chục nghìn đô la.

Nếu bạn muốn đặt một nền tảng vững chắc, đọc miễn phí cuốn “Introduction to Probability” (Giới thiệu về Lý thuyết Xác suất) của Đại học Harvard, 6 chương đầu là đủ. Sau đó, hãy thử viết một đoạn mã bằng Python mô phỏng việc tung đồng xu 10.000 lần và tự mình xem quy luật số lớn hoạt động như thế nào.

Giá trị kỳ vọng và phương sai: hai người bạn thân nhất của bạn

Trong giao dịch, có hai con số quan trọng hơn bất kỳ thứ gì khác.

Giá trị kỳ vọng (EV), mức độ chắc chắn của bạn.

Nếu giá trị kỳ vọng của một giao dịch là dương, điều đó có nghĩa là chỉ cần bạn lặp lại nó đủ số lần, bạn chắc chắn sẽ kiếm được tiền về lâu dài.

Sự khác biệt, rủi ro của bạn.

Nó cho bạn biết bạn sẽ trải qua bao nhiêu thăng trầm trước khi đạt được mục tiêu kiếm tiền "dài hạn" đó.

Hãy cho tôi một ví dụ. Giả sử bạn có một chiến lược với lợi nhuận kỳ vọng là 2 USD cho mỗi giao dịch nhưng độ lệch chuẩn là 50 USD. Điều này có nghĩa là mặc dù bạn "trung bình" kiếm được 2 đô la cho mỗi giao dịch, nhưng kết quả của một giao dịch có thể dao động mạnh mẽ giữa việc mất 100 đô la và kiếm được 100 đô la. Nếu số tiền gốc của bạn chỉ là 200 đô la, bạn có thể đã thua ba ván liên tiếp và bị xóa sổ trước khi "thời gian dài hạn" đến.

Kelly's công thức: xác định quy mô đặt cược một cách khoa học

Bây giờ tôi đã biết giá trị và phương sai kỳ vọng, tôi nên mua bao nhiêu khi gặp cơ hội tốt? Vị trí đầy đủ của stud?

Hoàn toàn không. Ở đây chúng ta cần giới thiệu Tiêu chí Kelly.

Công thức Kelly được thiết kế đặc biệt để cho bạn biết: Theo tỷ lệ chiến thắng và tỷ lệ cược nhất định, bạn nên đặt cược bao nhiêu phần trăm trong tổng số tiền của mình để khiến tiền của bạn trượt tuyết nhanh nhất mà không bị phá sản.

Nếu tính là 20% nghĩa là bạn chỉ có thể đặt cược với mức tối đa là 20% tổng số tiền.

Trong thực chiến, do ước tính tỷ lệ thắng của chúng tôi thường không chính xác (bạn nghĩ mình có tỷ lệ thắng 60%, thực tế có thể chỉ là 55%), những quant hàng đầu thường sử dụng "Một nửa Kelly", tức là chỉ đặt cược một nửa kết quả được tính theo công thức của Kelly. Điều này có thể làm giảm đáng kể sự lên xuống của tiền của bạn trong khi vẫn giữ được phần lớn tốc độ kiếm tiền của bạn.

Bài tập về nhà chương 1 (2 giờ mỗi ngày, mất khoảng 3-4 tuần để hoàn thành):

1. Đọc: Đọc "Introduction to Probability Theory" đồng tác giả Blitzstein & Hwang (Harvard cung cấp bản PDF miễn phí, link: http://probabilitybook.net[[1》(https://stat110.hsites.harvard.edu/))

2. Bài tập lập trình 1: Mô phỏng 10.000 lần tung đồng xu và sử dụng biểu đồ để kiểm chứng trực quan “Định luật số lớn”.

3. Bài tập lập trình 2: Triển khai trình cập nhật Bayes: nhập xác suất trước và hàm khả năng và xuất xác suất sau.

Chương 2: Thống kê = Máy dò tiếng ồn của bạn

Khi bạn học ngôn ngữ xác suất, bước tiếp theo là học cách "lắng nghe dữ liệu".

Đây là số liệu thống kê.

Bài học đầu tiên mà số liệu thống kê dạy chúng ta là hầu hết những thứ trông giống như "tín hiệu" thực chất lại là nhiễu.

Thử nghiệm giả thuyết và nhiều bẫy so sánh

Giả sử bạn viết một robot giao dịch và dữ liệu backtest cho thấy nó có thể kiếm được 15% mỗi năm. Điều này có đúng không, hay chỉ là sự may mắn?

Lúc này bạn cần tính giá trị p: Nếu chiến lược này thực sự là rác rưởi (hoàn toàn dựa trên sự lừa dối), thì xác suất để nó ngẫu nhiên đạt được lợi nhuận 15% là bao nhiêu? Thống kê có thể cho bạn biết xác suất này nhỏ đến mức nào (ví dụ: dưới 5%).

Tuy nhiên, có một cái bẫy lớn ở đây, được gọi là Bài toán so sánh bội số.

Hãy tưởng tượng bạn yêu cầu 1.000 con khỉ mỗi con ném phi tiêu 100 lần. Hoàn toàn nhờ may mắn, luôn có một số chú khỉ có thể bắn trúng trái tim đỏ liên tục và trông giống như những "bậc thầy phi tiêu". Nhưng bạn sẽ không thuê họ làm người quản lý đầu tư vì điều đó, phải không?

Việc viết chiến lược giao dịch cũng vậy. Nếu bạn sử dụng máy tính để tự động tạo ra 1.000 chiến lược mù quáng và chạy dữ liệu lịch sử, sẽ có khoảng 50 chiến lược có vẻ như có thể kiếm được rất nhiều tiền chỉ dựa vào may mắn thuần túy.

Mỗi người mới bước vào ngành sẽ đánh giá quá cao những “chiến lược hiệu quả” mà mình đã khám phá ra. Tôi có thể nói với bạn một cách có trách nhiệm rằng 10 chiến lược đầu tiên bạn viết chắc chắn là những con khỉ may mắn.

Cái gì là giải pháp? Bạn cần sử dụng hiệu chỉnh Bonferroni để nâng ngưỡng ý nghĩa của mình hoặc sử dụng biện pháp kiểm soát tỷ lệ phát hiện sai (FDR). Nói một cách đơn giản, nếu bạn kiểm tra 100 chiến lược, ngưỡng ý nghĩa của bạn không còn là 0,05 nữa mà là 0,05/100 = 0,0005. Bằng cách này, các tín hiệu sai do may mắn có thể được lọc ra.

Phân tích hồi quy: Phân tích các nguồn thu nhập của bạn

Hồi quy tuyến tính là một công cụ hữu ích trong thế giới tài chính. Trong giao dịch định lượng, bạn sẽ so sánh lợi nhuận của chiến lược của mình với sự tăng giảm của thị trường.

Số hạng chặn α (Alpha) ở đây là lợi nhuận vượt quá của bạn. Đó là tiền không thể giải thích được bằng sự lên xuống của thị trường và kiếm được hoàn toàn bằng kỹ năng cá nhân của bạn.

Hãy cho tôi một ví dụ. Giả sử chiến lược của bạn kiếm được 20% trong năm nay. Nhưng nếu toàn bộ thị trường có thể tăng 18% nếu bạn nhắm mắt mua, thì điểm kỹ thuật (Alpha) của bạn thực tế chỉ là 2%.

Điều tệ hơn nữa là nếu chiến lược của bạn chỉ là "theo đuổi cái tăng và giết cái giảm", thì sau khi loại trừ những biến động của thị trường, Alpha của bạn có thể trở thành số 0 hoặc thậm chí là số âm. Điều này cho thấy cái gọi là "lợi thế giao dịch" của bạn chỉ là một cách trá hình để đi theo dòng chảy.

Trong dữ liệu tài chính, có một vấn đề khác cần đặc biệt chú ý: Thường có hiện tượng tự tương quan (giá hôm nay có liên quan đến ngày hôm qua) và tính không đồng nhất (biến động không cố định) giữa các dữ liệu. Vì vậy bạn cần phải hiệu chỉnh lại kết quả hồi quy của mình theo sai số chuẩn Newey-West, nếu không các phép kiểm tra thống kê của bạn sẽ đưa ra những kết luận quá lạc quan.

Ước tính khả năng xảy ra tối đa (MLE): Nghệ thuật suy luận ngược

Khi bạn nghe một nhà định lượng từ một tổ chức hàng đầu nói rằng họ đang "hiệu chỉnh" một mô hình, họ hầu như luôn nói về một điều: Ước tính khả năng xảy ra tối đa (MLE).

Nguyên tắc của MLE thực ra rất dễ hiểu. Đó là một kiểu “lý luận ngược”.

Ví dụ. Bạn nhìn thấy một vũng nước có đường kính 2 mét ở bên đường. Bạn tự hỏi đêm qua trời mưa bao nhiêu. Bạn có một "mô hình lượng mưa" cho bạn biết những vũng nước lớn sẽ được tạo ra ở những lượng mưa khác nhau như thế nào.

MLE hoạt động ngược lại: Bây giờ tôi đã nhìn thấy một vũng nước dài 2 mét, lượng mưa nào có thể tạo ra một vũng nước lớn như vậy?

Cho dù mô hình GARCH phù hợp với biến động hay điều chỉnh giá quyền chọn theo giá thị trường, MLE là một công cụ cốt lõi.

Điều này cũng đúng trong giao dịch. Bạn thấy giá của các quyền chọn trên thị trường (vũng nước) và bạn muốn suy ra những kỳ vọng của thị trường về sự biến động trong tương lai (lượng mưa). MLE giúp bạn tìm tham số ẩn “giải thích rõ nhất về giá hiện tại”.

Dưới dạng liên kết, hãy thử tải xuống một số giá tài sản thực data (ví dụ: sử dụng thư viện yfinance của Python). Kiểm tra xem chúng có phân phối chuẩn hay không.

Spoiler: Hoàn toàn không. Thế giới thực đầy rẫy Fat Tails, nghĩa là các sự kiện cực đoan xảy ra thường xuyên hơn nhiều so với dự đoán của phân phối chuẩn. Hãy thử sử dụng MLE để phù hợp với phân phối t để xem rủi ro thực sự trông như thế nào.

Bài tập về nhà chương 2 (hoàn thành khoảng 4-5 tuần):

1. Đọc: Đọc Chương 1 đến Chương 13 trong cuốn “Tất cả các số liệu thống kê” của Wasserman. (Phiên bản PDF công khai của CMU: https://www.stat.cmu.edu/~brian/valerie/617-2022/0%20-%20books/2004%20-%20wasserman%20-%20all%20of%20statistics.pdf)

2. Bài tập lập trình 1: Sử dụng yfinance Tải xuống dữ liệu lợi nhuận cổ phiếu thực và thực hiện kiểm tra tính quy chuẩn trên đó (spoiler: có khả năng cao là nó sẽ bị từ chối, cho thấy tỷ lệ hoàn vốn không tuân theo phân phối chuẩn). Sau đó, sử dụng ước tính khả năng tối đa (MLE) để điều chỉnh phân phối t và so sánh sự khác biệt giữa hai phân phối.

3. Bài tập lập trình 2: Sử dụng thư viện mô hình thống kê để chạy hồi quy ba yếu tố Fama-Pháp cho danh mục đầu tư chứng khoán.

4. Bài tập lập trình 3: Thực hiện bài kiểm tra hoán vị: xáo trộn ngẫu nhiên ngày 10.000 lần và so sánh sự khác biệt giữa hiệu suất được xáo trộn và hiệu suất thực tế.

Chương 3: Đại số tuyến tính, động cơ cơ bản của thế giới lượng tử

Nhiều người cho rằng đại số tuyến tính thật nhàm chán, chỉ là một loạt các phép toán ma trận. Nhưng thực ra nó là cỗ máy vận hành toàn bộ thế giới định lượng. Xây dựng danh mục đầu tư, phân tích thành phần chính (PCA), mạng lưới thần kinh, ước tính hiệp phương sai, mô hình nhân tố, tất cả đều phụ thuộc vào nó.

Thậm chí còn có tin đồn rằng Quỹ Huy chương đã thực sự đánh bại Buffett với tỷ số 30% ở Nianhua là dựa trên mô hình Markov dựa trên đại số tuyến tính.

Bạn không thể là một quant nếu bạn không thể suy nghĩ trôi chảy về ma trận.

Ma trận hiệp phương sai: Tìm hiểu sự biến động của tài sản

Ma trận hiệp phương sai Σ (Sigma) ghi lại cách mỗi tài sản di chuyển so với tất cả các tài sản khác.

Nếu bạn đang xem 500 thị trường, ma trận có kích thước 500×500 và chứa 125.250 mục nhập duy nhất. Mỗi mục nhập cho bạn biết: "Khi tài sản A tăng, tài sản B có xu hướng tăng hay giảm và tăng bao nhiêu."

Phương sai của toàn bộ danh mục đầu tư có thể được tóm tắt thành một biểu thức toán học cực kỳ tinh tế:

σ²_p = w^T Σ w

* w là vectơ trọng số vị trí của bạn

* Σ Đây là ma trận hiệp phương sai

Công thức bậc hai này là cốt lõi của lý thuyết danh mục đầu tư của Markowitz, cốt lõi của quản lý rủi ro và cốt lõi của mọi thứ.

Nói cách khác, nếu bạn giao dịch nhiều thị trường liên quan cùng một lúc (chẳng hạn như "Trump thắng cử" và "Đảng Cộng hòa thắng Thượng viện"), tổng rủi ro của bạn không chỉ đơn giản là cộng rủi ro ở mỗi thị trường. Bạn cần xem xét mối tương quan giữa chúng. Ma trận hiệp phương sai là công cụ giúp bạn thực hiện điều này.

Phân tích riêng và PCA: Tìm động lực tiềm ẩn

Khi bạn lần đầu tiên sử dụng Phân tích riêng (Phân tích riêng) để thực hiện Phân tích thành phần chính (PCA), cách bạn nhìn thế giới sẽ thay đổi.

Phân tích thành phần chính có thể được giải thích bằng cách tương tự như sau: Giả sử bạn muốn mô tả hình dáng cơ thể của một người, bạn có thể ghi lại hàng tá dữ liệu như chiều cao, cân nặng, chiều dài cánh tay, chiều dài chân, chiều rộng vai, v.v. Nhưng trên thực tế, nhiều dữ liệu trong số này có liên kết với nhau (người cao thường có chân dài hơn). Vai trò của PCA là cô đọng hàng tá dữ liệu phức tạp này thành một số "nhãn ẩn" cốt lõi, chẳng hạn như: "kích thước tổng thể" và "độ béo và độ gầy".

Điều này cũng đúng trên thị trường tài chính. Nếu bạn nhìn vào sự tăng giảm của 500 token, bạn sẽ thấy rằngchỉ 5 “nhãn ẩn” (vector riêng) đầu tiên có thể giải thích 70% biến động trên toàn thị trường. Mọi thứ còn lại về cơ bản chỉ là tiếng ồn.

Bạn không cần phải hiểu mỗi token trong số 500 token đang làm gì. Bạn chỉ cần hiểu 5 “động lực tiềm ẩn” này (chẳng hạn như: tâm lý chung của thị trường, sự thay đổi của lãi suất, mức độ phổ biến của các bản nhạc cụ thể, v.v.). Đây là sự kỳ diệu của việc giảm kích thước.

Nếu bạn có đủ thời gian, bạn nên làm như vậy để xem khóa học mở đại số tuyến tính do Giáo sư Gilbert Strang của MIT giảng dạy. Sau đó, sử dụng Python để thực hiện phân tách PCA của lợi nhuận S&P 500 để tự mình xem một số thành phần chính đầu tiên là gì.

Bạn sẽ thấy rằng thành phần chính đầu tiên gần như ngang bằng với “sự lên xuống của toàn bộ thị trường”.

Bài tập về nhà chương 3 (hoàn thành khoảng 4-6 tuần):

1. Xem video: Sau khi xem hết video khóa học Đại số tuyến tính MIT 18.06 của Gilbert Strang, bạn không thể bỏ qua một bước nào. (Xem miễn phí MIT OpenCourseWare: https://ocw.mit.edu/courses/18-06-liner-algebra-spring-2010/video_galleries/video-lectures/)

2. Đọc: Đọc bài “Nhập môn đại số tuyến tính” của Strang và làm các bài tập trong sách. (Trang web chính thức của sách giáo khoa: https://math.mit.edu/~gs/lineralgebra/)

3. Bài tập lập trình 1: Thực hiện phân tách PCA (phân tích thành phần chính) trên dữ liệu trả về của S&P 500, vẽ phổ giá trị riêng (nghĩa là mỗi thành phần chính giải thích mức độ phương sai) và tìm 3 thành phần chính quan trọng nhất.

4. Bài tập lập trình 2: Thực hiện tối ưu hóa phương sai trung bình Markowitz từ đầu.

Chương 4: Tính toán và tối ưu hóa, ngôn ngữ nắm bắt sự thay đổi

Tính toán là ngôn ngữ về “sự thay đổi”. Trong thị trường tài chính, mọi thứ đều thay đổi: giá cả, sự biến động, mối tương quan, toàn bộ phân bổ xác suất thay đổi theo từng giây.

Tính toán được sử dụng để mô tả và sử dụng những thay đổi này.

Đạo hàm và khai triển Taylor: sử dụng tính đơn giản để xấp xỉ độ phức tạp

Đạo hàm (Đạo hàm, ở đây là đạo hàm toán học, không phải đạo hàm tài chính) xuất hiện trong quá trình lan truyền ngược của mọi mạng nơ-ron và cũng xuất hiện trong phép tính của mọi phương án "Hy Lạp".

Trong giao dịch định lượng, chúng ta thường sử dụng khai triển Taylor để thực hiện các phép tính gần đúng. Đạo hàm về cơ bản cung cấp đầu vào cần thiết cho việc khai triển Taylor.

Ý nghĩa của việc khai triển Taylor là mô phỏng bất kỳ hàm phức tạp nào bằng cách tinh chỉnh một đa thức để mô hình hóa mối quan hệ giữa x (các yếu tố chính) và y (giá tài sản).

Giả sử bạn muốn để vẽ một đường cong rất phức tạp, nhưng tất cả những gì bạn có là một cây thước. phải làm gì?

Bước đầu tiên, bạn sử dụng đường thẳng để khớp một điểm nhất định của đường cong (đây gọi là xấp xỉ bậc một, gọi là Delta trong tùy chọn). Xung quanh điểm này, một đường thẳng tương tự như một đường cong.

Bước thứ hai, nếu muốn phù hợp hơn, bạn có thể uốn cong đường thẳng một chút và biến nó thành hình parabol (cái này gọi là xấp xỉ bậc hai, gọi là Gamma trong tùy chọn).

Bạn uốn cong càng nhiều lần thì đường thẳng của bạn sẽ càng gần với đường cong phức tạp đó.

Trong giao dịch, sự thay đổi giá của quyền chọn là một công thức cực kỳ phức tạp. Chúng tôi không thể tìm ra điều đó nên chúng tôi đã sử dụng phép khai triển Taylor để chia nó thành nhiều phần đơn giản:

Tác động của hướng giá (Delta) + tác động của độ cong giá (Gamma) + tác động của thời gian trôi qua (Theta) + tác động của sự thay đổi biến động (Vega).

Tối ưu hóa lồi: tìm giải pháp tối ưu

Trong tài chính định lượng, hầu hết các bài toán "tối ưu hóa" đều có thể được biểu diễn dưới dạng bài toán tối ưu lồi (Tối ưu hóa lồi). Ví dụ: Với một ngân sách rủi ro nhất định, làm thế nào để phân bổ vốn để tối đa hóa lợi nhuận?

Hãy tưởng tượng bạn bị bịt mắt và đưa vào một thung lũng và được yêu cầu đi xuống đáy (giải pháp tối ưu).

* Nếu thung lũng này có nhiều hố, bạn có thể sẽ rơi vào một cái hố ở lưng chừng núi và không thể thoát ra được (tối ưu cục bộ).

* Nhưng nếu đây là một thung lũng hình "chiếc bát" hoàn hảo, bạn chỉ cần tiếp tục đi theo hướng xuống dốc (gradient down), và nhắm mắt chắc chắn bạn sẽ đạt đến điểm thấp nhất duy nhất ở phía dưới (giải pháp tối ưu toàn cục).

Miễn là bạn có thể viết một bài toán tài chính thành công thức toán học hình “chiếc bát”, máy tính có thể giúp bạn tìm ra lời giải hoàn hảo trong tích tắc. Đây là những gì tối ưu hóa lồi mang lại cho bạn. Tác giả của bài viết gốc đã đề cập rằng Boyd và Vandenberghe của Đại học Stanford đã viết một cuốn sách giáo khoa miễn phí "Tối ưu hóa lồi", đây là kinh thánh trong lĩnh vực này. Thư viện cvxpy của Python cho phép bạn giải quyết các vấn đề tối ưu hóa phức tạp chỉ bằng một vài dòng mã.

Ở đây tôi cũng giới thiệu một loạt các khóa học về AI của Andrew Ng. Giảm dần độ dốc và tối ưu cục bộ/tối ưu toàn bộ kịch tính sẽ được đề cập trong một số số đầu tiên. Sẽ thuận tiện cho mọi người hiểu rõ hơn về sự cần thiết của việc tối ưu hóa lồi. Link: https://www.youtube.com/watch?v=JPcx9qHzzgk

Bài tập về chương 4 (hoàn thành khoảng 4-5 tuần):

1. Đọc: Đọc Chương 1 đến Chương 5 cuốn “Tối ưu hóa lồi (Tối ưu hóa lồi)” của Boyd & Vandenberghe. (Stanford cung cấp phiên bản PDF miễn phí: https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf, trang chủ sách: https://stanford.edu/~boyd/cvxbook/)

2. Bài tập lập trình 1: Thực hiện thuật toán giảm độ dốc từ đầu và sử dụng nó để tìm giá trị tối thiểu của hàm Rosenbrock. (Hàm Rosenbrock là một trong những hàm kiểm tra cổ điển nhất trong lĩnh vực tối ưu hóa. Nhìn thì đơn giản nhưng thực ra rất khó tối ưu hóa, dùng để kiểm tra hiệu suất của thuật toán.)

3. Bài tập lập trình 2: Sử dụng cvxpy để giải quyết vấn đề tối ưu hóa danh mục đầu tư và thêm các ràng buộc về chi phí giao dịch.

Chương 5: Phép tính ngẫu nhiên, sự biến đổi từ một nhà khoa học dữ liệu thành một nhà định lượng thực tế

Trước khi học phép tính ngẫu nhiên, bạn chỉ là một "nhà khoa học dữ liệu thích tài chính". Một khi bạn học nó, bạn là một nhà định lượng thực sự.

Đây là nơi bạn học cách lập mô hình tính ngẫu nhiên trong thời gian liên tục. Tại đây, bạn sẽ rút ra phương trình Black-Scholes nổi tiếng từ những nguyên tắc đầu tiên và thực sự hiểu lý do tại sao thị trường phái sinh nghìn tỷ đô la lại vận hành như vậy.

*Lưu ý 5.1: Nếu bạn muốn hiểu rõ hơn về phương trình Black-Scholes và ý nghĩa của nó, bạn có thể tham khảo bài viết trước “Kinh thánh tạo thị trường đa thị trường”. Link: https://x.com/MrRyanChi/status/2033466480067747844

*Lưu ý 5.2: Tại sao phép tính ngẫu nhiên (Itô) khác với phép tính thông thường? Chính vì trong một quá trình ngẫu nhiên, số hạng Taylor bậc hai không biến mất. Trong phép tính thông thường, khi khoảng thời gian tiến tới 0, các số hạng bậc hai có thể bị bỏ qua. Tuy nhiên, trong quá trình ngẫu nhiên, do tính chất đặc biệt của chuyển động Brown (dW)² = dt nên số hạng bậc hai trở thành độ lớn bậc một và không thể bỏ qua. Xem bên dưới để biết chi tiết.

Chuyển động Brown: một biểu thức toán học của tính ngẫu nhiên thuần túy

Chuyển động Brown (còn gọi là quá trình Wiener, W_t) là một bước đi ngẫu nhiên trong thời gian liên tục.

Hãy tưởng tượng một người đàn ông say rượu đang đi dạo trên quảng trường. Mỗi bước anh đi đều theo những hướng hoàn toàn ngẫu nhiên. Quỹ đạo quanh co và không đều mà anh ta theo đuổi là chuyển động Brown. Sự dao động của giá cổ phiếu về mặt toán học được coi là tốc độ của người say rượu này.

Có rất nhiều ví dụ về chuyển động Brown. Ví dụ, trong khoa học, chuyển động của các hạt không khí cũng là chuyển động Brown ngẫu nhiên.

Đây là một cái nhìn sâu sắc định mệnh: Trong chuyển động Brown, thời gian trôi qua tương đương với bình phương khoảng cách (tức là (dW)² = dt). Chính vì tính chất này mà phép tính ngẫu nhiên khác với phép tính thông thường.

Bổ đề Itot: Quy tắc dây chuyền của một thế giới ngẫu nhiên

Giá cổ phiếu thường được mô hình hóa bằng chuyển động Brown hình học (GBM):

dS_t = μS_t dt + σS_t dW_t

Dịch: Thay đổi giá = xu hướng do tỷ suất lợi nhuận kỳ vọng + những cú sốc ngẫu nhiên gây ra bởi sự biến động

Và Bổ đề Itô là quy luật dây chuyền trong thế giới ngẫu nhiên.

* Trong phép tính thông thường (chẳng hạn như tính quỹ đạo của một ô tô chuyển động đều), bạn chỉ cần xét vận tốc (đạo hàm bậc nhất).

* Nhưng trong phép tính ngẫu nhiên (chẳng hạn như tính quỹ đạo của một ô tô đang lái trên đường cực kỳ xấu), do bản thân độ xóc (độ biến động) của đường quá nghiêm trọng nên cú va chạm này sẽ làm thay đổi đáng kể quỹ đạo của ô tô.

Vì vậy, Bổ đề Ito cho chúng ta biết: Khi tính toán những thay đổi ngẫu nhiên, bạn không thể chỉ nhìn vào hướng (thuật ngữ bậc một), bạn cũng phải thêm "độ gập ghềnh" (thuật ngữ bậc hai) vào công thức. Nếu bạn không thêm thì giá bạn tính sẽ sai.

Black-Scholes và Định giá trung lập với rủi ro

Khi bạn áp dụng Bổ đề Itot cho giá quyền chọn và xây dựng một danh mục đầu tư phòng ngừa rủi ro, điều kỳ diệu sẽ xảy ra.

Trong phương trình Black-Scholes dẫn xuất, biến đại diện cho "sự tăng giảm dự kiến" thực sự triệt tiêu lẫn nhau trong công thức và biến mất trong không khí!

Điều này có nghĩa là gì? Điều này có nghĩa là giá của quyền chọn hoàn toàn không phụ thuộc vào kỳ vọng của bạn rằng cổ phiếu sẽ tăng hay giảm trong tương lai.

Nghĩa là, giả sử bạn đang mua một quyền chọn mua. Bạn nghĩ rằng các quyền chọn đắt hơn vì mọi người đều lạc quan hơn. sai! Theo mô hình toán học hoàn hảo, giá của một quyền chọn chỉ liên quan đến một điều:Cổ phiếu này sẽ biến động mạnh như thế nào trong tương lai. Không quan trọng là nó tăng mạnh hay giảm mạnh.

Khi bạn thực sự hiểu khái niệm này lần đầu tiên, cảm giác sẽ vô cùng sốc. Nó giải thích tại sao một nhà giao dịch cực kỳ lạc quan và một nhà giao dịch cực kỳ giảm giá có thể vui vẻ giao dịch ở cùng một mức giá quyền chọn. Bởi vì những gì họ giao dịch không phải là định hướng mà là sự biến động.

Người Hy Lạp: Giải mã các khía cạnh rủi ro

Với mô hình định giá Black-Scholes, rủi ro có thể được chia chính xác thành nhiều khía cạnh độc lập. Các kích thước này được đặt tên theo các chữ cái Hy Lạp, vì vậy chúng được gọi là tiếng Hy Lạp:

* Delta (Δ) - Độ nhạy về giá: Giá quyền chọn thay đổi bao nhiêu khi tài sản cơ bản thay đổi 1 đô la. Nó trực tiếp cho bạn biết bạn cần mua bao nhiêu giao ngay để phòng ngừa rủi ro.

* Gamma (Γ) - Độ cong: Đồng bằng thay đổi nhanh như thế nào. Nó cho bạn biết tần suất bạn cần điều chỉnh vị thế phòng ngừa rủi ro của mình. Gamma lớn nhất và rủi ro cao nhất khi xác suất xảy ra sự kiện gần 50%.

* Theta (Θ) - Giảm dần theo thời gian: Một quyền chọn mất bao nhiêu giá trị mỗi ngày trôi qua. Bạn có thể coi đó là "tiền thuê" bạn phải trả hàng ngày để nắm giữ các quyền chọn.

* Vega (V) - Độ nhạy biến động: Giá quyền chọn thay đổi bao nhiêu khi độ biến động thay đổi 1%. Đây là nơi hầu hết các sàn giao dịch phái sinh Phố Wall thực sự kiếm được (hoặc mất) tiền của họ.

* Rho (ρ) - Độ nhạy cảm với lãi suất: Tác động của sự thay đổi lãi suất lên giá cả. Thông thường tác động là nhỏ và có thể bỏ qua.

Chương 5 bài tập về nhà (sẽ hoàn thành trong khoảng 6-8 tuần):

1. Đọc: Đọc "Tính toán ngẫu nhiên cho tài chính II (Phân tích ngẫu nhiên tài chính II: Mô hình thời gian liên tục)" của Shreve, được công nhận là sách giáo khoa tiêu chuẩn vàng trong lĩnh vực này. (Phiên bản PDF: https://cms.dm.uba.ar/academico/materias/2docuat2016/analisis_cuantitativo_en_finanzas/Steve_ShreveStochastic_Calculus_for_Finane_II.pdf)

2. Sách giáo khoa thay thế: Nếu bạn thấy Shreve quá khó nhai, bạn có thể đọc "A First Course in Stochastic" của Arguin. Phép tính (Giới thiệu về phép tính ngẫu nhiên)", cuốn sách này mới hơn và dễ đọc hơn. (Trang chính thức của AMS: https://bookstore.ams.org/amstext-53/)

3. Bài tập đạo hàm 1: Áp dụng Bổ đề Itô cho f(S) = ln(S), trong đó S tuân theo chuyển động Brown hình học (GBM). mối quan hệ giữa lợi nhuận logarit và lãi kép liên tục.)

4. Bài tập đạo hàm 2: Bắt đầu từ lập luận phòng ngừa rủi ro delta, rút ra đầy đủ phương trình vi phân từng phần Black-Scholes

6. Bài tập lập trình: thực hiện định giá theo công thức Black-Scholes từ đầu, sau đó sử dụng cách định giá mô phỏng Monte Carlo, so sánh hai kết quả và xác minh rằng Monte Carlo hội tụ với giải pháp phân tích khi số lượng mô phỏng tăng lên. src="https://image.blockbeats.cn/file_v6/20260402/d3bc3bf5-1685-46a3-8a4b-0e7a0d3f5ea4.jpg?x-oss-process=image/quality,q_50/format,webp" alt="" data-href="" style=""/>

Chương 6: Polymarket và LMSR, toán học công cụ dự đoán thị trường

Bây giờ, chúng ta hãy mang tất cả vũ khí toán học trở lại thị trường giao dịch thú vị nhất thế giới hiện nay: Polymarket

Toán học đằng sau Polymarket kết nối hoàn hảo mọi thứ được đề cập trong bài viết này: lý thuyết xác suất, lý thuyết thông tin, tối ưu hóa lồi và lập trình số nguyên

LMSR = Softmax của Mạng thần kinh

Trong các thị trường dự đoán sớm, các nhà tạo lập thị trường tự động (AMM) thường sử dụng một cơ chế gọi là LMSR (Thị trường logarit). Quy tắc tính điểm). Quy tắc này do nhà kinh tế học Robin Hanson phát minh ra.

Hàm chi phí của nó là: C(q) = b · ln(Σ e^(q_i/b))Trong đó:

* q_i là tỷ lệ vị thế mở của một kết quả nhất định

* b là thông số thanh khoản (b càng lớn thì thị trường càng "dày" và giá càng khó bị điều khiển bởi các lệnh lớn).

Dựa vào hàm chi phí này, chúng ta có thể tính giá handicap tương ứng với bất kỳ kết quả i nào:

p_i = e^(q_i/b) / Σ_j e^(q_j/b)

Nếu bạn biết một chút về machine learning và nhìn thấy công thức tính giá của LMSR, bạn sẽ thốt lên ngay: Đây không phải là hàm Softmax sao?

Giả sử bạn có ba quả táo, hãy cân!

Công thức thúc đẩy dự đoán giá thị trường về mặt toán học tương đương với công thức thúc đẩy mọi trí tuệ nhân tạo (chẳng hạn như ChatGPT) để dự đoán từ tiếp theo. Đây không phải là sự trùng hợp ngẫu nhiên. Logic cơ bản của cả hai đều giống nhau: chuyển đổi một cách tinh tế một tập hợp các số lộn xộn thành phân bố xác suất hợp pháp.

Cơ chế này đảm bảo một số tính năng cực kỳ tinh tế.

* Nó có thể cung cấp tính thanh khoản không giới hạn (sẽ có). always be someone trading with you).

* The maximum potential loss of a market maker is strictly limited to b × ln(n), where n = the number of possible outcomes.

Polymarket’s CLOB mechanism: from theory to practice

It is worth noting that although LMSR is the classic theoretical basis of the prediction market AMM, today’s Polymarket has evolved to use the CLOB (central limit order book) mechanism.

For details, please see this article I wrote last October: https://x.com/MrRyanChi/status/1977932511775760517

In CLOB mode, the price is no longer forced to be calculated by a fixed mathematical formula, but is completely generated by the buyers and sellers in the market through the game of pending orders (Bids and Asks). This is just like a traditional stock trading platform or Binance’s contracts market.

Why is this important? Because under the CLOB mechanism, the role of market makers has undergone earth-shaking changes.

The core difference between LMSR (traditional AMM) and CLOB (Polymarket current):

* Price formation: LMSR is automatically calculated by mathematical formulas; CLOB is generated by the game of pending orders between buyers and sellers.

* Liquidity source: LMSR is automatically provided by the system fund pool; CLOB must be provided by market makers actively placing orders.

* Market maker role: There is no need for professional market makers in LMSR; but in CLOB, market makers are the lifeline of the market.

* Spread control:The bid-ask spread of LMSR is determined by the system parameters; the spread of CLOB is determined by the involution competition between market makers.

* Hedging needs: Under the CLOB model, market makers face extremely high unilateral exposure risks and must conduct extremely complex cross-market hedging.

In simpler words, in LMSR mode, AMM automatically provides liquidity, and you only need to trade with the formula. But under the CLOB model, liquidity is entirely provided by market makers. You need to calculate a reasonable probability yourself (using the Bayesian update and statistical model mentioned above), and then place buy and sell orders around this probability to earn the bid-ask spread.

If you miscalculate the probability on Polymarket, or do not hedge the correlation risk correctly, the orders you place will be eaten up instantly by smarter quantitative funds and harvested like leeks.

Chapter 7: The career landscape and toolbox of quants

If you want to turn this system into your career, or form your own quantitative team, you need to understand the ecology of this industry.

Four core roles

* Quant Researcher: A person who finds patterns in massive data and builds predictive models. They require extremely high aptitude for mathematics and statistics. In the context of Polymarket, they are responsible for building probabilistic models to determine what the "reasonable price" of a contract is.

* Quant Developer: People who build infrastructure. They need to be proficient in C++, Rust or Python to build low-latency trading systems. In the context of Polymarket, they are responsible for building a trading engine that interfaces with the API to ensure that orders can be submitted and executed within milliseconds.

* Quant Trader: A person who manages funds, controls risks, and makes real-time decisions. Their income variance is the largest. On Polymarket, they are the ones making markets on multiple markets simultaneously, adjusting spreads and positions in real time.

* Risk Quant: The guardian of the team. They are responsible for model validation, calculation of maximum losses (VaR) in extreme cases and stress testing.

Salary levels of top institutions

* Top companies (such as Jane Street, Citadel, HRT):The annual salary of entry-level newcomers is more than $300K to $500K; the annual salary of senior employees is $1M to more than $3M; star traders can earn more than $3M to $30M.

* Midstream and upstream companies (such as Two Sigma, DE Shaw): New employees’ annual salary is $250K to $350K; senior employees are $575K to $1.2M.

*Note: Jane Street’s average employee compensation in the first half of 2025 is as high as $1.4 million per year.

Recommended reading list (in order of study)

* Probability and statistics - Blitzstein & Hwang "Introduction to Probability": conditional probability, Bayes, distribution

* Advanced statistics - Wasserman "All of Statistics": hypothesis testing, regression, MLE

* Linear algebra - Strang "Introduction to Linear" Algebra": matrix, eigenvalue, PCA

* Optimization theory - Boyd & Vandenberghe "Convex Optimization": convex optimization theory and practice

* Stochastic calculus - Shreve "Stochastic Calculus for Finance II": Brownian motion, Itot's lemma, BS model

* Quantitative finance - Hull "Options, Futures, and Other Derivatives": Panoramic view of derivatives pricing

* Practical strategies - Ernest Chan "Quantitative Trading": A guide to avoiding pitfalls from backtesting to real trading

Conclusion: Three truths I wish I had known earlier

At the end of the article, the original author shared three extremely profound insights. This is also the advice I would like to give to all Polymarket traders.

1. Estimation error is your real enemy

Many people like to use the full position Kelly formula, or unconstrained Markowitz optimization, or machine learning models stuffed with hundreds of features. They all ultimately fail for the same reason: overfitting to noisy historical data.

Mathematics is perfect when its parameters are perfect. But in reality, you never get perfect parameters. The gap between theory and practice is always estimation error.

The top quants are not those who use the most complex models, but those who remain in awe of errors. They will actively reduce positions (use half-Kelly instead of full-Kelly), actively simplify the model (use 3 core features instead of 30), and actively add constraints.

2. 工具已经民主化了,但「确信度」没有

今天,任何人都可以免费下载 PyTorch。 Anyone can access Polymarket’s API. Technology is a necessary condition, but no longer a sufficient condition.

真正的交易优势(Edge),存在于独特的数据、独特的模型,或者独特的执行能力中。 It’s not that I installed a few more Python libraries than others.

这也是为什么我们把 @insidersdotbot 的更新推迟了整整一个月,来优先完善我们的聪明钱库,以及更好的 PNL 计算算法(比如比官方更准确的 Split 收益计算模式)。 因为独特的数据和模型,真的能够帮你赚更多的钱,或者转亏为盈。

在 Polymarket 上,这意味着什么?

意味着你需要找到别人没有的信息来源(比如某个小众领域的专家网络),或者构建别人没有的模型(比如一个能实时处理多市场相关性的定价引擎),或者拥有别人没有的执行能力(比如一个能在 10 毫秒内完成跨市场对冲的交易系统)。

3. 数学才是真正的护城河

AI 可以帮你写代码,甚至可以建议交易策略。但是,能够推导出为什么伊托引理多了一项,能够证明在风险中性测度下折现价格是鞛(Martingale),能够判断在一个组合市场中凸松弛(Convex relaxation)何时是紧的。

这种深厚的数学直觉,才是区分「创造优势的宽客」和「借用优势的宽客」的根本分水岭。 And the advantages borrowed will expire sooner or later.

预测市场正在经历传统期权市场在 1973 年经历过的变革。 Those who can be the first to introduce rigorous mathematical models, volatility pricing and complex arbitrage algorithms to this market will take away the biggest dividends.

停止靠直觉下注吧。 Go learn probability, go write code, and build your mathematical moat.

完整工具箱

Python 技术栈

数据处理:pandas、polars(Polars 在处理大数据集时比 pandas 快 10 到 50 倍)

数值计算:numpy、scipy

机器学习(表格数据方向):xgboost、lightgbm、catboost

机器学习(深度学习方向):pytorch

优化求解:cvxpy

衍生品定价:QuantLib(工业级别的库,底层是 C++ 写的,性能很强)

统计分析:statsmodels

回测框架:NautilusTrader

回测框架(更简单易上手的选择):backtrader、vectorbt(适合入门)

量化研究平台:Microsoft Qlib(GitHub 上超过 17000 颗星,偏 AI 方向)

强化学习交易:FinRL(GitHub 上超过 10000 颗星)

C++ 和 Rust

C++ 常用库:QuantLib、Eigen、Boost

Rust 方面:RustQuant 可以用来做期权定价,NautilusTrader 采用的是 Rust + Python 混合架构(底层核心用 Rust 保证速度,上层用 Python API 方便做研究)。

数据源

免费的:yfinance、Finnhub(每分钟 60 次请求限制)、Alpha Vantage

中等价位的:Polygon.io(每月 199 美元,延迟低于 20 毫秒)、Tiingo

企业级的:Bloomberg Terminal(彭博终端,大约每年 32000 美元)、Refinitiv、FactSet

区块链数据:Alchemy(有免费套餐,支持历史存档数据访问)

除此之外,@insidersdotbot 即将开源 API。 Will include ready-made smart money database and trading functions.欢迎点击小铃铛 Stay Tuned。

求解器

Gurobi:速度最快的商用混合整数规划求解器,学生和学术用户可以申请免费许可证。 It is inseparable from combinatorial arbitrage problems.

Google OR-Tools:免费求解器里面最强的。

PuLP / Pyomo:Python 建模接口,用来方便地定义和调用各种求解器。

参考资料
[1] gemchanger. (2025). How I'd Become a Quant If I Had to Start Over Tomorrow. X.
https://x.com/gemchange_ltd/status/2028904166895112617
[2] Blitzstein, J. K., & Hwang, J. (2014). Introduction to Probability. CRC Press.
https://projects.iq.harvard.edu/stat110
[3] Markowitz, H. (1952). Portfolio Selection. The Journal of Finance.
[4] Strang, G. MIT 18.06 Linear Algebra. MIT OpenCourseWare.
https://ocw.mit.edu/courses/18-06-linear-algebra-spring-2010/
[5] Boyd, S. & Vandenberghe, L. (2004). Convex Optimization. Cambridge University Press.
https://web.stanford.edu/~boyd/cvxbook/
[6] Hanson, R. (2003). Logarithmic Market Scoring Rules for Modular Combinatorial Information Aggregation.
[7] Polymarket Documentation. CLOB Overview & API.
https://docs.polymarket.com/trading/overview
[8] Black, F., & Scholes, M. (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy.
[9] Shreve, S. (2004). Stochastic Calculus for Finance II: Continuous-Time Models. Springer.

原文链接

QQlink

No crypto backdoors, no compromises. A decentralized social and financial platform based on blockchain technology, returning privacy and freedom to users.

© 2024 QQlink R&D Team. All Rights Reserved.