Mọi người ai học qua môn xác suất thống kê đều đã từng vô cùng “vật vã“ với công thức của Phân Phối Chuẩn (hay phân phối Gaussian):
Với:
— là hàm mật độ của phân bố
— là giá trị trung bình
— là độ lệch chuẩn
Bài viết này mình chỉ đơn thuần cố gắng giải thích công thức nhằm giúp bạn đọc hiểu rõ hơn ý nghĩa của nó, và từ đó, hy vọng rằng bạn đọc sẽ cảm thấy nó dễ nhớ hơn.
Một số tiêu chuẩn mấu chốt
Hàm số có dạng hình chuông
Đối xứng tại giá trị trung bình
Có tích phân từ đến là
Hai điểm uốn tại và :
Bản chất của hàm
Đầu tiên, hàm số có dạng hình chuông. Thực ra về bản chất, mọi hàm số mũ có dạng đều có dạng hình chuông đối xứng tại giá trị , không nhất thiết phải là cơ số . Thật vậy, vì với mọi ta luôn có thể biến đổi với .
Lúc đó ta có: . Sở dĩ, số được chọn là vì để dễ liên tưởng đến hàm số mũ (exponential).
Hàm mật độ thỏa
Ta có: . Tham khảo chứng minh ở bài viết của mình ở đây.
Như vậy, để thỏa mãn có tích phân toàn miền là , ta phải đem nhân với , hàm số trở thành
Đối xứng tại giá trị trung bình
Để thỏa mãn tính chất này, thực chất ta dời “hình chuông“ đến điểm . Như vậy hàm số biến đổi thành
Hai điểm uốn , đối xứng tại
Để đơn giản tính toán, ta tạm thời gác qua các giá trị . Xét hàm số , ta có:
Như vậy, để
Để điểm uốn tại điểm , ta đưa vào giá trị số mũ và khử đi bằng cách nhân với để bảo toàn tích phân, hàm số lúc này trở thành
Trị số là độ lệch chuẩn của phân phối. Trị số này cũng thể hiện cho bề rộng của hàm số, càng lớn, hàm số càng rộng và ngược lại. Ta đưa luôn và hàm số, và khử để bảo toán tích phân để có công thức cuối cùng:
Demo
Thay đổi giá trị , đồ thị sẽ trượt đi theo trục
Thay đổi giá trị , hàm số sẽ thao đổi bề rộng / hẹp