Conceitos de Probabilidade
Introdução
Definição Clássica (\(\Omega\) enumerável)
Segundo Magalhães (2006), a definição clássica de probabilidade se refere à subconjuntos unitários equiprováveis. No caso enumerável finito temos:
\[ P(A) = \frac{Número\ de\ Elementos\ em\ A}{Número\ total\ de\ Elementos\ em\ \Omega} \]
Se \(\Omega\) tiver uma quantidade infinita de elementos, precisamos tratar a a definição acima com o uso de limites.
Definição Clássica Geométrica (\(\Omega\) não enumerável)
Quando \(\Omega\) é não enumerável, o conceito se aplicará ao comprimento de intervalos, medidas de áreas ou similares, dando origem ao que chamamos de probabilidade geométrica. Por exemplo, se \(\Omega\) é um intervalo onde \(\Omega \in \mathbb{R}\), então:
\[ P(A) = \frac{Comprimento\ de\ A}{Comprimento\ de\ \Omega} \]
Definição Frequentista
A definição frequentista considera o limite de frequências relativas como o valor da probabilidade. Para tal, seja \(n_{A}\) o número de ocorrências de \(A\) em \(n\) repetições independentes do experimento em questão. Assim,
\[ P(A) = \lim_{n\rightarrow{+\infty}} \frac{n_A}{n} \]
Probabilidade Axiomática
As definições anteriores não são suficientes para uma formulação matemática mais rigorosa da probabilidade. Assim, na primeira metade do século XX, Kolmogorov (1933) apresentou um conjunto de axiomas matemáticos para definir probabilidade e, assim, pavimentando toda a evolução da probabilidade moderna.
É importante, e ao mesmo tempo fascinante, destacar que apenas com esses três axiomas todos os teoremas da Teoria da Probabilidade são viabilizados. Assim, podemos destacar que toda a evolução da probabilidade foi pavimentada pelo trabalho de Kolmogorov (1933).
Definição axiomática
Assumindo que podemos atribuir um número real \(P(A)\) para um evento \(A\):
Axioma 1. \(P(A) \ge 0\)
Axioma 2. \(P(\Omega) = 1\)
Axioma 3. Se \(A_1, A_2, ..., A_n\) são disjuntos (2 a 2) (isto é, mutuamente excludentes), então
\[ P\left( \bigcup_{k=1}^{n} A_k \right) = \sum_{k=1}^{n} P (A_k) \]
(Os eventos são disjuntos 2 a 2, se \(A_i \cap A_j = \emptyset, \forall i \ne j\))
Uma discussão mais aprofundada desses axiomas, incluindo uma versão mais conveniente para o Axioma 3 (para o caso \(n = \infty\)) e uma “Axioma 4” de continuidade no vazio, que pode ser derivado dos outros axiomas, é discutida no Capítulo 1 de James (2023).
Propriedades de probabilidade derivadas dos Axiomas de Kolmogorov
Como comentado, os Axiomas de Kolmogorov sustentam toda a teoria da probabilidade e alguns resultados diretos são:
- \(P(\emptyset) = 0\).
Prova.
\[ \begin{align*} P(A \cup \emptyset) &= P(A) + P(\emptyset) \\ P(A) &= P(A) + P(\emptyset) \\ P(\emptyset) &= 0 \end{align*} \]
- Para qualquer evento \(A\), \(P(A^c) = 1-P(A)\).
Prova.
\[ \begin{align*} P(\Omega) &= P(A \cup A^c) = P(A) + P(A^c) \\ 1 &= P(A) + P(A^c) \overset{\text{Isolando}}{\implies} P(A^c) = 1-P(A) \end{align*} \]
- Se \(A \subset B\), então \(P(A) \le P(B)\).
Prova.
\[ \begin{align*} P(B) &= P(A \cup (B \cap A^c)) = P(A) + P(B \cap A^c) \\ P(B) &\ge P(A) \end{align*} \]
Se \(A \subset B\), então \(P(A \cap B) = P(A)\).
Para qualquer evento \(A\), \(0 \le P(A) \le 1\).
Prova. Como \(A \subset \Omega\), então \(0 \le P(A) \le P(\Omega) = 1\)
- Para quaisquer eventos \(A\) e \(B\), \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\) (Esta relação é mais fácil de visualizar via Diagrama de Venn)
Prova.
Primeiro, vamos escrever \(P(A)\) e \(P(B)\) como a soma de suas partes:
\[ P(A) = P(A \cap B^c) + P(A \cap B) \\ P(B) = P(B \cap A^c) + P(B \cap A) \]
Agora, vamos escrever a união como a soma de suas partes:
\[ P(A \cup B) = P(A \cap B^c) + P(A \cap B) + P(B \cap A^c) \]
Agora, somando e substraindo \(P(A \cap B)\):
\[ \begin{align*} P(A \cup B) &= \overbrace{P(A \cap B^c) + P(A \cap B)}^{P(A)} + \overbrace{P(B \cap A^c) + P(A \cap B)}^{P(B)} - P(A \cap B) \\ P(A \cup B) &= P(A) + P(B) - P(A \cap B) \end{align*} \]
- (Desigualdade de Boole) Sejam \(A_1, A_2, ..., A_n\) então
\[ P\left( \bigcup_{i=1}^{n} A_i \right) \le \sum_{i=1}^{n}P(A_i) \]
Espaços de Probabilidade
Um Espaço de Probabilidade é um constructo que provê um modelo formal de um processo aleatório. Ele é composto por uma tríplice de valores \((\Omega, \mathcal{F}, P)\) onde
- \(\Omega\) é todo o espaço amostral
- \(\mathcal{F}\) (ou \(\sigma\)-álgebra) é o espaço de eventos (domínio)
- \(\mathcal{P}\) é uma função de probabilidade aplicada em \(\mathcal{F}\) que produz valores no intervalo \([0,1]\)
Para um entendimento mais consistente da importância da definição de um espaço de probabilidade, bem como da importância da definição de uma \(\sigma\)-álgebra, que é o domínio do espaço, recomenda-se a leitura do Capítulo 1 de James (2023), Capítulo 1 de Magalhães (2006), Capítulo 1 de Rolla (2022) e Capítulo 2B e 12 de Axler (2020).1 No entanto, como esta discussão é mais aprofundada, para uma visão mais geral recomendo fortemente o leitor a assitir o vídeo Bertrand’s Paradox (with 3blue1brown) - Numberphile (explicação do Exemplo 1.8 de Magalhães (2006)) para esclarecer qual o efeito da definição de diferentes espaços de probabiidade para um mesmo problema e assim produzir probabilidades significativamente diferentes dependendo da maneira como são definidos \(\Omega\) e \(\sigma\)-álgebra e, assim, produzindo diferentes processos geradores de eventos.
Referências
Notas de rodapé
O conceito de \(\sigma\)-álgebra (bem como de sua versão finita – Álgebra), em um primeiro momento, pode ser considerado difícil de assimilar do ponto de vista prático. No entanto, ela é fundamental para garantir uma base matemática sólida para toda a teoria da probabilidade. As propriedades desejáveis de uma \(\sigma\)-álgebra garantem que o espaço de probabilidade é um espaço mensurável. Por exemplo, uma das condições é de que se \(A_1\) e \(A_2\) são dois eventos sendo \(A_1 \in \mathcal{F}\) e \(A_2 \in \mathcal{F}\), então \((A_1 \cup A_2) \in \mathcal{F}\). Se essa condição não fosse satisfeita, os axiomas de Kolmogorov não poderiam ser naturalmente aplicados à este espaço e potencialmente inconsistências poderiam ser geradas. Por exemplo, seguindo o Exemplo 1.3 de Magalhães (2006), considerando \(\Omega = \{1, 2, 3\}\), suponha \(\mathcal{F} = \{ \emptyset, \Omega, \{1\}, \{2\}, \{1,3\}, \{2,3\} \}\) não é uma \(\sigma\)-álgebra pois \(\{1, 2\} \notin \mathcal{F}\) e, portanto, \(P(\{1, 2\})\) é indefinido. Portanto, não poderíamos, por exemplo, aplicar o terceiro axioma de Kolmogorov para calcular \(P(\{1, 2\})\). Neste exemplo, a definição de \(\mathcal{F}\) viola o Axioma do Par que é uma dos axiomas fundamentais da Teoria dos Conjuntos de Zermelo–Fraenkel. Adicionamente, discussão possui relação com outros conceitos matemáticos como Aditividade Contável de uma \(\sigma\)-álgebra, o Axioma da Escolha e o Paradoxo de Banach-Tarski. Recomenda-se também assistir o vídeo The Most Controversial Idea In Math.↩︎