Apostas esportivas

Apostas esportivas

  1. Apostas esportivas em cinco minutos
    1. Alguns tipos de apostas
      1. Apostas 2-way
      2. Apostas duplas
  2. Uma introdução à probabilidade
    1. Interpretando probabilidades
    2. Eventos aleatórios
    3. Estimando probabilidades; o que é um modelo?
  3. A relação entre odds das bancas de apostas e probabilidade
    1. Por que a relação é aproximida?
    2. Como a banca de apostas escolhe o vig
    3. Alguns algoritmos para remover o vig dos odds

Esse site discute apostas esportivas, particularmente apostas em futebol. O foco é quantitativo: explicamos como funcionam as apostas, como as bancas de apostas fazem dinheiro, e discutimos algum conhecimento básico útil.

Todo o conteúdo está em uma página, que você pode ler desconectado da Internet. Use o índice acima para pular para a sessão desejada dentro da página.

Apostas esportivas em cinco minutos

Jogos modernos de apostas em futebol são feitos da seguinte forma: você entra em um site de uma banca de apostas e pode apostar em resultados de partidas. Para cada resultado há um número chamado de odds. Um exemplo de uma partida:

Palmeiras Empate Flamengo
3.473.092.11

O retorno da aposta funciona assim: se você apostar no Palmeiras a \(3.47\) de odds e você perder, você perde todo o dinheiro da apoosta. Se você apostar no Pameiras e ganhar, você ganha \(3.47\) vezes o que apostou. Por exemplo, se você apostar 100 reais no Palmeras e ganhar, vai receber:

\[ 100 \times 3.47 = 347\]

Note que o seu lucro no caso dessa vitória é \(247\), pois você gastou \(100\) na aposta.

Note que o formato da aposta é sempre dado dessa forma: primeiro o time da casa ou mandante, depois o empate, e depois o time visitante. No campeonato brasileiro, isso geralmente quer dizer que o time da casa está jogando em sua cidade, com apoio de sua torcida, etc, a não ser que o time tenha sofriado alguma punição. Em campeonatos como a copa do mundo, os dois times podem estar jogando em um país estrangeiro.

Os odds não são estáticos no tempo. Eles podem variar de acordo com o momento em que as apostas são feitas. Uma vez que um apostador faça uma aposta, vale o odd que ele aceitou naquele momento. Se a banca de apostas mudar os odds, essa mudança não vale para apostas que já foram feitas.

Isso quer dizer que uma aposta pode valer a pena uma semana antes do jogo mas não valer mais a pena próximo do jogo, ou vice-versa.

Também é possível apostar durante o jogo, e nesse caso os odds podem variar rapidamente à medida em que gols vão acontecendo e o tempo vai passando. De forma geral esse texto pensa em apostas que acontecem antes da partida.

Alguns tipos de apostas

Dependendo da casa de apostas, há tipos diferentes de apostas para o mesmo jogo. Aqui estão alguns exemplos:

Apostas 2-way

A maioria dos apostadores casuais prefere apostar em um time - apostar em empate é pouco emocionante. As casas de apostas podem oferecer para esses jogadores apostas "2-way". Exemplo:

Palmeiras Flamengo
1.513.47

Nesse cenário, se o jogador apostar no Palmeiras e estiver correto, o jogador receberá:

\[ 100 \times 1.51 = 151 \]

Ou seja, o lucro foi de \(51\) reais já que \(100\) foi o preço da aposta.

Caso aposte \(100\) no Palmeiras e perca, o jogador receberá \(0\) - perderá o dinheiro que apostou.

Mas, se houver empate, o jogador receberá de volta \(100\), o dinheiro que havia apostado. O jogador não ganha nem perde nada.

Como a casa de apostas não ganha nada em caso de empate, ela, para compensar, oferece odds piores para as vitórias dos times. Compare esses odds com o tipo de aposta anterior e note como o prêmio por estar certo é inferior.

Apostas duplas

As apostas duplas são feitas em dois resultados possíveis. Aqui se usa a seguinte convenção: o time mandante é o time 1, o time visitante é o time 2 e o empate é o resultado X. Vamos ver o que uma banca de apostas oferece para o mesmo jogo Palmeiras e Flamengo de que temos falado até agora:

1X 12 2X
1.301.341.70

Usando essa tabela, se o jogador apostar 100 reais no Palmeiras e o resultado for vitória do Palmeiras ou empate, o jogador receberá:

\[ 100 \times 1.30 = 130\]

Caso o Flamengo ganhe, o jogador receberá zero.

A aposta 2X é a aposta do outro lado: no Flamengo ou no empate.

E a aposta 12 é a mais curiosa: o apostador ganha se o Flamengo ganhar ou o Palmeiras ganhar, e perde se houver empate. É uma aposta contra o empate.

Uma introdução à probabilidade

Probabilidade é um número que indica o quão provável é que um evento aconteça. Esse número pode ser expresso como percentuais, como um número entre \(0\) e \(1\), ou como uma fração.

Por exemplo, você tem uma sacola que tem 10 maçãs e 10 laranjas. Se colocar a mão na sacola sem olhar, a probabilidade de tirar uma maçã é de 50%.

\[ p = 50\% \]

Também podemos expressar isso como uma fração. Como uma em cada duas frutas é uma maçã, a probabilidade de pegar uma maçã é:

\[ p = \frac{1}{2}\]

Ou, ainda, exprimindo a mesma quantidade como um número de zero a um, a probabilidade de tirar uma maçã da sacola é:

\[ p = 0.5 \]

Como outro exemplo, suponha que em um campo de futebol haja 22 jogadores, dois bandeirinhas e um juíz: o total é de 25 pessoas. A probabilidade de que ao selecionar por acaso uma pessoa, o juíz seja escolhido, é de \(1\) em \(25\), que pode ser expressa como:

\[ p = \frac{1}{25} = 4\% = 0.04 \]

Dessas três formulas equivalentes de exprimir probabilidade, a mais comum entre pessoas que trabalham com estatística é exprimindo números entre \(0\) e \(1\).

É importante de lembrar que \(p = 1\) significa que um exemplo vai acontecer com certeza (é um chance de \(100\%\)). E um evento com probabilidade \(p = 0\) não pode acontecer: é uma chance de \(0\%\).

Interpretando probabilidades

Às vezes alguém publica na imprensa alguma informação como: "Há \(80\%\) de chance do Corinthians ganhar".

A partida acontece e o Corinthians perde. E vem a reação: "a previsão errou!".

Ela errou? Não necessariamente.

Pense no caso entre um jogo entre o Barcelona e o XV de Piracicaba. A maioria das pessoas sabe que a probabilidade de o Barcelona ganhar esse time é quase absoluta: algo muito próximo de \(p = 1\), talvez \(p = 0.99999\) porque a chance de acontecer uma zebra está sempre lá. Probabilidade é difícil de calcular com precisão, mas é algo existe.

Quando falamos que o Corinthians vai ganhar a conta não é que ele vai ganhar com certeza, e sim que: se fosse possível jogar infinitas partidas, nas mesma situação, o Corinthians ganharia a partida \(80\%\) das vezes. Isso quer dizer que \(20\%\) das vezes ele não vai ganhar.

Como a partida só acontece uma vez, não é fácil dizer se a previsão estava correta ou não, mas o fato de o evento de menor probabilidade ter acontecido não significa que o cálculo da probabilidade estava errado.

Probabilidades são apenas estimativas: provavelmente estão erradas, às vezes por muito, às vezes por pouco.

Eventos aleatórios

"Futebol é uma caixinha de surpresas" de verdade. Um time que está liderando o campeonato pode perder para o lanterna. Um goleiro pode ser expulso. Um atacante pode quebrar a pena ou ter um dia ruim.

Uma partida de futebol é composta de alguns eventos determinísticos, como a escolha inicial de jogadores ou o local onde a partida vai acontecer, e alguns eventos aleatórios.

A quantidade de gols de cada lado é um evento aleatório. Não sabemos quantos vão acontecer, não há formula para saber o valor exato, mas podemos tentar estimar esse valor e tentar melhorar essa previsão.

Estimando probabilidades; o que é um modelo?

Podemos estimar probabilidades para eventos aleatórios, mas não podemos medir a probabilidade deles.

Por exemplo, na série A do Campeonato Brasileiro de 2020, de 372 partidas, o time da casa marcou um gol em 289 partidas. Uma boa maneira de estimar a probabilidade de que o time da casa marque pelo menos um gol é:

\[ p = \frac{289}{372} = 0.7769 = 77.69\%\]

Isso é uma boa estimativa da probabilidade de um time marcar um gol jogando em casa. Se não souber mais nada sobre o assunto, é um bom número inicial.

Isso não quer dizer que o próximo jogo vai ter exatamente essa probabilidade. Talvez um time tenha mais tendência a fazer gols em casa. Talvez haja uma diferença na escolha de jogadores que influencie positivamente o negativamente o resultado.

Mas algo em torndo de \(p = 0.7769\) é uma boa probabilidade inicial.

Vamos melhorar essa estimativa: digamos que sabemos que o Flamengo é o próximo time que vai jogar em casa, nas condições do Campeonato Brasileiro de 2020.

Olhando apenas para os jogos do Flamengo em 2020, temos os seguintes números. O Flamengo jogou 19 jogos em casa nesse ano, e marcou um gol em 17 desses jogos. Uma boa estimativa da probabilidade do Flamengo marcar um gol em casa em um hipotético vigésimo jogo nesse ano é:

\[ p = \frac{17}{19} = 0.8947 = 89.47\% \]

A qualidade da previsão depende da quantidade de dados que temos. Se não tivéssemos os resultados específicos do Flamengo, poderíamos usar a probabilidade inicial geral de \(p = 0.7769\). Com os dados específicos do Flamengo, podemos estimar uma probabilidade diferente, mas mais exata, de \(p = 0.8947\).

Se formos apostar que o Flamengo marca pelo menos um gol, ter o número mais exato pode fazer toda diferença entre estratégia ganhadora ou perdedora.

Nós poderíamos melhorar essa previsão: nesse exemplo contamos que todos os jogos são iguais. Mas alguns fatores que podem influenciar a probabilidade do Flamengo marcar gol em casa ou não são:

  1. A força da defesa do outro time

  2. Se o jogo é um jogo importante ou apenas para "marcar tabela"

  3. Se o Flamengo e seu adversário estão com seus times principais ou se há muitos reservas.

  4. Se o Flamengo está jogando contra a luz do sol, se o tempo está muito quente, etc.

  5. Se há muita torcida em campo a favor do Flamego

e muitos outros critérios. Se tivermos muitos dados, e conseguirmos analisar corretamente a influência deles, podemos ter previsões melhores da probabilidade de um evento acontecer.

Quando juntamos os dados e a análise sobre eles para tentar estimar a probabilidade de um evento, chamamos isso de modelo. Quanto mais próximo da realidade for, melhor o modelo.

A relação entre odds das bancas de apostas e probabilidade

odds e probabilidade (\(p\)) estão intimamente ligados pela seguinte fórmula.

\[ \text{odds} \approx \frac{1}{p} \]

ou, o equivalente:

\[ p \approx \frac{1}{\text{odds}} \]

O sinal \(\approx\) significa "aproximadamente". Mais sobre isso abaixo.

Por exemplo, se olharmos para o jogo Palmeiras x Flamengo usado para cima, temos que os odds da vitória do Palmeiras são 3.47. Isso quer dizer que a banca estima a probabilidade de vitória do Palmeiras como aproximidadamente:

\[ p \approx \frac{1}{3.47} \approx 0.2882 \]

Por que a relação é aproximida?

Vamos ver o mesmo caso de Palmeiras x Flamengo: o jogo só pode ser vitória do Palmeiras, vitória do Flamengo ou empate. Se somarmos todas as probabilidades, o resultado tem que ser \(1\), pois \(100\%\) das resultados possíveis são cobertos por esses resultados. Vamos ver se isso dá certo:

\[ p_{\text{palmeiras}} \approx \frac{1}{3.47} \approx 0.2882 \\[+1em] p_{\text{flamengo}} \approx \frac{1}{2.11} \approx 0.4739 \\[+1em] p_{\text{empate}} \approx \frac{1}{3.09} \approx 0.3236 \\[+2em] p_{\text{total}} = 0.2882 + 0.4739 + 0.3236 = 1.0857\]

A probabilidade total seria \(1.0857\) ou mais de \(100\%\). Isso é a comissão da casa de apostas, e é assim que eles ganham dinheiro. Eles estimam cada um dos eventos como um pouco mais provável do que realmente acham que seria. Essa comissão se chama vig.

Bancas de apostas diferentes oferecem odds parecidos mas muito próximos entre si. Quanto maior o número do odd, melhor para o apostador. Isso quer dizer que receberá mais dinheiro se estiver certo.

Quando escolher fazer uma aposta, o apostador deve escolher o lugar que ofereça o melhor odd – desde que a casa de apostas seja confiável. Isso quer dizer que está pagando também um menor vig, ou comissão.

Como a banca de apostas escolhe o vig

Vig é uma comissão cobrada pela casa de apostas, e está embutido no odd. Como remover essa comissão para descobrir a probabilidade real estimada pela casa de apostas?

Infelizmente não há uma solução direta. O vig pode ser diferente para cada um dos resultados! Por exemplo, uma casa de apostas pode decidir cobrar \(4\%\) de vig para uma vitória do time da casa, e \(6\%\) de vig para a vitória do time visitante – na mesma partida.

Não há transparência quanto ao vig.

As casas de apostas podem querer variar o vig por questões concorrenciais – para atrair mais apostadores. Mas podem também podem variar para gerenciamento de risco. Por exemplo, se a casa de apostas acha que muita gente está apostando numa vitória improvável, ela poda aumentar o vig para se proteger do caso de uma zebra acontecer. O vig acaba servindo como uma espécie de apólice de seguros para a casa de aposta.

Alguns algoritmos para remover o vig dos odds

O cálculo exato do vig é conhecido apenas pela banca de apostas, e é um segredo comercial. Ele também pode variar com o tempo e ser diferente para resultados diferentes da mesma partida.

Vamos aplicar dois métodos diferentes para remover o vig da partida Palmeiras x Flamengo da qual viemos falando. Note que vamos usar as probabilidades e não os odds para fazer as contas.

\[ \begin{align*} p_{\text{real}} &\approx \frac{p_{\text{palmeiras}}}{p_{\text{palmeiras}} + p_{\text{flamengo}} + p_{\text{empate}}} \\[+1em] &\approx \frac{0.2882}{0.2882+0.4739+0.3236} \approx 0.2655 \end{align*} \]

(ou seja, divida a probabilidade inferida pela soma das três probabilidades inferidas para ter uma estimativa da probabilidade real estimada pela casa de apostas.)

Então, sem o vig, a estimativa da casa de apostas para uma vitória do Palmeiras é \(0.2655\).

Veja que isso é uma estimativa de qual a é a estimativa da casa de apostas. Nós não sabemos quanto o vig é na verdade. Esse método de remover o vig é um entre vários, e se chama multiplicativo.

Um método que normalmente funciona melhor é o método proporcional, criado por Joseph Buchdahl. Esse método tenta compensar o fato de que um grande número de apostadores prefere apostar no time que tem menor probabilidade de vencer, o que faz a banca de apostas aumentar o vig para se proteger em caso de um resultado inesperada. Ela faz isso distribuindo uma parte maior do vig para os eventos menos prováveis.

Precisamos primeiro calcular a comissão, chamada de margin em inglês, a que vamos chamar de \(m\):

\[ \begin{align*} m &= p_{\text{palmeiras}} + p_{\text{flamengo}} + p_{\text{empate}} - 1 \\[+1em] &= 0.2882 + 0.4739 + 0.3236 - 1\\[+1em] &= 0.0857 \end{align*} \]

(uma conta parecida foi feita quando começamos a analisar a relação entre odds e a probabilidade estimada pela banca de apostas)

E, para calcular a estimativa da probabilidade calculada pela casa de apostas, a fórmula é:

\[ p_{\text{real}} = p - \frac{m}{n} \]

onde \(n\) é a quantidade de resultados possíveis. Em uma aposta clássica \(n = 3\) (porque há três resultados possíveis: time da casa, empate ou visitante). Em uma aposta 2-way, \(n = 2\) (porque só é possível que o time da casa ou o visitante vençam, e o dinheiro é devolvido em caso de empate.

Pensando no nosso caso concreto do Palmeiras x Flamengo:

\[ \begin{align*} p_{\text{real}} &= 0.2882 - \frac{0.0857}{3} \\[+1em] &= 0.2596 \end{align*} \]

É possível repetir o procedimento para calcular a probabilidade estimada pela banca para o caso de empate e de vitória do Flamengo. Esse método se chama proporcional.

Aqui está a tabela com todos os cálculos para o jogo Palmeiras x Flamengo, com os odds iniciais, as probabilidades com e sem vig, pelos dois métodos, e o vig estimado pelos dois métodos.

PalmeirasEmpateFlamengo
Odds3.473.092.11
Probabilidade com vig0.28820.32360.4739
Probabilidade sem vig (multiplicativo)0.26550.29810.4365
Vig (multiplicativo)0.090.090.09
Probabilidade sem vig (proporcional)0.25960.2950.4453
Vig (proporcional)0.110.10.06

É importante lembrar: vig não é uma probabilidade! Vig é um percentual sobre a aposta que é cobrado como comissão.