segunda-feira, 14 de novembro de 2016

Usar comida no treino



O treino em positivo utiliza recompensas de forma a ensinar um cão que comportamento é que desejamos ver repetido em determinado contexto – por exemplo a sentar-se e esperar sentado sempre que alguém chega a casa – em vez de castigar os comportamentos naturais dos cães que não achamos desejáveis no contexto em que decorrem – como faríamos se, cada vez que o cão saltasse ao nos cumprimentar à porta, levantássemos um joelho. Resumindo, com este tipo de treino ensinamos os cães como queremos que eles se comportem em vez de castigar os comportamentos que consideramos errados.
Com isto, não quero dizer que tenhamos de utilizar sempre comida. Sendo que podemos recompensar um cão sem a utilizar. O que são então recompensas? Qual é o papel delas no treino e como é que fugimos ao mito de não "viciar" os cães?
O que são recompensas?
Posso estar a cair no ridículo por fazer uma pergunta destas, aparentemente óbvia, mas a verdade é que muitas pessoas não sabem o que é verdadeiramente uma recompensa no treino positivo. Ainda muitas pessoas acham que treino em positivo significa apenas que o treinador vai atirar biscoitos ao cão por tudo e por nada.
Vulgarmente chamadas de recompensas, estas são, na verdade, reforços que provocam um aumento da frequência do comportamento certo. É simples: se recompensarmos os nossos cães sempre que os virmos sossegados na cama deles, eles passarão a repetir este comportamento, cada vez mais, à medida que este vai sendo recompensado. É errado, no entanto, falar apenas em comida quando se fala em reforços. A comida pode ser um reforço, verdade, mas é apenas UM deles.
Então o que são reforços? De um modo geral podemos definir como sendo um reforço tudo o que o cão deseje ao exibir certo comportamento. Parece mais complicado do que é. Vejamos, um cão raspa na porta para poder sair.
Logo:
Comportamento apresentado – raspar na porta
Consequência desejada – poder sair
Neste caso, para o comportamento raspar na porta ser reforçado seria necessário que a porta abrisse, permitindo ao cão sair. Este reforço pode ser oferecido por uma pessoa – que abre a porta ao cão quando este raspa – ou auto-reforçado no caso de, com a pata, conseguir abrir a porta sozinho. É desta forma que os cães adquirem certos comportamentos como abrir a porta do frigorífico para conseguirem comer, saltar para as bancadas, etc. Podemos então definir que um reforço não é dependente de um agente externo e é o resultado da satisfação de uma qualquer motivação que origine o comportamento.
Os reforços são portanto tudo o que o cão deseja naquele momento sendo que um treinador positivo treina outros comportamentos que, ao serem apresentados, lhe permitem o acesso ao que deseja. Voltando acima, caso quiséssemos que o cão não raspasse na porta poderíamos treinar um outro comportamento – por exemplo, o sentar – e oferecer como recompensa a abertura da porta. Para recompensarmos um comportamento que estejamos a treinar todos estes pormenores utilizando reforços como a atenção, o ir cheirar as ervas, correr, aumentar a distância face a um estímulo, ir cumprimentar outro cão, etc.
Porque usamos então comida?
A comida é uma necessidade primária de todos os cães e um recurso muito valioso e fácil de utilizar. Todos os cães comem todos os dias. A diferença está na forma como o comem – em vez de simplesmente colocarmos a taça no chão, podemos utilizar todos aqueles grãos de ração e utilizar cada um deles para recompensar um qualquer comportamento que os nossos cães apresentem durante o dia, para o vermos repetidas mais vezes. Se o seu cão ladra muito, tem aqui 100 (ou mais, dependendo da quantidade que ele come) oportunidades de recompensar o seu cão por estar calado ao longo do dia. Para além de estarmos a treinar o nosso cão a apresentar comportamentos que achemos correctos, o “extra” de darmos a ração dos nossos cães à mão é que parte do valor da comida passa para nós alterando a forma como os nossos cães se relacionam connosco e aumentando também a sua confiança.
Usar a comida vicia?
Assim que um comportamento está treinado é imperativo que ensinemos ao cão a apresenta-lo fora das sessões de treino e sem o reforço por perto. Isto é, se estamos a ensinar o cão a sentar e ele já o faz perfeitamente durante as nossas sessões de treino diários devemos, em seguida, começar a pedir sentas ao longo do dia fora destas sessões utilizando ainda variações de reforços – por exemplo, pedir um senta antes de sair para passear, pedir um senta antes de subir para o sofá, etc. Quando o comportamento for estável fora das sessões começamos então a recompensar apenas de vez em quando, de forma aleatória. Se recompensarmos o comportamento aleatoriamente, o cão nunca saberá em qual das vezes será recompensado e continuará a praticar o comportamento mesmo não sendo este sempre reforçado. Fazendo este exercício podemos ir diminuindo a frequência com que entregamos o reforço – fazendo com que o cão responda sempre ao nosso sinal sem que tenhamos de ter comida perto de nós e podendo utilizar outros reforços que não comida mais facilmente
Valor da recompensa
O valor de cada recompensa depende de cada cão e daquilo que eles preferem. Para uns cães a melhor recompensa pode ser uma bola de ténis enquanto outros não a acham um prémio tão valioso assim. O valor da recompensa deve ser adequado ao exercício que está a ser treinado. Isto é, se tivermos a capturar comportamentos calmos dentro de casa podemos utilizar apenas ração mas, se estivermos a ensinar o nosso cão a responder à chamada na rua, não vamos conseguir ser bem-sucedidos utilizando apenas ração já que, estaremos a competir com imensos estímulos mais atractivos. Como exercício de reflexão podemos fazer uma tabela com o top5 do que achamos ser mais valioso para os nossos cães, pensando depois como incorporar estes reforços nos comportamentos que estamos a treinar.
A quê é que os vossos cães dão mais valor?

Sem comentários:

Enviar um comentário