1 de fevereiro de 2011

Série: Don’t Shoot the dog (parte 18)

 

3. Durante o processo de moldagem, coloque os níveis de resposta sob variáveis reforços antes de aperfeiçoar o critério

Muitos treinadores iniciantes discordam do uso de treinamento positivo pois acham  que  terão que sempre ter petiscos na mão para captar o bom comportamento. Mas o oposto também é verdade. Formação com reforços, liberam as pessoas de terem que ter uma constante vigilância sobre o animal por causa dos momentos de reforço variáveis.

Um momento variável de reforço significa apenas que as vezes você irá recompensar, e as vezes não. Muitas vezes quando estamos ensinando um comportamento, nós usamos uma constante recompensa para o aluno, e recompensamos todas as vezes que o animal se comporta da maneira que queríamos. Mas, quando estamos apenas em manutenção do comportamento, recompensamos ocasionalmente, usando momentos esporádicos.

Quando treinamos com aversivos – e é como muita gente começa a ensinar seus cães – ensinamos que todo erro terá que ser corrigido toda vez. Quando o comportamento não é corrigido, o animal simplesmente pára com o comportamento. Muitos cães são obedientes quando estão na guia, porém não são confiáveis quando estão sem ou fora de alcance. Quando muitos adolescentes estão com seus amigos, fazem coisas que jamais imaginariam fazer na frente dos seus pais. Isso acontece porque o sujeito sabe que está livre de punições mas também pode ser um efeito colateral de uma educação a base de punições. Desde que a mensagem que os aversivos passam são “Não faça isso” quando o sujeito está fora do ambiente de coação, a mensagem torna-se “Agora você pode fazer”.  Com reforço positivo, por outro lado, não é necessário recompensar o bom comportamento para sempre, e apenas ocasionalmente. Por que?

O coração do processo de modelagem é reforçar alguns comportamentos e outros não, então essa resposta improvisa, pouco a pouco, até que ele consiga alcançar uma nova meta. Todos os comportamentos são variáveis, quando você espera por uma recompensa, o próximo comportamento é um pouco diferente. Assim, o fato de ignorar, traz respostas mais fortes e melhores. Isso muitas vezes é chamado de “diferencial” ou “seletivo” momento de reforçar, você está escolhendo reforçar apenas alguns tipos de resposta: aqueles que atendem por exemplo de ir mais rápido ou mais devagar, ir para direita ou para a esquerda.

85470379

Mas para um aluno inexperiente que até agora está sempre recebendo recompensas, pode ser  um choque deixar de receber. Seu cãozinho senta, você clica e dá o petisco. Então ele senta cada vez mais rápido como se dissesse “Olhe, estou sentando, clique e me dê o petisco” E de repente, algumas vezes que ele senta, ele simplesmente não tem a recompensa. Se o seu cão não está pronto para suportar a ausência de recompensas ocasionalmente, ele pode entrar em desespero ou diminuir o desempenho. Você então deve acostumá-lo à eventuais ausências de recompensas antes de aprimorar o comportamento. Seu sujeito tem que estar apto a tolerar uma falha por si, sem parar o comportamento no entanto. Ou tecnicamente falando, você tem que estabelecer um esquema de intermitentes reforços para só então começar a melhorar o desempenho através de um esquema diferencial.

Em um seminário em 1990 eu rotulei esse tipo de momentos variáveis como “twofers” que é uma gíria que significa dois comportamentos pelo preço de um. Faça o cão fazer duas vezes por um click e um petisco. Ensinar a tolerar algumas ausências de recompensa, faz o comportamento e outros que virão depois, serem mais resistentes à extinção.

Há um outro benefício para esse uso breve de um esquema intermitente durante a fase de aprendizagem. Quando o sujeito está apto a tolerar a ausência de recompensas, e você deixar algum comportamento que você queria passar despercebido, seu aluno irá fazer mais vezes “Ei, eu fiz, você não viu? Vou fazer de novo” Isso intensifica o comportamento – chamado de estouro da extinção – permitindo você se mover rapidamente ao seu objetivo final. Um formador qualificado pode sempre omitir recompensas a fim de provocar uma variação ou uma resposta mais vigorosa. O Comportamentalista Gary Wilkes chama isso de “surfar nas rajadas da extinção”.

 

90790414

Uma vez que o sujeito tem conhecimento de que uma ocasional ausência de reforço não significa que o comportamento foi errado, mas simplesmente que pode ser preciso tentar de novo, os fluxos de elaboração de reforço contínuo para reforço diferencial (como selecionar para uma melhor forma,maior duração, maior velocidade, as latências mais curtas, e assim por diante) e depois voltar para o reforço contínuo (sempre que o comportamento é "perfeito" ou, em termos de laboratório, "satisfaz os critérios"). O uso de intermitentes reforços deliberados não será mais necessário porque o aluno já será hábil a suportar variações nos momentos do reforço.

Em última instância, quando o comportamento é satisfatório em todas as repetições, isso torna-se parte de um repertório. O requerimento de um comportamento torna-se parte do pedido de um outro mais complexo e elaborado, com melhor forma,maior rapidez, maior distância e então uma mistura com o todo, e isso tudo torna-se o comportamento que deverá ser recompensado. Isso não o faz voltar aos reforços intermitentes, mas o faz ganhar um ocasional click ou “obrigada” que serve para manter as coisas funcionando como devido. A alta taxa de recompensas positivas, a inundação de clicks e petiscos, podem agora serem usados em um novo comportamento.

 

 

Essa é uma tradução livre, feita por mim Aline Viena de Souza, do livro Don’t Shoot the dog de Karen Pryor e não tem a permissão de ser copiado. Essas traduções também não fazem desnecessária a leitura da obra original uma vez que algumas partes são conscientemente omitidas para preservar a originalidade da obra.

2 comentários:

  1. Oi Aline!
    Adooooro seu blog e já o acompanho há um tempinho, apesar de ainda não ter feito nenhum comentário. Sorry o.O!
    Estou amando a série "Don't Shoot the Dog", acho louvável sua iniciativa de compartilhar todo esse conhecimento, ainda mais que dá um trabalhão ficar traduzindo tudo!
    Muito Obrigada!
    Bjs

    ResponderExcluir
  2. Aline, não estou achando a proximo capitulo da série, você parou? Don't do it, please!!! Obrigada.

    ResponderExcluir

Comente a vontade.
Mantenha as normas básicas de convivência e seja bem vindo.