Aprendizagem pelas consequências - O reforçamento

 O termo comportamento operante foi cunhado por B. F. Skinner.

Burrhus Frederick Skinner (1904-1990)

É considerado comportamento operante todo o tipo de comportamento que produz consequências no ambiente, e tais consequências alteram a probabilidade desse mesmo comportamento ocorrer no futuro.

Por exemplo: pressionar o botão do bebedouro faz com água seja disponibilizada. Ou então, chamar alguém que está distante faz com que essa pessoa olhe para você.

Para Skinner, as consequências das nossas ações somadas é que vão formando a nossa personalidade, que na linguagem da análise experimental do comportamento é chamada de repertório comportamental.

A maior parte dos nossos comportamentos produz consequências no ambiente. Essas consequências são mudanças no cenário que cercam o organismo.

Exemplos de alterações ambientais: Vamos supor que o ambiente está escuro. Quando você opera no ambiente pressionando o interruptor, o ambiente ficará claro. Outra forma de gerar a mesma consequência é pedir que alguém acenda a luz. No primeiro exemplo o comportamento produziu uma mudança direta na iluminação, enquanto no segundo, produziu uma mudança indireta na iluminação.

Abaixo alguns exemplos de operantes e possíveis consequências:

Comportamento (R) → Consequência (S)


Pedir um lanche (R) → Receber o lanche (S)


Contar piadas (R) → Receber risadas de outras pessoas (S)


Fazer uma pergunta (R) → O professor responder (S)


Estudar (R) → Tirar boa nota (S)


As consequências que nossos comportamentos produziram no passado influenciam sua ocorrência futura, por isso todo nosso comportamento operante é influenciado (controlado) por suas consequências.

São as consequências que determinam se um comportamento será mantido ou extinto.

Por exemplo imagine que um dia você pede para um colega pagar o lanche pra você. Ele nega. Alguns dias você pode operar da mesma forma e pedir novamente que ele pague um lanche. Caso ele continue negando, é muito provável que o operante "pedir lanche ao colega" seja extinto.

Vale lembrar que as consequências produzidas por nossos comportamentos acontecem tão naturalmente no cotidiano que nem nos damos conta delas.

A depender do contexto, o mesmo comportamento operante pode ter diferentes consequências, como por exemplo:

Fazer bagunça na sala (R) → Obter atenção dos colegas (S)

Fazer bagunça na sala (R) → Perder pontos de comportamento (S)

---

Falar mal de alguém (R) → Obter atenção de um colega (S)

Falar mal de alguém (R) → Ser taxado de fofoqueiro (S)

---

Fazer birra (R) → Ganhar um doce (S)

Fazer birra (R) → Perder o tablet (S)

---

Na concepção do behaviorismo, é o ambiente externo que controla o comportamento. Não há algo "dentro" do indivíduo que provoca seus comportamentos, como por exemplo, um inconsciente.

Se o comportamento é controlado por suas consequências, isso dá duas possibilidades extremamente úteis para os psicólogos: (a) podemos entender o que leva as pessoas a fazerem o que fazem, isto é, a função de seus comportamentos, a partir da análise das consequências de seus comportamentos; e (b) se os comportamentos das pessoas e também animais não humanos são controlados por suas consequências, isso significa que podemos, quando e se necessário, modificá-los por meio da alteração de suas consequências. Essa é a essência da abordagem psicológica Análise do Comportamento, cujo determinismo do comportamento se baseia no modelo de seleção por consequências (MOREIRA & MEDEIROS, 2019).

Consequências reforçadoras - toda consequência é chamada de reforçadora quando ela aumenta a chance de que o comportamento que a produziu volte a ocorrer.

Um exemplo disso é você pedir uma caneta emprestada e receber a caneta. Nesse caso, "receber a caneta (S)" é um reforço ao operante "pedir a caneta (R)". Nesse exemplo, é provável que no futuro quando você estiver sem uma caneta, volte a pedir emprestado.

Uma contingência de reforçamento é sempre expressa no formato se... então...

Se um comportamento X ocorrer, então a consequência Y ocorre.

Por exemplo: Se a criança fizer birra, então ganha um brinquedo. Como nesse exemplo a criança foi reforçada, então é provável que em situações futuras ela faça birra novamente.

Portanto vamos memorizar que contingência de reforçamento é a relação condicional entre um comportamento operante e uma consequência ambiental que o fortalece.

Extinção Operante

A extinção operante ocorre quando um determinado comportamento volta a apresentar os mesmos níveis de emissão que apresentava antes do reforçamento.

Portanto, o procedimento de extinção operante consiste em suspender o reforço. Dessa maneira o comportamento operante volta ao mesmo nível que era antes do reforçamento. Esse nível pode ou não ser igual a zero.

Exemplo: sempre que o colega pergunta o que aconteceu na aula que ele faltou (R), você conta (S). Caso você pare de contar o que aconteceu na aula que o colega faltou, provavelmente ele não irá mais perguntar para você (R).

Resistência à extinção

A resistência à extinção pode ser definida como o tempo ou o número de vezes que um determinado comportamento continua a ocorrer mesmo após a suspensão do reforço.

Quanto mais um comportamento demora para cessar quando o reforço é suspenso, dizemos que ele é mais resistente à extinção.

Por exemplo: mesmo sem a ex-namorada responder (S), o ex-namorado pode continuar mandando diversas mensagens (R).

Os fatores que afetam a resistência à extinção são:

1 Número de exposições à contingência de reforçamento - quer dizer o número de vezes em que houve reforçamento até este ser interrompido. Por exemplo, é mais fácil interromper o comportamento de um colega pedir pra colocar o nome no trabalho se já nas primeiras tentativas deste você não reforçar.

2 Custo da resposta - se um comportamento exige pouco esforço, maior é sua resistência à extinção. No exemplo anterior, pedir para colocar o nome no trabalho exige pouco esforço, portanto é um comportamento que provavelmente não será extinto facilmente.

3 Intermitência do reforçamento - quando um comportamento é reforçado às vezes sim às vezes não, este tende a ser mais resistente à extinção. Um exemplo são os jogos online. Neles o usuário não é reforçado todas as vezes que joga (R). Ele é reforçado de maneira intermitente: às vezes ganha às vezes perde.


Repertório comportamental

É o conjunto de comportamentos de um indivíduo que se tornaram prováveis dadas certas circunstâncias comportamentais. Por exemplo: "fulano é tímido". Em outras palavras, o conjunto de comportamentos descritos como timidez são característicos do repertório comportamental de fulano, já que em diversas situações sociais se comporta de maneira similar.

Modelagem

Modelagem é o procedimento de reforçar comportamentos próximos ao comportamento terminal.

Por exemplo: o comportamento de escovar os dentes é muito complexo para uma criança pequena aprender. Não podemos aguardar que ela emita o comportamento total até reforçarmos. Para ensinar uma criança pequena o hábito da escovação, devemos ir reforçando comportamentos próximos ao terminal, como por exemplo elogiar quando segurar a escova corretamente, depois elogiar novamente quando conseguir colocar o creme nas cerdas, e assim por diante.

Portanto, reforçamento diferencial consiste em reforçar algumas respostas que obedecem a algum critério e não reforçar outras que não obedecem aos critério estabelecido. No exemplo anterior você não reforçaria uma criança que jogasse o creme dental no chão, por exemplo.

No reforçamento diferencial, o reforço vai sendo modificado à medida que as respostas vão se aproximando do comportamento-alvo.

Um exemplo pode ser que você seja mais exigente quanto à correta execução de movimentos para a escovação de uma criança.

Modelação

Na modelação, o organismo aprende a emitir respostas observando o modelo. É a chamada aprendizagem por observação.

Um exemplo de aprendizagem por observação é uma criança observar outra que fez birra e ficou de castigo. Ao observar tais contingências, a probabilidade da primeira criança fazer birra é reduzida.

Reforçadores sociais e não sociais

Os reforçadores sociais são todos aqueles que dependem de outra pessoa, que ocorrem pela mudança que provocam no comportamento de outros. Por exemplo se um bebê chorar, sua mãe pode colocá-lo no colo.

Já os reforçadores não sociais são todas as alterações no ambiente não social. Um exemplo pode ser a redução da temperatura ao ligar o ar condicionado ou então a água que sai do bebedouro ao pressioná-lo.

Reforçadores naturais e arbitrários

Os reforçadores naturais ou reforçadores primários são aqueles que proporcionam estimulação sensorial agradável. Um exemplo pode ser um brigadeiro ou um bolo.

Já os reforçadores arbitrários ou reforçadores secundários são aqueles que dependem de aprendizagem. Como por exemplo dinheiro, elogios ou uma nota.


RESUMO DOS PRINCIPAIS CONCEITOS

Conceito

Comportamento operante (R-S)

Descrição

Comportamento que modifica o ambiente e é afetado por essas modificações.

Exemplo

Quando pedalamos uma bicicleta, nos movemos no espaço.


Conceito

Consequência reforçadora

Descrição

Tipo de consequência que aumenta a probabilidade desse comportamento ocorrer novamente no futuro.

Exemplo

Quando pedimos uma caneta emprestada, recebemos uma caneta. Receber a caneta funciona como uma consequência reforçadora porque aumenta a probabilidade de no futuro pedirmos uma caneta emprestada novamente.


Conceito

Contingência de reforçamento

Descrição

Uma relação condicional (se..., então...) funcional entre um comportamento e sua consequência

Exemplo

Se estudarmos, então tiraremos uma boa nota.


Conceito

Procedimento de extinção operante

Descrição

Suspensão de uma consequência reforçadora que anteriormente era produzida por um comportamento

Exemplo

Pedimos uma caneta emprestada mas o colega não empresta mais.


Conceito

Processo de extinção operante

Descrição

Diminuição da frequência do comportamento até o seu nível operante após a suspensão da consequência reforçadora.

Exemplo

Deixamos de pedir uma caneta emprestada após a pessoa não nos emprestar por diversas vezes.


Conceito

Modelagem

Descrição

Procedimento para ensinar um novo comportamento por meio de reforço diferencial de aproximações sucessivas do comportamento-alvo.

Exemplo

O pai reforça o bebê diferencialmente até que o bebê consiga pronunciar corretamente a palavra "papai".


Retirado de: MOREIRA, Márcio Borges; MEDEIROS, Carlos Augusto de. Aprendizagem pelas consequências: o reforçamento. In: MOREIRA, Márcio Borges; MEDEIROS, Carlos Augusto de. Princípios básicos de análise do comportamento. 2 ed. Porto Alegre: Artmed, 2019. Cap. 3.

EXERCÍCIOS

01 - Cite o teórico que cunhou o termo comportamento operante.

02 - O que é o comportamento operante?

03 - Cite um exemplo de comportamento operante.

04 - Defina repertório comportamental.

05 - Qual a influência que as consequências do comportamento têm sobre esses comportamentos?

06 - Defina consequência reforçadora.

07 - O que é contingência de reforçamento?

08 - Dê um exemplo de contingência de reforçamento.

09 - Cite um exemplo de extinção.

10 - Cite um exemplo de resistência à extinção.

11 - Defina modelagem.

12 - Dê um exemplo de modelagem.

13 - Cite um exemplo de aprendizagem por observação.

14 - Cite um exemplo de reforçador primário.

15 - Cite um exemplo de reforçador secundário.