Как работает подкрепление
А вот теперь — самое интересное про то как работает условный рефлекс (о рефлексах тут). Давайте посмотрим, как при помощи этих знаний людей заставляют делать так, как хочет "дрессировщик".
Например, вот история, которую первоначально опубликовали на Tumblr, а потом она разлетелась по всему интернету, и даже на Reddit её обсуждали как: "а вот девушка обучила парня условным рефлексам по Павлову"
Я была влюблена в одного парня (а он в меня вроде как не очень), и я решила сыграть с ним шутку. Каждый раз, как мы виделись, я предлагала ему конфеты той марки, которая ему очень нравилась. Через некоторое время стали заметны результаты: когда он видел меня, он на секунду приходил в восторг, а затем выражение его лица менялось на удивление (он сам не понимал, какого черта он был так рад меня видеть). Я чувствовала себя виноватой (какие злые вещи я творю с человеком!), но это было одновременно так весело! Я понравилась парню, заставив его ассоциировать меня с конфетой, которая ему нравилась.
Ну, в целом, как-то так это работает и всегда работало. Например, мужчины всегда дарили понравившимся девушкам подарки и цветы, и через некоторое время те начинали парней ассоциировать с приятными эмоциями от подарочков и букетов. Вот так и работает оно -- положительное подкрепление.
Дальше я расскажу принцип работы подкрепления
Важное! Самое важное! Положительное подкрепление важно отличать от награды и наказания.
Подкрепление — это то, что происходит ОДНОВРЕМЕННО с действием, на которое мы хотим повлиять. А награда и наказание — по времени от самого действия обычно значительно отсрочены. Поэтому да, и награда и наказание — они как-то действуют (иначе их не применяли бы). Но намного, намного слабее, а чаще всего, вообще криво и не так.
Тогда как подкрепление работает со всеми (от олигофренов до профессоров; при помощи положительного подкрепления дрессируют цыплят и медведей, о собаках и кошках мы даже не говорим; ни награда, ни наказание не сработали бы с цыплятами или теми же дождевыми червяками, о которых я писала в прошлый раз).
Положительное подкрепление работает как-то так. Понятно же, что такой девушке надо дарить мечи, топоры, кинжалы и прочее холодное оружие -- вон как она радуется!
Что такое подкрепление?
Простыми словами, подкрепление — это любое событие, которое происходит во время или сразу после поведения и увеличивает вероятность того, что это поведение повторится в будущем.
Девушка из истории про парня и конфетки хотела увеличить проявления радости и симпатии у парня — и связать их со своим образом. У неё получилось!
А вот очень часто встречающаяся, но неправильная стратегия поведения в отношениях: девушка получает от парня букет и кривит рожицу: фи, гвоздики. Ей, возможно, кажется, что она так "воспитывает" ухажёра, показывая, что не всякие цветы ей можно дарить. Но он-то получает моментальное наказание, и его мозг связывает: даришь ей цветы — в ответ получаешь негатив. Ну и зачем оно мне надо? Тут нужное поведение (дарение цветов) не закрепилось, а совсем даже наоборот. (Я знаю одного мужчину, который мне рассказывал, как ещё до встречи с женой ходил на свидание с некоей девушкой, которая примерно так и отреагировала на букет. "Фи, мне такие цветы не нравятся, что за веник!" Он выкинул цветы в ближайшую урну и тут же ушёл. Женился в итоге на другой).
Ещё раз повторю ключевые моменты:
Положительное подкрепление всегда увеличивает частоту желаемого поведения
Подкрепление должно быть своевременным — чем точнее момент подкрепления совпадает с желаемым действием, тем быстрее обучается «ученик» (будь то ребёнок, собака, партнёр или вы сами)
Запоздалое подкрепление теряет силу: мозг уже не связывает его с конкретным действием.
Это самое запоздалое подкрепление в обыденной жизни называется "наказание" (или "награда") и для мозга связать награду/наказание и желаемое поведение — очень трудно, практически невозможно.
Например, на том, что награда работает гораздо хуже подкрепления, погорают все программы похудения. Вот человек изнуряет себя диетами и спортзалом ради красивой фигуры. А когда она будет у него, красивая фигура, и будет ли вообще? Тогда как страдать от брокколи и приседаний надо прямо сейчас. А вот шоколад — он даёт человеку немедленное подкрепление. Кусочек в рот — ммм, вкусно, давай ещё! Шоколад даёт подкрепление, а спортзал обещает награду. И награда вчистую проигрывает подкреплению.
Вообще, вкусняшки -- идеальное положительное подкрепление: быстро, приятно, воздействует на древний мозг
Или ещё пример, из жизни тех, у кого была собака (у меня вот была). Все собаководы видели на прогулках каких-нибудь истеричных хозяев, которые пытаются воспитать собаку наказанием. Например: "Джерри, ко мне! Джерри, ко мне! Джерри, ну!!!". И когда Джерри случайно подбегает поближе, хозяин хватает пса, берёт на поводок, и... наказывает! Лупит, ругает, дёргает за поводок. Какое получает собака подкрепление? Джерри понимает: я подойду — меня отлупят. Оно мне надо? Вот пёс и бегает свободно, а за ним на расстоянии несётся хозяин.
Тогда как положительное подкрепление выглядит так: Джерри, наигравшись и набегавшись, подходит на подзыв хозяина — и тот его гладит, ласкает, играет с ним (пусть даже хочется лопнуть от злости на непослушную псину). Но собака в итоге послушалась (сделала желаемое действие) — его надо позитивно подкрепить. Тогда пёс будет охотнее выполнять команды и впредь, а ведь цель была именно такая: приучить собаку слушаться (а не показать, кто тут главный). И тогда есть шансы сократить время реакции на подзыв (есть для этого дрессировочные техники, в психологии называемые бихевиоризмом), и даже, в конце концов, получить идеально воспитанную собаку, которая немедленно бросает всё, что делает и слушается хозяина. Но начинать надо с малого.
А что может послужить подкреплением (таким и другим, то есть, позитивным или негативным)?
Виды подкрепления
1. Положительное подкрепление (positive reinforcement)
Это добавление чего-то приятного после желаемого поведения.
Например:
Похвала, улыбка, лакомство, внимание, одобрение.
Ребёнок убрал игрушки — получил совместную игру с мамой и слова любви
Собака села по команде — получила вкусняшку и почухивание между ушами
Молодой человек принёс цветы — получил нежную улыбку, долгий поцелуй и слова о том, что ты самый у меня лучший и как же мне повезло
Ещё раз напомню, что большинство по привычке ведёт себя не так и не используют подкрепление. Ребёнок убрал игрушки -- ну нечего его хвалить, и он так должен комнату в чистоте держать (а вот если не убрал, мама будет орать весь вечер). Собака села по команде — нечего её поощрять, надо выполнять команду быстрее. Симпатичный молодой человек пришёл с розочкой — а чего только одна, что я в инсту выложу?
В итоге желаемое поведение, которое могло бы закрепиться и развиться во что-то большее -- угасает. А это не было целью.
2. Отрицательное подкрепление (negative reinforcement) ради достижения желаемого поведения
Это убирание чего-то неприятного после достижения желаемого поведения.
Например: дрессировщик добивается, чтобы собака шла рядом, и, когда она начинает слушаться, он ослабляет давление на поводок. Дискомфорт уходит — нужное поведение животного закрепляется.
С отрицательным подкреплением тоже, в среднем, у населения просто швах. Никто специально не ставит задачу выработать (у других или себя) правильное поведение и подавить нежелательное. Часто поведенческая реакция совершается ради того, чтобы просто выплеснуть эмоции.
Например, вот жена пилит мужа, что он не сделал дома полочку. Муж, долбаемый супругой, в конце концов берёт инструменты и идёт вешать. То есть, желаемое поведение достигнуто? Как бы ни так: когда он придёт к супруге ("принимай работу, хозяйка"), то услышит или: "а чего мусор не убрал?", или "ну вот, не мог сразу, пришлось два месяца напоминать!", ну или ещё какие-нибудь неприятные слова. Ну да, это как с пёсиком Джерри (см.выше), принцип тот же: поведение достигнуто — нужно подкрепить последнее поведение (если именно оно желаемое), а не высказывать, насколько вы настрадались, напоминая повесить полку или почему опилки на полу.
Ну, это если вашей целью является выработка нужного поведения, а не выпустить пар на выбесившего мужа.
Почему подкрепление работает лучше наказания?
А наказание как таковое работает существенно хуже подкрепления (что положительного, что отрицательного).
Наказание:
Вызывает страх и подавление поведения (а не его исчезновение).
Ухудшает отношения.
Не учит, что именно нужно делать вместо нежелательного.
Подкрепление же фокусируется на том, что мы хотим видеть. Например, вместо "не кричи" — мы подкрепляем моменты спокойного общения. (Тогда как большинство, повторюсь, воспринимает нормальную или даже желательную ситуацию как должное, и только когда что-то идёт не так, начинает высказывать отрицательные эмоции, ругаться, скандалить и даже распускать руки. Нормальное общение вместо серии скандалов -- давно пора. Ребёнок приносил двойки и принёс четвёрку и три тройки -- а чего не все пятёрки, ты же можешь? Положительно подкрепить когда всё начинает идти хорошо — это редко, очень редко кто делает).
Ещё раз напомню, что вся теория (и практика) положительного подкрепления выросла из опытов И.П. Павлова на собаках и исследований формирования условного рефлекса. Да, вот в чём польза этих исследований, а не только в том, чтобы лампочку одновременно с кормлением собаки зажигать.
(Всякие параллели из человеческого поведения, отношений полов и даже политики предлагаю читателю привести самостоятельно).
Если будет интересно, расскажу правила формирования поведения при помощи подкрепления.
____________________________________
Напоминаю: я психолог; ссылка на мой канал в телеграме -- в шапке профиля. Подписывайтесь тут и в телеграме, буду рада.
По теме поста задавайте вопросы, отвечу по мере сил.



Лига социальных наук
3 поста3 подписчика