Cách tăng cường và trừng phạt sửa đổi hành vi
Điều hòa vận hành (đôi khi được gọi là điều hòa công cụ ) là một phương pháp học tập xảy ra thông qua phần thưởng và hình phạt cho hành vi. Thông qua điều hòa operant, một liên kết được thực hiện giữa một hành vi và hậu quả cho hành vi đó.
Ví dụ, khi một con chuột thí nghiệm nhấn một nút màu xanh, ông nhận được một viên thực phẩm như một phần thưởng, nhưng khi ông nhấn nút màu đỏ, ông nhận được một cú sốc điện nhẹ.
Kết quả là, anh học cách nhấn nút màu xanh nhưng tránh nút màu đỏ.
Nhưng điều hòa operant không chỉ là một cái gì đó diễn ra trong các thiết lập thử nghiệm trong khi đào tạo động vật thí nghiệm; nó cũng đóng một vai trò mạnh mẽ trong việc học tập hàng ngày. Củng cố và trừng phạt diễn ra hầu như mỗi ngày trong môi trường tự nhiên cũng như trong các thiết lập có cấu trúc hơn như lớp học hoặc các buổi trị liệu.
Chúng ta hãy xem xét kỹ hơn về cách điều hòa operant được phát hiện, tác động của nó đối với tâm lý học, và nó được sử dụng như thế nào để thay đổi hành vi cũ và dạy những hành vi mới.
Lịch sử điều hành
Điều hòa vận hành được đặt ra bởi nhà hành vi BF Skinner , đó là lý do tại sao bạn thỉnh thoảng có thể nghe nó được gọi là điều hòa Skinnerian. Là một nhà hành vi, Skinner tin rằng nó không thực sự cần thiết để nhìn vào suy nghĩ và động lực nội tại để giải thích hành vi. Thay vào đó, ông đề nghị, chúng ta chỉ nên nhìn vào những nguyên nhân bên ngoài, quan sát được về hành vi của con người.
Qua phần đầu của thế kỷ 20, hành vi đã trở thành một lực lượng chính trong tâm lý học. Ý tưởng của John B. Watson thống trị trường phái tư tưởng này từ rất sớm. Watson tập trung vào các nguyên tắc của điều hòa cổ điển , một khi nổi tiếng gợi ý rằng ông có thể đưa bất kỳ người nào bất kể nền tảng của họ và đào tạo họ để được bất cứ điều gì ông đã chọn.
Khi những nhà hành xử đầu tiên tập trung vào sở thích của họ về việc học kết hợp, Skinner quan tâm nhiều hơn đến hậu quả của hành động của con người ảnh hưởng đến hành vi của họ như thế nào.
Skinner đã sử dụng thuật ngữ thuật ngữ để chỉ bất kỳ "hành vi hoạt động nào hoạt động dựa trên môi trường để tạo hậu quả". Nói cách khác, lý thuyết của Skinner giải thích cách chúng ta có được hàng loạt các hành vi đã học mà chúng ta triển lãm mỗi ngày.
Lý thuyết của ông bị ảnh hưởng nặng nề bởi công việc của nhà tâm lý học Edward Thorndike , người đã đề xuất cái mà ông gọi là luật hiệu quả . Theo nguyên tắc này, các hành động được theo sau bởi các kết cục mong muốn có nhiều khả năng được lặp lại trong khi những kết quả được theo sau bởi các kết quả không mong muốn ít có khả năng được lặp lại.
Điều kiện vận hành dựa trên một tiền đề khá đơn giản - các hành động tiếp theo là tăng cường sẽ được tăng cường và nhiều khả năng xảy ra một lần nữa trong tương lai. Nếu bạn kể một câu chuyện hài hước trong lớp và mọi người cười, bạn có thể sẽ có nhiều khả năng kể lại câu chuyện đó trong tương lai. Nếu bạn giơ tay để đặt câu hỏi và giáo viên của bạn ca ngợi hành vi lịch sự của bạn, bạn sẽ có nhiều khả năng giơ tay của bạn trong lần tiếp theo bạn có câu hỏi hoặc nhận xét.
Bởi vì hành vi được theo sau bằng cách tăng cường, hoặc một kết quả mong muốn, các hành động trước đó được tăng cường.
Ngược lại, các hành động dẫn đến hậu quả hoặc hậu quả không mong muốn sẽ bị suy yếu và ít có khả năng xảy ra lại trong tương lai. Nếu bạn kể lại cùng một câu chuyện trong một lớp khác nhưng không ai cười lần này, bạn sẽ ít có khả năng lặp lại câu chuyện này trong tương lai. Nếu bạn hét lên một câu trả lời trong lớp và giáo viên của bạn mắng bạn, sau đó bạn có thể ít có khả năng làm gián đoạn lớp học một lần nữa.
Các loại hành vi
Skinner phân biệt giữa hai loại hành vi khác nhau
- Hành vi trả lời là những hành vi tự động diễn ra và theo phản xạ, chẳng hạn như kéo tay bạn trở lại từ bếp nóng hoặc giật chân khi bác sĩ vỗ nhẹ vào đầu gối của bạn. Bạn không cần phải học những hành vi này, chúng đơn giản xảy ra tự động và vô tình.
- Mặt khác , các hành vi của người vận hành là những hành vi dưới sự kiểm soát có ý thức của chúng tôi. Một số có thể xảy ra một cách tự nhiên và những người khác cố ý, nhưng đó là hậu quả của những hành động này sau đó ảnh hưởng đến việc chúng có xảy ra lần nữa trong tương lai hay không. Những hành động của chúng ta về môi trường và hậu quả của hành động đó tạo nên một phần quan trọng của quá trình học tập .
Trong khi điều kiện cổ điển có thể giải thích cho các hành vi trả lời, Skinner nhận ra rằng nó không thể giải thích được rất nhiều. Thay vào đó, Skinner đề nghị rằng điều hành operant có tầm quan trọng lớn hơn nhiều.
Skinner đã phát minh ra các thiết bị khác nhau trong thời niên thiếu của mình và ông đặt những kỹ năng này để làm việc trong các nghiên cứu của mình về điều hòa operant.
Ông đã tạo ra một thiết bị được biết đến như một buồng điều hòa operant, thường được gọi là hộp Skinner . Căn phòng là một chiếc hộp có thể chứa một con vật nhỏ như chuột hoặc chim bồ câu. Hộp cũng chứa một thanh hoặc chìa khóa mà con vật có thể nhấn để nhận phần thưởng.
Để theo dõi phản hồi, Skinner cũng đã phát triển một thiết bị được gọi là máy ghi tích lũy. Thiết bị ghi lại các phản hồi như một chuyển động hướng lên của một đường để có thể đọc được tốc độ đáp ứng bằng cách nhìn vào độ dốc của đường thẳng.
Các thành phần của nhà điều hành
Có một số khái niệm chính trong điều kiện operant.
Tăng cường trong điều hành vận hành
Tăng cường là bất kỳ sự kiện nào tăng cường hoặc tăng cường hành vi theo sau. Có hai loại tăng cường:
- Tăng cường tích cực là các sự kiện thuận lợi hoặc kết quả được trình bày sau hành vi. Trong các tình huống phản ánh tăng cường tích cực, một phản ứng hoặc hành vi được tăng cường bằng cách bổ sung một cái gì đó, chẳng hạn như lời khen ngợi hoặc một phần thưởng trực tiếp. Ví dụ: nếu bạn làm tốt công việc và người quản lý sẽ cấp cho bạn một khoản tiền thưởng.
- Tăng cường tiêu cực liên quan đến việc loại bỏ một sự kiện bất lợi hoặc kết quả sau khi hiển thị một hành vi. Trong những tình huống này, một phản ứng được tăng cường bằng cách loại bỏ một cái gì đó được coi là khó chịu. Ví dụ, nếu con của bạn bắt đầu hét lên ở giữa cửa hàng tạp hóa, nhưng dừng lại khi bạn đưa cho anh ta một điều trị, bạn sẽ có nhiều khả năng đưa cho anh ta một điều trị vào lần sau khi anh ấy bắt đầu hét lên. Hành động của bạn dẫn đến việc loại bỏ tình trạng khó chịu (đứa trẻ la hét), tăng cường tiêu cực hành vi của bạn.
Trong cả hai trường hợp tăng cường này, hành vi tăng lên.
Trừng phạt trong điều hành vận hành
Trừng phạt là sự trình bày về một sự kiện hoặc kết quả bất lợi gây ra sự sụt giảm trong hành vi mà nó theo sau. Có hai loại hình phạt:
- Hình phạt tích cực , đôi khi được gọi là hình phạt bằng cách áp dụng, trình bày một sự kiện hoặc kết quả không thuận lợi để làm suy yếu phản hồi theo sau. Đánh lừa cho hành vi sai trái là một ví dụ về hình phạt bằng cách áp dụng.
- Hình phạt tiêu cực , còn được gọi là hình phạt bằng cách loại bỏ, xảy ra khi một sự kiện hoặc kết quả thuận lợi bị loại bỏ sau khi một hành vi xảy ra. Lấy đi một trò chơi điện tử của trẻ sau khi hành vi sai trái là một ví dụ về hình phạt tiêu cực.
Trong cả hai trường hợp bị trừng phạt này, hành vi sẽ giảm.
Lịch gia cố
Tăng cường không nhất thiết phải là một quá trình đơn giản và có một số yếu tố có thể ảnh hưởng đến việc học được những điều mới và nhanh chóng như thế nào. Skinner nhận thấy rằng khi nào và tần suất hành vi được tăng cường đóng một vai trò trong tốc độ và sức mạnh của việc mua lại. Nói cách khác, thời gian và tần suất gia cố ảnh hưởng đến cách hành vi mới được học và cách hành vi cũ được sửa đổi.
Skinner đã xác định một số lịch trình gia cố khác nhau có tác động đến quá trình điều hòa operant:
- Liên tục tăng cường liên quan đến việc cung cấp một gia cố mỗi khi một phản ứng xảy ra. Việc học tập có xu hướng xảy ra tương đối nhanh, nhưng tỷ lệ đáp ứng khá thấp. Sự tuyệt chủng cũng xảy ra rất nhanh khi sự gia cố bị dừng lại.
- Lịch biểu tỷ lệ cố định là một loại tăng cường một phần. Câu trả lời chỉ được tăng cường sau khi một số câu trả lời cụ thể đã xảy ra. Điều này thường dẫn đến một tỷ lệ đáp ứng khá ổn định.
- Lịch trình khoảng thời gian cố định là một dạng gia cố từng phần khác. Tăng cường xảy ra chỉ sau một khoảng thời gian nhất định đã trôi qua. Tỷ lệ phản ứng vẫn khá ổn định và bắt đầu tăng lên khi thời gian gia cố đến gần, nhưng chậm lại ngay sau khi tăng cường đã được giao.
- Lịch trình thay đổi tỷ lệ cũng là một loại tăng cường từng phần liên quan đến tăng cường hành vi sau một số lượng phản hồi khác nhau. Điều này dẫn đến cả tỷ lệ đáp ứng cao và tỷ lệ tuyệt chủng chậm.
- Lịch trình thay đổi khoảng thời gian là dạng cuối cùng của cốt thép một phần Skinner được mô tả. Lịch trình này bao gồm việc cung cấp cốt thép sau một khoảng thời gian đã trôi qua. Điều này cũng có xu hướng dẫn đến tỷ lệ đáp ứng nhanh và tỷ lệ tuyệt chủng chậm.
Ví dụ về điều kiện vận hành
Chúng tôi có thể tìm thấy các ví dụ về điều hòa operant tại nơi làm việc xung quanh chúng ta. Xem xét trường hợp trẻ em hoàn thành bài tập về nhà để kiếm được phần thưởng từ cha mẹ hoặc giáo viên hoặc nhân viên hoàn thành dự án để nhận được lời khen ngợi hoặc khuyến mãi.
Một số ví dụ về điều hành operant trong hành động:
- Nếu con bạn hành động trong một chuyến đi mua sắm, bạn có thể cho anh ta một điều trị để làm cho anh ta được yên tĩnh. Bởi vì bạn đã tích cực củng cố hành vi sai trái, anh ta có thể sẽ có nhiều khả năng hành động trở lại trong tương lai để nhận được một điều trị khác.
- Sau khi biểu diễn trong vở kịch của cộng đồng, bạn nhận được tràng pháo tay từ khán giả. Điều này đóng vai trò như một người củng cố tích cực, truyền cảm hứng cho bạn để thử vai trò hiệu suất hơn.
- Bạn đào tạo con chó của bạn để lấy bằng cách cung cấp cho anh ta khen ngợi và vỗ nhẹ vào đầu bất cứ khi nào anh ta thực hiện hành vi một cách chính xác.
- Một giáo sư nói với sinh viên rằng nếu họ có hoàn toàn đi học tất cả các học kỳ, sau đó họ không phải đi thi toàn diện cuối cùng. Bằng cách loại bỏ một kích thích khó chịu (thử nghiệm cuối cùng) học sinh được tăng cường tiêu cực để tham dự lớp học thường xuyên.
- Nếu bạn không đưa tay vào một dự án đúng thời hạn, sếp của bạn sẽ trở nên tức giận và bực bội hiệu suất của bạn trước đồng nghiệp của bạn. Điều này đóng vai trò như một kẻ trừng phạt tích cực khiến bạn ít có khả năng hoàn thành dự án muộn hơn trong tương lai.
- Một cô gái tuổi teen không dọn dẹp phòng của mình khi cô được hỏi, vì vậy cha mẹ cô lấy điện thoại của cô cho phần còn lại của ngày. Đây là một ví dụ về một hình phạt tiêu cực, trong đó một kích thích tích cực được lấy đi.
Trong một số ví dụ này, lời hứa hoặc khả năng của phần thưởng gây ra sự gia tăng hành vi, nhưng điều hòa operant cũng có thể được sử dụng để giảm một hành vi. Việc loại bỏ một kết quả mong muốn hoặc ứng dụng kết quả tiêu cực có thể được sử dụng để giảm hoặc ngăn chặn các hành vi không mong muốn. Ví dụ, một đứa trẻ có thể được cho biết họ sẽ mất đặc quyền giải lao nếu họ nói chuyện lần lượt trong lớp học. Tiềm năng trừng phạt này có thể dẫn đến giảm hành vi gây rối.
Một từ từ
Trong khi behaviorism có thể đã mất nhiều sự thống trị nó được tổ chức trong phần đầu của thế kỷ 20, điều operant vẫn là một công cụ quan trọng và thường được sử dụng trong quá trình học tập và hành vi sửa đổi. Đôi khi hậu quả tự nhiên dẫn đến những thay đổi trong hành vi của chúng ta. Trong các trường hợp khác, phần thưởng và hình phạt có thể được chia ra một cách có ý thức để tạo ra thay đổi.
Điều hòa vận hành là điều bạn có thể nhận ra ngay lập tức trong cuộc sống của chính bạn, cho dù đó là cách tiếp cận để dạy cho con bạn những hành vi tốt hay trong việc huấn luyện con chó gia đình để ngừng nhai dép yêu thích của bạn. Điều quan trọng cần nhớ là với bất kỳ loại hình học tập nào, đôi khi nó có thể mất thời gian. Hãy xem xét các loại tăng cường hoặc trừng phạt có thể làm việc tốt nhất cho tình huống duy nhất của bạn và đánh giá loại lịch trình tăng cường có thể dẫn đến kết quả tốt nhất.
> Nguồn:
> Coon, D & Mitterer, JO. Tâm lý học: Hành trình. Belmont, CA: Wadsworth; 2014.
> Domjan, M. Nguyên tắc học tập và hành vi, ấn bản thứ bảy. Stamford, CT; Cengage Learning; 2015.