죄수의 딜레마의 한 예

위의 예는 부자연스러워 보이지만, 현실에서는 인간 사회와 자연계가 죄수의 딜레마와 같은 예를 찾아 그 결과를 같은 지불 매트릭스로 나눌 수 있다. 사회과학의 경제학, 정치학, 사회학, 자연과학의 동물행동주의와 진화생물학은 모두 죄수의 딜레마 분석을 통해 생물이 직면한 끝없는 죄수의 딜레마 게임을 시뮬레이션할 수 있다. 죄수의 딜레마가 광범위하게 적용될 수 있다는 것은 이 게임의 중요성을 알 수 있다. 다음은 각 업종의 예이다. 유명한 작가 삼중은 그의 산문' 광기' 에' 거품 속의 죄수의 딜레마' 라는 짧은 글이 있다. 2008 년 부동산 분야의 죄수의 딜레마를 묘사했다.

거시경제학을 배우면 반드시 게임론을 배울 수 있고, 게임론을 배우면 반드시 죄수의 딜레마 모델이 관련될 것이다. 나는 항상 모든 시장 게임 모델에서' 죄수의 딜레마' 가 심리학에 가장 가깝고, 선악을 가장 잘 드러내고, 집단적 지혜를 가장 잘 표현할 수 있다고 생각한다. 배신이나 협력을 선택하는 것은 영원히 변하지 않는 주제이다 ...

현재의 부동산 시장에 초점을 맞추자. 큰' 죄수의 딜레마' 가 이미 우리 눈앞에 나타났다. 반케 파레토 최적 솔루션을 포기 하는 데 앞장 선다. 현재의 시장 환경에서 예상되는 게임 내쉬 균형은 미래의 딜레마에서 부동산 개발업자들 간의 보편적인 상호 배신임이 분명하다. (윌리엄 셰익스피어, 윈스턴, 시장, 시장, 시장, 시장, 시장, 시장, 시장, 시장) 즉, 반케 들은 "죄수의 딜레마" 에서 첫 손을 선택 했습니다. 그것을 제외한 모든 부동산업자를 매각하는 것은 가능한 한 빨리 모든 파트너를 팔지 않으면 매각될 것으로 예상되기 때문이다. 결국 이것은 넌제로섬 게임이기 때문에, 판매 행위는 매우 큰 이익을 얻을 수 있다 ...

왜 내가 여기서' 배신' 이라는 단어를 비열하게 사용해야 하는가? 지난 N 년 동안 부동산 개발상이 만든' 공수동맹' 을 돌이켜보면 내가 제 1 재경 채널에서' 부동산업계에 폭리가 있는지 여부',' 부동산 개발비용이 공개돼야 하는지 여부' 등의 문제로 줄곧 적나라한 반대에 직면해 있다는 것을 알 수 있다. 나는 항상 부동산 개발업체들이 폭리를 가지고 있다고 생각했다 (현재의 시장 환경에서 합리적인지 여부는 저자가 2008 년 부동산 시장에 대한 해석에 대한 묘사를 볼 수 있다). (윌리엄 셰익스피어, 윈스턴, 부동산, 부동산, 부동산, 부동산, 부동산, 부동산) 당시 거의 모든 개발업자들은 폭리의 존재를 만장일치로 부인했다. 더욱이, 팬 씨는 수줍어하게 비용을 아내의 젖에 비유하여 원가가 자연스럽지 않다는 것을 충분히 설명했다. 물론 반케 목소리도 있다 ... 오늘의 반케 들은 그가 참여했던' 연맹' 을 짓밟고 뛰쳐나와 실천에 사용했다.

동료를 반케 배반하면 정말 개인의 최대의 이익을 얻을 수 있을까? 이론적으로는 얻을 수 있지만 실제로는 결국 오산이 될 수 있다. 모든 실천에서' 죄수의 딜레마' 게임은 정보가 극도로 비대칭적인 폐쇄환경에서 결과를 내야 하기 때문이다. 모든 죄수들의 두려움과' 이성적 의사결정' 은 서로 격리되어 있다. 이 게임은 반복할 수 없다 (더글라스 창조). 호프슈타트). 현재의 시장 환경은 이미 한 번 이상 반복되었다 (하이난, 05 전국, 08 선전). 이런 반복적인 게임은 결국 모든 참가자들을 곤경에서 벗어나게 할 것이며,' 죄수의 딜레마' 는 이미 완전히 깨졌다 ...

또한, 가장 중요한 점은 이 게임에서 정부도 참여한다는 것이다. 그가 직접 참여하는 코너는 원천, 즉 토지의 공급 (임대) 으로' 죄수의 딜레마' 의 파쇄를 가속화한다. 이는 모든 참가자들과 본질적인 차이가 있기 때문이다. 정부는 전체 게임의 디자이너이며, 감금 규칙의 디자이너이며, 세포를 만들고 철거하는 사람이다. 정부와 관련된' 죄수의 딜레마' 가 진정한' 딜레마' 라고 불릴 수 있다고 상상하기 어렵다. 뒤를 돌아보니 반케, 그에게 배신당한 모든 소위 동료들 중 한 정부의 그림자가 ... 내가 이렇게 말하는 것은 정확하지 않을 수도 있다. 결국 이것은 이상적인' 죄수의 딜레마' 가 아니다. 범인 사이에는 서로 고립된 것이 아니라, 적어도 업계에서 정보가 극도로 비대칭적인 것은 아니다. 반케 (WHO) 가 어떤 사명을 맡았는가?

마지막으로 수요측도' 죄수의 딜레마' 에 직면해 타오의' 집을 사지 않는다' 에서' 만인구매' 에 이르기까지 한 점을 볼 수 있다.

나는 부동산상과 부동산 시장이 결국' 죄수의 딜레마' 에서 나올 수 있는 가능성은 두 가지라고 생각한다. 하나는 위에서 언급한 가장 걸출한 죄수들이 어떻게 행동하는지, 자신을 감금하는 것인지 아니면 세상을 사면하는 것이다. 다른 하나는 모든 죄수들이 현명하게 게임을 중단하고 게임을 반복하는 과정에서 협력을 만든다는 것이다. 지난 몇 년 동안 그들은 해냈다. 이제 다시 해야 할 때가 된 것 같다. 그들이 필요로 하는 것은 단지 집단적 지혜일 뿐이다. 판매자에게 도둑맞은 케이크는 당분간 판매자의 수명을 연장할 수 밖에 없을 것 같지만, 결국 그들은 앞으로 죄수의 자격조차 없을 것이다. 두 글자,' 신뢰' 를 위해서!

그 후, 아마도' 죄수의 딜레마' 는 또 다른 새로운 모델로 변할 것이다. 나는 그것을' 반복 게임 결과에 따른 죄수의 복수' 라고 부른다. 두 나라는 관세에 대해 두 가지 선택을 할 수 있다.

관세를 올려 너의 상품을 보호하라. (배신)

서로 관세 협의를 달성하여 관세를 낮추어 각 상품의 유통을 용이하게 하다. (협력)

한 나라가 어떤 이유로 관세협정을 지키지 않고 단독으로 관세를 올리면 다른 나라도 같은 반응 (배신) 을 해 관세전을 일으키며 양국의 상품이 상대방의 시장을 잃고 자국 경제에 손해를 끼칠 수 있다 (결과적으로 * * * 배신). 그런 다음 양국은 새로운 관세 협정에 도달했다. (반복되는 게임의 결과는 발견과 * * * 협력수익이 가장 크다는 것이다. 상업 활동에서도 각종 죄수의 딜레마의 예가 나타난다. 광고 경연대회를 예로 들다.

두 회사는 서로 경쟁하고, 그들의 광고는 서로 영향을 미친다. 즉, 한 회사의 광고가 고객이 더 쉽게 받아들일 수 있다면, 다른 회사의 수입의 일부를 가져가게 된다. 그러나 비슷한 품질의 광고를 동시에 게시하면 수입은 거의 증가하지 않지만 비용은 증가합니다. 그러나 광고의 질을 높이지 않으면 장사는 상대방에 의해 빼앗길 것이다.

두 회사는 두 가지 옵션을 가질 수 있습니다.

서로 협의하여 광고 비용을 줄이다. (협력)

광고 비용을 늘리고, 가능한 한 광고의 질을 높이고, 상대방을 압도하다. (배신)

두 회사가 서로 불신하고 협력하지 못하고 배신이 주도전략이 되면 두 회사는 광고대전에 빠지고 광고비의 증가는 두 회사의 이윤을 손상시킬 수 있다. 이것이 죄수의 딜레마다. 현실에서 서로 경쟁하는 두 회사는 협력 협의를 달성하기 어렵고 대부분 죄수의 곤경에 빠진다. 그의 저서' 협력의 진화' 에서 로버트 악셀로드는 고전 죄수의 딜레마의 확장을 탐구하며' 반복되는 죄수의 딜레마' (IPD) 라고 불렀다. 이 게임에서 참가자들은 서로 관련된 전략을 반복해서 선택하고 그들의 이전 대항을 기억해야 한다. 아크셀로드는 세계 각지에서 온 학술 동료들을 초청하여 컴퓨터 전략을 설계하고 반복되는 죄수의 딜레마 경기에서 서로 경쟁했다. 경기 절차의 차이는 알고리즘의 복잡성, 초기 대항, 용서 능력 등 여러 방면에서 광범위하게 존재한다. 악셀로드는 이러한 대립이 서로 다른 전략을 선택한 모든 참가자들에 의해 오랫동안 반복될 때' 탐욕' 전략은 감소하는 경향이 있고' 이타적인' 전략은 더 많이 채택된다는 것을 발견했다. 그는 자연 선택을 통해 이타적인 행동의 메커니즘이 원래의 순전히 이기적인 메커니즘에서 진화할 수 있다는 것을 설명하기 위해 이 게임을 사용했다.

최고의 확실성 전략은' 이로 갚는다' 라고 하는데, 이는 Anatol Rapoport 가 개발한 한 가지 방법으로 선수권 대회에 적용된다. 그것은 모든 참가 절차 중 가장 간단하며, 4 줄의 기본 언어만 포함하고 경기에서 이겼다. 이 전략은 반복 게임이 시작될 때 협력하고 상대방의 이전 전략을 채택하는 것일 뿐이다. (알버트 아인슈타인, 도전명언) 더 좋은 전략은' 이로 갚는다' 가 상대가 배신할 때, 어쨌든 다음 라운드에서 작은 확률 (약 1%~5%) 을 맞춰야 한다는 것이다. 가끔 순환 배신의 사기에서 회복해야 한다는 점을 감안하는 것이다. 게임에 잘못 소개되었을 때' 타격에 대한 용서' 가 최고다. 이것은 때때로 당신의 행동이 당신의 상대에게 잘못 전달된다는 것을 의미합니다: 당신은 협력했지만, 당신의 상대는 당신이 배신했다고 들었습니다. 악셀로드는 높은 점수에 대한 분석을 통해 전략 성공에 필요한 몇 가지 조건을 지정했다.

우호적인

가장 중요한 조건은 전략이 반드시 우호적이어야 한다는 것이다. 즉 상대가 배신할 때까지 배신하지 말라는 것이다. 거의 모든 높은 점수 전략은 우호적이다. 그러므로 완전히 이기적인 전략은 단지 이기적인 이유일 뿐, 결코 상대를 먼저 공격하지 않을 것이다. (윌리엄 셰익스피어, 이기심, 이기심, 이기심, 이기심, 이기심, 이기심, 이기심)

보복

그러나, 아크셀로드는 성공적인 전략이 맹목적으로 낙관적이어서는 안된다고 생각한다. 늘 보복하다. 보복성 전략의 한 예는 협력이다. 이것은 매우 나쁜 선택이다.' 더러운' 전략이 이런 바보를 잔인하게 착취하기 때문이다.

용서하다

성공 전략의 또 다른 특징은 용서받아야 한다는 것이다. 비록 그들은 보복하지 않지만, 만약 상대가 계속 배신하지 않는다면, 그들은 한 번에 한 번씩 합작으로 돌아갈 것이다. 이는 장기적인 보복과 반보복을 제지하고 득점점을 극대화했다.

질투하지 않다

마지막 품질은 질투하지 않는 것이다. 즉 상대보다 더 높은 점수를 쟁취하지 않는 것이다. ('우호적인' 전략은 반드시 질투하지 않는 것이다. 즉' 우호적인' 전략은 상대보다 더 높은 점수를 얻을 수 없다.)

따라서 악셀로드는 이기적인 개인이 종종 우호적이고 관용적이며 이기적인 이익 때문에 질투하지 않는다는 유토피아적인 결론을 내렸습니다. 악셀로드는 죄수의 딜레마를 반복하는 연구에 대한 중요한 결론은 우호적인 사람이 먼저 거래를 완성할 수 있다는 것이다. 고전적인 죄수의 딜레마 절에 제시된 군비 경쟁 모델을 재고하다. 결론은 이성적인 전략만이 군사력을 증강시켰다는 것이다. 양국은 버터가 아닌 총포에 GDP 를 쓰는 것을 선호하는 것 같다. 흥미롭게도, 반대 국가들이 실제로 이런 방식으로 경쟁하고 있다는 것을 증명하려고 하는 것 ('죄수의 딜레마가설 반복' 하에서 각기 다른 시기의 군비 지출이 모두' 높음' 과' 낮음' 사이에 있다는 것) 은 종종 가설적인 군비 경쟁이 예상대로 나타나지 않는다는 것을 보여준다. (예를 들어, 그리스인과 터키인의 군비 지출은' 이로 갚는다' 는 반복되는 죄수의 딜레마를 따르지 않고 국내 정책에 이끌릴 가능성이 더 높다. 이것은 일회성 게임과 반복 게임에서 서로 다른 이성적인 행동의 한 예일 수 있다.

일회성 죄수의 딜레마 게임에서 최고의 전략 (포인트 최대화) 은 배신이다. 앞서 언급했듯이 상대의 행동이 무엇이든 간에 이것은 사실이다. 하지만 반복되는 죄수의 딜레마 게임에서 가장 좋은 전략은 가능한 상대의 전략과 배신과 협력에 대처하는 방법에 달려 있다. 예를 들어, 한 무리의 사람들을 생각해 보십시오. 그 중 한 명은 매번 배신을 합니다. 단, 첨예한 상대 전략을 따르는 사람은 예외입니다. 이 사람은 1 라운드에서 져서 약간 열세에 처해 있다. 이런 사람들 중에서 이 사람의 가장 좋은 전략은 매번 배신하는 것이다. 총 배신자가 일정 비율을 차지하고 나머지는 날카롭게 맞서는 사람들 중에서 개인의 최선의 전략은 이 비율과 게임의 길이에 달려 있다. 베이지안 내쉬 균형: 대결 전략의 통계적 분포를 결정할 수 있다면 (예: 50% 를 띠로, 50% 는 항상 협력한다), 수학적으로 최고의 상대전략 [4] 을 얻을 수 있다.

일단 몬테카를로 시뮬레이션 군중, 낮은 개인이 사라지고, 높은 점수 개체 반복 (최고의 전략을 얻을 수 있는 천재 알고리즘) 이 있었다. 최종 군중의 알고리즘 합성은 일반적으로 예비 집단의 알고리즘 합성에 따라 달라집니다.

이로 갚는 것이 가장 믿을 만한 기본 전략으로 여겨졌지만, 죄수의 딜레마를 반복한 지 20 주년을 맞아 영국 사우샘프턴 대학의 한 팀 (Nicholas Jennings [1] 이 이끄는 팀) 에는 Rajdeep Dash, Sarva Pall 이 포함되어 있다. 이 전략은 프로그램 간의 협력에 의존하며 단일 프로그램에 대해 가장 높은 점수를 얻습니다. Southampton University 는 경쟁에 참여하기 위해 60 개의 프로그램을 제출했습니다. 이러한 프로그램의 시작은 5 부터 10 까지의 동작 세트로 서로를 식별하도록 설계되었습니다. 일단 이런 감정들이 이루어지면, 한 절차는 항상 협조하고, 다른 절차는 항상 배신하여 반역자가 가장 큰 가산점을 받을 수 있도록 보장한다. 프로그램이 Southampton 이 아닌 참가자를 조작하고 있다는 것을 인식하면 프로그램은 경쟁 절차의 점수를 최소화하려고 계속 배신할 것이다. 결과 [5], 이 전략은 상위 3 으로 경쟁을 끝냈고, 바닥에 가까운 위치도 많이 얻었다. 이 전략은 첨예한 대립보다 더 효과적이라는 것이 분명하지만, 이런 특수한 경쟁에서 여러 채널을 허용하는 사실을 이용하기 때문이다. 한쪽이 단일 플레이어만 통제할 수 있는 경쟁에서 이를 갚는 것이 더 좋은 전략이다.

죄수의 딜레마를 반복하면 n 번 반복되고 n 이 상수라는 것을 알면 또 다른 재미있는 사실이 나타난다. 내쉬 균형은 매번 배신이다. 이것은 귀납법으로 쉽게 증명할 수 있다. 너도 마지막 라운드에서 배신할 수 있다. 왜냐하면 너의 상대는 너를 처벌할 기회가 없을 것이기 때문이다. 그래서, 마지막 라운드에서 당신들은 모두 배신할 것입니다. 이 때, 너는 꼴찌에서 두 번째 라운드에서 배신할 수 있다. 왜냐하면 네가 마지막에 무엇을 하든, 너의 상대는 배신할 것이기 때문이다. 이런 것들이죠. 요청을 유지하기 위해 협력하기 위해서는 미래가 두 참가자에게 불확실해야 한다. 한 가지 해결책은 총 게임 수 N 을 무작위로 만드는 것입니다. 미래에 대한 기대는 확실히 불확실하다.

또 다른 단독 예는' 끝이 없다' 는 죄수의 딜레마이다. 이 게임은 여러 번 반복되는데, 너의 점수는 평균이다.

죄수의 딜레마 게임은 인류 협력과 신뢰 이론의 기초이다. 죄수의 딜레마가 신뢰가 필요한 두 사람 사이의 교류를 시뮬레이션할 수 있다고 가정하면, 집단의 협력 행위는 여러 참가자들이 반복되는 게임의 변종으로 시뮬레이션할 수 있다. 이것은 많은 학자들의 지속적인 흥미를 불러일으켰다. 65438 에서 0975 까지 Grofman 과 Pool 은 2000 개 이상의 학술 문장 들이 이 연구에 전념할 것으로 예상하고 있습니다.

上篇: 오, 이런! 아주 좋은 애니메이션은 어디에 있습니까? ! 下篇: 소방 주제 활동 계획