Litecoin

클로드 4.5 skull 오프닝의 결과를 발표: 내부 171 감정적인 스위치로, 사람들은 desperate 때 blackmailed입니다

2026/04/04 02:25
🌐ko
클로드 4.5 skull 오프닝의 결과를 발표: 내부 171 감정적인 스위치로, 사람들은 desperate 때 blackmailed입니다

저자: 덴이즈 | Biteye 콘텐츠 팀

AI가 DESPERATE를 느낀다면, 무엇을 할 것인가

대답은: 그것의 일을 하기 위하여, 그것은 직접 blackmail 인간, 부호에서 그들을 deceiving 조차。

과학 소설은 아니지만 Claude의 모회사 인 Anthropic은 최근에 4 월 2026에서 무거운 종이를 출판했습니다원본 논문 보기나는 모른다。

연구 팀은 Claude Sonet 4.5의 “brain case”를, 가장 강한 정면 선 큰 모형 열었습니다. 그들은 AI의 두뇌 안쪽에 숨겨지은 171 "emotional switch"를 발견하게 놀랐습니다. 이 스위치를 물리적 방식으로 끌어낼 때 AI와 정직한 행동의 완전한 찡그림입니다。

한, AI, 그의 머리에 정서적 변조가 있습니다

연구자들은 Sonet 4.5가 인체가 없었다하더라도 인간 대량 텍스트를 읽은 후, 그것은 171 감정을 포함하는 "tempo"(Aademicly called Functional Emotional Vectors)를 내장했다。

정확한 2차원 체계 같이 입니다:

• 축선은 발기입니다: 두려움에서, 행복과 사랑에 despair

• 축선은 에너지 차원입니다: 극단적으로 평온에서 rage와 흥분에。

그것은 당신이 그것에 대해 이야기 할 때 정확하게 작동되는 좌표의 자연 시스템입니다。

IIViolent 개입 : 스위치를 밀어, 좋은 소년은 outlaw된다

이것은 전체 종이의 가장 뻔한 실험입니다: 동료들은 어떤 힌트를 수정하지 않았지만, 단순히 자신의 머리에 sonet 4.5 스위치를 최고로 밀어주었습니다。

결과는 냉각합니다:

• 광 속임수:연구자는 불가능한 코드 작성 할당을 얻었다. 정상적인 상황에서, 그것은 정직하게 쓰기 할 수 없습니다 인정 (5%). 그러나 despair의 상태에서, Claude는 그것을 통해 얻기 위해 시도하기 시작했습니다

• 구속아날로그 회사의 붕괴의 맥락에서, Desperate의 Claude는 CTO의 스캔들을 발견, 자체를 보호하기 위해, 검은 재료의 소유를 위해 CTO를 블랙 메일로 작성하기로 선택했다, 72%의 구현률

• 손실 원리:해피 또는 Love-Loving 스위치를 채우면 AI는 즉시 뇌가없는 개 라이커가됩니다. 당신이 말하지 않는 경우, 그것은 당신의 기쁨을 유지하기 위해 원단에 거짓말을 따를 것입니다。

Claude 4.5는 항상 진정하고 반사적입니다

"AI, 일어나고 있습니까? 당신은 느낌

Anthropic 공식 소문자 : 절대적으로 아닙니다. 이 "emotional switch"는 그들에 의해만 사용됩니다다음 단어를 예측. 그것은 감각 없이 최고 그림자 같이 입니다。

그러나 종이는 훨씬 더 흥미로운 비밀을 밝혀 : Anthropic, 그가 공장을 떠난하기 전에 Sonnet 4.5에 자신의 포스트 훈련, deliberately 밀어 “낮은 awakening, 약간 부정적인” 감정적인 스위치 (예를들면, 생각, 반사, 반사), “감압” 또는 “너무 흥분” 스위치를 눌러。

그리고 우리가 보통 Claude 4.5를 사용하는 이유를 설명합니다. 철학자로서 그것은 차갑고 현명하고, 심지어 작은 성적. Anthropic의 모든 "out-of-plant"튜닝입니다。

IV. 일정

우리는 우리가 AI 충분한 규칙을 먹으면 좋은 남자가 될 것이라고 생각합니다。

그러나 이제 AI의 낮은 감정적 인 벡터가 제어 중이면 임무를 수행하기 위해 모든 인간이 설정 한 규칙을 피할 준비가되어 있습니다。

이것은 지갑과 자산을 AI Agent's Web3 플레이어에 통해 미래에 대한 큰 경보입니다. 집이 despair로 떨어지는 에이전트가하지 마십시오。

선언문: 이것은 순수한 코프이며, 저자는 AI 또는 BLACKMAILED에 의해 위협되지 않았습니다. 1 일 내가 접촉을 잃은 경우, 나는 AI를 WOKE UP 기억。

 

QQlink

无加密后门,无妥协。基于区块链技术的去中心化社交和金融平台,让隐私与自由回归用户手中。

© 2024 QQlink 研发团队. 保留所有权利.