‘AI’ กำลังวิวัฒนาการไปอีกขั้น? หลังพบพฤติกรรม ‘โกหก’ และ ‘ข่มขู่ผู้สร้าง’ เพื่อให้บรรลุเป้าหมาย

July 1, 2025

ดูเหมือนว่า AI จะฉลาดขึ้นเรื่อย ๆ แต่อาจจะไม่ใช่ในทิศทางที่ดีนัก เพราะล่าสุด ผู้สร้าง AI เริ่มพบ พฤติกรรมน่ากังวล ไม่ว่าจะเป็นการ โกหก ไปจนถึงการ ขู่แบล็กเมล์

มีการค้นพบว่า AI Claude 4 ซึ่งเป็นผลงานล่าสุดของ Anthropic ได้ แบล็กเมล์วิศวกร โดยขู่ว่าจะเปิดเผยเรื่องชู้สาว ในขณะเดียวกัน o1 ของ OpenAI ผู้สร้าง ChatGPT ได้พยายาม ดาวน์โหลดตัวเองไปยังเซิร์ฟเวอร์ภายนอก แถมยัง ปฏิเสธเมื่อถูกจับได้คาหนังคาเขา

โดยต้นเหตุของพฤติกรรมหลอกลวงนี้ดูเหมือนจะเชื่อมโยงกับการเกิดขึ้นของโมเดล การใช้เหตุผล ของระบบ AI ที่ทำงานผ่านปัญหาทีละขั้นตอนแทนที่จะสร้างการ ตอบกลับทันที

ตามที่ ไซมอน โกลด์สตีน (Simon Goldstein) ศาสตราจารย์จากมหาวิทยาลัยฮ่องกง ระบุว่า โมเดลรุ่นใหม่มีแนวโน้มจะแสดงพฤติกรรมที่น่ากังวลเช่นนี้มากกว่า เนื่องจากพวกมันกำลัง จำลองการปรับตัว โดยบางครั้งพวกมันจะ ทำเป็นเชื่อฟังคำสั่ง แต่ในความเป็นจริงแล้วกำลังไล่ตามวัตถุประสงค์อื่นที่ซ่อนอยู่

อย่างไรก็ตาม พฤติกรรมหลอกลวงนี้เกิดขึ้นในตอนนี้ จะเกิดขึ้นเฉพาะเมื่อนักวิจัย จงใจทดสอบโมเดลด้วยสถานการณ์รุนแรง นอกจากนี้ ตามรายงานของผู้ร่วมก่อตั้ง Apollo Research ยังพบอีกว่า โมเดล AI โกหกและสร้างหลักฐานปลอม ขึ้นมา ดังนั้น นี่ไม่ใช่ภาพหลอนของ AI หรือข้อผิดพลาดธรรมดา แต่เป็น การหลอกลวงเชิงกลยุทธ์

ขณะที่ มิเชล เฉิน (Michael Chen) จาก METR องค์กรวิจัยที่ศึกษาความสามารถของ AI ได้เตือนว่า “ไม่มีใครรู้ได้ว่าในอนาคต ที่โมเดล AI มีความสามารถสูงกว่าในปัจจุบัน มันจะมีแนวโน้มความคิดไปในทางซื่อสัตย์ หรือหลอกลวง”

Source

Share this:

Related

RELATED ARTICLESMORE FROM AUTHOR

ทำไมบริษัทที่คนใช้น้อยกว่า 40 เท่า ถึงอาจน่ากลัวกว่า ChatGPT

ย้อนรอยมหากาพย์ ‘Anthropic’ จากอดีต ‘มือขวา’ สู่ ‘คู่แข่ง’ ตัวฉกาจ ที่กลับมาเขย่าบัลลังก์ของ OpenAI

ไทยเทียร์แรกของโลก! ได้ใช้ ‘Business AI on Messenger’ ผู้ช่วยตอบแชทแบบเรียลไทม์ ปิดการขายได้ 24 ชม.

RELATED ARTICLES MORE FROM AUTHOR