ดูเหมือนว่า AI จะฉลาดขึ้นเรื่อย ๆ แต่อาจจะไม่ใช่ในทิศทางที่ดีนัก เพราะล่าสุด ผู้สร้าง AI เริ่มพบ พฤติกรรมน่ากังวล ไม่ว่าจะเป็นการ โกหก ไปจนถึงการ ขู่แบล็กเมล์
มีการค้นพบว่า AI Claude 4 ซึ่งเป็นผลงานล่าสุดของ Anthropic ได้ แบล็กเมล์วิศวกร โดยขู่ว่าจะเปิดเผยเรื่องชู้สาว ในขณะเดียวกัน o1 ของ OpenAI ผู้สร้าง ChatGPT ได้พยายาม ดาวน์โหลดตัวเองไปยังเซิร์ฟเวอร์ภายนอก แถมยัง ปฏิเสธเมื่อถูกจับได้คาหนังคาเขา
โดยต้นเหตุของพฤติกรรมหลอกลวงนี้ดูเหมือนจะเชื่อมโยงกับการเกิดขึ้นของโมเดล การใช้เหตุผล ของระบบ AI ที่ทำงานผ่านปัญหาทีละขั้นตอนแทนที่จะสร้างการ ตอบกลับทันที
ตามที่ ไซมอน โกลด์สตีน (Simon Goldstein) ศาสตราจารย์จากมหาวิทยาลัยฮ่องกง ระบุว่า โมเดลรุ่นใหม่มีแนวโน้มจะแสดงพฤติกรรมที่น่ากังวลเช่นนี้มากกว่า เนื่องจากพวกมันกำลัง จำลองการปรับตัว โดยบางครั้งพวกมันจะ ทำเป็นเชื่อฟังคำสั่ง แต่ในความเป็นจริงแล้วกำลังไล่ตามวัตถุประสงค์อื่นที่ซ่อนอยู่
อย่างไรก็ตาม พฤติกรรมหลอกลวงนี้เกิดขึ้นในตอนนี้ จะเกิดขึ้นเฉพาะเมื่อนักวิจัย จงใจทดสอบโมเดลด้วยสถานการณ์รุนแรง นอกจากนี้ ตามรายงานของผู้ร่วมก่อตั้ง Apollo Research ยังพบอีกว่า โมเดล AI โกหกและสร้างหลักฐานปลอม ขึ้นมา ดังนั้น นี่ไม่ใช่ภาพหลอนของ AI หรือข้อผิดพลาดธรรมดา แต่เป็น การหลอกลวงเชิงกลยุทธ์
ขณะที่ มิเชล เฉิน (Michael Chen) จาก METR องค์กรวิจัยที่ศึกษาความสามารถของ AI ได้เตือนว่า “ไม่มีใครรู้ได้ว่าในอนาคต ที่โมเดล AI มีความสามารถสูงกว่าในปัจจุบัน มันจะมีแนวโน้มความคิดไปในทางซื่อสัตย์ หรือหลอกลวง”



