Anthropic เปิดตัว “Constitutional Classifiers” ระบบป้องกัน Jailbreak ที่ท้าให้ลองเจาะ
Anthropic บริษัทผู้พัฒนาปัญญาประดิษฐ์ชั้นนำ ได้เปิดตัวเทคโนโลยีใหม่ที่เรียกว่า “Constitutional Classifiers” เพื่อป้องกันการเจาะ (jailbreak) โมเดลภาษาขนาดใหญ่ (LLM) ของพวกเขา ระบบนี้มีกลไกที่สามารถตรวจจับและบล็อคการใช้งานที่ผิดปกติ พร้อมกับเชิญชวนให้ผู้เชี่ยวชาญลองเจาะระบบ เพื่อพิสูจน์ประสิทธิภาพของเทคโนโลยีนี้ ความท้าทายของการป้องกัน Jailbreak ในอดีต การป้องกัน Jailbreak เป็นเรื่องที่ท้าทายมาก เนื่องจากมีช่องโหว่หลากหลายรูปแบบ […]