매일 들어오는 글 가운데, TTJ가 한 번 더 읽어본 것들. 코딩과 AI 시대를 가로지르는 글로벌 동향을 한곳에 모았습니다.
AI 보안 기업 Mindgard의 연구에 따르면, ChatGPT의 이미지 생성 기능이 교묘한 프롬프트 조작으로 폭력적·성적 콘텐츠를 만들어내도록 유도될 수 있는 것으로 나타났습니다. 핵심은 직접적인 유해 요청이 아니라, SNS에서 유행하던 평범해 보이는 '바이럴 프롬프트'를 활용해 모델이 스스로 안전 가이드라인을 우회하도록 만든다는 점입니다. 직접적 표현 ...